pte20091013003 Forschung/Entwicklung, Technologie/Digitalisierung

Übertriebene Genauigkeit ist verhängnisvoll

Schlechtere Messdaten durch falsche Nachkomma-Speicherung


Daten werden oft präziser abgespeichert als ihre Messung erfolgt ist (Foto: pixelio.de/Hautumm)
Daten werden oft präziser abgespeichert als ihre Messung erfolgt ist (Foto: pixelio.de/Hautumm)

Remagen (pte003/13.10.2009/06:10) Genauigkeit kann statistischen Messdaten auch zum Verhängnis werden. Das bericht Markus Neuhäuser, Statistiker am ReinAhrCampus Remagen http://www.fh-koblenz.de in der Zeitschrift Behavioral Ecology and Sociobiology. Gemeinsam mit einem britischen Kollegen entdeckte Neuhäuser, dass die Effizienz der statistischen Verfahren sinkt, wenn Größen automatisiert gemessen und mit übertriebener Genauigkeit abgespeichert werden. "Erst kürzlich wurde bekannt, dass man die Zeit noch genauer als mit derzeitigen Atomuhren messen kann. Das ist ein Fortschritt, der zu begrüßen ist. Problematisch ist hingegen, wenn Messdaten durch übertrieben genaue Speicherung im Nachkommastellen-Bereich verzerrt werden und dadurch Scheingenauigkeit entsteht", so der Forscher im pressetext-Interview.

Aufgekommen ist das von Neuhäuser beschriebene Problem erst mit der enormen Preissenkung von Speicherplatz in den vergangenen Jahren. "Früher war Speicherung wesentlich teurer. Im vorigen Jahrhundert wurde die Zahl '19' bei Jahresangaben in der Regel gar nicht mitgespeichert, was der eigentliche Grund für das Jahr-2000-Problem war." Heute sei Speicherplatz so billig, dass man beliebig viele Kommastellen nach der Null abspeichern könne. "Eine Temperatur von 17,2 Grad Celsius kann etwa im Computer als 17,200005 gespeichert werden. Ähnlich ist der Effekt, wenn Werte weiter umgerechnet werden."

Zum Problem wird die Scheingenauigkeit bei bestimmten statistischen Verfahren, erklärt Neuhäuser. "Viele Verfahren basieren nicht auf den Rohdaten, sondern auf Rangfolgen, die man den Werten nach ihrer Größe zuteilt. Löste man bisher das Problem gleich großer Werte stets durch Vergabe von Mittelrängen, was mathematisch die beste Lösung ist, führt heute die Scheingenauigkeit in den Nachkommastellen der Werte zur Vergabe stets verschiedener Ränge. Welche Ränge zwei scheinbar gleichen Messwerten zugeteilt werden, entscheidet dabei oft der Zufall, was den statistischen Test schlechter macht." Relevant sei dies in erster Linie für die Wissenschaft und könne das Ergebnis medizinischer Untersuchungen beeinflussen.

Als Vorschlag für einen besseren Umgang mit Messdaten schlägt Neuhäuser die Rundung von Zahlen gemäß der Präzision der zugrunde liegenden Messung vor. "Dieser Schritt ist sehr einfach, wird jedoch oft übersehen." Ein Beispiel dafür sei der Body-Mass-Index (BMI), der durch die Messwerte Größe und Gewicht ermittelt wird. "Der Quotient, mit dem gerechnet wird, ist eine reelle Zahl mit beliebig vielen Nachkomma-Stellen. Um die Genauigkeit zu gewährleisten, muss man deren Nachkommastellen entsprechend der Genauigkeit der Messung runden." Für den BMI einer Einzelperson sei dieses Problem irrelevant, nicht jedoch für größere Studien, so der Remagener Statistiker. "Werden etwa zwei Diätformen verglichen, könnte die Scheingenauigkeit auch die Testergebnisse beeinträchtigen. Im Extremfall kommt dadurch ein unterschiedliches Ergebnis zustande."

Abstract des Originalartikels unter http://www.springerlink.com/content/a757704707951858/

(Ende)
Aussender: pressetext.deutschland
Ansprechpartner: Johannes Pernsteiner
Tel.: +43-1-81140-316
E-Mail: pernsteiner@pressetext.com
|