versch. Standardabweichungen < Stochastik < Hochschule < Mathe < Vorhilfe
|
Aufgabe | Es liegen 10 Messwerte vor, die alle durch einen zufälligen Fehler leicht gestreut sind.
Es soll das ganze statistisch ausgewertet werden. |
Hallo,
ich bin etwas verwirrt und hoffe ich bekomme hier einen Tipp.
ich weiss, dass ich fuer 10 Messwerte die Student-T- Verteilung nehmen kann. Zusammen mit dem arithmetischen Mittel und der Anzahl der Freiheitsgrade (N-1)
.
Allerdings gibt es verschiedene Formeln für die Standardabweichung, und ich weiss nicht welche ich nehmen muss :(
Es gibt sie mit N und mit N-1 im Nenner so wie ich das sehe.
Kann mir jemand einen Tipp geben ?
|
|
|
|
Hallo Traumfabrik!
die zwei Formeln mit N und 1-N im Nenner sind gedacht für zwei verschiedene Fälle. Du brauchst ja den Mittelwert, um die Standardabweichung zu berechnen. Wenn Du den Mittelwert der zehn Messwerte nimmst, dann ist die Formel mit N-1 im Nenner die bessere. Hätte Dir ein Engel im Traum (oder ein Lehrer auf Papier) den wahren, der Stichprobe zu Grunde liegenden Mittelwert verraten, dann käme die Formel mit N im Nenner zum Einsatz. Also eigentlich nie, wenn es um Messungen geht.
Wegen Student-t: auch die Student-t-Verteilung kannst Du nur nehmen, wenn derselbe Engel (bzw. Lehrer) Dir verraten hat, dass die Messwerte aus einem normalverteilten Zufallsexperiment kommen. In ale anderen Fällen gilt sie nicht.
Wenn Du mir noch sagst, was "es soll statistisch ausgewertet werden" genau bedeutet, dann helfe ich gerne weiter.
Gruss,
Hanspeter
|
|
|
|
|
Erstmal vielen Dank für die schnelle Antwort.
Ich weiss jetzt welche Formel ich nehmen muss, der mathematische Hintergrund ist mir aber noch nicht so ganz klar.
Es handelt sich um zufällige Messfehler, von denen man einfach ausgeht sie wären normalverteilt :) mir ist bewusst, dass wenn es nicht so wäre die Student-t verteilung zu nehmen ein logischer Fehler wäre
|
|
|
|
|
OK, ich entnehme Deiner "Frage" nun aber gar keine Frage: bitte Schreib nun mal auf, wie weit Dir das Vorgehen nun klar ist, und frag dort weiter, wo Du stecken bleibst.
Da Du Student-t erwähnst, willst Du wohl auch Konfidenzintervalle?
|
|
|
|
|
Diese Konfidenzintervalle, bin da manchmal etwas vergesslich was die Begrifflichkeiten angeht. Ich weiss aber, dass ich aus Tabellen, anhand der Anzahl der Freiheitsgrade (N-1) für die Student T verteilung einen faktor ablesen kann der je nach wahrscheinlichkeit unterschiedlich ist. Diesen multiplizier ich mit der Standardabweichung und habe so mein Intervall in dem ein zukünftiger Messwert mit der von mir vorher gewählten Wahrscheinlichkeit liegt?!
Ist das soweit richtig?
|
|
|
|
|
Ah, OK, Du machst also kompletten Blindflug. Dann empfehle ich wohl besser etwas Lektüre.
Zuerst zu Deiner Aussage "und habe so mein Intervall in dem ein zukünftiger Messwert mit der von mir vorher gewählten Wahrscheinlichkeit liegt?"
Antwort: Nein, mit Hilfe der Student-t Verteilung kannst Du nur ein Konfidenzinervall berechnen, innerhalb dessen der wahre Mittelwert der Verteilung mit einer bestimmten Wahrscheinlichkeit liegt. Das macht noch keine Aussage über zukünftig zu erwartende Werte!
Ein Beispiel für die Rechnung mit 11 Messwerten findest Du hier, gleich unter der Tabelle: https://en.wikipedia.org/wiki/Student%27s_t-distribution#Table_of_selected_values
Ein nicht zu langer Text zum Problem "was schliesse ich aus wenigen Messwerten" ist hier: http://schmid-werren.ch/hanspeter/publications/2014sscm.pdf. Wenn Du nur über die Normalverteilung Bescheid wissen wills, reicht es, die ersten 3 Seiten und den Anfang der vierten Seite zu lesen.
Hilft das erst mal weiter?
|
|
|
|
|
Vielen Dank !
Hab den Artikel erst überflogen (Die Formeln muss ich mir nochmal genau anschauen), aber auf jeden Fall sehr informativ.
Vielleicht habe ich es falsch verstanden, aber aus dem Artikel würde ich entnehmen, dass wenn ich praktische Messwerte habe, die Normalverteilung eigentlich nie vorausgesetzt werden kann.
In der vorgeschlagenen Methode ( soweit ich das verstehe) sind die Bedingungen für die Anwendung ja wesentlich niedriger.
Was mich dann aber zu der Frage führen würde, warum alle Autoren deren Werk ich bisher gelesen habe, einfach immer von normalverteilten zufälligen Fehlern ausgehen ?
|
|
|
|
|
Ja DAS möchte ich auch gerne wissen. Ich habe den zitierten Artikel geschrieben, weil in meinem wissenschaftlichen Gebiet (Mikroelektronik) international unhinterfragt diese Statistik angewandt wird, obwohl es eigentlich ganz klar falsch ist. Schlimmer noch, ich habe mitgekriegt, wie ein Gutachter von einem Autor in einem sehr renommierten Journal diese Art von Statistik ausdrücklich verlangt hat, obwohl er das Beste gemacht hat, was man mit wenigen Messwerten (in seinem Fall 10 Kurven) tun kann: alle tabellieren. Und da hab ich mich entschlossen, das zu ändern, selbst wenn ich geflamed werde.
Was übrigens nicht geschehen ist bisher ;) Dafür gibt es schon im Dezember einen Reprint dieses Artikels in einem anderen IEEE-Magazin, weil offenbar viele Leute froh sind, dass das mal klargestellt wurde.
Also, was spricht überhaupt FÜR die Normalverteilung?
Daneben, dass das Rechnen damit recht einfach ist, sagt das Gesetz der grossen Zahlen, dass sich die Summe von Werten von vielen UNBHÄNGIGEN identisch verteilten Zufallsvariablen der Normalverteilung annähert. So ist auch die Normalverteilung als Grundlagen für Rauschberechnungen in Kommunikationssystemen durchaus nützlich.
Nur ist das Problem bei physikalischen Messungen bei "Summe", "unabhängig" sowie bei "identisch verteilt". Alle drei sind in der Mess-Praxis nicht gegeben, und so gibt es dort auch die Normalverteilung eher nicht. Kann es ja auch nicht. Beweis: Stell Dir vor, Du misst eine Temperatur in Kelvin. Wäre die normalverteilt, dann gäbe es eine nichtverschwindende Wahrscheinlichkeit für Temperaturen unter dem absoluten Nullpunkt. Die Atome hätten dann weniger als keine thermische Energie [mm] $\to$QED [/mm] durch reductio ad absurdum.
Allerdings ist es so, dass Excel die Funktion =AVERAGE() und =STDEV() hat, die wirklich jede und jeder anwenden kann. Wenn Du von einer Verteilung halt wirklich nur Mittelwert und Standardabweichung kennst, nichts anderes, dann musst Du eine Normalverteilung annehmen. Jede andere Annahme impliziert mehr Information, als Du hast. Die Normalverteilung ist die Maximum-Entropie-Verteilung für den Fall, dass nur die ersten zwei Momente bekannt sind. Siehe https://en.wikipedia.org/wiki/Maximum_entropy_probability_distribution#Given_mean_and_standard_deviation:_the_normal_distribution.
Übrigens, Excel: bis Excel 2007 konnte man mit =CONFIDENCE() das Konfidenzintervall des wahren Mittelwerts berechnen lassen, aber Microsoft hatte die falsche Formel eingebaut! =CONFIDENCE rechnet nicht mit Student-t und verlangt als Parameter die WAHRE Standardabweichung, nicht die empirische. Erst seit Excel 2010 ist das gelöst. Das heisst: alle Leute, die bis und mit Excel 2007 =CONFIDENCE auf Messdaten angewandt haben, haben viel zu enge Konfidenzintervalle gekriegt. Ist schon fast skandalös, aber hast Du je davon gehört? Unglaublich, nicht? Den Leuten scheint es weitgehend egal zu sein, sogar den Fachleuten ...
Ich nehme deshalb an, dass es alle schreiben, weil es alle anderen auch schreiben, und (fast) keiner hat es hinterfragt. Und die, die es hinterfragt haben, liest man nicht gerne, weil sie ja nicht das schreiben, was sonst alle schreiben.
Ich hoffe ich hab jetzt nicht wesentlich mehr geschrieben als Du eigentlich wolltest.
|
|
|
|
|
Das habe ich soweit alles verstanden, ich habe nur noch eine wirklich dumme Frage, die ich mir aber imom nicht erklären kann.
Die StichprobenStdabw. vom Mittelwert multipliziere ich ja mit einem Faktor wenn ich ein bestimmtes Konfidenzintervall will ( kann ich sortiert nach Anzahl der Freiheitsgrade(N-1) und gewählten Konfidenzintervall aus einer Tabelle auslesen).
Wenn ich jetzt aber das Konfidenzintervall um diesen Mittelwert angeben will, wird diese Abweichung noch durch [mm] (N)^0.5 [/mm] geteilt.
Ich verstehe nicht ganz warum? ( Man könnte die Werte ja auch direkt in die Tabelle mit einrechnen?)
Finde dafür leider keine Erklärung, steht auch in Wikipedia einfach so drin.
|
|
|
|