modellvergleiche < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Aufgabe | Sie haben ein Experiment durchgeführt, bei dem Sie den Einfluss von Düngung (in 10 verschiedenen Stufen) und bestimmten Bodenorganismen (vorhanden/vs. nicht vorhanden) auf die Primärproduktion von Pflanzen bestimmen. Sie erhalten für das Modell, das den
Einfluss beider Faktoren berücksichtigt, eine etwas geringere Summe der quadratischen
Abweichung als für das Modell, das nur die Düngung berücksichtigt. Können Sie eindeutig
festlegen, welches das bessere Modell ist? Wenn ja: welches? Wenn nein: welche
Information müsste zusätzlich berücksichtigt werden und warum? Geben Sie Ihre Erklärung
in circa 3-5 Sätzen an. |
also ich würde mal behaupten, dass man eigentlich schon festlegen kann, dass das Modell, welches beide faktoren berücksichtigt das bessere ist.
mich stört hier nur das wort eindeutig.
kann man eventuell gar nicht eindeutig feststellen, welches modell besser ist, wenn die Summe der quadratischen Abweichung nur wenig geringer ist als bei dem anderen modell?
im prinzip gilt doch, je kleiner der Wert der quadratischen Abweichung, desto besser ist das modell oder nicht?
ich kann jetzt allerdings nicht erklären, weshalb das eine modell anhand der geringeren summe der quadratischen abweichung besser ist als das andere.
Kann mich jemand darüber aufklären?
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 21:37 Fr 01.02.2013 | Autor: | chrisno |
Jeder der Messwerte ist mit einer Messunsicherheit behaftet. Wenn Du diese kennst, dann kannst Du schauen, ob die Abweichungen zwischen Modell und Messwerten innerhalb dieses Unsicherheitsbereichs liegen. Also: Jeder Messwert wird mit seinem Fehlerbalken versehen und wenn dann die Modellkurve innerhalb der Fehlerbalken liegt, dann gibt es nichts mehr zu verbessern. Es würden nur noch die zufällig bei diesen Messungen vorhanden Schwankungen beschrieben, die aber nicht interessieren.
Laufen beide Kurven, die des ein-Parameter Modells und die des zwei-Parameter Modells innerhalb der Fehlerbalken, dann gewinnt das ein-Parameter Modell. Stichwort "Occams razor"
Das war nun die schlichteste Praktiker Variante.
Als nächstes muss man erst einmal klären, was genau mit den Fehlerbalken gemeint ist. Dazu bräuchte man viele Wiederholungen, die hier aber nicht vorgesehen sind. Wenn Voraussetzungen erfüllt sind, die ich nicht benennen kann, dann ist es möglich statistische Tests durchzuführen, die sagen, ob die Abweichungen wischen Daten und Modell "signifikant" sind. Dazu muss man auch noch definieren, was man mit signifikant meint. Ich erinnere mich da an das Stichwort Chi-Quadrat.
Vor so 20 Jahren kam in meinem Forschungsbereich dann die "maximum-entropy-methode" auf, mit der geklärt werden kann(?) wie viele Paramter eines Modells aus den Daten geholt werden können.
Kurz gesagt: solange Du nicht sagen kannst, ob die Summe der quadrierten Abweichungen innerhalb des statistischen Rauschens liegt, kannst Du nichts zur Qualität der Modelle sagen.
(Ihr Mathematiker, bitte verzeiht dem Praktiker des "Fittens" seine Formulierungen.)
|
|
|
|
|
also wenn ich das richtig verstanden habe ist die antwort auf die aufgabenstellung:
es ist nicht möglich eindeutig festzustellen, welches das bessere modell ist, da in der Aufgabenstellung nicht erwähnt wird ob die messwerte der beiden Modelle innerhalb des Unsicherheitsbereichs liegen.
es könnte also genausogut sein, dass beide modelle außerhalb liegen und beide nix taugen egal ob bei einem die abweichung etwas geringer ist?
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 22:09 Fr 01.02.2013 | Autor: | chrisno |
genau so ist es.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 20:21 So 03.02.2013 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|