Varianz, Kovarianz, Regression < Sonstiges < Stochastik < Oberstufe < Schule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 04:42 Do 17.08.2006 | Autor: | Teufel |
Hallo, Leute!
Ich wollte mal fragen, ob mir jemand kurz (oder auch länger, wenn er Lust hat :P) erklären kann, was es mit diesen Begriffen auf sich hat.
Wir haben das nie in der Schule behandelt und das würde mich mal interessieren.
Mit arithmetischen Mitten Und Meridian kann ich etwas anfangen, aber mit Varianz, Kovarianz, Standartabweichung, (lineare) Regression und Korrelation leider nicht.
Das hängt sicher irgendwie alles zusammen... naja, also wenn jemand Lust hat das etwas zu erklären wäre ich dankbar!
Und wie in allen meinen Posts: Haltet es bitte einfach oder macht euch erst nicht die Mühe zu kompliziertes Zeugs zu schreiben :)
|
|
|
|
Das, was der Volksmund Mittelwert oder Durchschnitt nennt, also mathematisch das arithmetische Mittel, faßt eine Datenreihe in einer einzigen Kennzahl zusammen. Dabei geht natürlich Information verloren. In gewisser Weise mißt die Varianz oder deren Wurzel, die Standardabweichung, wie gut der Mittelwert die ursprüngliche Datenreihe noch repräsentiert.
Um es konkret zu machen, betrachte das Dorf 1 mit 10 Bauern und ihrem Viehbestand:
[mm]\begin{matrix} \mbox{Bauer} & 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 & 9 & 10 \\ \mbox{Kühe} & 7 & 6 & 11 & 10 & 8 & 13 & 11 & 9 & 14 & 11 \end{matrix}[/mm]
Im Mittel besitzt jeder Bauer 10 Kühe.
Und nun das Dorf 2 mit 9 Bauern:
[mm]\begin{matrix} \mbox{Bauer} & 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 & 9 \\ \mbox{Kühe} & 12 & 2 & 1 & 1 & 31 & 2 & 37 & 3 & 1 \end{matrix}[/mm]
Auch hier besitzt jeder Bauer im Mittel 10 Kühe. Wenn man also nur den Mittelwert nimmt, scheinen beide Dörfer gleich reich zu sein. Schon der bloße Augenschein zeigt aber, daß im ersten Dorf die Bauern etwa gleich reich (oder gleich arm) sind, während im zweiten Dorf zwei Großbauern, ein mittelreicher Bauer und sechs arme Schlucker leben. Durch die Mittelwertbildung geht dieser ungleiche Aufbau der Datenreihen verloren. Das meinte ich oben mit Informationsverlust. Um diesen Informationsverlust teilweise aufzufangen, könnte man sich jetzt die Abweichungen vom Mittelwert anschauen und diese wiederum mitteln.
Im ersten Dorf gibt das
( 3 + 4 + 1 + 0 + 2 + 3 + 1 + 1 + 4 + 1 ) / 10 = 2
Und im zweiten Dorf
( 2 + 8 + 9 + 9 + 21 + 8 + 27 + 7 + 9 ) / 9 = 11,1
Durchschnittlich weicht also im Dorf 1 die Kühezahl um 2 vom Mittelwert 10 ab, im Dorf 2 dagegen um 11,1. Und das ist schon fast das, was man als Standardabweichung bezeichnet. Deren genaue Definition geht allerdings etwas anders. Man mittelt nicht direkt die Abweichungen vom Mittelwert, sondern betrachtet die Wurzel aus der Quadratsumme dieser Abweichungen. Die genaue Definition findest du bei Wikipedia unter den entsprechenden Stichwörtern.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 13:54 Do 17.08.2006 | Autor: | Teufel |
Hoi, danke erstmal dafür, hab's soweit verstanden :) und wie sieht es mit den anderen Begriffen aus?
|
|
|
|
|
Ich bin kein Stochastikexperte, aber Korrelation hat etwas mit rechnerischer Abhängigkeit von Datenreihen zu tun. Berühmtes Beispiel: Gibt es zwischen der Anzahl der Störche und der Anzahl der Geburten eine rechnerische Abhängigkeit, z.B. einen linearen Zusammenhang.
|
|
|
|