Korrelation von Messreihen < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 16:49 Do 13.09.2012 | Autor: | Tea |
Aufgabe | Hallo Matheraum ,
heute stelle ich eine Frage zur Diskussion von Versuchsdaten zur Diskussion.
Im Detail liegen mir mehrere Messgrößen zu Probensätzen (mit je mehreren Einzelmessungen) vor, deren Korrelation ich bestimmen möchte.
Um die Streuung zu berücksichtigen, habe ich für jede Probe den Mittelwert [mm] \mu [/mm] und die Standardabweichung sigma dargestellt.
Also:
Probe 1:
Messgröße 1: [mm] \mu1_1, sigma1_1 [/mm]
Messgröße 2: [mm] \mu1_2, sigma1_2
[/mm]
Probe 2:
Messgröße 1: [mm] \mu2_1, sigma2_1
[/mm]
Messgröße 2: [mm] \mu2_2, sigma2_2
[/mm]
usw.. |
Wie kann ich aus diesen Werten die Korrelation der Messgrößen über alle Proben berechnen?
Die Möglichkeit der Funktion KORREL in Excel ist mir bekannt. Dies habe ich genutzt, allerdings weiß ich nicht, wie so die Streuung berücksichtigt werden kann, da ich nur die Mittelwert [mm] \mu1_1, \mu2_1 [/mm] mit [mm] \mu2_1, \mu2_2 [/mm] korreliert habe.
Vorab vielen Dank für eure Antworten.
|
|
|
|
Hossa ;)
Die Messreihen müssen aus gleich vielen Messpunkten n bestehen. Die Werte für Messreihe 1 seien [mm] $x_i$ [/mm] und die Werte für Messreihe 2 seien [mm] $y_i$. [/mm] Für jede dieser Messreihen bildest du den Mittelwert, also [mm] $\overline [/mm] x$ und [mm] $\overline [/mm] y$. Dann ordnest du die beiden Messreihen als Vektoren an:
[mm] $\vec x:=\left(\begin{array}{c}x_1-\overline x\\ x_2-\overline x\\ x_3-\overline x\\ \vdots\\ x_n-\overline x\end{array}\right)\quad;\quad\vec y:=\left(\begin{array}{c}y_1-\overline y\\ y_2-\overline y\\ y_3-\overline y\\ \vdots\\ y_n-\overline y\end{array}\right)$
[/mm]
Der Korrelationskoeffizient $r$ ist der Cosinus des Winkels zwischen diesen beiden Vektoren. Den kriegst du über das Skalarprodukt raus:
[mm] $r=\cos\angle(\vec x,\vec y)=\frac{\vec x\cdot\vec y}{\left|\vec x\right|\cdot\left|\vec y\right|}=\frac{\sum\limits_{i=1}^n(x_i-\overline x)\cdot(y_i-\overline y)}{\sqrt{\sum\limits_{i=1}^n(x_i-\overline x)^2}\cdot\sqrt{\sum\limits_{i=1}^n(y_i-\overline y)^2}}\in[0;1]$
[/mm]
Wenn du die Varianzen bzw. die Standardabweichungen darin wieder finden möchtest, kannst du den Bruch noch mit $1/n$ erweitern:
[mm] $r=\frac{\frac{1}{n}\sum\limits_{i=1}^n(x_i-\overline x)\cdot(y_i-\overline y)}{\sqrt{\frac{1}{n}\sum\limits_{i=1}^n(x_i-\overline x)^2}\cdot\sqrt{\frac{1}{n}\sum\limits_{i=1}^n(y_i-\overline y)^2}}$
[/mm]
Ok?
|
|
|
|
|
Status: |
(Frage) überfällig | Datum: | 19:50 Fr 14.09.2012 | Autor: | Tea |
Hallo Hasenfuss,
vielen Dank für die schnelle und umfangreiche Antwort.
> Hossa ;)
>
> Die Messreihen müssen aus gleich vielen Messpunkten n
> bestehen.
Genau hier gibt es Abweichungen, da in meinem Fall nicht für jede Messgröße die gleiche Anzahl an Messungen durchgeführt wurde. D.h. die Messreihen bestehen nicht aus gleich vielen Messpunkten.
Gibt es eine Möglichkeit, diese Problematik zu entschärfen, bzw. welchen Nachteil bringt es mit sich, wenn ich nur die Mittelwerte korreliere? Abgesehen davon, dass natürlich die Streuung vernachlässigt wird, was ja nicht mein Ziel war...
> Die Werte für Messreihe 1 seien [mm]x_i[/mm] und die
> Werte für Messreihe 2 seien [mm]y_i[/mm]. Für jede dieser
> Messreihen bildest du den Mittelwert, also [mm]\overline x[/mm] und
> [mm]\overline y[/mm]. Dann ordnest du die beiden Messreihen als
> Vektoren an:
>
> [mm]\vec x:=\left(\begin{array}{c}x_1-\overline x\\ x_2-\overline x\\ x_3-\overline x\\ \vdots\\ x_n-\overline x\end{array}\right)\quad;\quad\vec y:=\left(\begin{array}{c}y_1-\overline y\\ y_2-\overline y\\ y_3-\overline y\\ \vdots\\ y_n-\overline y\end{array}\right)[/mm]
>
> Der Korrelationskoeffizient [mm]r[/mm] ist der Cosinus des Winkels
> zwischen diesen beiden Vektoren. Den kriegst du über das
> Skalarprodukt raus:
Ok, jetzt weiß ich auch wo der Korrelationskoeffizient herkommt.
>
> [mm]r=\cos\angle(\vec x,\vec y)=\frac{\vec x\cdot\vec y}{\left|\vec x\right|\cdot\left|\vec y\right|}=\frac{\sum\limits_{i=1}^n(x_i-\overline x)\cdot(y_i-\overline y)}{\sqrt{\sum\limits_{i=1}^n(x_i-\overline x)^2}\cdot\sqrt{\sum\limits_{i=1}^n(y_i-\overline y)^2}}\in[0;1][/mm]
>
Das ist dann der Korrelationskoeffizient nach Bravais-Pearson...
> Wenn du die Varianzen bzw. die Standardabweichungen darin
> wieder finden möchtest, kannst du den Bruch noch mit [mm]1/n[/mm]
> erweitern:
>
... der auch als [mm] \bruch{s_{xy}}{s_{x}*s_{y}} [/mm] geschrieben werden kann, nicht wahr?
> [mm]r=\frac{\frac{1}{n}\sum\limits_{i=1}^n(x_i-\overline x)\cdot(y_i-\overline y)}{\sqrt{\frac{1}{n}\sum\limits_{i=1}^n(x_i-\overline x)^2}\cdot\sqrt{\frac{1}{n}\sum\limits_{i=1}^n(y_i-\overline y)^2}}[/mm]
>
> Ok?
Bis auf das eingangs angesprochene Problem, alles ok. Vielen Dank!
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 20:20 So 16.09.2012 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|