Regression < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 10:31 Do 20.01.2005 | Autor: | lululein |
Hallo,
kann mir jemand helfen. Ich habe die lineare Regression verstanden, doch die Multiple nicht genau. Mich interressiert wie man diese mit einer abhängigen Variable und mehreren unabhängigen Variablen (3-4) berechnet ohne Hilfe des SPSS Programms. (Grundstrucktur)
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
|
|
|
|
Hmmmm, ist wohl das erste Mal, wo ich hier poste. Aber ich denke die Frage könnte ich beantworten.
Im allgemeinen werden in der Regressionsanalyse mehrere unabhängige Variablen mit in den Regressionsterm miteinbezogen. Das geht in der Regel auf Kosten der Anschaulichkeit. Bei der einfachen linearen Regression kannst Du ja mit nem 2-dimesionalen Streudiagramm die Regression darstellen, wobei das bei der multiplen Regression nicht mehr grafisch darzustellen ist. Daher ist sie schwieriger vorzustellen. Obwohl das Prinzip das Gleiche ist. Bei der multiplen Regression geht es um die Verbesserung der Vorhersage (Prädiktion) im Vergleich zur einfachen Regression. Dadurch dass Du nicht nur eine unabhängige Variable hast sondern mehrere, soll sich die Vorhersage verbessern.
Das wird mit folgender Gleichung dargestellt:
y' = b1x1 + b2x2 + ... + bnxn+a
Wobei es darum geht die Koeffizienten der Gleichung zu schätzen, wobei "n" die Anzahl der unabhängigen Variablen ist, die mit x1 bis xn bezeichnet sind.
a=eine Konstante (also bei der linearen Regression wie gehabt, der Schnittpunkt mit der Ordinate), b=Regressionskoeffizient, Beta-Gewicht.
Fiktives Beispiel von mir mit drei Prädiktoren (x1-x3):
Die "Führereigenschaft" (y) einer Nachwuchsführungskraft soll vohergesagt werden durch "Soziabilität" (x1) und "Dominanz" (x2) und "Extraversion (im Sinne Eysencks)" (x3)....also nunmehr nicht wie bei der linearen Regression nur ausschliesslich durch nur einen Faktor z.B. "Dominanz". Dann würde der Term folgendermassen lauten:
"Führereigenschaft" = Regressionkoeffizient 1 * "Soziabilität" + Regressionkoeffizient 2 * "Dominanz" +Regressionkoeffizient 3 * "Extraversion" + Konstante
Aber was Du beachten solltest: bei der Multiplen Regression kann es "prädiktive Redundanzen" (dieses Problem ist auch bekannt unter dem Begriff "Multikollinearität") geben und sollten vermieden werden, z.B. die Korrelationen zwischen den Prädiktorvariablen (x) untereinander sollten möglichst gering sein Der Grund: Das Beta-Gewicht (b) ist nicht nur abhängig von Korrelation der Prädiktorvariablen (x) mit Kriterium (y), sondern auch von der Korrelation mit anderen Prädiktorvariablen (xn). Also: Je höher Interkorrelation zwischen Prädiktorvariablen(x1 und x2) und je höher die Korrelation zwischen Kriterium (y) und einem Prädiktor (x1) ist, desto weniger wird das Betagewicht beim anderen Prädiktor (x2) durch ihre Einzelkorrelation mit dem Kriterium (y) bestimmt (und umgekehrt).
Wieder zu unserem Beispiel: "Führereigenschaft" (y) einer Nachwuchsführungskraft soll vohergesagt werden durch "Soziabilität" (x1), "Dominanz" (x2) und "Extraversion" (x3)
Um "y" bestmöglich vorherzusagen, soll "Soziabilität" und "Führereigenschaft", sowie "Dominanz" und "Führereigenschaft", "Extraversion" und "Führereigenschaft" möglichst hoch miteinander korrelieren, jedoch sollte "Soziabilität", "Dominanz" und "Extraversion" niedrig untereinander korrelieren. Hohe Interkorrelationen bedeuten, dass ein Faktor (x) entbehrlich ist.
Hoffe ich konnte Dir ein wenig helfen.
Grüssle
|
|
|
|