Prüfen auf Verteilung < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Aufgabe | [mm] $\begin{tabular}{lcr}
airline & pos.count &neg.count \\
austrian airlines & 177 & 38 \\
Lufthansa & 150 & 51 \\
Ryanair & 60 & 113 \\
SAS & 83 & 120 \\
Swiss & 190 & 50 \\
Germanwings & 40 & 72\\
Air France & 92 & 55
\end{tabular}$
[/mm]
Are the positive and negative counts equally distributed across the Airlines? Please use suitable statistical tests, and describe the problem graphically and numerically. |
Hallo,
wenn man in R auf Normalverteilung testet, dann erhält man :
Im vektor "pos" stecken die pos.counts und im Vektor "neg" die neg.counts.
> shapiro.test(pos)
Shapiro-Wilk normality test
data: pos
W = 0.91735, p-value = 0.4491
> shapiro.test(neg)
Shapiro-Wilk normality test
data: neg
W = 0.84245, p-value = 0.1047
das bedeutet, dass in beiden Fällen die Hypothese :" die Daten folgen einer Normalverteilung " angenommen wird.
Beantwortet das die Fragestellung "Are the positive and negative counts equally distributed across the Airlines? " oder meint das wirklich, ob eine Gleichverteilung vorliegt ? aber das kann man ja quasi per hinsehen ausschließen.
VIelen Dank für etwaige Antworten.
LG Peter
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 14:14 Fr 20.10.2017 | Autor: | luis52 |
Moin Peter, mit Normalverteilung bist du gaenzlich auf dem
Holzweg. Man koennte annehmen, dass die Daten unabhaengige Stichproben
aus 7 Bernoulli-Verteilungen mit Parameter [mm] $p_j$ [/mm] sind. Zu testen ist
[mm] $H_0:p_1=\dots=p_7$. [/mm] Test 41 hier scheint geeignet.
|
|
|
|
|
Hallo Luis,
Vielen Dank für deine Antwort.
> chisq.test(neg)
data: neg
X-squared = 89.098, df = 6, p-value < 2.2e-16
> chisq.test(pos)
data: pos
X-squared = 184.48, df = 6, p-value <
2.2e-16
erhalte ich nun. Also in beiden Fällen ist der p-Wert < 0.05
entsprechend wären diese Datenpunkte nicht gleich verteilt..
Stimmt das?
Man sieht allerdings, dass die beiden Datenvektoren "pos" und "neg" die gleiche Verteilung haben.
> chisq.test(pos, neg)
Pearson's Chi-squared test
data: pos and neg
X-squared = 42, df = 36, p-value = 0.227
LG
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 20:26 Fr 20.10.2017 | Autor: | luis52 |
Moin, du kannst nicht getrennt testen. Korrekt ist die Daten in Form einer Kontingenztabelle zu analysieren:
1: | pm <- structure(c(177, 38, 150, 51, 60, 113, 83, 120, 190, 50,
| 2: | 40, 72, 92, 55), .Dim = c(2L, 7L), .Dimnames = list(c("+",
| 3: | "-"), c("aa", "lh", "ra", "sas", "swiss", "gw", "af")))
| 4: | chisq.test(pm)
|
|
|
|
|
|
Vielen Dank für deine Antwort.
In einem anderen Unterpunkt findet man :
please check the following data with suitable measures for distribution if they were similarly distributed : LV <- c(14,14,7,11,13)
Da ist jetzt auch nur ein einziger Vektor --- könnte man hier nicht als Hypothese beispielsweise annehmen, dass diese Daten einer zugrundeliegenden Normalverteilung entspringen?
LG
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 18:00 Sa 21.10.2017 | Autor: | luis52 |
> In einem anderen Unterpunkt findet man :
>
> please check the following data with suitable measures for
> distribution if they were similarly distributed : LV <-
> c(14,14,7,11,13)
Hier muss ich passen. Der Begriff einer "similar distribution" ist mir noch nicht begegnet.
>
> Da ist jetzt auch nur ein einziger Vektor --- könnte man
> hier nicht als Hypothese beispielsweise annehmen, dass
> diese Daten einer zugrundeliegenden Normalverteilung
> entspringen?
>
Kann man. Und dann? Wie gesagt, bin ueberfragt.
|
|
|
|
|
Wäre es eine sinnvolle Hypothese anzunehmen, dass die Daten in LV <- c(14,14,7,11,13)
einer [mm] $N(\mu, \sigma^2)$ [/mm] Stichprobe entsprigen und das etwas mittels
shapiro.test(LV)
zu prüfen?
LG
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 19:23 Sa 21.10.2017 | Autor: | luis52 |
> Wäre es eine sinnvolle Hypothese anzunehmen, dass die
> Daten in LV <- c(14,14,7,11,13)
> einer [mm]N(\mu, \sigma^2)[/mm] Stichprobe entsprigen und das etwas
> mittels
>
> shapiro.test(LV)
>
> zu prüfen?
>
> LG
>
>
>
Da steht similarly distributed, nicht normally distributed ...
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 21:13 Sa 21.10.2017 | Autor: | Peter_123 |
Hallo Luis ,
Die Frage geht noch etwas weiter :
Describe the data graphically and numerically. Answer the research hypothesis if the classes are equally distributed using the appropriate statistical method. Don’t forget to state the hypotheses too.
Und zwar bezogen auf jenen Vektor aus dem vorigen Post.
LG
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 14:46 So 22.10.2017 | Autor: | luis52 |
Es ist immer wunderbar, wenn man die Fragestellungen in homooepathischen
Dosen serviert bekommt. Jetzt ist noch von "Klassen" die Reden. Was fuer
Klassen?
Vorschlag zur Guete: Scanne doch einmal die Aufgabenstellung, wie du es
oben schon gemacht hast.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 17:39 So 22.10.2017 | Autor: | Peter_123 |
Ich hänge hier das Originaldokument an :)
Herzlichen Dank für die Bemühungen.
[Bild Nr. 1 (fehlt/gelöscht)]
|
|
|
|
|
Hallo Luis,
Nochmals Danke, dass du dich dieser Frage annimmst.
b) Classes at University should be distributed similarly. There should be in general the same amount of sessions for each class. Please check the following data with suitable measures for distribution if they were similarly distributed:
LV <- c(14,14,7,11,13)
Nur den Vektor testen – ohne Table
Describe the data graphically and numerically. Answer the research hypothesis if the classes are equally distributed using the appropriate statistical method. Don’t forget to state the hypotheses too.
Das ist die vollständige Task.
LG
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 18:13 So 22.10.2017 | Autor: | luis52 |
Wenn "the same amount of sessions" stattfinden sollten, so sollten die
Anteile in jeder Klasse ungefaehr identisch sein. Es sollte also gelten
[mm] $59p_1=59p_2=\dots=59p_5$. [/mm] Ueberpruefe also [mm] $H_0:p_1=p_2=\dots=p_5=0.2$. [/mm]
|
|
|
|
|
Ah vielen Dank und das kann man wieder mittels chisq.test machen nehme ich an?
LG
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 19:12 So 22.10.2017 | Autor: | luis52 |
> Ah vielen Dank und das kann man wieder mittels chisq.test
> machen nehme ich an?
>
|
|
|
|
|
> [mm]$\begin{tabular}{lcr}
airline & pos.count &neg.count \\
austrian airlines & 177 & 38 \\
Lufthansa & 150 & 51 \\
Ryanair & 60 & 113 \\
SAS & 83 & 120 \\
Swiss & 190 & 50 \\
Germanwings & 40 & 72\\
Air France & 92 & 55
\end{tabular}$[/mm]
>
> Are the positive and negative counts equally distributed
> across the Airlines? Please use suitable statistical tests,
> and describe the problem graphically and numerically.
Hallo Peter
Mir scheint hier ganz grundsätzlich rätselhaft, was da mit
den "positive counts" und "negative counts" überhaupt
gemeint sein soll.
Handelt es sich um irgendwelche Bewertungen der Leistungen
der Airlines durch Kunden, oder worum sonst ?
Meiner Meinung nach ist es praktisch sinnlos, irgendwelche
Daten statistisch zu klassifizieren, falls man keine Ahnung
davon hat, was die Daten denn bedeuten sollen und wie sie
zustande gekommen sind.
So etwas wie eine "Gleichverteilung" kann man allerdings auf
den ersten Blick ausschließen - aber dazu muss man nicht
einmal eine Ahnung von statistischen Methoden haben.
Eine wichtige Frage, die bei mir bleibt, wäre zum Beispiel diese:
Wie dumm darf einer sein, dass er trotzdem noch Statistik
unterrichten darf ?
LG , Al-Chw.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 15:20 So 22.10.2017 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|