Konfidenzintervalle < math. Statistik < Stochastik < Hochschule < Mathe < Vorhilfe
|
Hallo,
ich habe eine Frage zu den Konfidenzintervallen, weil es hierzu ja zwei Formeln gibt:
1. [mm] h_{n}-z*\wurzel{\bruch{p(1-p)}{n}}\le [/mm] p [mm] \le h_{n}+z*\wurzel{\bruch{p(1-p)}{n}}
[/mm]
2. [mm] h_{n}-z*\bruch{1}{2*\wurzel{n}} \le [/mm] p [mm] \le h_{n}+z*\bruch{1}{2*\wurzel{n}}
[/mm]
Ich habe mal eine Aufgabe mit beiden Varianten gerechnet, es kam nicht unbedingt immer dasselbe heraus. Deswegen, wann benutzt man denn welche?? Da in meinen Aufgaben unterschiedliche Ergebnisse herauskamen, kann es ja nicht ganz so egal sein?
Dann habe ich noch eine zweite Frage zu den Sigma-Regeln:
Aufgabe: Von einer Produktionsstraße für Dachpfannen werden 200 Stück auf Fehler überprüft, wobei die Straße einen Ausschussanteil von 3% hat. Berechne die Mindest- und Höchstanzahlen der möglichen Ausschussteile bei einer Sicherheit von 90%.
Ich hätte diese Aufgabe mit der Sigma-Regel gelöst.
Sei X binomialverteilt (Ausschussanteil) mit n=200 und p=0,03.
E(x)=6, [mm] \sigma=\wurzel{V(x)}=2,412<3, [/mm] also eigentlich kleiner als 3. Rechne ich mit den Sigmaregeln trotzdem, so muss ich
[mm] [\mu-1,64*\sigma; \mu+1,64*\sigma] [/mm] berechnen, da z=1,64 bei 90%-iger Sicherheit ist.
Also [3;9]
Meine Frage, wie würde ich vorgehen, wenn ich die Simga-Regeln nicht beachte, wie gesagt, es ist ja [mm] \sigma [/mm] < 3.
Grüße
|
|
|
|
Hallo,
> Hallo,
>
> ich habe eine Frage zu den Konfidenzintervallen, weil es
> hierzu ja zwei Formeln gibt:
>
> 1. [mm]h_{n}-z*\wurzel{\bruch{p(1-p)}{n}}\le[/mm] p [mm]\le h_{n}+z*\wurzel{\bruch{p(1-p)}{n}}[/mm]
>
> 2. [mm]h_{n}-z*\bruch{1}{2*\wurzel{n}} \le[/mm] p [mm]\le h_{n}+z*\bruch{1}{2*\wurzel{n}}[/mm]
>
Sagen wir mal so: diese zwei hast du bis jetzt kennen gelernt. Geben tut es theoretisch mindestens so viele, wie es unterschiedliche Wahrscheinlichkeitsverteilungen gibt...
> Ich habe mal eine Aufgabe mit beiden Varianten gerechnet,
> es kam nicht unbedingt immer dasselbe heraus. Deswegen,
> wann benutzt man denn welche?? Da in meinen Aufgaben
> unterschiedliche Ergebnisse herauskamen, kann es ja nicht
> ganz so egal sein?
>
>
> Dann habe ich noch eine zweite Frage zu den Sigma-Regeln:
>
> Aufgabe: Von einer Produktionsstraße für Dachpfannen
> werden 200 Stück auf Fehler überprüft, wobei die Straße
> einen Ausschussanteil von 3% hat. Berechne die Mindest- und
> Höchstanzahlen der möglichen Ausschussteile bei einer
> Sicherheit von 90%.
>
> Ich hätte diese Aufgabe mit der Sigma-Regel gelöst.
>
> Sei X binomialverteilt (Ausschussanteil) mit n=200 und
> p=0,03.
>
> E(x)=6, [mm]\sigma=\wurzel{V(x)}=2,412<3,[/mm] also eigentlich
> kleiner als 3. Rechne ich mit den Sigmaregeln trotzdem, so
> muss ich
>
> [mm][\mu-1,64*\sigma; \mu+1,64*\sigma][/mm] berechnen, da z=1,64 bei
> 90%-iger Sicherheit ist.
>
> Also [3;9]
>
> Meine Frage, wie würde ich vorgehen, wenn ich die
> Simga-Regeln nicht beachte, wie gesagt, es ist ja [mm]\sigma[/mm] <
> 3.
>
Es ist so: beide Intervall-Formeln dienen dazu, ein Konfidenz- bzw. Vertrauensintervall für eine Wahrscheinlichkeit zu finden. Im ersten Fall geht man davon aus, dass die zugrunde liegende Verteilung eine Binomialverteilung ist, im zweiten Fall sieht mir das so aus, dass es um das Intervall einer Standardnormalverteilung geht, wobei eine transformierte Zufallsvariable z zum Einsatz kommt, durch die dann noch die Parameter der zugrundeliegenden Normalverteilung berücksichtigt werden.
Wenn ihr also die [mm] \sigma>3-Regel [/mm] beachten sollt, dann wäre hier die erste 'Formel' zuständig.
Gruß, Diophant
|
|
|
|
|
Hi,
ich gebe mal noch ein konkretes Aufgabenbeispiel:
Ein Hersteller von Kosmetikprodukten produziert unter anderem Pumpflaschen mit Duschgel. Die Qualität der Pumpflaschen ist im Folgenden zu untersuchen. Die Pumpflaschen mit dem Duschgel werden vor dem Verpacken kontrolliert. Bei 5% der Flaschen ist das Etikett nicht richtig aufgeklebt, bei 15% der Flaschen funktioniert der Pumpmechanismus nicht.
Die Pumpmechanismen der Flaschen werden aufgrund häufiger Kundenbeschwerden überprüft. Die Prüfung wird an 600 zufällig ausgewählten Flaschen durchgeführt. Dabei werden 200 defekte Pumpmechanismen gefunden.
Berechnen Sie näherungsweise das auf diese Stichprobe bezogene 95%-Vertrauensintervall
[mm] [p_{1};p_{2}] [/mm] für den Anteil der defekten Pumpflaschen in der Grundgesamtheit.
Für mich handelt es sich hier auch um eine Binomialverteilung. In der Lösung benutzen die jedoch die "2" Formel. Ich würde jedoch die "1" bevorzugen und komme damit leicht auf ein anderes Ergebnis.
Welche Formel sollte man denn nun hier verwenden??
|
|
|
|
|
Hallo,
> Ein Hersteller von Kosmetikprodukten produziert unter
> anderem Pumpflaschen mit Duschgel. Die Qualität der
> Pumpflaschen ist im Folgenden zu untersuchen. Die
> Pumpflaschen mit dem Duschgel werden vor dem Verpacken
> kontrolliert. Bei 5% der Flaschen ist das Etikett nicht
> richtig aufgeklebt, bei 15% der Flaschen funktioniert der
> Pumpmechanismus nicht.
>
> Die Pumpmechanismen der Flaschen werden aufgrund häufiger
> Kundenbeschwerden überprüft. Die Prüfung wird an 600
> zufällig ausgewählten Flaschen durchgeführt. Dabei
> werden 200 defekte Pumpmechanismen gefunden.
> Berechnen Sie näherungsweise das auf diese Stichprobe
> bezogene 95%-Vertrauensintervall
> [mm][p_{1};p_{2}][/mm] für den Anteil der defekten Pumpflaschen in
> der Grundgesamtheit.
>
> Für mich handelt es sich hier auch um eine
> Binomialverteilung. In der Lösung benutzen die jedoch die
> "2" Formel. Ich würde jedoch die "1" bevorzugen und komme
> damit leicht auf ein anderes Ergebnis.
>
> Welche Formel sollte man denn nun hier verwenden??
Natürlich ist es eine Binomialverteilung. Die Standardabweichung ergibt sich zu
[mm] \sigma=\wurzel{600*\bruch{1}{3}*\bruch{2}{3}}\approx{11.5}>3
[/mm]
Also ist das gängige Kriterium erfüllt, dass man hier die Binomialverteilung durch eine Normalverteilung approximieren kann. Und das soll hier offensichtlich so gemacht werden, du musst dir aber klarmachen, dass die Gründe hier nicht rein mathematischer Natur sind.
Um diese Problematiken rund um die Annäherung der Binomialverteilung durch eine Normalverteilung aus heutiger Sicht besser verstehen zu können, muss man sich mal gedanklich in Zeiten zurückversetzen, als es überhaupt noch keine elektronischen Rechenhilfmsittel gab. Dadurch war eine ganz praktische Notwendigkeit gegeben, monströse Rechnungen wie einen Wert der kumulierten Binomialverteilung für große n irgendwie mit akzeptablem Rechenaufwand anzunähern. Und hier war eben der Zentrale Grenzwertsatz einfach aus ganz praktischen Gründen ein Segen: man braucht, wenn man ihn anwendet, nur noch eine Tabelle der Standardnormalverteilung, mit der dann solche Rechnungen eben damals schon in absehbarer Zeit bewerkstelligt werden konnten.
Versuche einmal, wenn du den Stoff noch einmal rekapitulierst, auf Hinweise zu achten, dass hier vieles nicht zwangsweise, also aus mathematischen Gründen, so und nicht anders gemacht werden muss, sondern dass es durchaus auch unterschiedliche Gepflogenheiten gibt, je nachdem, welcher Gesichtspunkt im Vordergrund steht. Das können die Rechengenauigkeit, der Rechenaufwand, die mathematische 'Exaktheit' und auch noch einige andere Dinge sein.
Gruß, Diophant
|
|
|
|
|
Hi nochmal,
vielen dank für die Ausführungen.
D.h. ja eigentlich, die erste Formel zu benutzen wäre auch nicht falsch, oder?
Grüße
|
|
|
|
|
Hallo,
> Hi nochmal,
>
> vielen dank für die Ausführungen.
>
> D.h. ja eigentlich, die erste Formel zu benutzen wäre auch
> nicht falsch, oder?
Das hast du richtig erkannt.
Gruß, Diophant
|
|
|
|
|
Hallo,
ich habe hierzu nochmal eine Frage.
Wenn ich die Konfidenzellipsen zeichnen möchte, welche Funktionen sind das dann?
Die hier:
[mm] y_1=n*p+z*\wurzel{n*p*(1-p)}, [/mm] z=Radius der Umgebung
[mm] y_1=n*p-z*\wurzel{n*p*(1-p)}
[/mm]
oder
[mm] y_1=h_{n}-z\cdot{}\wurzel{\bruch{p(1-p)}{n}}
[/mm]
[mm] y_2=h_{n}+z\cdot{}\wurzel{\bruch{p(1-p)}{n}}
[/mm]
??
Danke für eure Hilfe.
Grüße
|
|
|
|
|
Moin,
> Hallo,
>
> ich habe hierzu nochmal eine Frage.
>
> Wenn ich die Konfidenzellipsen zeichnen möchte, welche
> Funktionen sind das dann?
>
> Die hier:
>
> [mm]y_1=n*p+z*\wurzel{n*p*(1-p)},[/mm] z=Radius der Umgebung
> [mm]y_1=n*p-z*\wurzel{n*p*(1-p)}[/mm]
>
> oder
>
> [mm]y_1=h_{n}-z\cdot{}\wurzel{\bruch{p(1-p)}{n}}[/mm]
> [mm]y_2=h_{n}+z\cdot{}\wurzel{\bruch{p(1-p)}{n}}[/mm]
>
> ??
>
letztere. Siehe hier.
Gruß, Diophant
|
|
|
|
|
> Hallo,
>
> ich habe eine Frage zu den Konfidenzintervallen, weil es
> hierzu ja zwei Formeln gibt:
>
> 1. [mm]h_{n}-z*\wurzel{\bruch{p(1-p)}{n}}\le[/mm] p [mm]\le h_{n}+z*\wurzel{\bruch{p(1-p)}{n}}[/mm]
>
> 2. [mm]h_{n}-z*\bruch{1}{2*\wurzel{n}} \le[/mm] p [mm]\le h_{n}+z*\bruch{1}{2*\wurzel{n}}[/mm]
>
> Ich habe mal eine Aufgabe mit beiden Varianten gerechnet,
> es kam nicht unbedingt immer dasselbe heraus. Deswegen,
> wann benutzt man denn welche?? Da in meinen Aufgaben
> unterschiedliche Ergebnisse herauskamen, kann es ja nicht
> ganz so egal sein?
Hallo Steve
Falls der Wert von p bekannt ist, sollte man die erste
Formel nehmen, die p wirklich enthält. Sie liefert im
Allgemeinen eine schärfere (engere) Abschätzung des
Vertrauensintervalls als die zweite Formel.
Die zweite geht aus der ersten hervor, wenn man bedenkt,
welche Zahlenwerte der Term T = p*(1-p) überhaupt
annehmen kann. Es muss ja $\ [mm] 0\le [/mm] p [mm] \le [/mm] 1$ gelten und
deshalb $ [mm] 0\le T\le \frac{1}{4}$ [/mm] (zugehörige Parabel betrachten !
Die resultierende Ungleichungskette ist aber außer im
Fall [mm] p=\frac{1}{2} [/mm] schwächer als die ursprüngliche.
Man sollte sie also wenn immer möglich nicht gebrauchen,
wenn von p bekannt ist, dass es entweder nahe bei 0 oder
nahe bei 1 liegt ! Nur falls über p keinerlei nähere
Information als eben $\ [mm] 0\le [/mm] p [mm] \le1$ [/mm] vorliegt, sollte man
deshalb zur schwächeren Formel (2.) greifen !
LG , Al-Chwarizmi
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 09:42 Di 15.07.2014 | Autor: | steve.joke |
Danke euch!!
|
|
|
|