Wahrscheinlichkeit Krankheit < Stochastik < Hochschule < Mathe < Vorhilfe
|
Hi,
gleich noch eine Aufgabe die Probleme macht:
Eine bestimmte Krankheit kann mit Hilfe eines Bluttests zweifelsfrei diagnostiziert werden.
a) In Land A seien sechs Prozent aller Einwohner mit der Krankheit infiziert. Wie viele Einwohner müssen mindestens getestet werden, damit mit einer Wahrscheinlichkeit von mehr als 95 Prozent wenigstens eine infizierte Person entdeckt wird?
b) In Land B wurde die Krankheit erst kürzllich eingeschleppt; der Anteil p der infizierten Einwohner ist daher noch unbekannt. Um die Kosten der aufwendigen Reihenuntersuchungen zu reduzieren, schlägt einer der Mediziner folgendes Verfahren vor: Das Blut von je 30 Personen wird vermischt, und anschließend wird das Gemisch getestet. Ist der Test negativ, so sind alle 30 Personen gesund und weitere Tests überflüssig. Ist der Test hingegen positiv, so werden alle 30 Personen noch einmal einzeln getestet. Für welche Werte von p sind bei diesem Verfahren weniger Tests zu erwarten als bei der konventionellen Methode, bei der stets alle 30 Personen einzeln getestet werden, ohne eine Mischung durchzuführen?
Bei dieser Mamut-Textaufgabe bin ich erstmal sehr erschlagen. Kann mir jemand sagen welche Wahrscheinlichkeits-Formeln hier benutzt werden müssen und wie er/sie darauf gekommen ist? Ich hab zuerst mit Bayes rumprobiert, aber das führte irgendwie nicht zum Ziel. Kann mir jemand einen kleinen Tip geben?
Gruß
Andreas
|
|
|
|
Hallo, Andreas,
geh'n wir die Sache stückweise an.
Natürlich geht's hier um Binomialverteilungen, wobei in Aufgabe a) die Kettenlänge n, in Aufgabe b) die Trefferwahrscheinlichkeit p gesucht ist.
Ich helf' Dir erst mal bei a)
Also: p=0,06, n=?
"Mindestens 1 Treffer" (in unserem Fall gilt eine infizierte Person als Treffer): das ist bei unbekannter Kettenlänge n nicht berechenbar, aber: das Gegenereignis, also: kein Treffer.
Folglich lautet der Ansatz: 1 - P(X=0) > 0,95.
P(X=0) ist bei einer Binomialverteilung gleich
B(n;0,06;0)= [mm] \vektor{n \\ 0}*0,06^{0}*0,94^{n}=0,94^{n}
[/mm]
Also hast Du den Ansatz: 1 - [mm] 0,94^{n} [/mm] > 0,95.
Wie man diese Ungleichung nach n auflöst weißt Du?
(Hinweis: Logarithmus; Lösung: n > 48,4. Also: Mindestens 49 Personen müssen getestet werden. Keine Garantie für Rechenfehler!)
Schreib', wenn Du zu dieser Aufgabe noch Fragen hast; schreib' auch, wenn wir zu b) gehen können (aber vielleicht kannst Du b) ja jetzt bereits alleine?!)
mfG!
Zwerglein
|
|
|
|
|
Hallo Zwerglein,
Also danke für Erklärung jetzt sehe ich etwas klarer.
> Also hast Du den Ansatz: 1 - [mm]0,94^{n}[/mm] > 0,95.
> Wie man diese Ungleichung nach n auflöst weißt Du?
> (Hinweis: Logarithmus; Lösung: n > 48,4. Also: Mindestens
> 49 Personen müssen getestet werden. Keine Garantie für
> Rechenfehler!)
Im Prinzip schon, aber irgendwie komme ich auf etwas anderes. (Den ausführlich Schritt mit dem Logarithmus lasse ich weg)
[mm] $1-0,94^n [/mm] > 0,95$
[mm] $-0,94^n [/mm] > -0,05$
[mm] $0,94^n [/mm] < 0,05$
$n * log 0,94 < Log 0,05$
$n < 48,41$
Also die Ungleichung durch das muliplizieren mit -1 gedreht.
> Schreib', wenn Du zu dieser Aufgabe noch Fragen hast;
> schreib' auch, wenn wir zu b) gehen können (aber vielleicht
> kannst Du b) ja jetzt bereits alleine?!)
Ich hab mit der b) schon etwas rumgerechnet, aber bevor wir da anfangen wäre noch eine Grundsätzliche Frage zu beiden, bzw. zur Binominalverteilung zu klären. Soweit ich die Binominalverteilung verstehe wird ja ein Experiment mit Zurücklegen ausgeführt. Sowohl bei Teil a), als auch bei b) scheint mir das nicht sinnvoll zu sein. Man verfälscht doch die Tests, wenn eine Person mehrmals ausgewählt wird. Soweit ich jetzt schon das nächste Kapitel angefangen habe zu lesen sollte da nicht eher die Hypergeometrische Verteilung zutreffen?
Gruß
Andreas
|
|
|
|
|
Hallo, Andreas,
zur 1. Frage, also der Sache mit der Ungleichung:
Ich vermute, Du meinst mit "log" den dekadischen Logarithmus?
(Übliche Abkürzung: lg!) Dann musst Du beim letzten Schritt beachten, dass lg(0,94) eine negative Zahl ist .
Bei der Division durch lg(0,94) dreht sich also das Ungleichungszeichen wieder um! n > 48,4 ist also richtig!
Zu Frage 2: Binomialverteilung ja oder nein?
Dazu ist zu sagen, dass Du natürlich grundsätzlich recht hast, dass bei einer B-Vtlg. streng genommen "mit Zurücklegen" gezogen wird. Im "täglichen Leben" geht man jedoch oft auch dann von einer B-Vtlg. aus, wenn eine so große Grundmenge (hier: Bevölkerung eines Landes, nicht etwa nur einer Kleinstadt oder so) vorliegt, dass "das Ziehen eines einzelnen Menschen" die Trefferwahrscheinlichkeit p so wenig ändert, dass man's praktisch nicht merkt!
Wenn Du zu Frage b) schon "ein bissl rumgerechnet" hast, lass' bitte erst mal Deine Überlegungen sehen!
mfG!
Zwerglein
|
|
|
|
|
Status: |
(Frage) reagiert/warte auf Reaktion | Datum: | 22:21 Di 01.02.2005 | Autor: | andreas99 |
Hallo Zwerglein,
> (Übliche Abkürzung: lg!)
Scheint wohl unterschiedlich zu sein. In den Büchern von Papula steht log, deshalb hab ich es mir angewöhnt. Werde drauf achten.
> Dann musst Du beim letzten
> Schritt beachten, dass lg(0,94) eine negative Zahl ist .
> Bei der Division durch lg(0,94) dreht sich also das
> Ungleichungszeichen wieder um! n > 48,4 ist also richtig!
Oh, da hab ich nicht aufgepasst. Das kommt davon, wenn man den TR zu viele Schritte auf einmal machen lässt...
> Wenn Du zu Frage b) schon "ein bissl rumgerechnet" hast,
> lass' bitte erst mal Deine Überlegungen sehen!
Also meine ersten Überlegungen waren halt zu Hypergemetrischer Verteilung, aber das ist ja hier wohl auch nicht der Fall, weil ich ja hier keine Aussagen über Stichproben habe. Als ich mir das ganze nochmal durchgelesen habe, ist mir außerdem das "p" in der Frage jetzt aufgefallen. Ich vermute mal das ist ein Tip zur Binominalverteilung. Es ist also die Konstante Wahrscheinlichkeit für das Eintreten des Ereignisses (Patient aus Gruppe erkrankt) gesucht.
Da für 30 Patienten auch 30 Tests benötigt werden muss der Wert für p eben so gewählt werden, dass es weniger Tests braucht.
Die Überlegung ist erstmal folgende. Im optimalen Fall (keiner in Gruppe krank) muss ich nur einmal testen und spare also 29 Tests. Für den anderen Fall brauche ich 31 Tests, also genau einen mehr wie wenn ich alle einzeln teste.
Für x und n könnte ich mir jetzt zwei Fälle vorstellen:
schlechter Fall:
x=1 (min. mehr ist unrelevant)
n=31
guter Fall:
x=0
n=1
Soweit kommt mir das alles logisch vor, oder ist es doch eine andere Funktion? Wie ich das aber in die Gleichung einsetzen soll hab ich keine wirkliche Idee. Was ist P(X)? Der Wert ist gesucht, aber was mache ich mit q? Der ist ja dadurch auch unbekannt. Bin ich auf dem richtigen Weg und wie geht es weiter?
Gruß
Andreas
|
|
|
|
|
Hallo, Andreas,
mein Pech gereicht Dir sozusagen zum Vorteil:
Bin nämlich zur Zeit selbst krank (passend zur Aufgabe!) und kann daher für ein paar Tage nicht außer Haus!
Naja: Zur Aufgabe.
Zunächst muss Dir klar sein, dass es nur 3 Möglichkeiten gibt:
Entweder, es findet nur 1 Test statt (bester Fall)
oder es finden 31 Tests (1 Vortest + 30 eigentliche Tests) statt
oder es finden 30 Tests statt. Dazwischen gibt's nix.
Nun lautet die Frage: Für welche Trefferwahrscheinlichkeit p ist es günstig, den Vortest zu machen?
Nun, doch wohl dann, wenn man sich "ziemlich sicher" sein kann, dass man die 30 Test anschließend nicht doch noch machen muss!!!
Mathemathisch: Der Vortest ist dann günstig, wenn die Wahrscheinlichkeit, unter den 30 getesteten Personen keine einzige infizierte zu finden größer ist, als das Gegenteil, nämlich mindestens eine (1, 2, 3, ...30)
infizierte zu finden! (***)
(Bitte immer mitdenken: Ich mach' so eine Aufgabe auch zum ersten Mal und bin mir daher keineswegs 100%ig sicher!)
Wenn nun die Trefferwahrscheinlichkeit p ist, dann ist die Wahrscheinlichkeit dafür, dass ein beliebiger Mensch aus Land B nicht infiziert ist: 1-p=q.
Somit ist die Wahrscheinlichkeit, unter 30 zufällig ausgewählten Personen keine infizierte, also 30 "Gesunde" zu finden: [mm] q^{30}.
[/mm]
Umgekehrt ist die Gegenwahrscheinlichkeit, also diejenige, mindestens 1 Infizierten zu finden: [mm] 1-q^{30}. [/mm]
Nach der Vorüberlegung (***) muss nun gelten:
[mm] q^{30} [/mm] > [mm] 1-q^{30}
[/mm]
Das zu lösen ist nun noch leichter als Aufgabe a:
[mm] 2*q^{30} [/mm] > 1
[mm] q^{30} [/mm] > 0,5
q > 0,977
Demnach mus p < 0,023 sein, die "Infektionsrate" kleiner als 2,3 %
(Hoffentlich stimmt's!)
mfG!
Zwerglein
|
|
|
|