Genom Taufliege < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 15:32 Do 06.10.2011 | Autor: | mikexx |
Aufgabe | Hallo, liebe Helferinnen und Helfer!
Ich habe mich auf die Suche nach ein paar Stochastikaufgaben gemacht und bin in Georgii, "Stochastik" auf folgende Aufgabe gestoßen:
2.9 Das Genom der Taufliege Drosophila melanogaster gliedert sich in etwa m=7000 Abschnitte (die anhand des Färbungsmusters der in den Speicheldrüsen befindlichen Riesenchromosomen erkennbar sind). Zur Vereinfachung sei angenommen, dass sich in jedem Abschnitt gleich viele, nämlich M=23000 Basenpaare befinden. Das Genom umfasst also N=mM Basenpaare. Durch hochenergetische Bestrahlung werden n=1000 (rein zufällig verteilte) Basenpaare zerstört. Finden Sie ein stochastisches Modell für die Anzahl der zerstörten Basenpaare in allen Genomabschnitten. Berechnen Sie für jedes [mm]1\leq i\leq m[/mm] die Verteilung der Anzahl [mm]Z_i[/mm] der zerstörten Basenpaare im Abschnitt i und begründen Sie, dass [mm]Z_i[/mm] approximativ Poisson-verteilt ist. |
Ich bin ein wenig überfordert mit dieser Aufgabe.
Wirkliche Ideen habe ich keine, nur ein paar Dinge sind mir dazu in den Kopf gekommen:
Spontan kam mir für jeden Abschnitt der Begriff "Binomialverteilung" (Basenpaar zerstört oder nicht zerstört) in den Sinn. Möglich wäre aber für jeden Abschnitt auch eine hypergeometrische Verteilung, indem man die zerstörten Basenpaare (0,1,...,1000) von den intakten Basenpaaren unterscheidet.
Ich tendiere zu der Binomialverteilung, da man dann für den letzten Teil der Aufgabe die Poisson-Approximation der Binomialverteilung bestimmt irgendwie verwenden könnte, wenn ich auch nicht weiß, wie.
So wirklich konkret weiter komme ich jedenfalls nicht (zumal ich nicht weiß, was mit "Modell" in der Aufgabenstellung gemeint ist) und wäre daher dankbar für jede Hilfe.
Liebe Grüße
mikexx
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 16:28 Do 06.10.2011 | Autor: | Harris |
Hi!
Finden Sie ein stochastisches Modell für die Anzahl der zerstörten Basenpaare in allen Genomabschnitten
Du hast eine Urne (das Genom) mit N Kugeln. Diese sind in m Farben (Genomabschnitte) gefärbt, so dass jede Farbklasse also M Mitglieder (Basenpaare) hat.
Nachdem ein Basenpaar getroffen wurde, ist es kaputt und kann nicht mehr getroffen werden. Klingt nach 1000-maligem Ziehen aus einer Urne ohne Zurücklegen -> Hypergeometrische Verteilung.
Berechnen Sie für jedes [mm] $1\leq i\leq [/mm] m$ die Verteilung der Anzahl [mm] $Z_i$ [/mm] der zerstörten Basenpaare im Abschnitt i
Ich habe m Felder an der Wand und werfe zufallsbasiert meinem Dartpfeil auf die Wand. Mit Wahrscheinlichkeit 1/m treffe ich ein bestimmtes Feld i, die Wahrscheinlichkeit eines Nichttreffers liegt bei (m-1)/m. Dieses Experiment wird 1000 Mal durchgeführt. Dies liefert eine Binomialverteilung.
[mm] $Z_i$ [/mm] ist approximativ Poisson-verteilt
Lasse die Anzahl der Genomabschnitte gegen unendlich Laufen. Die Wahrscheinlichkeit für einen bestimmten Abschnitt wird somit kleiner und kleiner. Die Anzahl der radioaktiven Strahlen lässt du auch gegen unendlich laufen. Im Grenzwert ergiebt sich die Poisson-Verteilung.
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 16:44 Do 06.10.2011 | Autor: | mikexx |
Sehe ich das richtig, dass die Aufgabe also folgende Unterscheidung macht:
1.) Man sucht eine Verteilung für alle Genomabschnitte zusammen; das ist die hypergeometrische.
2.) Man sucht eine Verteilung für jeden einzelnen Abschnitt; das ist die binomiale?
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 17:15 Do 06.10.2011 | Autor: | Harris |
Bei der ersten Frage schaut man auch IN die Genomabschnitte hinein. Man kathegorisiert also alle Basenpaare nach ihrer Zugehörigkeit und wählt nach und nach welche aus.
Da ein Basenpaar nicht zweimal zerstört werden kann, ändert sich die Wahrscheinlichkeit für einen Treffer eines Abschnittes pro Schuss.
Bei der zweiten Frage wählt man nacheinander Genomabschnitte aus. Hat man einen ausgewählt, so zerstört man ein darin enthaltenes Basenpaar. Hierbei bleibt die Wahrscheinlichkeit eines Treffers gleich.
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 17:13 Do 06.10.2011 | Autor: | mikexx |
Mal schauen, ob ich Dich verstanden habe!
Finden Sie ein stochastisches Modell für die Anzahl der zerstörten Basenpaare in allen Genomabschnitten.
Man sucht also nach einer Wahrscheinlichkeits-Beschreibung (universell für jeden Abschnitt, gleich, welchen man betrachtet) für die Anzahl zerstörter Basenpaare in einem Abschnitt (wie gesagt: Diese Beschreibung soll für jeden Abschnitt gelten).
Da komme ich dann auf
[mm]\sum_{y=0}^{k}\frac{\binom{23000}{y}\binom{mM-23000}{1000-y}}{\binom{mM}{1000}}[/mm], wobei [mm]k\leq 1000[/mm].
Diese Wahrscheinlichkeit könnte man auch mit [mm]P(Z_i\leq k)[/mm] bezeichnen, oder?
Berechnen Sie für jedes [mm]1\leq i\leq m[/mm] die Verteilung der Anzahl [mm]Z_i[/mm] der zerstörten Basenpaare im Abschnitt i...
Dies meint (so, wie ich es nun verstanden habe) zum Beispiel: Im Abschnitt 7 seien 70 zerstörte Basenpaare. Wie wahrscheinlich ist das? (Nur mal so als Verständnisbeispiel...)
Da komme ich dann allgemein auf:
[mm]P(Z_i=k)=\binom{23000}{k}\left(\frac{1}{7000}\right)^k\cdot \left(\frac{6999}{7000}\right)^{23000-k}[/mm].
...und begründen Sie, dass [mm]Z_i[/mm] approximativ Poisson-verteilt ist.
Hier komme ich noch nicht klar.
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 17:31 Do 06.10.2011 | Autor: | Harris |
Wie bei vielen Stochastik-Aufgaben kann man über Lösungsansätze diskutieren.
Auch hier: Ändert sich die Wahrscheinlichkeit eines Treffers in einem Genomabschnitt nach Treffen eines Basenpaares? Können Basenpaare mehrmals getroffen werden? usw...
Für die Interpretation von vorhin denke ich, ist die Aufgabe richtig gelöst.
Zur letzten Aufgabe: Anzahl der Schüsse und Wahrscheinlichkeit eines Treffers verändern sich, jedoch das Produkt soll gleich bleiben. (die Anzahl der Abschnitte verdoppelt sich, also halbiert sich die Wahrscheinlichkeit eines Treffers. Also müssen doppelt so viele Schüsse abgegeben werden).
Dies identifiziert man i.A. mit [mm] $np=\lambda$
[/mm]
Mit dem Ansatz
[mm] $lim_{n\rightarrow\infty}P(X=k)=lim_{n\rightarrow\infty}\frac{n!}{k!\cdot(n-k)!}p^k(1-p)^{n-k},$
[/mm]
dem Zusammenhang
[mm] $p=\frac{\lambda}{n}$
[/mm]
und der Kenntnis von
[mm] $lim_{n\rightarrow \infty} \left(1+\frac{x}{n}\right)^n=e^x$
[/mm]
sind das nur wenige Rechenschritte. Blättere bei Wikipedia "Poisson-Verteilung" nicht zu weit nach hinten, sonst verdirbst du dir den Rechenspaß.
Ist - wie ich finde - ein wunderschöner Zusammenhang.
Gruß,
Harris
|
|
|
|
|
Status: |
(Frage) überfällig | Datum: | 17:47 Do 06.10.2011 | Autor: | mikexx |
Zunächst freue ich mich, daß die ersten beiden Teilaufgaben richtig zu sein scheinen.
Bei der dritten Teilaufgabe, die Du sicher sehr gut beschrieben hast, habe ich aber eine grundsätzliche Frage:
Was muss ich denn hier überhaupt (für eine angemessene Begründung der Behauptung) eigentlich zeigen? Das ist mir noch nicht klar und sollte ich zunächst klären.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 18:20 Sa 08.10.2011 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|
|
Status: |
(Frage) überfällig | Datum: | 23:01 Do 06.10.2011 | Autor: | mikexx |
In einem anderen Forum habe ich gelesen, dass das mit der Binomialverteilung hier nicht stimmt, sondern dass die Aufgabe nur zwei Teilaufgaben hat.
http://www.matheboard.de/thread.php?postid=1476769#post1476769
Jetzt bin ich irgendwie verwirrt.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 23:20 Sa 08.10.2011 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|