Metrik für Distributionen < stoch. Analysis < Stochastik < Hochschule < Mathe < Vorhilfe
|
Aufgabe | Kurzfassung:
Gegeben sind diskrete eindimensionale Zufallsvariablen.
Bereits berechnet habe ich ihre PDFs und CDFs.
Nun suche ich einen Weg diese zu vergleichen. |
Hallo Community,
ich bin auf der Suche nach einer Möglichkeit PDFs (Probability distribution functions) oder CDFs (cumulative distribution functions) zu vergleichen.
Ich muss allerdings zugeben, dass die Stochastik nicht meine Paradedisziplin in der Mathematik ist.
Ich habe schon ein paar Tage nach Ansätzen dafür gesucht, aber noch keine Möglichkeit gefunden, die ich gut genug verstehe um es tatsächlich anwenden zu können.
Was ich bisher als beste Möglichkeit gefunden habe sind die
Kantorovich distance oder die Wasserstein Metric (Welche erstere ja verallgemeinert).
[mm] $d_{1}(P,\hat{P}) [/mm] = [mm] \sup [/mm] ( [mm] \int [/mm] h dP - [mm] \int [/mm] h [mm] d\hat{P}$ [/mm] : [mm] $\or$ [/mm] $|h(u) - h(v)| [mm] \le \| [/mm] u - v [mm] \|$ [/mm] )
Für H ist allerdings nur angegeben, dass es sich um eine Familie von Funktionen handelt.
Weiß daher nicht, wie ich es im praktischen Fall anwenden könnte.
Ansonsten könnte es mir helfen, wenn jemand eine Distanz für Zufallsvariablen wüsste, da ich dann das Dualproblem lösen könnte.
Die verallgemeinerte Wasserstein Metrik
[mm] $d_r(P,\hat{P}) [/mm] = ( [mm] \int d(w,\hat{w})^r \pi [d(w),d(\hat{w})] [/mm] )^(1/r)$
kann ich leider auch nicht anwenden, da ich nicht gut genug verstehe, was konkret [mm] $\pi$ [/mm] sein soll..
In anderen Foren habe ich dazu nichts gefunden oder geposted, bin aber über nützliche Links genau so dankbar wie für Antworten
MfG
Ringodini
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
|
|
|
|
Hiho,
vielleicht sollten wir erstmal Begrifflichkeiten klären.
Du schreibst, du möchtest die "Probability distribution functions" und die "cumulative distribution functions" miteinander Vergleichen.
Im Normalfall meint man mit "Probability distribution functions" einfach die Zähldichte und mit "cumulative distribution functions" die Verteilungsfunktion, zumindest soweit mir bekannt ist.
Da man das eine aus dem jeweils anderen im diskreten Fal problemfrei durch Summation (bzw. Subtraktion) herleiten kann, gibt es da eigentlich nichts zu vergleichen.
Oder möchtest du zwei Verteilungen miteinander vergleichen? Danach sieht es mir nämlich bei deinen Metrikvorschlägen aus.
Eine Metrik für [mm] $L^2$-Zufallsvariablen [/mm] wäre bspw $d(X,Y) = [mm] \sqrt{E\left[(X-Y)^2\right]}$, [/mm] auf dem [mm] L^1 [/mm] könnte man $d(X,Y) = [mm] E\left[|X-Y|\right]$ [/mm] nehmen.
Soviel erstmal dazu.
Gruß,
Gono.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 10:28 So 03.11.2013 | Autor: | Ringodini |
Die Übersetzungen sind soweit richtig.
Und ja, ich möchte zwei PDFs miteinander vergleichen (oder sollte jemand ein Argument haben warum es sinnvoller ist CDFs miteinander zu vergleichen auch diese).
Ich möchte jedoch NICHT die PDF mit der zugehörigen CDF vergleichen.
Tut mir leid, falls ich mich da undeutlich ausgedrückt habe.
Ich hoffe es ist jetzt ein wenig klarer.
|
|
|
|
|
Hiho,
da ja nur noch die Metrik für Verteilungsfunktionen offen ist, könntest du dir mal die Lévy-Prokhorov Metrik anschauen, wobei dir da eher die Definition über Verteilungsfunktionen zusagen dürfte:
$d(F,G) = [mm] \inf\left\{\varepsilon>0\;:\;\forall x\in\IR \; F(x-\varepsilon) - \varepsilon \le G(x) \le F(x+\varepsilon) +\varepsilon \right\}$
[/mm]
Die Metrik induziert die Topologie der schwachen Konvergenz auf dem Raum der Verteilungsfunktionen und dürfte daher am ehesten dem entsprechen, was man sich unter einem "Abstand" vorstellt.
Gruß,
Gono.
|
|
|
|