Benford'sches Gesetz < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Aufgabe | Mathematisch ergibt sich als Häufigkeit für n als erste Ziffer:
[mm] f_n [/mm] = [mm] log_{10}(1 [/mm] + [mm] \bruch{1}{n})
[/mm]
Wie erklärt sich diese seltsame Häufigkeitsverteilung? Die Häufigkeiten für z. B. Geldbeträge sollten unabhängig von der verwendeten Währung sein. Beträgt der Umrechnungsfaktor zwischen Euro und Dollar 1 € = 1.2 USD, so sollte ein Geldbetrag zwischen 1 € und 10 € genausohäufig wie ein Geldbetrag zwischen 1.2 USD und 12 USD sein. Bei gleichmäßig verteilten Häufigkeiten wäre die Häufigkeit der Euro-Beträge proportional 10 - 1 = 9 und die Häufigkeit der Dollar-Beträge proportional zu 12 - 1.2 = 10.8. Gehen wir aber davon aus, dass nicht die Zahlen selbst, sondern ihre Logarithmen gleichmäßig verteilt sind, so erhalten wir die gewünschte Unabhängigkeit: ln(10) - ln(1) = [mm] ln(\bruch{10}{1}) [/mm] = [mm] ln(\bruch{12}{1.2}) [/mm] = ln(12) - ln(1,2) |
Ich grübel schon eine Weile über dieser Erklärung und werde nicht schlau daraus. Wer versteht sie und kann sie mir verständlich machen?
Der Satz
"Bei gleichmäßig verteilten Häufigkeiten wäre die Häufigkeit der Euro-Beträge proportional 10 - 1 = 9 ..."
ist mir schleierhaft. Wie kann denn die Häufigkeit von Beträgen proportional zu einer Konstanten (9) sein? (Wie kann überhaupt irgendetwas (außer einer Konstanten) proportional zu einer Konstanten sein?)
Alles was danach kommt ist mir auch unklar, insbesondere dann auch, was es mit 10 - 1 = 9 bzw. 12 - 1.2 = 10.8 auf sich hat und wie das im Zusammenhang steht mit der Formel
[mm] f_n [/mm] = [mm] log_{10}(1 [/mm] + [mm] \bruch{1}{n}).
[/mm]
Vielleicht ergibt die Erklärung ja Sinn für jemanden, der ohnehin schon weiß, was damit gemeint ist und kann sie mir erläutern.
Vielen Dank!
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 12:58 Sa 20.07.2019 | Autor: | Infinit |
Hallo sancho1980,
eine richtige Aufgabe ist ja damit nicht verbunden, aber aus mathematischer Sicht (auch wenn ich Ingenieur bin) halte ich diesen Text für grauenvoll. Mit Deinem Kommentar zur Propoartionalität hast Du natürlich recht. Was damit ausgedrückt werden soll,nehme ich mal an, ist, dass man bei der Analyse großer Datensätze erwarten würde, dass alle Ziffern zwischen 1 und 9 gleichverteilt vorkommen würden, das ist aber interessanterweise für etliche Datensätze nicht der Fall. Die Verteilung der logarithmierten Erstziffer ist mit guter Näherung normalverteilt. Das Bendfordsche Gesetz ist in diesem Sinne keine mathematische Gesetzmäßigkeit, sondern eine an der Praxis erprobte Berechnungsformel, die häufig der wirklichen Verteilung sehr nahe kommt. Im Wikipedia-Aufsatz zu diesem Gesetz findest Du mehr darüber. Die ganze Argumentation zu diesem Gesetz greift natürlich nur, wenn man "genügend nahe" mit dieser Formel an die reell existierende Ziffernverteilung herankommt, man muss also einen Test dazu durchführen und aus dessen Ergebnis dann bestimmen, ob man der Aussage, dass ein bestimmter Datensatz Benford-verteilt ist, zustimmt oder eben nicht.
Der Begriff der Unabhängigkeit im letzten Paragraph ist extrem unglücklich gewählt, denn er hat nichts mit einer statistischen Unabhängigkeit zwischen Datensätzen zu tun. Gerade das Beispiel mit der Umrechnung von Euro in Dollar zeigt dies, denn sellbstverständlich sind beide Datensätze abhängig voneinander. Was hier wohl gemeint ist, ist, dass die Skalierung eines Datensatzes mit einer Konstanten (hier der Umrechnungsfaktor von 1,2) nichts an der Benford-Verteilung ändert, sie verschiebt sie nur, da sich durch den Logarithmus ein konstanter Faktor als konstante additive Größe abbildet, an der Verteilung selbst aber nichts ändert.
Das sind so meine ersten Gedanken zu diesem Text, der nicht gerade sauber formuliert ist, wie ich meine.
Ich lasse mal Deine Frage auf "teilbeantwortet", vieleicht hat ja noch jemand anders Lust, sich dazu zu äußern.
Viele Grüße,
Infinit
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 23:20 So 21.07.2019 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|