Realisierung z der standardisierten Zufallsvariable Z:
$$ \text{z} = \frac{\frac{1}{\text{N}} \sum_{k=1}^{\text{N}} \left( x_{k} - \mu \right)}{\frac{1}{\sqrt{ \text{N}} } \sigma } $$Verteilung der Realisierungen z der standardisierten Zufallsvariable Z auf Basis von 1000 Wiederholungen:
Aufgabenstellung
- Machen Sie sich mit unterschiedlichen Verteilungen, sowie deren Verteilungsparametern vertraut.
- Navigieren Sie im Reiter ganz oben zum Tab "Statistische Verteilungen". Wählen Sie im linken Panel die "Normalverteilung" als Verteilung aus und setzen sie sie Anzahl der Realisierungen zunächst auf "100". Schauen sie sich die oberen 3 Abbildungen an und versuchen Sie die Abbildungen nachzuvollziehen.
- Variieren Sie mehrmals die Verteilungsparameter sowie die Anzahl der Realisierungen. Versuchen Sie die Änderungen mithilfe der oberen Abbildungen nachzuvollziehen.
- Wiederholen Sie nun auch die vorherigen Schritte für die übrigen Eingangsverteilungen. Inwiefern ändert sich der Q-Q-Plot im Vergleich zur Normalverteilung? Warum ist das so?
- Wenden Sie den Zentralen Grenzwertsatz an.
- Wählen Sie die "Exponentialverteilung" als Eingangsverteilung mit "100" Realisierungen aus und berechnen Sie die Realisierung der Zufallsvariable. Versuchen Sie die Berechnung nachzuvollziehen.
- Wiederholen Sie diesen Schritt 1000 mal, indem Sie den Button 1000 Wiederholen generieren drücken. Es werden nun bei fixen Verteilungsparametern zufällig 1000 Stichproben generiert und die zugehörige Realisierung z der standardisierten Zufallsvariable Z berechnet. Die Verteilung dieser Realisierungen z werden unten in analogen Abbildungen zu denen der Eingangsverteilung dargestellt. Was fällt im Vergleich zur Eingangsverteilung auf?
- Wiederholen Sie die Schritte für unterschiedliche Realisierungs-Anzahlen N von "5" bis "500". Was fällt auf?
- Probieren Sie nun auch die übrigen Eingangsverteilungen aus. Gibt es Unterschiede zwischen den Fällen (auch hinsichtlich des Einflusses von N)?
- Untersuchen Sie die Verteilung von Niederschlagssummen unterschiedlicher Aggregationszeiten.
- Navigieren Sie im Reiter ganz oben zum Tab "Beispiel: Aggregierte Niederschlagssummen" und wechseln sie zwischen den unterschiedlichen Aggregationsintervallen durch. Welche Systematik lässt sich hinsichtlich der Verteilung erkennen. Versuchen Sie die Ergebnisse zu erklären.
Anleitung und Hilfe
Hier werden die Wahrscheinlichkeitsdichte F(x), die Wahrscheinlichkeitsverteilung f(x) und der Quantil-Quantil Plot von verschieden auswählbaren Eingangsverteilungen sowie von der daraus berechneten standardisierten Zufallsvariable Z dargestellt.
Eingabe - Linkes Panel
Im linken Panel wird die Art der zugrundeliegenden Eingansverteilung sowie deren individuelle Verteilungsparameter aus der nachfolgend zufällig Werte (Realisierungen x) generiert werden, ausgewählt. Die Anzahl N der Realisierungen die generiert werden soll, kann ebenfalls bestimmt werden.
Mithilfe der Option Zeige Standardnormalverteilung können zusätzlich die Kurven für die Standardnormalverteilung auf den Abbildungen hinzugefügt werden.
Ausgabe - Rechtes Panel
Dargestellt werden zunächst 3 Abbildungen (oben). In der 1. Abbildung (links, unten) wird die Wahrscheinlichkeitsdichte der zufällig generierten Realisierungen x mittels Histogramm dargestellt.
In der 2. Abbildung (Mitte, unten) wird die Wahrscheinlichkeitsverteilung der zufällig generierten Realisierungen x dargestellt.
In der 3. Abbildung (rechts, oben) werden die Quantile der zufällig generierten Realisierungen x gegenüber den theoretischen Quantilen einer Normalverteilung mithilfe eines Quantil-Quantil Plots gegenübergestellt. Wenn alle Punkte auf einer Geraden liegen, dann kann davon ausgegangen werden, dass die zugrundeliegende Verteilung die einer Normalverteilung entspricht. Markante und systematische Abweichungen deuten hingegen auf eine andere Verteilung hin.
Unter den 3 Abbildungen wird die Berechnung der Realisierung z der standardisierten Zufallsvariable Z in Ahängigkeit von N, μ und σ dargestellt. Als Basis für die Berechnung von z dienen die Realisierungen x, die anhand der ausgewählten Eingangsverteilung zufällig generiert wurden.
Um die Verteilung der Realisierungen der standardisierten Zufallsvariable zu erhalten, wird der oben genannte Schritt 1000x wiederholt, so dass 1000 Sätze von zufälligen Realisierungen x generiert werden und anschließend für jeden Satz die zugehörige Realisierung z der standardisierten Zufalssvariable Z berechnet wird. Hierzu muss der 1000 Wiederholungen-Button aktiviert werden. Beachte, dass dieser Schritt bei jeder Änderung der Eingangsparameter erneut durchgeführt werden muss.
Nach erfolgreicher Betätigung des 1000 Wiederholungen-Buttons, wird nachfolgend die Verteilung der 1000 resultierenden, Realisierungen z der standardisierten Zufallsvariablen Z anhand von den bereits bekannten, oben beschriebenen, Abbildungen visualisiert. In der 1. Abbildung (links, unten) wird die Wahrscheinlichkeitsdichte der resultierenden Realisierungen z der standardisierten Zufallsvariablen Z mittels Histogramm dargestellt.
In der 2. Abbildung (Mitte, unten) wird die (kumulative) Verteilungsfunktion der resultierenden Realisierungen z der standardisierten Zufallsvariablen Z dargestellt.
In der 3. Abbildung (rechts, unten) werden die Quantile der resultierenden Realisierungen z der standardisierten Zufallsvariablen Z gegenüber den theoretischen Quantilen einer Normalverteilung mithilfe eines Quantil-Quantil Plots gegenübergestellt. Wenn alle Punkte auf einer Geraden liegen, dann kann davon ausgegangen werden, dass die zugrundeliegende Verteilung die einer Normalverteilung entspricht. Markante und systematische Abweichungen deuten hingegen auf eine andere Verteilung hin.
Aufgaben-Panel
Zusätzlich zum Reiter Aufgabenstellung kann die Aufgabenstellung in einem separaten Fenster dargestellt werden. Dieses Fenster ist frei beweglich und kann mit der Maus (via Drag & Drop) zur gewünschten Position verschoben werden. Ein- bzw. ausgeblendet wird das zusätzliche Fenster im Reiter Aufgabenstellung.
Weitere Informationen
- Weitere Informationen zum Zentralen Grenzwertsatz sind auf der Webseite des FUB E-Learning Projekts SOGA (https://www.geo.fu-berlin.de/en/v/soga/Basics-of-statistics/Central-Limit-Theorem/index.html; Hartmann, K., Krois, J., Waske, B. (2018): E-Learning Project SOGA: Statistics and Geospatial Data Analysis. Department of Earth Sciences, Freie Universitaet Berlin.) vorhanden. Dies beinhaltet auch die Anwendung mit R.
- Vorlesungsskript (Kapitel 2.3) Angewandte Statistik (Henning Rust)
Copyright (C) 2019 Andy Richling