Fazitbox
Pro und Contra pp- und qq-Plot:
Pro
pp- und qq-Plots eignen sich sehr gut dazu, Unterschiede zwischen
zwei Verteilungen zu erkennen. In der Praxis werden die Plots meistens
dazu eingesetzt, um zu prüfen, ob ein Datensatz einer angenommenen
Verteilung folgt.Durch die zusätzliche Verwendung von Konfidenzbändern kann man
leichter einschätzen, ob die beobachteten Abweichungen zwischen zwei
Verteilungen über die zu erwartenden zufälligen Schwankungen
hinausgehen.
Contra
Der pp-Plot ist etwas schwerer zu interpretieren als der qq-Plot,
wobei mit dem pp-Plot Abweichungen in der Mitte der Verteilung besser
erkannt werden können, während sich der qq-Plot besser dazu eignet,
Abweichungen in den Flanken und Ausreißer zu identifizieren.Es benötigt eine gewisse Erfahrung im Umgang mit diesen Plots, um
auffällige Abweichungen zu erkennen. Gerade bei kleinen bis moderaten
Fallzahlen ist es generell schwierig, eine zuverlässige Aussage zur
Verteilung von Daten zu treffen.
Einführung
Die Gültigkeit der Ergebnisse statistischer Verfahren hängt
grundsätzlich davon ab, ob die zur Herleitung der Verfahren verwendeten
(theoretischen) Annahmen zumindest näherungsweise erfüllt sind. In der
Praxis bedeutet dies, dass man jeweils prüfen sollte, ob die gemachten
Annahmen für die erhobenen Daten gelten bzw. auf Basis der vorliegenden
Informationen zumindest plausibel erscheinen, bevor man die
statistischen Ergebnisse interpretiert und diskutiert. Häufig gehört zu
den notwendigen Voraussetzungen auch das Vorliegen einer bestimmten
(Wahrscheinlichkeits-)Verteilung, wie etwa die Normalverteilung beim
t-Test [1] oder bei linearen Modellen [2]. In der Praxis können
Verteilungsannahmen mit pp- oder qq-Plots, die speziell für den
Vergleich von Verteilungen entwickelt wurden [3] und sich hierfür besser
eignen als Histogramm oder Dichteschätzung [4], grafisch überprüft
werden. Darüber hinaus werden oft auch statistische Tests für diesen
Zweck verwendet (vgl. Abschnitt 7.2 in [5]). Diese sogenannten
Anpassungstests werden wir in diesem Tutorial nicht betrachten. Zur
Demonstration werden wir zunächst pp- und qq-Plots für verschiedene
Szenarien vorstellen, die häufig in der Praxis zu beobachtenden
Abweichungen entsprechen, und anschließend die Plots auf reale Daten
anwenden.
Probability-Probability-Plot
Beim Probability-Probability-Plot oder kurz pp-Plot handelt es sich
um ein Diagramm, in dem die Verteilungsfunktionen von zwei Verteilungen
gegeneinander aufgetragen werden. Falls die beiden Verteilungsfunktionen
identisch sind, sind auch die Verteilungen gleich. Trägt man in diesem
Fall die Werte der Verteilungsfunktionen in ein Diagramm ein, so liegen
alle Punkte auf der Geraden y = x, wobei x und y auf das Intervall [0,1]
(Wahrscheinlichkeiten) beschränkt sind. In der Praxis wird meist die
(empirische) Verteilung eines Datensatzes mit einer für die statistische
Analyse vorausgesetzten (theoretischen) Verteilung verglichen. In diesem
Fall werden die beiden Verteilungen nie völlig identisch sein, sondern
es sind gewisse zufällige Abweichungen von der Geraden y = x zu
erwarten. Es ist umgekehrt sogar so, dass eine zu perfekte
Übereinstimmung ein Hinweis auf eine Datenmanipulation sein kann. Solche
Manipulationen werden heute in der Forschung leider immer mehr zu einem
Problem [6], weshalb auch diese „umgekehrte“ Anwendung von
Verteilungsvergleichen von wachsendem Interesse ist.
Das Erkennen von auffälligen Abweichungen von der Geraden y = x
erfordert eine gewisse Erfahrung. Daher ist es hilfreich, die Gerade um
ein 95 %-Konfidenzband zu erweitern. Die Form des Konfidenzbandes zeigt
auf, welche Abweichungen und in welchem Umfang per Zufall zu erwarten
sind. Liegen auffällig viele Punkte (>5 %) außerhalb des
Konfidenzbandes, so deutet dies auf signifikante Unterschiede zwischen
den beiden verglichenen Verteilungen hin. Darüber hinaus sollte man auch
immer darauf achten, ob die eingezeichneten Punkte auffällige Strukturen
oder Trends zeigen, da diese auch typische Zeichen für Unterschiede
zwischen den beiden Verteilungen sind.
Quantil-Quantil-Plot
Im Fall des Quantil-Quantil-Plots oder kurz qq-Plots werden anstelle
der Verteilungsfunktionen die Quantilfunktionen zweier Verteilungen
verglichen, wobei die Quantilfunktion mathematisch gesprochen die
verallgemeinerte Inverse oder Pseudoinverse der Verteilungsfunktion ist.
Falls es sich um eine stetige Verteilung mit einer streng monoton
wachsenden Verteilungsfunktion handelt, entspricht die Quantilfunktion
der „üblichen“ Umkehrfunktion in der Mathematik. Zwei Verteilungen sind
identisch, falls sie identische Quantilfunktionen haben. Entsprechend
liegen in diesem Fall die Werte der Quantilfunktionen auf der Geraden y
= x, wobei aber x und y im Unterschied zum pp-Plot nicht auf das
Intervall [0,1] beschränkt sind, sondern auf den sogenannten Träger der
Verteilung. Darunter versteht man alle Werte, die eine Zufallsvariable
mit dieser Verteilung annehmen kann. Zum Beispiel ist der Träger der
Normalverteilung die Menge der reellen Zahlen, während der Träger der
log-Normalverteilung die Menge der positiven reellen Zahlen ist. Als
Träger kommt jede (nicht leere) Teilmenge der reellen Zahlen in Frage.
Zur leichteren Interpretation des Plots empfiehlt es sich, analog zum
pp- Plot, zusätzlich ein 95 %-Konfidenzband um die Gerade y = x
herumzulegen. Neben vielen Punkten (>5 %) außerhalb des
Konfidenzbandes sind auch beim qq-Plot auffällige Strukturen oder Trends
zusätzliche wichtige Hinweise auf das Vorliegen unterschiedlicher
Verteilungen.
Beispiele
Wir verwenden im ersten Schritt zwei theoretische Verteilungen, um zu
demonstrieren, wie sich bestimmte Unterschiede zwischen zwei
Verteilungen im pp- und qq-Plot zeigen. Die verschiedenen Szenarien
haben wir in Anlehnung an Abbildung 7.7 in [5] gewählt, wobei wir die
Verteilungen der verschiedenen Szenarien immer mit der Normalverteilung
vergleichen, da dies auch dem häufigsten Anwendungsfall entspricht. In
Abbildung 1 sehen wir die typische Abweichung, die entsteht, wenn die
Daten einer rechtsschiefen Verteilung anstelle einer Normalverteilung
folgen.
Im Fall der pp-Plots ist die Abweichung vor allem im Zentrum der
Verteilung deutlich zu sehen, während im Fall des qq-Plots die
Abweichung in den Flanken auffälliger ist. Dies ist auch typisch für die
beiden Plots. Mit dem pp-Plot können generell Abweichungen im Zentrum
der Verteilungen besser erkannt werden, während im qq-Plot Unterschiede
in den Flanken und Ausreißer deutlicher zu sehen sind. Im Fall einer
linksschiefen Verteilung sind die Strukturen, die man erhält, gerade
gespiegelt zur rechtsschiefen Situation, wie in Abbildung 2 zu sehen
ist.
In Abbildung 3 sehen wir den Fall, dass wir eine Normalverteilung mit
einer Verteilung vergleichen, die in der Mitte steiler ist und deutlich
breitere Flanken aufweist. In diesem Fall sind die Unterschiede im
qq-Plot deutlich stärker zu sehen als im pp-Plot.
Abb. 1: Vergleich von Dichte (Dichteplot), Verteilungsfunktion
(pp-Plot) und Quantilfunktion (qq-Plot) der Normalverteilung mit einer
rechtsschiefen Verteilung (orange Dichte) (erstellt mit dem Paket
ggplot2 [7] der Statistiksoftware R [8])

Abb. 2: Vergleich von Dichte (Dichteplot), Verteilungsfunktion
(pp-Plot) und Quantilfunktion (qq-Plot) der Normalverteilung mit einer
linksschiefen Verteilung (orange Dichte) (erstellt mit dem Paket ggplot2
[7] der Statistiksoftware R [8])

Abb. 3: Vergleich von Dichte (Dichteplot), Verteilungsfunktion
(pp-Plot) und Quantilfunktion (qq-Plot) der Normalverteilung mit einer
steileren und breiteren Verteilung (orange Dichte) (erstellt mit dem
Paket ggplot2 [7] der Statistiksoftware R [8])

Abb. 4: Vergleich von Dichte (Dichteplot), Verteilungsfunktion
(pp-Plot) und Quantilfunktion (qq-Plot) der Normalverteilung mit einer
flacheren und schmaleren Verteilung (orange Dichte) (erstellt mit dem
Paket ggplot2 [7] der Statistiksoftware R [8])

Abb. 5: Vergleich von Dichte (Dichteplot), Verteilungsfunktion
(pp-Plot) und Quantilfunktion (qq-Plot) der Normalverteilung mit einer
nach unten begrenzten Verteilung (orange Dichte) (erstellt mit den
Paketen distr [9] und ggplot2 [7] der Statistiksoftware R [8])

In Abbildung 4 betrachten wir umgekehrt den Fall, dass die Verteilung
in der Mitte flacher ist und deutlich schmalere
Flanken besitzt. Hier sind die Auffälligkeiten gespiegelt zum
vorherigen Fall, wobei die Abweichung im qq-Plot wieder stärker
hervortritt.
In Abbildung 5 sehen wir den Fall, dass die Verteilung, mit der wir
die Normalverteilung vergleichen, nach unten begrenzt
ist. Wir sehen eine deutliche Auffälligkeit am linken Rand von pp-und
qq-Plot, wobei diese im qq-Plot stärker ausgeprägt ist.
Ist die Verteilung nach oben begrenzt, ergeben sich
Plots, in denen die Auffälligkeit vom unteren zum oberen Rand von pp-
und qq-Plot gespiegelt ist, wie in Abbildung 6 zu sehen ist.
In Abbildung 7 ist schließlich zu sehen, wie sich
Ausreißer bei pp- und qq-Plots bemerkbar machen. Im
pp-Plot sind diese kaum auszumachen, während sich diese im qq-Plot ganz
deutlich zeigen.
Abb. 6: Vergleich von Dichte (Dichteplot), Verteilungsfunktion
(pp-Plot) und Quantilfunktion (qq-Plot) der Normalverteilung mit einer
nach oben begrenzten Verteilung (orange Dichte) (erstellt mit den
Paketen distr [9] und ggplot2 [7] der Statistiksoftware R [8])

Abb. 7: Vergleich von Dichte (Dichteplot), Verteilungsfunktion
(pp-Plot) und Quantilfunktion (qq-Plot) der Normalverteilung mit einer
Verteilung, die Ausreißer aufweist (orange Dichte) (erstellt mit den
Paketen distr [9], distrEx [9] und ggplot2 [7] der Statistiksoftware R
[8])

Abb. 8: Vergleich von Dichteschätzung (orange), empirischer
Verteilungsfunktion (pp-Plot) und empirischer Quantilfunktion (qq-Plot)
von Daten zur venösen Sauerstoffsättigung (SvO2) von 30 erwachsenen
Patient:innen an der extrakorporalen Zirkulation (EKZ) mit einer
Normalverteilung (erstellt mit den Paketen qqplotr [10] und ggplot2 [7]
der Statistiksoftware R [8])

Abschließend werden wir pp- und qq-Plots für reale Datensätze
erzeugen, wobei wir zusätzlich 95 %-Konfidenzbänder verwenden, um besser
einschätzen zu können, ob es sich um signifikante Abweichungen von der
Normalverteilung handelt. Die Konfidenzbänder werden hierbei mittels
Bootstrap erzeugt, wobei sich die Konfidenzbänder aus punktweisen
Konfidenzintervallen zusammensetzen. Wir beginnen mit den Daten der
venösen Sauerstoffsättigung (SvO2) von 30 erwachsenen
Patient:innen an der extrakorporalen Zirkulation (EKZ) [4]. Der
Dichteplot in Abbildung 8 zeigt deutliche Abweichungen von der
Normalverteilung. Laut pp- und qq-Plot sind diese Abweichungen aber noch
im Rahmen zufälliger Schwankungen, da alle Punkte innerhalb der
Konfidenzbänder liegen und keine der Strukturen aus den Abbildungen 1–7
eindeutig zu erkennen sind. Dieses Beispiel zeigt, wie schwer es bei
einer kleinen bis mittelgroßen Stichprobe ist, zu entscheiden, ob eine
Verteilungsannahme erfüllt ist oder nicht. Daher ist es wichtig, immer
auch fachtheoretische Überlegungen und Recherchen anzustellen, ob für
die statistische Analyse notwendige Annahmen plausibel sind.
Abb. 9: Vergleich von Dichteschätzung (orange), empirischer
Verteilungsfunktion (pp-Plot) und empirischer Quantilfunktion (qq-Plot)
der GFR-Daten der Nitroprussid-Gruppe (219 Patient:innen) mit einer
Normalverteilung (erstellt mit den Paketen qqplotr [10] und ggplot2 [7]
der Statistiksoftware R [8])

Abb. 10: Vergleich von Dichteschätzung (orange), empirischer
Verteilungsfunktion (pp-Plot) und empirischer Quantilfunktion (qq-Plot)
der GFR-Daten der Nitroglycerin-Gruppe (176 Patient:innen) mit einer
Normalverteilung (erstellt mit den Paketen qqplotr [10] und ggplot2 [7]
der Statistiksoftware R [8])

Abb. 11: Vergleich von Dichteschätzung (orange), empirischer
Verteilungsfunktion (pp-Plot) und empirischer Quantilfunktion (qq-Plot)
der GFR-Daten der Gruppe ohne Intervention (219 Patient:innen) mit einer
Normalverteilung (erstellt mit den Paketen qqplotr [10] und ggplot2 [7]
der Statistiksoftware R [8])

Für das zweite Datenbeispiel verwenden wir Daten der glomerulären
Filtrationsrate (GFR) nach einer Herzoperation mit EKZ, wobei wir drei
Gruppen unterscheiden [11]. Eine Gruppe erhielt für eine bessere
Verteilung des Blutes zum „venösen Pooling“
zusätzlich Nitroprussid, eine zweite Gruppe zusätzlich Nitroglycerin
und eine Gruppe war ohne Intervention. Es liegen Daten von 614
Patient:innen vor (Nitroprussid: 219, Nitroglycerin: 176, ohne
Intervention: 219). In Abbildung 9 sind der pp- und qq-Plot für die
Nitroprussid-Gruppe zu sehen, wobei sowohl zu viele Punkte (>5 %)
außerhalb der Konfidenzbänder liegen als auch Strukturen zu erkennen
sind, die denen aus Abbildung 1–7 ähneln. Das Vorliegen einer
Normalverteilung muss daher abgelehnt werden. Wie bereits in [4]
besprochen, liegt eine biomodale Verteilung vor, die darauf hindeutet,
dass die Nitroprussid-Gruppe inhomogen ist und sich aus mindestens zwei
Subgruppen zusammensetzt.
Im Fall der Nitroglycerin-Gruppe zeigt sich eine gute Übereinstimmung
mit der Normalverteilung, wie in Abbildung 10 zu sehen ist. Es liegen
alle Punkte innerhalb der 95 %-Konfidenzbänder und es zeichnen sich auch
keine auffälligen Strukturen oder Ausreißer ab.
Für die Gruppe ohne zusätzliche Intervention fällt die Entscheidung
am schwersten. In der linken Flanke der Verteilung zeigt sich in
Abbildung 11 eine Abweichung von der Normalverteilung, die auch klar im
pp- und qq-Plot zu sehen ist. Es handelt sich hierbei um eine auffällige
Häufung von GFR-Werten im Bereich von ca. 40 bis 55, weshalb auch einige
Punkte außerhalb der 95 %-Konfidenzbänder liegen. Streng genommen könnte
man dies zum Anlass nehmen, die Normalverteilung abzulehnen. Auf der
anderen Seite ist die Fallzahl recht groß und die Abweichung nur
moderat. Daher ist davon auszugehen, dass diese Abweichung nur einen
sehr geringen Einfluss auf die statistische Analyse hat. Dies bestätigen
auch die statistischen Ergebnisse in [11], die für den Vergleich der
Nitroglycerin-Gruppe mit der Gruppe ohne Intervention für verschiedene
statistische Verfahren nahezu identisch sind (vgl. Abb. 3 in [11]).
Zusammenfassung
pp- und qq-Plots sind wichtige grafische Hilfsmittel, um Unterschiede
zwischen zwei Verteilungen zu erkennen. Sie eignen sich sehr gut dafür,
zu prüfen, ob ein Datensatz einer bestimmten Verteilung folgt, und damit
die Verteilungsannahmen von statistischen Verfahren zu plausibilisieren.
Indem man zusätzlich Konfidenzbänder verwendet, kann man außerdem besser
beurteilen, ob die beobachteten und zu erwartenden Abweichungen über das
zu erwartende Maß von zufälligen Schwankungen hinausgehen. Der pp-Plot
ist hierbei etwas schwerer zu interpretieren als der qq-Plot, wobei im
pp-Plot üblicherweise Abweichungen im Zentrum der Verteilung besser zu
erkennen sind, während der qq-Plot Abweichungen in den Flanken und
Ausreißer deutlicher aufzeigt. Generell benötigt es eine gewisse
Erfahrung, um diese Plots sicher interpretieren zu können, und gerade
bei kleinen bis moderaten Stichprobengrößen ist es immer schwierig
Abweichungen zu erkennen und eine zuverlässige Aussage zur Verteilung
der Daten zu treffen. In diesem Fall ist es besonders wichtig, immer
auch fachtheoretische Überlegungen und Recherchen zu den für die
statistische Analyse benötigten Voraussetzungen anzustellen und im
Zweifelsfall einen Statistiker zu Rate zu ziehen.







