Zur CCInfo-Startseite
 
Statistiken
 
   
 
Startseite CCInfo
 
Foren
Pflanzen
Foto und Fotolabor
Technik/Elektronik
  Allg. Grundlagen
  - Differential
  - Integral
  - Lotto
  - Statistiken
  Audio / Musik
  Diverses
  Elektr. Strom
  Magnete
  Rund um den PC
  Strahlung
  Technik-Links
Verschiedenes
Impressum
 


F.A.Q.
Suche
Was ist neu?



Sponsor werden
 

Vorherige Seite
Inhalt:
 Allgemeines
 Statistiken
    Statistikgrundlagen und grundlegende Probleme
    Studien / doppelter Blindversuch
    Literaturstudien und statistische Vergleiche
 Meinungsumfragen
    Fragestellung
    Personengruppe
    Auswertung
Vorsätzlicher Beschiß durch Meinungsumfragen und Statistiken
Und da war noch ...
 Weitere Themen:
 Differential
 Integral
 Lottospiel

Allgemeines

Sicher haben Sie schon einmal den Spruch "Glaube keiner Statistik, die Du nicht selbst gefälscht hast" gehört. Es soll zwar manchmal vorkommen, daß Statistiken wirklich gefälscht werden, aber die ganze Wahrheit ist noch viel erschreckender: Normalerweise braucht man eine Statistik noch nicht einmal zu fälschen, um zu konträren Ergebnissen zu kommen. Wie Statistiken erstellt werden und warum man ihnen selten relevante Informationen entnehmen kann, können Sie nachfolgend erfahren.


Statistiken

Statistikgrundlagen und grundlegende Probleme

Eine Statistik ist im Grunde nur eine Sammlung von Daten, die in einer bestimmten Art und Weise aufgearbeitet wurde. Statt einzelner Daten wird die Darstellung meistens dadurch komprimiert, daß man z.B. bestimmte Ereignisse in bestimmten Zeiträumen zusammenfaßt. Wenn man beispielsweise einen kleinen Laden betreibt und 10 unterschiedliche Produkte anbietet, kann man für jeden Monat die Zahlen zusammentragen, wie oft jedes dieser Produkte verkauft wurde. Wenn man dies in Form einer Zahlenreihe oder graphisch über einen bestimmten Zeitraum aufbereitet, hat man bereits eine Statistik erstellt.

Man erstellt eine Statistik jedoch nicht, um lediglich ein paar schöne Zahlen oder bunte Bildchen vorweisen zu können, sondern man will Erkenntnisse daraus gewinnen. Man könnte im Beispiel versuchen, das Produkt zu identifizieren, das sich am schlechtesten verkauft, um es aus dem Sortiment zu nehmen. Man könnte auf die Idee kommen, daß das Produkt mit den geringsten Verkaufszahlen das Produkt ist, das sich am schlechtesten verkauft. Diese Einschätzung kann korrekt sein, aber es kann auch sein, daß der Lieferant nur geringe Stückzahlen liefern konnte und man viel höhere Stückzahlen hätte verkaufen können, wenn es nur lieferbar gewesen wäre. Den nackten Verkaufszahlen kann man diese wichtige Information leider nicht entnehmen.

Der Ladeninhaber wird ganz sicher nicht auf die Idee kommen, das im Grunde sehr gut verkäufliche Produkt mit den geringen Verkaufszahlen aus dem Sortiment zu nehmen, sondern vielmehr Druck auf seinen Lieferanten ausüben, damit er ihm mehr davon liefert. Denn der Inhaber eines Ein-Mann-Ladens kennt die ganze Wahrheit und vertraut nicht reinen Zahlen. Wenn bei einem größeren Laden der Inhaber sich allerdings nicht mit allen Details beschäftigt, sondern Mitarbeiter mit dem Tagesgeschäft betraut, die ihm regelmäßig Statistiken als Rückmeldung zur Entscheidungsfindung liefern, könnte er sehr schnell eine falsche Entscheidung treffen, wenn er alleine die Statistiken zur Entscheidungsfindung heranzieht.

Es ist deshalb extrem wichtig, die Datenbasis so zu wählen, daß man aus der daraus erstellten Statistik die richtigen Schlüsse ziehen kann. Wenn man wissen will, welche Produkte sich besonders gut verkaufen, reicht es nicht aus, als Datenbasis einfach nur die Menge der verkauften Produkte pro Monat aufzulisten. In diesem Fall würde es sich z.B. anbieten, als Datenbasis zusätzlich die Zeit heranzuziehen, wie lange die Produkte im Lager liegen. Bei gut verkäuflichen Produkten würde man üblicherweise sehen, daß die Lagerzeit sehr kurz ist. Aber auch dies kann unter bestimmten Bedingungen trügerisch sein: Wenn man z.B. eine sehr große Menge an gut verkäuflichen Produkten eingekauft hat (beispielsweise einen Sonderposten zu günstigen Konditionen), kann man diese in der Regel nicht sofort verkaufen, sondern benötigt dazu einige Zeit.

Sie sehen, schon bei solch einfachen Dingen kann man aus einer Statistik völlig falsche Schlüsse ziehen, wenn man sich nur die Zahlen anschaut. Wenn Sie Statistiken nutzbringend einsetzen wollen, sollten Sie daher besondere Vorsicht walten lassen und Entscheidungen nie ausschließlich auf dieser Basis treffen.


Studien / doppelter Blindversuch

Vor allem in der Medizin führt man oft sogenannte Studien durch, in denen man den Einfluß bzw. die Wirksamkeit bestimmter Substanzen, Verfahren etc. auf den Menschen untersucht. Hierzu zählen auch klinische Tests. Wenn man einfach hingeht, kranken Menschen einen Wirkstoff verabreicht und nach einem gewissen Zeitraum nachschaut, ob die Behandlung erfolgreich war, hat man so ziemlich alle Fehler gemacht, die man machen kann. Das Ergebnis hat dann nahezu die gleiche Qualität, wie wenn man zur Ermittlung der Zahlen einen Würfel bemühen würde.

Menschen sind nämlich keine Maschinen, sondern reagieren zusätzlich zu Wirkstoffen auch auf die Umgebung und insbesondere auf psychologische Einflüsse. Der behandelnde Arzt hat daher durch sein Verhalten großen Einfluß auf den Heilungsprozeß. Weiterhin gibt es den Placebo-Effekt (ein Placebo ist im medizinischen Sprachgebrauch eine wirkstofffreie Kopie eines Medikaments): Alleine das Wissen um eine (scheinbare) Behandlung mit einem Medikament heilt wundersamerweise einen Teil kranker Menschen, was ja die Homöopathie beweist. Dieser Anteil ist natürlich abhängig von der Erkrankung; bei AIDS ist eine Heilung durch ein Placebo eher unwahrscheinlich, bei Befindlichkeitsstörungen wie z.B. einem empfindlichen Magen ist der Placebo-Effekt allerdings sehr hoch. Desweiteren muß man berücksichtigen, daß etliche Krankheiten von selbst heilen. Man denke nur an Erkältungskrankheiten.

Aus diesem Grund hat sich als Standard für Studien der sogenannte doppelte Blindversuch durchgesetzt, gern auch doppelter Blindtest genannt. Hierbei teilt man die Personen, die an der Studie teilnehmen, ohne deren Wissen in zwei Gruppen auf. Eine Gruppe erhält den zu untersuchenden Wirkstoff, die andere ein Placebo. Der behandelnde Arzt weiß ebenfalls nicht, ob er den Wirkstoff anwendet oder das Placebo, um eine psychologische Beeinflussung des Patienten zu vermeiden. Er weiß nur, daß er die Versuchspersonen mit dem ihm zugeordneten Medikament behandeln soll. Lediglich der Versuchsleiter weiß, welche Versuchsperson den Wirkstoff und welche ein Placebo erhält. Weil sowohl der Proband als auch der behandelnde Arzt nicht wissen, ob ein Wirkstoff oder ein Placebo verabreicht wird, bezeichnet man diese Vorgehensweise als doppelten Blindversuch bzw. als doppelten Blindtest. Als einfachen Blindversuch bzw. einfachen Blindtest bezeichnet man eine Untersuchung, bei der lediglich der Proband über den Wirkstoff im Unklaren gelassen wird.

Nach einem definierten Testzeitraum schaut man sich dann jeweils an, wieviele Personen in den beiden Gruppen gesundet sind. Wenn in der Gruppe, die den Wirkstoff erhielt, alle Personen gesundet sind, heißt das noch lange nicht, daß der zu untersuchende Wirkstoff tatsächlich wirksam ist. Denn wenn in der Kontrollgruppe, die den Placebo erhielt, ebenfalls alle Probanden gesundet sind, ist der Wirkstoff nutzlos. Aus diesem Grund vergleicht man den Prozentsatz der gesundeten Probanden in beiden Gruppen miteinander. Der zu untersuchende Wirkstoff wird nur dann als wirksam angesehen, wenn bei seiner Anwendung deutlich mehr Personen gesunden als durch Anwendung eines Placebos. Wichtig ist dabei, daß die Anzahl der Probanden hoch genug ist, damit zufällige Ereignisse das Ergebnis nicht zu stark verfälschen. Testgruppen mit beispielsweise nur 10 Personen haben keinerlei Aussagekraft. Andererseits ist es wichtig, daß die Probanden rein zufällig (z.B. durch Würfel) und nicht etwa durch manuelle Auswahl auf eine der beiden Gruppen aufgeteilt werden. Denn wenn sich in einer Gruppe nur "Pferdenaturen" befinden und in der anderen schwächelnde Personen, verfälscht dies das Ergebnis sehr stark.

Der doppelte Blindversuch ist nicht nur in der Medizin ein zwingendes Muß für Untersuchungen des Einflußes von Stoffen oder Reizen auf den Menschen, sondern ist ein gängiger Standard. Wenn man darauf verzichtet, muß man sich über falsche Ergebnisse nicht wundern. Wie leicht sich Menschen beeinflussen lassen, sieht man bei HiFi-Anlagen, denn nicht selten behaupten Leute, sie seien in der Lage, teure von billigen  CD-Spielern (z.B. 5000- gegen 200-Euro-Klasse) problemlos zu unterscheiden.

Wenn sie Sichtkontakt zur Musikanlage haben und man ihnen den Umschalter in die Hand gibt, werden sie dazu auch in der Lage sein. Aber das wäre auch ein Gehörloser, weil er ja als Bediener des Umschalters weiß, welcher CD-Spieler gerade die Musik liefert. Man kann sich, und das ist ein typischer menschlicher Wesenszug, nicht der Vorstellung entziehen, daß der teure und edel aussehende CD-Spieler mit seiner massiven Edelstahlfrontplatte viel besser klingen muß als das billige, häßliche Kästchen mit seinen klapprigen Bedienelementen. Wenn er aber garnicht weiß, welche Geräte überhaupt verwendet werden, weil er sie nicht sehen kann, und wenn nicht er sondern jemand anders (der auch nicht weiß, welche Geräte bei einer bestimmten Schalterstellung auf den Ausgang geschaltet werden) den Umschalter betätigt, geht die Trefferrate stark in den Keller. Sie wird übrigens statistisch gesehen nicht Null, denn bei Verwendung von 2 Geräten beträgt die Trefferrate im statistischen Mittel ohnehin 50%. Wenn man garnicht hinhört und immer nur eine Münze wirft, erreicht man genau diese 50% Trefferrate. Bei parallel untersuchten 3 Geräten liegt sie bei 33%, bei 4 Geräten bei 25% usw.

Ein korrekt durchgeführter doppelter Blindversuch läuft grob gesehen folgendermaßen ab: Der Versuchsdurchführer, der den Umschalter bedient, schaltet zuerst auf Anweisung des Probanden zwischen den Geräten um, damit sich dieser mit deren Klang vertraut machen kann. Beiden Personen bekannt ist zu diesem Zeitpunkt nur die Schalterstellung, nicht aber welche Geräte sich dahinter verbergen. Dann beginnt der eigentliche Test. Der Versuchsdurchführer schaltet viele Male nach einem vom Versuchsleiter vorgegebenen Schema zwischen den zu untersuchenden Geräten hin und her, ohne die Schalterstellung dem Probanden zu verraten und notiert die vom Probanden genannten Ergebnisse. Wichtig dabei ist, daß der Proband nicht aufgrund von Lautstärkeunterschieden, Zeitversatz der Musikwiedergabe zwischen den beiden CD-Spielern o.ä. Rückschlüsse auf das Gerät ziehen kann. Danach wird ausgewertet.

Wichtig ist, daß die Anzahl der Hörproben nicht zu gering ist, um die statistische Ungenauigkeit gering zu halten. Wenn beispielsweise der Versuchdurchführer nach dem vom Versuchsleiter vorgegebenen Schema wild durcheinandergewürfelt (also nicht nur Gerät 1, 2, 1, 2 usw.!) jeweils 5 Hörproben von zwei Geräten präsentiert hat, ist die statistische Ungenauigkeit relativ hoch. Bei diesen in Summe 10 Hörproben liegt sie bei 10%, weil es bei 10 Versuchen nur Trefferraten in 10%-Schritten gibt. 1 Treffer bei 10 Versuchen bedeutet eine Trefferrate von 10%, 2 Treffer bei 10 Versuchen eine Trefferrate von 20% usw. Jede einzelne Hörprobe hat daher relativ großen Einfluß auf das Ergebnis. Denn wer bei 9 Hörproben 5 Treffer erzielt hat, was einer Trefferrate von 55% entspricht, kann bei der zehnten Hörprobe entweder einen weiteren Treffer landen (d.h. 6 Treffer bei 10 Hörproben, was 60% ergibt) oder den zehnten Versuch vergeigen (d.h. 5 Treffer bei 10 Hörproben, was 50% ergibt).

Daher ist es wichtig, daß die Anzahl der Hörproben so hoch gewählt wird, daß die statistische Ungenauigkeit nicht das Ergebnis bestimmt. Im obigen Beispiel liegt der Proband sehr dicht an dem Wert, den man durch Werfen einer Münze erreicht (d.h. 50%). Eine Trefferrate von 60% bei einer Ungenauigkeit von 10% bedeutet schlicht, daß er die Geräte nicht zuordnen konnte. Bei 100 Hörproben und 60 Treffern ergibt sich ebenfalls eine Trefferrate von 60%. Hier liegt die statistische Ungenauigkeit aber nur bei 1%, so daß man hier die Aussage treffen kann, daß der Proband in seltenen Fällen Abweichungen gehört hat. Wer behauptet, Geräte einigermaßen sicher am Klang identifizieren zu können, muß Trefferraten deutlich oberhalb von 80% erreichen.

Eines sollte man bei aller Statistik im Hinterkopf behalten: Statistik ist immer nur ein Durchschnitt. Es kann im Einzelfall starke Ausreißer nach oben oder unten geben. Im Beispiel mit dem CD-Spieler könnte auch ein Gehörloser bei 100 Hörproben rein zufällig immer die richtige Antwort geben. Die Wahrscheinlichkeit (nähere Infos siehe  Lotto), daß er bei einem einzigen Hörversuch und 2 Geräten richtig tippt, liegt bei 50%. Bei zwei Versuchen sind es 25%, bei drei Versuchen 12,5% usw. Bei 10 Versuchen liegt die Wahrscheinlichkeit, alle Antworten durch bloßen Tippen richtig gegeben zu haben, bei ca. 0,1%. Bei 100 Versuchen ist zwar die Zahl sehr klein (sie hat dannn 28 Nullen hinter dem Komma), aber die Wahrscheinlichkeit ist nicht Null.

Wenn man nicht 100% korrekte Antworten als Kriterium heranzieht, sondern sich mit 70% richtigen Antworten zufrieden gibt, kommt man durch bloßes Tippen statt Hören bei 10 Hörproben auf eine Wahrscheinlichkeit von 1,6% und bei 100 Hörproben auf eine Zahl, die "nur noch" 19 Nullen hinter dem Komma hat (bei 100% waren es immerhin noch 28 Nullen). Im Klartext heißt das, daß bei jeweils 10 Hörproben pro Versuchsdurchgang in 1,6% der Durchgänge 70% Trefferwahrscheinlichkeit erreicht werden, obwohl der Probant nachgewiesenermaßen überhaupt keinen Unterschied hören kann.


Literaturstudien und statistische Vergleiche

Oft liest man in den Medien Meldungen in der Art, daß man beispielsweise festgestellt habe, daß Olivenöl die Gefahr eines Herzinfarkts reduziere. Die Art und Weise, wie man zu diesem Ergebnis kommt, ist fast immer die gleiche: Man besorgt sich aus der Literatur Zahlenmaterial und vergleicht dann zwei Gruppen, zwei Zeiträume, zwei Ereignisse o.ä. miteinander und zieht daraus Schlüsse. Im eben genannten Fall ist es tatsächlich so, daß Bewohner mediterraner Gebiete deutlich seltener einen Herzinfarkt erleiden als z.B. Deutsche. Da in mediterranen Gebieten sehr viel Olivenöl verwendet wird, in Deutschland jedoch eher selten, kommt man zu dem Schluß, daß der Genuß von Olivenöl die Gefahr eines Herzinfarkts reduziert.

Aus statistischer Sicht ist diese Art der Informationsgewinnung jedoch gelinde gesagt höchst bedenklich, auch wenn der Verzehr von Olivenöl wahrscheinlich tatsächlich eine positive Wirkung zur Folge hat. Der Grund liegt darin, daß sich Mittelmeeranrainer und Deutsche nicht nur dadurch unterscheiden, daß die einen Olivenöl verzehren und die anderen nicht. In südlichen Ländern gehen bekanntlich die Uhren ohnehin anders, und man macht sich in der Regel deutlich weniger Streß als in Deutschland. Zudem sind die Ernährungsgewohnheiten sehr unterschiedlich, denn in Deutschland wird enorm viel Fleisch gegessen, in mediterranen Gebieten bevorzugt man hingegen eher Gemüse und Fisch. Weiterhin sind Deutsche viel häufiger übergewichtig als Leute aus mediterranen Gebieten. Nach gängiger Meinung der Schulmedizin sind diese exemplarisch dargestellten Unterschiede relevant für die Wahrscheinlichkeit eines Herzinfarkts. Man vergleicht daher Äpfel mit Birnen. Aus diesen Gründen ist es absolut unsinnig und unseriös, alleine aus den Unterschieden der Herzinfarktshäufigkeit ableiten zu wollen, daß Olivenöl die Gefahr eines Herzinfarkts reduziere. Korrelation kann Kausalität nicht ersetzen! Wenn man diesen Grundsatz nicht beachtet, kann man mit Statistik auch den allergrößten Unsinn "beweisen".


Meinungsumfragen

Es ist leider in Mode gekommen, für nahezu alles eine Meinungsumfrage zu starten und das Ergebnis mehr oder weniger reißerisch zu veröffentlichen. Meistens sind die Umfragen nach einem erschreckend einfachen Strickmuster gestaltet: Man fragt einfach irgendwo ein paar beliebige Personen. Diese können dann aus bestimmten vorgegebenen Antwortmöglichkeiten eine auswählen, und man zählt dann die Anzahl der jeweils gegebenen Antworten zusammen. Was dabei als Ergebnis herauskommt, ist meistens derart zufällig, daß man auch einen Würfel benutzen könnte. Am Beispiel einer Meinungumfrage, die der heiß diskutierten Frage nachgeht, ob ein Geschwindigkeitslimit auf deutschen Autobahnen eingeführt werden sollte, können Sie sich ein Bild davon machen, welche Fehler nahezu immer gemacht werden und mit welchen Problemen eine mit wissenschaftlichen Methoden durchgeführte Meinungsumfrage zu kämpfen hat.


Fragestellung

Am Anfang einer Meinungsumfrage steht das Formulieren der Frage. Schon hier kann man eine Menge verkehrt machen bzw. den Ausgang der Umfrage stark beeinflussen. Im Beispiel kann man die Frage eher neutral formulieren ("Sind Sie der Meinung, daß man ein Tempolimit auf deutschen Autobahnen einführen soll?"), schon eine Wertung in der Frage abgeben ("Sind Sie der Meinung, daß auf deutschen Autobahnen zu schnell gefahren wird?") oder aber die gewünschte Antwort in die Frage verpackt ("Sind Sie der Meinung, daß man Raser auf deutschen Autobahnen stoppen soll?").

Wenn man die Frage so stellt wie im letzten Beispiel, ist schon von vornherein klar, wie das Umfrageergebnis ausgeht, da das Wort "Raser" sehr negativ vorbelastet ist. Verwerflich dabei ist, wenn man die Ergebnisse als Umfrage zum Tempolimit veröffentlicht, aber gar nicht nach der Einführung eines Tempolimits fragt sondern nur danach, ob man Raser stoppen sollte. Das ist etwas völlig anderes! Der Begriff Raser ist zudem nicht genau definiert. Im eigentlichen Sinn handelt es sich um Leute, die schneller fahren, als es die Bedingungen objektiv zulassen. Häufig wird der Begriff jedoch ganz anders ausgelegt, nämlich als "Raser ist, wer schneller als ich selbst fährt". Zudem ist es objektiv recht gefahrlos möglich, auf einer freien Autobahn 250 km/h zu fahren, während z.B. 20 km/h in einer Spielstraße oder 70 km/h in der Stadt höchst unfallträchtig sind. Der Begriff "Raser" ist daher wachsweich. In mit wissenschaftlichen Methoden durchgeführten Meinungsumfragen werden solche unpräzisen und erst recht negativ vorbelasteten Begriffe tunlichst vermieden und Wert auf möglichst einfache und eindeutige Fragen gelegt.


Personengruppe

Die zu befragende Personengruppe hat einen ganz entscheidenden Einfluß auf das Umfrageergebnis. Wenn Sie eine Umfrage zum Tempolimit beim Parteitag der Grünen durchführen, ist das Ergebnis genauso eindeutig, wie wenn Sie die Besucher eines Formel-1-Rennens befragen. Zwischen beiden Extremen gibt es zahlreiche Möglichkeiten, die nur davon abhängen, welche Personen Sie als Teilnehmer an der Umfrage auswählen. Wenn Sie sich nachmittags in eine Fußgängerzone stellen und jeden fragen, der bereitwillig Auskunft gibt, erhalten Sie selbst dann kein vernünftiges Ergebnis, wenn Sie eine Million Leute fragen. Das Ergebnis ist nämlich nicht repräsentativ, weil es nur einen bestimmten Typus von Mensch berücksichtigt - nämlich den, der sich nachmittags in Fußgängerzonen aufhält. In der Regel werden dies zum größten Teil Bewohner der jeweiligen Stadt sein. Bewohner ländlicher Gebiete sind hierbei genauso unterrepräsentiert wie Bewohner anderer Städte (wer weiß schon, ob die Meinungen in München und Hamburg gleich sind?). Personen, die berufstätig sind, sind bei dieser Umfrage ebenfalls unterrepräsentiert, weil etliche Berufstätige zu dieser Zeit noch am Arbeiten sind; Vertreter sind zu dieser Zeit mit einiger Wahrscheinlichkeit noch auf der Autobahn unterwegs, während Rentner und Hausfrauen, die dort eher selten fahren, das Ergebnis dieser Umfrage prägen. Je länger man darüber nachdenkt, desto mehr Bevölkerungsgruppen findet man, die bei dieser Art der Befragung durch die Maschen fallen - vor allem solche, die von dem Thema wirklich tangiert werden. Berufstätige im Dunstkreis von Ballungszentren nutzen beispielsweise oft die Autobahn, um ihre Arbeitsstätte zu erreichen. Die Mehrheit dürfte wenig davon begeistert sein, auf Tempo 100 eingebremst zu werden, sollte ausnahmsweise mal kein Stau auf dem Nach-Hause-Weg sein.

Wenn Sie stattdessen tagsüber zufällig aus dem Telefonbuch ausgewählte Personen anrufen, werden Sie feststellen, daß oft niemand zu Hause ist. Das Geldverdienen findet bekanntlich überwiegend nicht zu Hause statt. Sie werden daher zum großen Teil die Meinung von Hausfrauen, älteren Leuten, Arbeitslosen und Sozialhilfeempfängern in Erfahrung bringen (diese Aussage bitte nicht als negative Wertung mißverstehen!). Fernsehumfragen, bei denen man eine der eingeblendeten Telefonnummern anrufen soll, sind genausowenig repräsentativ, weil Fernsehsendungen lediglich eine begrenzte Personengruppe ansprechen. Man denke nur an die zahlreichen Talksendungen am frühen Nachmittag mit unterstem Niveau. Wenn die anzurufende Rufnummer auch noch kostenpflichtig ist (0190/0900- oder 0137-Nummer), begrenzt sich das Ergebnis zudem noch weiter auf einen wahrscheinhlich eher einfach gestrickten Personenkreis, dem es wichtig ist, für die Teilnahme an einer objektiv gesehen völlig nutzlosen Umfrage auch noch Geld auszugeben.

Für eine repräsentative Umfrage ist es schwierig, einen passenden Personenkreis zu finden, der wirklich dem Querschnitt durch die Bevölkerung entspricht. Zudem lassen sich vor allem intelligente und dadurch kritisch eingestellte Personen grundsätzlich nicht von beliebigen Firmen ausfragen und betrachten ihre Vorlieben und Abneigungen als Privatsache, die niemanden etwas angehen. Deren Meinung in Erfahrung zu bringen, ist daher nicht einfach.

Bei vielen Fragestellungen ist allerdings eine repräsentative Umfrage überhaupt nicht sinnvoll. Es macht nämlich oft keinen Sinn, die Meinung von Leuten zu berücksichtigen, die mit dem Thema, um das es geht, überhaupt nichts zu tun haben. Im Beispiel Tempolimit mag zwar jemand, der keinen Führerschein besitzt, eine Meinung zum Tempolimit auf deutschen Autobahnen haben, aber es ist durchaus eine Überlegung wert, ob seine Meinung in das Ergebnis einfließen sollte. Es gibt gute Argumente dafür, daß man eine Umfrage zur Einführung eines Tempolimits nur in einem Personenkreis durchführt, der selbst Auto fährt und wenigstens gelegentlich auf nicht geschwindigkeitslimitierten Autobahnen unterwegs ist. Allerdings gibt man damit der Umfrage schon gleich eine Wertung mit, denn der größte Teil der Autofahrer, die häufig auf Autobahnen unterwegs sind, dürften von einem Tempolimit überhaupt nicht begeistert sein. Und wenn schon Geschwindigkeitslimit, neigen die meisten Leute dazu, Ihre eigene Wohlfühlgeschwindigkeit als Maß aller Dinge zu betrachten.

Sie sehen, schon bei der Vorbereitung einer Meinungsumfrage wird der Grundstein gelegt, welches Ergebnis die Umfrage haben wird. Durch "geschickte" Fragestellung sowie Wahl des befragten Personenkreises kann man wunderbar das Ergebnis eine Umfrage so steuern, wie es dem Auftragsgeber in den Kram paßt. Ziel solcher Umfragen ist meistens, mit dem vermeintlichen (!) Willen des Volkes Druck auf die Politik auszuüben. In vielen Fällen ist es aber überhaupt nicht sinnvoll, dieser Meinung zu folgen, weil zwar jeder Bürger zu jedem Thema eine Meinung haben kann aber sicher nicht zu jedem Thema genügend Sachverstand besitzt. In vielen Fällen ist es daher gut, wenn die Politik auf die Expertise von unabhängigen Fachleuten vertraut, die auf objektiven Fakten basiert, die Otto Normalbürger oft nicht kennen und meistens auch nicht verstehen.


Auswertung

Selbst bei der Auswertung kann man große Fehler machen. Mit dem bloßen Zusammenzählen der Anzahl der verschiedenen Antworten (im Beispiel also ja/nein/egal) ist es nämlich nicht getan. Es wird Ihnen nämlich kaum gelungen sein, von jedem eine Antwort zu erhalten. Jede nicht erhaltene Antwort geht aber als Unsicherheit in das Endergebnis ein. Wenn befragte Personen die Auskunft verweigert, kennen Sie nicht deren Meinung. Möglicherweise ist deren Meinung aber völlig konträr zu der auf dem Papier dominierenden Meinung (sofern es eine gibt). Zu einer Auswertung gehört daher auch immer die Angabe des Prozentsatzes der Personen, die eine Antwort verweigerten. Idealerweise wurde sie schon gleich als mögliche Schwankungsbreite in das Endergebnis eingerechnet. Leider findet man korrekte Auswertungen extrem selten.

Bei intimen Fragen ist es ohnehin schwierig, eine wahrheitsgemäße Antwort zu bekommen. Wenn (wie in Teilen der USA) z.B. Oralsex selbst unter Verheirateten unter Strafe gestellt ist, werden Sie auf die Frage, ob die betreffende Person schon einmal Oralsex hatte, nur wenige ehrliche Antworten bekommen. Wahrscheinlich wird ein großer Teil gar keine Antwort geben und ein weiterer großer Teil eine falsche. Aus Angst vor Strafe werden sicher nur ganz wenige Leute, die tatsächlich Oralsex hatten, wahrheitsgetreu antworten. Was für dieses zugegeben extreme Beispiel gilt, gilt abgeschwächt auch auf viele scheinbar unverfängliche Fragen.


Vorsätzlicher Beschiß durch Meinungsumfragen und Statistiken

Eine aussagekräftige Meinungsumfrage ist eine schwierige Sache. Es gibt extrem viele Einflußfaktoren, die das Ergebnis verfälschen können. Man muß leider sagen, daß nahezu alle Meinungsumfragen entweder absolut stümperhaft gemacht sind oder von vornherein einen bestimmten Zweck verfolgen. Wie oben dargelegt, kann man das Ergebnis völlig ohne vordergründige Manipulation sehr gut steuern. Das beste, was man machen kann, ist, solche Umfragen geflissentlich zu ignorieren, da sie keinerlei Aussagekraft besitzen, sondern oft eine Meinung prägen sollen. Viele Menschen neigen nämlich dazu, sich der (vermeintlichen) Mehrheitsmeinung anzuschließen, sodaß man Umfrageergebnisse in der Tat sehr gut dazu benutzen kann, um eine Meinung zu prägen.

Statistiken und Studien werden ebenfalls sehr gern für bestimmte Ziele mißbraucht, wenngleich bei weitem nicht alle manipuliert sind. Ein "gutes" sprich extrem negatives Beispiel für den Mißbrauch zur Meinungsprägung ist die berüchtigte Nord-Karelien-Studie (weitere Infos lassen sich unter diesem Suchbegriff mit einer Suchmaschine Ihrer Wahl finden), in der Margarine als gesunde Alternative zu Butter proklamiert wurde. Begründet wurde der Vorteil von Margarine damit, daß eine Bevölkerungsgruppe in Finnland in einer groß angelegten Kampagne zur Verwendung von Margarine statt Butter bewegt wurde. Bestimmte Herz-Kreislauf-Erkrankungen gingen nach einigen Jahren statistisch gesehen zurück, was der Margarine zugeschrieben wurde. Verschwiegen wurde, daß eine Vergleichsgruppe existierte, die nach wie vor Butter verwendete und bei der die Erkrankungen im Testzeitraum noch deutlich stärker zurückging. Ihren Zweck der Meinungsprägung hat diese Statistik erreicht, denn viele Leute sind auch heute noch der Meinung, daß Margarine gesünder als Butter sei. Mittlerweile gibt es allerdings etliche Statistiken, die zum Ergebnis kommen, daß Margarine ungesund sei. Wenn man sich anschaut, aus was Margarine hergestellt wird, ist das nicht wirklich ein Wunder: Üblicherweise besteht Margarine nämlich im wesentlichen aus billigen Fetten bzw. -ölen (gehärtet und ungehärtet, tierischen oder pflanzlichen Ursprungs), Wasser bzw. Magermilch, Säurungsmittel und Beta-Karotin als Farbstoff, durch das eine butterähnliche Farbe erreicht werden soll. Da bei der Herstellung nahezu alle Vitamine zerstört werden, werden zusätzlich oft künstliche Vitamine zugegeben. Warum Margarine trotzdem als besonders gesund beworben wird, ist leicht dadurch erklärbar, daß Margarine nicht wesentlich billiger als Butter verkauft wird und daher der Profit für den Hersteller und die Vertriebskette entsprechend hoch ist, weshalb man möglichst viele Menschen zum Verzehr von Margarine bewegen möchte.

Sehr "beliebt" ist auch, mit viel zu kleinen Fallzahlen zu arbeiten, wodurch die statistische Varianz im Ergebnis viel zu groß ist, um überhaupt eine einigermaßen vernünftige Aussage machen zu können. Wie groß der Einfluß zu kleiner Fallzahlen auf das Ergebnis ist, kann man natürlich mathematisch berechnen. Einen deutlichen Aha-Effekt können Sie aber auch durch folgenden Versuch erzielen, den Sie einfach und schnell selbst machen können. Wir wollen der Einfachheit halber annehmen, daß der mittlere Intelligenzquotient (IQ) in Deutschland 105 beträgt. Und jetzt wollen wir die 5 bevölkerungsreichsten Bundesländer Deutschlands gegeneinander antreten lassen. Statt real Personen auf ihren IQ hin zu testen, wollen wir das Ergebnis einfach erwürfeln. Ein guter Würfel liefert gemittelt über sehr viele Würfe einen mittlere Augenzahl von 3,5. Wenn Sie zehnmal werfen, die Augenzahl mit 3 multiplizieren und aufaddieren, sollte daher 10*3,5*3=105 herauskommen, was dem angenommenen mittleren IQ entspricht. Machen Sie diesen Versuch fünf mal hintereinander und vergleichen Sie die Ergebnisse. Man sollte erwarten, daß fünfmal das Gleiche herauskommt, weil der Würfel statistisch gesehen keine Zahl bevorzugt. Das tut es aber nicht! Bei meinem eigenen Versuch kam beispielsweise folgendes heraus:

Land10 WürfeErgebnis
Nordrhein-Westfalen   3, 6, 1, 3, 1, 4, 2, 5, 4, 2   93   
Bayern5, 2, 1, 1, 4, 3, 1, 4, 2, 687   
Baden-Württemberg1, 2, 2, 6, 4, 5, 3, 6, 3, 6114   
Niedersachsen1, 5, 6, 3, 2, 3, 6, 2, 4, 4108   
Hessen2, 4, 6, 3, 2, 4, 2, 1, 3, 596   

Wie man sieht, streut das Ergebnis sehr stark, obwohl das Werfen des Würfels gleichverteilte Zufallszahlen liefert, d.h. daß keine Zahl bevorzugt wird und hinter jedem Land ein IQ von 105 stehen sollte. Hätte man in einem realen Versuch die Leute rein zufällig ausgewählt und auf ihren IQ hin getestet, würden die meisten Leute fälschlicherweise annehmen, daß die Bayern im Schnitt die Dümmsten und die Baden-Württemberger die Schlauesten im Lande sind. Da wir aber einen Würfel verwendet haben, kommt die Abweichung vom Mittelwert 105 nicht dadurch zustande, daß die Einwohner der Bundesländer einen unterschiedlichen IQ besitzen. Die Abweichungen vom Mittelwert kommen ausschließlich dadurch zustande, daß die Anzahl der Würfe nicht hoch genug war, um eine ausreichend geringe statistische Varianz zu gewährleisten.

In der Realität überlagert sich der gemessene IQ natürlich mit der durch die begrenzte Fallzahl bedingte Abweichung vom realen Mittelwert. Wenn man nicht auf einen wirklich repräsentativen Querschnitt mit ausreichend vielen Personen zurückgreifen kann (und das ist meistens eben nicht der Fall), ist Schrott als Ergebnis vorprogrammiert. Wenn man Meinungsmache betreiben will, helfen geringe Fallzahlen sehr, den eigenen Standpunkt zu unterstreichen. Sollte beim ersten Versuch das Ergebnis nicht den eigenen Wünschen entsprechen, kann man den Versuch einfach nochmal wiederholen, denn bei geringen Fallzahlen ist der Aufwand gering. Den ersten Versuch verschweigt man dann natürlich. Trotzdem scheuen sich leider viele Medien nicht, solchen Blödsinn zu veröffentlichen.


Und da war noch ...

... der Witz von dem Jäger, der einmal links am Hasen vorbeischoß und ein zweites Mal rechts. Im statistischen Mittel könnte man sagen, daß er den Hasen getroffen habe. Dieser Statistikwitz ist zwar schon ziemlich alt, zeigt aber sehr treffend das grundsätzliche Problem auf. Also nehmen Sie bitte Statistiken nicht so ernst!
  

Vorherige Seite
Seitenanfang







Legende:    =Verweis auf eine andere Datei (Ladezeit)    =Verweis innerhalb der aktuellen Seite (Zugriff ohne Ladezeit)
 =Es folgt eine eMailadresse    =Dies ist ein Download

Alle Angaben in Zusammenhang mit dieser Site wurden nach bestem Wissen und Gewissen gemacht. Trotzdem kann hierfür keine Haftung übernommen werden. Schadenersatzansprüche jeglicher Art sind grundsätzlich ausgeschlossen.

Alle Bilder und Texte sind urheberrechtlich geschützt und Eigentum von Chr. Caspari (sofern nicht anders gekennzeichnet). Es gelten die allgemeinen  Benutzungsbedingungen.

Mitteilungen über Fehler sind stets willkommen (Kontaktmöglichkeiten siehe  Impressum). Ich bitte um Verständnis, daß mir infolge Zeitmangels keine Beantwortung von Fragen und erst recht keine individuelle Beratung möglich ist - auch nicht ausnahmsweise. Für Fragen zu Pflanzenpflege, Foto und Technik stehen Ihnen jedoch verschiedene  Foren ("schwarze Bretter") zur Verfügung.


Letzter Upload dieser Seite: 05.11.2016 (Untergeordnete Seiten können aktueller sein)