Blog:Zbieżność czy przyczyna?

Z MruczekWiki
Przejdź do nawigacji Przejdź do wyszukiwania

Zbieżność czy przyczyna?
9 listopada 2022 | Kenex


Załóżmy, że w szkole przeprowadzono badanie na setce uczniów, które wykazało, że występuje „korelacja” między paleniem marihuany, a gorszymi ocenami. Korelacja informuje nas o wzajemnym związku, współzależności. Inaczej - co się dzieje z jedną cechą, gdy zachodzą zmiany w drugiej. W naszym przykładzie znaczy to, że uczniowie, którzy palą marihuanę, osiągają statystycznie gorsze wyniki w nauce. Im więcej palą, tym silniejszy wpływ na wyniki. Czy można w oparciu o to stwierdzić, że marihuana jest PRZYCZYNĄ gorszych ocen? Chociaż intuicyjnie wydaje nam się, że tak, w rzeczywistości sama korelacja to za mało, by mówić o zależności przyczynowo skutkowej. Już tłumaczę, dlaczego.

Korelacja to nie przyczynowość

Czy wiesz, że margaryna sprzyja rozwodom? Nie wierzysz? Gdy zestawimy ze sobą konsumpcję margaryny i liczbę rozwodów przypadającą na każde 100 par w Maine, zależność staje się uderzająca.

Korelacja pozorna.png

Tak więc jeśli zależy Ci na trwałym małżeństwie, unikaj margaryny!

Kręcisz nosem, że coś tu nie gra? Przyczyna rozwodów wydaje się idiotyczna? Słusznie!

Powyższy wykres jest idealnym przykładem korelacji pozornej. Jest to sytuacja w której zachodzą podobne zmiany trendów różnych, zupełnie niepowiązanych ze sobą wielkości. Jeśli w tym samym czasie spadnie sprzedaż margaryny i liczba rozwodów, to nie znaczy, że jedno jest przyczyną drugiego!

Korelacje pozorne występują także:

  • między konsumpcją sera, a liczbą osób, które umarły na skutek zaplątania się w pościeli
  • między liczbą osób, które utonęły, wypadłszy z łodzi rybackich, a liczbą małżeństw zawieranych na tysiąc par w Kentucky

Te zabawne przykłady pochodzą ze strony „Spurious correlations” stworzonej przez studenta Tylera Vigena, który napisał program przekopujący setki danych statystycznych i wyciągający podobieństwa w zmianach trendów. Ta zgodność może być najzwyklejszym przypadkiem, dlatego poszukiwania potrafią dać komiczny efekt.

Niestety nasz mózg jest zaprogramowany do nałogowego poszukiwania wyjaśnień przyczynowo skutkowych. Trudno go o to winić. Spójrzmy z perspektywy ewolucji. Jeśli zauważymy, że po zjedzeniu danej potrawy robi nam się niedobrze, odstawienie jej będzie rozsądnym działaniem zwiększającym nasze szanse przetrwania. Niestety ten mechanizm jest podatny na wypaczenia. Wystarczy nam pokazać wymowny wykres, byśmy przyjęli, że widzimy przyczynę i skutek.

Zdarza się też tak, że umiejscawiamy przyczynę w złym miejscu. Znana jest korelacja między liczbą gniazd bocianich w najbliższym sąsiedztwie a liczbą dzieci w gospodarstwie domowym. Im więcej bocianów, tym większa dzietność. Czyżby prawdą było, że dzieci przynosi bocian? Możemy sobie wyobrazić rodzica, który pokazuje dziecku tę statystykę, by uwiarygodnić swoje kłamstwo. A prawdziwe wyjaśnienie jest inne. W obszarach wiejskich jest zwykle większy przyrost naturalny (na jedno gospodarstwo domowe przypada więcej dzieci) i jednocześnie bocian chętniej założy gniazdo w pobliżu wsi, niż w centrum miasta.

Wróćmy do naszego badania, które wykazało, że występuje korelacja między paleniem marihuany, a gorszymi ocenami. Przyjmijmy, że palenie marihuany oznaczymy literą A, zaś oceny literą B. Przyjrzyjmy się, jakie mogą być przyczyny odkrytej zależności.

  • A powoduje B – palenie marihuany powoduje pogorszenie ocen. Można to tłumaczyć skutkami ubocznymi uzależnienia.
  • B powoduje A – gorsze oceny sprzyjają paleniu marihuany. Być może uczniowie osiągający gorsze wyniki w nauce są bardziej zestresowani warunkami szkolnymi i za pomocą narkotyku się odprężają.
  • Na A i B wpływa czynnik C – może zdarzyć się tak, że zależność między A i B wynika z tego, że reagują w podobny sposób na przyczynę C. Przykładowo szkodliwa atmosfera w domu może zarówno sprzyjać uciekaniu w narkotyki, jak i spadkowi ocen w wyniku ciągłego stresu. Przypomnij sobie przykład z bocianami.
  • Wartości A i B przypadkowo zmieniły się podobnie – po prostu tak się złożyło, że wystąpiła korelacja. Zwykły przypadek. Jak w sytuacji z margaryną.

Korelacje pozorne a wiara w przesądy

Wielu ludzi posiada jakiś przedmiot, który ma im przynosić szczęście. Student na egzamin zabiera „szczęśliwy długopis”. Później swój sukces będzie tłumaczył długopisem, chociaż - patrząc racjonalnie - taki wniosek nie ma sensu.

Załóżmy, że zaprosiliśmy do pokoju 30 osób. Okazuje się, że dwie z nich mają urodziny tego samego dnia. Magia? Przeznaczenie? Nie. To rachunek prawdopodobieństwa. Szanse wystąpienia takiego zdarzenia są większe niż 50%. Ten przypadek doczekał się nawet swojej nazwy – paradoks dnia urodzin.

Kupiliśmy los na loterię. Szansa wygranej wynosi 1 na milion. Jeśli zakłady obstawi 5 milionów, wygrana pięciu z nich nie dziwi. Ale dla mózgu to słabe wytłumaczenie. "Szczęśliwa kolektura" albo "szczęśliwe numery" – dużo lepsze. Próbujemy znaleźć powód, dla którego akurat TA kombinacja wygrała. Chociaż przecież wiemy, że zdecydowało losowanie.

W życiu codziennym uczestnicy loterii często zakładają, że warto stawiać na liczby, które dawno nie padały, a nie warto na te, które były wylosowane w ostatnim losowaniu. Jest to błędne założenie, ponieważ szansa, że w następnym losowaniu wylosowane zostaną dokładnie te same liczby, co w ostatnim, jest równa szansie, że padnie kombinacja niespotykana przez wiele miesięcy. Przed losowaniem każda kombinacja liczb ma taką samą szansę na wylosowanie.

Myślenie w kategoriach magii i sił nadprzyrodzonych o codziennych sytuacjach daje nam proste odpowiedzi na trudne pytania. „On zachował się w taki sposób, ponieważ urodził się w lipcu”. „Ona miała wypadek, ponieważ wcześniej drogę przebiegł jej czarny kot”. Chociaż kuszące są odpowiedzi, które można zmieścić w jednym zdaniu, nie daj się nabrać. Są po prostu nieprawdziwe. Odciągają Twoją uwagę od faktycznych przyczyn różnych zjawisk.

Naiwne wnioski

Proste odpowiedzi są niejako pod ręką naszego umysłu. Łatwiej stwierdzić, że kobieta poroniła dziecko, ponieważ kilka miesięcy temu przeszła pod drabiną, niż ukończyć studia medyczne, by fachowo odpowiedzieć na to pytanie. Łatwiej stwierdzić, że trzęsienie Ziemi było rezultatem gniewu siły wyższej, niż zostać ekspertem, który odpowie na to zgodnie z wiedzą akademicką.

W psychologii spotykana jest metafora człowieka jako badacza. Każdy z nas ma w sobie coś z naukowca, który stara się zrozumieć świat. Stawia hipotezy oraz poszukuje dowodów na ich słuszność. Niestety nie posiada odpowiedniego zaplecza, nie zna teorii, a metodologię badawczą można nazwać „metodą na chłopski rozum”. Nie unika błędów poznawczych, dlatego uznaniem cieszy się określenie człowieka jako naiwnego badacza.

Naiwny badacz na poparcie swoich tez posiada dowody anegdotyczne – uznawane za najsłabszy rodzaj dowodu. Przyjrzyjmy się stwierdzeniu: „Picie koziego mleka wydłuża życie. Słyszałem, że człowiek, który pił dużo koziego mleka, żył prawie 120 lat!”. Po pierwsze, źródło dowodu w postaci „słyszałem” jest bardzo słabe. Po drugie, nawet jeśli ten człowiek faktycznie pił kozie mleko i żył prawie 120 lat, wcale nie oznacza, że długość życia zawdzięcza mleku. Nie można też na podstawie jednostkowego przypadku wyciągać tak ogólnych wniosków wobec wszystkich ludzi. Może jemu kozie mleko pomagało, ale komuś innemu może zaszkodzić.

Pomyśl o sytuacji z 2014 roku. Z dachu 11-piętrowego budynku w San Francisco spadł pracownik firmy zajmującej się myciem okien i przeżył. Jeśli potraktowalibyśmy anegdoty jako wystarczający dowód do szerokich wniosków, moglibyśmy powiedzieć tak – „Upadek z dużej wysokości wcale nie jest taki niebezpieczny. Słyszałem, że pewien człowiek spadł z jedenastego piętra i przeżył”.

Wyobraźmy sobie, że organizowany jest kurs przygotowujący do egzaminu. Zarówno przed kursem jak i po kursie są sprawdzane postępy za pomocą próbnego testu. Wśród stu uczestników tylko jeden napisał test gorzej po kursie niż przed. Dowód anegdotyczny brzmiałby tak „Unikaj tego kursu. Mój znajomy stracił tylko czas. Po szkoleniu napisał próbny egzamin gorzej niż przed”. A że pozostałe 99 uczestników poprawiło swoje wyniki? Takich „drobiazgów” dowody anegdotyczne nie obejmują.

Żeby tego było mało, anegdoty to często sytuacje niezwykle rzadkie. Przypisujemy większe prawdopodobieństwo zdarzeniom, które łatwiej nam sobie przypomnieć i wywołują większe emocje. Fachowo nazywamy to heurystyką dostępności. Rządne sensacji media najczęściej relacjonują anomalie, czyli zdarzenia nietypowe, bo będą dla odbiorców bardziej interesujące. Tak nakręca się błędne koło, w którym anomalia jest odbierana jako norma. Wśród anomalii ludzie najlepiej zapamiętują skrajną anomalię itd.

Według danych Instytutu Badań Opinii Publicznej aż 50 proc. osób odczuwa jakiś dyskomfort związany z lataniem. Szacuje się, że nawet 1/3 ludzi może cierpieć na tzw. awiofobię, czyli silny lęk przed podróżami samolotem. Przyczyny są bardzo różne, ale osoby dotknięte tą przypadłością m.in. pielęgnują w sobie strach, skupiając się wyłącznie na katastrofach lotniczych i potencjalnych zagrożeniach. Pomagają w tym media, sumiennie informując o każdym takim zdarzeniu.

A statystyki są jednoznaczne – każdego roku samolotami lata ponad 3 mld pasażerów. Ile z nich ginie rocznie wskutek katastrof? Średnio 500. Czyli tyle, ile rocznie zostaje zabitych przez hipopotamy. Warto uzmysłowić sobie fakt, że liczba ofiar wypadków samochodowych w tym samym czasie wynosi 1,2 mln! Nieprawdą jest też, że w razie katastrofy lotniczej giną wszyscy pasażerowie. W latach 1982-2009 odsetek ofiar wyniósł 39 proc.

Podsumowanie

Jak widzisz, intuicyjne wnioskowanie potrafi łatwo wprowadzić w błąd. Dlatego warto się pilnować.

  • To że oba zjawiska osłabły w tym samym czasie, nie znaczy, że są ze sobą powiązane.
  • To że jedna rzecz wystąpiła po drugiej, nie znaczy, że druga była przyczyną.
  • To że na jednego człowieka dana substancja zadziałała w określony sposób, nie znaczy, że tak samo zadziała na wszystkich.

Korelacja kontra przyczynowość.jpg
Korelacja kontra przyczynowość

Zobacz też

MiauBlog:

MruczekWiki: