Czy to tylko przypadek?

Ludzki mózg wydaje się być zaprogramowany do zauważania wzorców. To prawdopodobnie ma pewne ewolucyjne zalety, ale ta cecha może nas wprowadzić w błąd w świecie przeładowanym danymi. Zacznę od osobistej anegdoty, a następnie pokażę implikacje dla analizy danych.
18 czerwca, podróżując przez zachodnią część Vancouver, zauważyłem ulicę o nazwie „Trutch”. Pamiętam, że pomyślałem, że to dziwna nazwa. Kilka dni później Tyler Cowen zamieścił link do artykułu w gazecie w Vancouver , w którym omawiano fakt, że nazwa tej ulicy została właśnie zmieniona:
Dan Fumano: Wielu mieszkańców ulicy, która niedawno została nazwana Trutch, powiedziało, że popiera zmianę nazwy. Martwią się jednak o możliwe praktyczne implikacje ulicy, której jedyna nazwa jest zapisana w języku innym niż angielski.
Autor artykułu: Dan Fumano Opublikowano 17 czerwca 2025 r., Ostatnia aktualizacja 18 czerwca 2025 r.
To jeszcze dziwniejsza nazwa!
Zauważ, że zmiana nazwy nastąpiła mniej więcej w tym samym czasie, kiedy obserwowałem ulicę. To wydaje się dość niesamowitym zbiegiem okoliczności. Ale to nie wszystko. W ostatni poniedziałek spędziliśmy jedną noc w hotelu w Calgary, zanim polecieliśmy do domu. Następnego ranka obudziłem się i sprawdziłem Marginal Revolution. To pierwszy post, który zobaczyłem:
Calgary wznawia stosowanie fluoru, a oto fakt dnia z QuebecuTo jeszcze większy zbieg okoliczności. To prawie tak, jakby Tyler wiedział o moich planach podróży i celowo opublikował materiały związane z moją lokalizacją. Oczywiście to bzdura, nawet nie wiedział, że jestem na wakacjach. Ale możesz zrozumieć, jak przesądna osoba może uznać te zbiegi okoliczności za znaczące. Jakie są szanse?
Być może myślisz, że w świecie, w którym miliardy zdarzeń zdarzają się każdego dnia, zbieg okoliczności nie ma aż tak dużego znaczenia. Jednak większość naszych badań w nauce i naukach społecznych opiera się na założeniu, że zbiegi okoliczności są bardzo znaczące. Przynajmniej w fizyce naukowcy często upierają się przy bardzo nietypowych zbiegach okoliczności, „zdarzeniach 5 sigma”, co oznacza więcej niż 5 odchyleń standardowych od przewidywanej wartości. Jednak w wielu dziedzinach istnieje znacznie słabszy test istotności, zaledwie dwa odchylenia standardowe od hipotezy zerowej. Oznacza to, że losowe zbiegi okoliczności z prawdopodobieństwem zaledwie 20 do 1 są postrzegane jako wysoce znaczące.
W niedawnym wpisie na EconLog Kevin Corcoran napisał:
W 2007 r. Eliezer Yudkowsky napisał interesujący artykuł, w którym opowiadał się za tym, co nazwał „ przeciwstawianiem się danym”. Pomysł był dość prosty – powiedzmy, że masz jakąś teorię wyjaśniającą, jak działa świat. Nowe badanie zostaje opublikowane z danymi, których nie da się wyjaśnić za pomocą twoich ram teoretycznych. Jak powinieneś zareagować?
Jedną z odpowiedzi jest porzucenie swojej teorii na rzecz nowych danych. Inną odpowiedzią jest zachowanie nienaruszonej teorii i, jak mówi Yudkowsky, „ zaatakowanie eksperymentu – oskarżenie badaczy o nieuczciwość, wadliwy projekt lub konflikt interesów”. Istnieje jednak trzecia możliwość – po prostu zignorowanie danych. . . .
Jeśli teoria została ugruntowana i potwierdzona licznymi badaniami i eksperymentami, to jedno naprawdę uderzające pojawienie się danych jej przeczących nie powinno mieć większego znaczenia.
Na pierwszy rzut oka może to brzmieć nienaukowo. Jednak w praktyce często się zdarza, że dowody „obalające” daną teorię są niczym więcej niż zwykłym zbiegiem okoliczności — czymś, co zdarza się każdego dnia.
Nawet bardzo inteligentni eksperci (i ja sam) czasami dają się nabrać na zbiegi okoliczności. Jednym z najgorszych ostatnich przykładów jest debata na temat pochodzenia Covid. Przez całą historię pandemie często zaczynały się w dużych miastach południowych Chin, gdzie duże populacje żyły w bliskim sąsiedztwie targów dzikich zwierząt. Tak rozpoczęła się pierwsza epidemia SARS w listopadzie 2002 r. Pandemia Covid (SARS-2) wydaje się rozpocząć w niemal identyczny sposób, na targu dzikich zwierząt w jednym z największych miast południowych Chin.
Pomimo tego faktu wielu ekspertów przyjęło całkowicie niepotwierdzoną teorię, że Covid pochodzi z wycieku z laboratorium, ponieważ wśród pół tuzina największych obszarów metropolitalnych w południowych Chinach, najpierw pojawił się w jednym, w którym znajduje się ważny instytut badawczy ds. wirusów. To jeden z najsłabszych zbiegów okoliczności, jaki kiedykolwiek widziałem, a mimo to wiele osób wydaje się postrzegać go jako mocne poparcie dla teorii wycieku z laboratorium. Natomiast hipoteza rynku zwierzęcego opiera się na zbiegu okoliczności, który jest o wiele rzędów wielkości mniej prawdopodobny, aby wystąpił przypadkowo.
Na świecie są miliony ulic. Fakt, że zauważyłem pewną ulicę w Vancouver tuż przed tym, jak Tyler opublikował artykuł o tej ulicy, jest w rzeczywistości dość niesamowitym zbiegiem okoliczności. A to, że wpis Tylera o fluorze pojawił się zaledwie 10 dni później, kiedy przejeżdżałem przez Calgary, jest jeszcze bardziej niesamowitym zbiegiem okoliczności. Natomiast cała teoria wycieku laboratoryjnego opiera się na niczym więcej niż na łagodnym zbiegu okoliczności, który jest mniej więcej tak interesujący, jak wyrzucenie tej samej liczby dwa razy z rzędu podczas rzucania sześciościenną kostką.
econlib