|
|
Onderwerp Opties | Zoek in onderwerp | Waardeer Onderwerp | Weergave Modus |
#1
|
||||
|
||||
Statistiek snappen is nu belangrijker dan ooit
Statistiek snappen is nu belangrijker dan ooit
Wanneer we worden overladen met statistieken en grafieken, is het belangrijk dat we leren hoe we ze moeten interpreteren, schrijft Italiaans fysicus en auteur Carlo Rovelli. In het instituut waar ik een paar jaar geleden werkte, werden vijf collega’s kort na elkaar getroffen door een zeldzame, niet-besmettelijke ziekte. De sfeer was wat paniekerig en er werd koortsachtig gezocht naar de oorzaak. In het verleden was het gebouw gebruikt als een biologisch laboratorium, dus dachten we misschien aan een vorm van chemische vervuiling, maar we konden niks vinden. De ongerustheid nam toe. Sommige collega’s zochten ander werk. Op een avond, tijdens een etentje, vertelde ik erover tegen een bevriende wiskundige. Hij proestte het uit. ‘De vloer van deze kamer telt 400 tegels’, zei hij. ‘Als ik 100 rijstkorrels in de lucht gooi, is er dan één tegel waarop ik vijf korrels zal vinden?’ We antwoordden ontkennend. Er was maar één korrel per vier tegels, te weinig dus om er vijf te hebben op één tegel. We hadden het mis. We probeerden het meermaals uit: we gooiden met echte rijstkorrels en er was altijd een tegel met twee, drie, vier, zelfs vijf of meer korrels erop. Waarom? Waarom zouden korrels die we lukraak in het rond slingeren zich niet netjes ordenen, op gelijke afstand van elkaar? Net omdat ze per toeval neerkomen, en er zijn altijd wanordelijke korrels die neerkomen op tegels waar al andere korrels liggen. Plots keken we anders naar het vreemde geval van de vijf zieke collega’s. Dat vijf rijstkorrels op dezelfde tegel terechtkomen, wil niet zeggen dat de tegel een soort ‘rijstaantrekkende’ kracht heeft. Vijf mensen die op één werkplek ziek werden, betekende niet dat die plek besmet moest zijn. Het instituut waar ik werkte, maakte deel uit van een universiteit. Wij, betweterige professoren, hadden een enorme statistische fout gemaakt. We waren ervan overtuigd geraakt dat een ‘bovengemiddeld aantal’ zieke mensen om een verklaring vroeg. Sommige collega’s waren zelfs naar elders vertrokken, zonder enige reden. Onnauwkeurigheid Het leven zit vol zulke verhalen. Over het algemeen weten mensen te weinig van statistiek. De huidige pandemie heeft ons allemaal gedwongen om aan kansberekening te doen, van regeringen die aanbevelingen doen over hoe we ons moeten gedragen op basis van statistische voorspellingen, tot mensen die een inschatting maken van het risico om door het virus besmet te worden tijdens heel normale bezigheden. Onze verregaande statistische ongeletterdheid is dezer dagen bijzonder gevaarlijk. We redeneren elke dag op basis van kansberekening, en de meesten onder ons hebben een zekere kennis van gemiddelden, veranderlijkheid en onderlinge verbanden. Maar we gebruiken ze bij benadering, en we maken vaak fouten. Statistiek verscherpt en verfijnt die begrippen. Ze definieert ze heel precies, zodat we, bijvoorbeeld, op een betrouwbare manier kunnen bepalen of een geneesmiddel of een gebouw gevaarlijk is of niet. De maatschappij zou er veel baat bij hebben als kinderen op school de basisbegrippen zouden leren van kansberekening en statistiek – in een eenvoudige vorm op de lagere school en uitgebreider op de middelbare school. Dat is een krachtig hulpmiddel om in te schatten en te analyseren. Als we dat niet kunnen, staan we machteloos. Niet weten wat gemiddelde, variantie, schommelingen en correlatiecoëfficiënt zijn, is net zoiets als niet weten hoe je moet vermenigvuldigen of staartdelen. Dat we niet vertrouwd zijn met statistiek, leidt ertoe dat veel mensen kansberekening verwarren met onnauwkeurigheid. Toen wetenschappers in het begin van de coronapandemie de verspreiding van het virus in Groot-Brittannië in kaart brachten en in modellen goten, kregen ze kritiek omdat ze schattingen gebruikten in plaats van nauwkeurig te beschrijven hoe erg de toestand zou kunnen worden. De kritiek op hun ‘twijfelachtige voorspellingen’ kwam voort uit een misverstand: die onzekerheid is precies de reden waarom statistiek zo nuttig is. Het kan regenen, of niet Zonder kansberekening en statistiek zouden moderne geneeskunde, kwantummechanica, weersvoorspellingen en sociologie niet zo efficiënt zijn. Om maar een paar willekeurige, maar belangrijke voorbeelden te noemen: dankzij statistiek weten we dat roken ongezond is en dat asbest dodelijk is. Meer nog: als we niet wisten wat kansberekening is, zou de experimentele wetenschap in haar geheel niet bestaan, van scheikunde tot astronomie. We zouden amper weten hoe atomen, samenlevingen en sterrenstelsels werken. Wat is kansberekening? De traditionele definitie is gebaseerd op frequentie: als ik vaak met een dobbelsteen gooi, zal ik één keer op de zes het cijfer 1 gooien, dus zeg ik dat de kans dat ik een 1 gooi één op de zes is. Een andere manier om kansberekening te zien, is als een ‘neiging’. Een radioactief atoom heeft de ‘neiging’ om binnen het halfuur instabiel te worden. Dat wordt bepaald door de kans dat dat kan gebeuren. In de jaren 30 bracht filosoof en wiskundige Bruno de Finetti een concept naar voren dat cruciaal zou worden om kansberekening te begrijpen: kansberekening is niet van toepassing op het systeem zelf (de dobbelsteen, het instabiele atoom, het weer voor morgen) maar op wat ik van dat systeem weet. Als ik beweer dat de kans op regen morgen groot is, dan zeg ik iets over de mate waarin ik de toestand van de atmosfeer niet begrijp. We weten veel, maar er is nog veel meer wat we niet weten. We weten niet wie we morgen op straat tegen het lijf zullen lopen, we weten niet waardoor veel ziektes veroorzaakt worden, we kennen de ultieme fysische wetten niet die het universum bepalen, we weten niet wie de volgende verkiezing zal winnen, we weten niet of er morgen een aardbeving zal zijn. Als ik het virus krijg, weet ik niet of ik het zal overleven. Maar dat we niet alles weten, betekent niet dat we niets weten, en statistiek is een krachtig instrument dat ons de weg wijst als we iets niet volledig begrijpen – zo goed als altijd, met andere woorden. Sterftecijfers, besmettingsgraad en reproductiegetallen komen nu elke dag in het nieuws. Een betere kennis van statistiek en kansberekening zou ons niet alleen helpen om te begrijpen wat we weten over de pandemie, maar ook om wijzere beslissingen te nemen, bijvoorbeeld als we risico’s inschatten en berekenen of een bepaalde vorm van gedrag wel veilig is. Maar geen enkel gedrag is gegarandeerd veilig, en er is geen manier om het virus gegarandeerd te krijgen. In deze onzekere tijden is het onnozel om absolute zekerheid te vragen. Wie opschept dat hij zeker is, is doorgaans het minst betrouwbaar. Maar dat betekent nu ook niet dat we in onwetendheid leven. Tussen zekerheid en totale onzekerheid zit een kostbare tussenzone. En het is in die tussenzone dat onze levens zich afspelen en dat onze beslissingen worden genomen. Dit essay is een bewerking van een stuk dat op 5 november verschijnt bij Penguin. DS, 31-10-2020 (Carlo Rovelli) Laatst aangepast door Barst : 25th May 2021 om 15:45. |