Bayes sats och verkligheten

För ett tag sedan gick vi igenom några av de intuitiva tankarna bakom bayesiansk konfirmationsteori. Men varför är den här teorin så viktig? Låt mig illustrera detta genom ett tankeexperiment.

En person ska göra ett klamydiatest. Andelen som har klamydia i personens åldersgrupp är 1%.

Men testet är inte perfekt.

Av de som har klamydia får 90 % ett positivt resultat (true positive). Det innebär att 10 % av de som har klamydia får ett negativt resultat (false negative).

Av de som inte har klamydia får 20 % ett positivt resultat (false positive), vilket innebär att av de som inte har klamydia får 80 % ett negativt resultat (true positive).

Personen får positivt på testet. Hur stor sannolikhet är det att personen har klamydia? Tänk efter innan du läser vidare.

Om du svarade ”ungefär 90 %” på den här frågan är du i gott sällskap. Nästan alla svarar ”ungefär 90 %”. Men nästan alla har fel. Och de har fel med en stor marginal. Det rätta svaret är: “givet ett positivt resultat är sannolikheten ungefär 4 % att personen har klamydia”. Hur? Varför? Det är nu vi kan visa nyttan av att tänka bayesianskt.

Tänk så här. 1000 personer går och testar sig. Av dem har 10 (1 %) klamydia. Av dessa 10 får 9 (90 %) ett positivt resultat. En av de som har klamydia får ett negativt resultat.

Men. Av de 1000 som testar sig har 990 (99 %) inte klamydia. Av dessa friska 990 får 198 (20 %) ett positivt resultat. Resterande, 792 får ett negativt resultat.

Så vi har två grupper som båda har fått ett positivt resultat. De som har klamydia, 9 personer, och de som inte har klamydia, 198 personer.

Personen som har fått ett positivt resultat på sitt test vet inte om hen tillhör den första eller den andra gruppen. Men hen vet en sak: det är mycket mer sannolikt att tillhöra den större gruppen. Varför?

Det är just detta som bayesiansk konfirmationsteori handlar om. Den ger oss ett matematiskt verktyg att på ett precist sätt kunna säga hur sannolikheten hos en hypotes förändras i ljuset av ny evidens.

Vi gör detta genom att dividera 9, antalet som faktiskt har klamydia, med 207, antalet som fått positivt på testet. Då får vi veta hur stor andel av de som fått positivt på sitt test har klamydia. Svaret är ungefär 0,04; alltså 4 %.

Var testet värdelöst? Inte alls. Innan vi gjorde testet var vår subjektiva sannolikhet att personen hade klamydia 1 %. Det positiva testresultatet innebar att den subjektiva sannolikheten fyrdubblades.

Med hjälp av bayesiansk konfirmationsteori kan vi alltså göra precisa bedömningar av hur våra subjektiva sannolikheter bör förändras i ljuset av ny information, och dessa bedömningar är, i vissa fall extremt kontraintuitiva. Men eftersom de likväl är korrekta visar det vikten i att använda bayesianskt tänkande när vi funderar på hur ny evidens bör förändra våra uppfattningar om världen.

Publicerad torsdag, november 7th, 2013 i Karim Jebari, politik.

En kommentar

  1. Anonymous skriver:

    Det var mig ett basalt inlägg. Ska du skriva om statistik så får du vara lite mer allmängiltig. ”Vi gör detta genom att dividera 9”. Baye’s sats bör dessutom förklaras med betingning.

    Lycka till med eran progressiva blogg.

Vad tycker du?