Forskjellen mellom type I og type II feil i hypotesetesting

C.K. Taylor
Den statistiske praksisen til hypotesetesting er utbredt ikke bare i statistikk, men også i hele natur- og samfunnsvitenskapene. Når vi lage en hypotese test der et par ting som kan gå galt. Det er to typer feil, som designmessig ikke kan unngås, og vi må være klar over at disse feilene eksisterer. Feilene er gitt de ganske fotgjengernavn av type I og type II feil. Hva er type I og type II feil, og hvordan skiller vi mellom dem? Kort:
- Type I-feil oppstår når vi avviser en sann nullhypotesen
- Type II-feil oppstår når vi ikke klarer å avvise en falsk nullhypotese
Vi vil utforske mer bakgrunn bak denne typen feil med mål om å forstå disse utsagnene.
Hypotesetesting
Prosessen med hypotesetesting kan synes å være ganske variert med en mengde teststatistikker. Men den generelle prosessen er den samme. Hypotesetesting innebærer uttalelse av en nullhypotese og valg av enbetydningsnivå. Nullhypotesen er enten sann eller usann og representerer standardkravet for en behandling eller prosedyre. For eksempel, når man undersøker effektiviteten til et legemiddel, vil nullhypotesen være at legemidlet ikke har noen effekt på en sykdom.
Etter å ha formulert nullhypotesen og valgt et signifikansnivå innhenter vi data gjennom observasjon. Statistiske beregninger fortelle oss om vi skal forkaste nullhypotesen eller ikke.
I en ideell verden vil vi alltid forkaste nullhypotesen når den er usann, og vi ville ikke forkaste nullhypotesen når den faktisk er sann. Men det er to andre scenarier som er mulige, som hver vil resultere i en feil.
Type I-feil
Den første typen feil som er mulig innebærer avvisning av en nullhypotese som faktisk er sann. Denne typen feil kalles en type I-feil og kalles noen ganger en feil av den første typen.
Type I-feil tilsvarer falske positiver. La oss gå tilbake til eksemplet med et stoff som brukes til å behandle en sykdom. Hvis vi forkaster nullhypotesen i denne situasjonen, så er vår påstand at stoffet faktisk har en viss effekt på en sykdom. Men hvis nullhypotesen er sann, så bekjemper ikke stoffet sykdommen i virkeligheten i det hele tatt. Stoffet er feilaktig hevdet å ha en positiv effekt på en sykdom.
Type I-feil kan kontrolleres. Verdien av alfa, som er relatert til betydningsnivå som vi valgte har direkte betydning for type I-feil. Alfa er den maksimale sannsynligheten for at vi har en type I-feil. For et 95 % konfidensnivå er verdien av alfa er 0,05. Dette betyr at det er 5 % sannsynlighet for at vi forkaster en sann nullhypotese. På sikt vil en av hver tjue hypotesetester vi utfører på dette nivået resultere i en type I feil.
Type II feil
Den andre typen feil som er mulig oppstår når vi ikke forkaster en nullhypotese som er usann. Denne typen feil kalles en type II-feil og omtales også som en feil av den andre typen.
Type II-feil tilsvarer falske negativer. Hvis vi tenker tilbake på scenariet der vi tester et medikament, hvordan ville en type II-feil se ut? En type II feil ville oppstå hvis vi aksepterte at stoffet ikke hadde noen effekt på en sykdom, men i virkeligheten gjorde det det.
Sannsynligheten for en type II feil er gitt av den greske bokstaven beta. Dette tallet er relatert til kraften eller følsomheten til hypotesetesten, angitt med 1 – beta.
Hvordan unngå feil
Type I og type II feil er en del av prosessen med hypotesetesting. Selv om feilene ikke kan elimineres helt, kan vi minimere én type feil.
Vanligvis når vi prøver å redusere sannsynligheten for en type feil, øker sannsynligheten for den andre typen. Vi kan redusere verdien av alfa fra 0,05 til 0,01, tilsvarende 99 % nivå av tillit . Men hvis alt annet forblir det samme, vil sannsynligheten for en type II feil nesten alltid øke.
Mange ganger vil den virkelige verden-anvendelsen av hypotesetesten vår avgjøre om vi aksepterer type I eller type II feil. Dette vil så bli brukt når vi utformer vårt statistiske eksperiment.