En introduksjon til sosiologistatistikk

Bruke skjermer med grafer og diagrammer i forretningsmøter

Monty Rakusen/Getty Images





Sosiologisk forskning kan ha tre distinkte mål: beskrivelse, forklaring og prediksjon. Beskrivelsen er alltid en viktig del av forskningen, men de fleste sosiologer forsøker å forklare og forutsi hva de observerer. De tre forskningsmetodene som oftest brukes av sosiologer er observasjonsteknikker, undersøkelser og eksperimenter. I hvert tilfelle er måling involvert som gir et sett med tall, som er funnene, eller dataene, produsert av forskningsstudien. Sosiologer og andre forskere oppsummerer data, finner forhold mellom sett med data og avgjør om eksperimentelle manipulasjoner har påvirket en variabel av interesse.

Ordet statistikk har to betydninger:



  1. Feltet som bruker matematiske teknikker for organisering, oppsummering og tolkning av data.
  2. Selve matematiske teknikkene. Kunnskap om statistikk har mange praktiske fordeler.

Selv en rudimentær kunnskap om statistikk vil gjøre deg bedre i stand til å evaluere statistiske påstander fra journalister, værmeldinger, TV-annonsører, politiske kandidater, myndighetspersoner og andre personer som kan bruke statistikk i informasjonen eller argumentene de presenterer.

Representasjon av data

Data er ofte representert i frekvensfordelinger, som indikerer frekvensen av hver skåre i et sett med skårer. Sosiologer bruker også grafer å representere data. Disse inkluderer sektordiagrammer, frekvens histogrammer , og linjegrafer. Linjegrafer er viktige for å representere resultatene av eksperimenter fordi de brukes til å illustrere forholdet mellom uavhengige og avhengige variabler.



Beskrivende statistikk

Beskrivende statistikk oppsummere og organisere forskningsdata. Mål for sentral tendens representerer den typiske poengsummen i et sett med poengsummer. Modusen er den hyppigst forekommende poengsummen, medianen er midtskåren, og gjennomsnittet er det aritmetiske gjennomsnittet av settet med poeng. Mål for variasjon representerer graden av spredning av skårer. Området er forskjellen mellom høyeste og laveste skåre. De forskjell er gjennomsnittet av kvadrerte avvik fra gjennomsnittet av settet med skårer, og standardavviket er kvadratroten av variansen.

Mange typer målinger faller på en normal, eller klokkeformet, kurve. En viss prosentandel av poengsummene faller under hvert punkt på abscissen til normal kurve . Persentiler identifiserer prosentandelen av poengsummene som faller under en bestemt poengsum.

Korrelasjonsstatistikk

Korrelasjonsstatistikk vurdere forholdet mellom to eller flere sett med skårer. ENsammenhengkan være positiv eller negativ og variere fra 0,00 til pluss eller minus 1,00. Eksistensen av en korrelasjon betyr ikke nødvendigvis at en av de korrelerte variablene forårsaker endringer i den andre. Eksistensen av en korrelasjon utelukker heller ikke denne muligheten. Korrelasjoner er vanligvis tegnet på spredningsplott. Den kanskje vanligste korrelasjonsteknikken er Pearsons produkt-øyeblikk-korrelasjon. Du kvadrerer Pearsons produkt-øyeblikk-korrelasjon for å få bestemmelseskoeffisienten, som vil indikere mengden varians i en variabel som står for en annen variabel.

Inferensiell statistikk

Inferensiell statistikk tillater samfunnsforskere å bestemme om funnene deres kan generaliseres fra prøvene til populasjonene de representerer. Tenk på en enkel undersøkelse der en eksperimentell gruppe som er utsatt for en tilstand sammenlignes med en kontrollgruppe som ikke er det. For at forskjellen mellom gjennomsnittene til de to gruppene skal være statistisk signifikant, må forskjellen ha lav sannsynlighet (vanligvis mindre enn 5 prosent) for å oppstå ved normal tilfeldig variasjon.



Kilder:

  • McGraw Hill. (2001). Statistikkgrunnlag for sosiologi. http://www.mhhe.com/socscience/sociology/statistics/stat_intro.htm