Två viktiga frågor i många typer av forskning är om två variabler är korrelerade , och om så är fallet , styrkan ( eller betydelse ) i det förhållandet. Finns det en signifikant korrelation , till exempel, mellan kön eller etnicitet och politisk tillhörighet ? Den chi - square test är en allmänt använd metod för att mäta om ett signifikant samband finns mellan två nominella eller kategoriska variabler , såsom kön och politisk tillhörighet . Saker du behöver
dator eller kalkylator
uppsättning data
Statistik bok eller manuell
Visa fler instruktioner
1
Börja med en hypotes innan du börjar din dataanalys . En vanlig hypotes i mycket forskning är att det inte finns något samband mellan de två variablerna av intresse . Den chi ( rimmar med " min " ) square test mäter nivån av avvikande beteende från en given hypotes . Ju större chi -kvadrat statistik , desto mindre väl hypotesen passar datan. Anta till exempel att vi tittar på en uppsättning data som frågade 125 registrerade väljare ( 65 kvinnor och 60 män ) deras politiska partitillhörighet ( demokratisk eller republikansk ) . Antag att vi vet från tidigare forskning att 55 procent av väljarna identifierade sig som demokrater . Vår arbetshypotes är att detta 55 procent jämnt kommer att fördelas mellan män och kvinnor .
2
Beräkna de förväntade värden som baseras på hypotetiska modell för politisk tillhörighet efter kön . Baserat på 125 väljare förväntar vi oss att 55 procent ( 69 röstberättigade ) kommer att identifiera sig som demokrater . Fördelat på kön , förväntar vi oss att 36 kvinnor och 33 män kommer att uttrycka en preferens för det demokratiska partiet , lämnar 29 kvinnor och 27 män gynnar det republikanska partiet . Organisera dina data i en 2 - av - 2-matris ( två rader och två kolumner ) . Låt partitillhörighet vara kolumnen variabler och kön vara rad variabler .
3
Jämför de verkliga värdena från dina data med de förväntade värdena du beräknade i steg 2 . För detta exempel , låt oss säga att det bland de 65 kvinnorna , identifierade 44 procent sig själva som demokrater och 21 republikaner som , medan 36 män hävdade en demokratisk tillhörighet och 24 föredrog det republikanska partiet .
4
Beräkna chi - kvadrat statistik , vilket är summan av de kvadrerade skillnaderna mellan de observerade och förväntade värden ( även känd som residualerna ) , dividerat med de förväntade värdena . Du behöver detta för de fyra möjliga kombinationer av kön och politisk tillhörighet anges i modellen . Om du använder en dator , kan många statistiska och kalkylprogram beräkna chi - square statistik för dig . I vårt exempel , är summan av kvadratiska differentialer dividerat med förväntade värden 4,59 .
5
Bestäm om chi - square statistik du beräknas i steg 4 är statistiskt signifikant . För att göra detta , måste du veta två saker : de frihetsgrader och signifikans nivån . Frihetsgrader är antalet rader i tabellen minus ett , gånger antalet kolumner minus ett . Signifikansnivå avser sannolikheten att den observerade korrelationen kan ha uppstått av en slump ensam . Många forskare föredrar en .05 signifikans nivå , vilket innebär att det är bara en 5 procent sannolikhet att det observerade sambandet är ren slump . I vårt exempel har vi bara en frihetsgrad . Använd din statistik bok ( oftast i appendix ) , leta upp chi - kvadrat värde som motsvarar den signifikansnivå och frihetsgrad . I vårt exempel är det chi - kvadrat värde för 1 frihetsgrad och 0,05 signifikansnivå 3,84 . Vårt värde på 4,59 är större , vilket innebär att det finns ett statistiskt signifikant samband mellan kön och politisk tillhörighet , med kvinnor är betydligt mer benägna att identifiera sig som demokrater .