Kluster analys är en statistisk metod som används för att ordna ärenden i kategorier så att de fall i varje kategori liknar varandra och skiljer sig från fall i andra kategorier . Varje kategori är ett kluster . Samhällsvetare använder SPSS ( Statistical Package för samhällsvetenskap ) att genomföra kluster analyser . I K -means klustring forskaren betecknar antalet önskade kluster . K är antalet kluster forskare tyder de vill . K -means klustring låter forskare kluster mycket stora datamängder . Instruktioner
Analysera data
1
Klicka på " Analysera " överst th SPSS skärmen . Välj " Klassificera " från drop - down menyn och " K - Means Cluster . "
2
Välj ett urval av ärenden . I dialogrutan , klicka på " Variables " och markera de variabler du vill använda i den initiala K - Means analys . Klicka på den vänstra pilen för att flytta variablerna i rutan . Ange antalet kluster , vanligtvis 5 i en genomsnittlig storlek datamängd , i rutan " antal kluster . " Antalet kluster måste vara mer än två och inte mer än antalet ärenden . Klicka på " Iterate och klassificera " i dialogrutan för att få kluster centra . Klicka på " Skriv final . " Addera 3
Inkludera hela datafilen för final K - Means analys . Klicka på " Analysera " i toppen av SPSS -skärmen. Välj " Klassificera " från drop - down menyn och " K - Means Cluster . " I dialogrutan väljer du " Variables " och markera de variabler du vill använda . Klicka på den vänstra pilen . Ange antalet kluster på 5 i rutan " antal kluster . " Klicka på " Klassificera " i dialogrutan . Välj " Läs Initial " för att få klustret centra från provet i steg 2 . Klicka på " Spara ". Klicka på " Cluster -medlemskap . " Klicka på " Fortsätt . " Addera Läs Output
4
Review den första tabellen i produktionen , märkta " Final Cluster Centers . " Den övre delen av bordet har siffrorna 1 till 5 över den, som anger var och en av de fem kluster. Den vänstra kolumnen listar " REGR faktor värdering " ( Regression faktor poäng eller hur väl varje variabel förutspår poängen ) för varje analys . Om du följer den linjen bredvid betyget 1 för analys 1 till höger , kommer det att ge dig den faktor poäng för varje kluster .
5
Läs nästa tabell i utdata rubriken " antalet fall i varje Cluster . " Rutan till vänster visar de kluster av nummer , 1 till 5 . Följ Cluster till höger och du kommer att finna det antal fall i detta kluster .
6
Titta på den sista tabellen i produktionen , " Cluster medlemskap " som visar vilka ärenden finns i varje klustret. Ärendena listas i den vänstra kolumnen och klustret nummer finns i kolumnen längst till höger .