Principal Component Analysis minskar en uppsättning av korrelerade variabler till en mindre uppsättning okorrelerade variabler , förenkla en komplex uppsättning data för vidare undersökning . Denna komplexa statistiska förfarandet kan utföras av många program för dataanalys programvara , eller genom att lägga på program som utökar förmågan hos vissa existerande programpaket . Förenkling av datamängder
Principal Component Analysis är en data prospektering och minskning teknik som analytiker använder för att extrahera den viktigaste informationen från stora , förvirrande datamängder . Analytiker använder huvudkomponentanalys när de har ett stort antal observerade variabler som gör en uppsättning data som verkar otymplig . Ofta är många av de variabler korrelerade , göra de uppgifter överflödiga . Principal Component Analysis förenklar data genom att uttrycka dessa variabler i form av ett mindre antal underliggande strukturer ( sk huvudkomponenter ) som står för större delen av variansen i åtgärderna .
Programvara Begagnade
komplexitet huvudkomponentanalys kräver användning av ett program . En mängd olika statistiska program finns, och de flesta av dem är kapabel att genomföra huvudkomponentanalys . De mest använda programpaket för statistisk analys inkluderar SAS , Stata och SPSS . Universitet, forskningscentrum , organisationer konsulttjänster och andra yrkesgrupper forskning använder dessa specialiserade program . Alla tre programmen kan utföra huvudkomponentanalys på en uppsättning av uppgifter i ett kalkylblad där raderna representerar enskilda observationer och kolumnerna representerar separata variabler .
Funktioner
flesta program för huvudkomponentanalys , inklusive SAS , Stata och SPSS , kommer visa resultatet av huvudkomponentanalys i en tabellform som innehåller egenvärdena , eller åtgärder förklarad variation . Många program också kommer att tillhandahålla visuell visning av resultaten i form av en scree tomt .
Överväganden
Principalkomponentanalys ibland förväxlas med faktoranalys , annan datareduktion teknik som förklarar korrelerade observationer i termer av bakomliggande faktorer . De två är faktiskt skilda förfaranden , även huvudkomponentanalys är ett steg i faktoranalys . Men många programpaket kombinera de två förfarandena .
En annan viktig faktor är att specialiserade programpaket som SAS , SPSS och Stata är dyra att köpa . Därför kan dessa program inte vara användbara för människor som inte planerar att genomföra frekventa statistiska analyser .
Excel
Människor som behöver utföra några statistiska analyser , men skulle föredra att inte köpa ett specialiserat program , kan fråga om allmänt tillgängliga kalkylprogram som Excel , är kapabel att genomföra huvudkomponentanalys . Svaret är ja och nej . Även Excel har vissa funktioner för dataanalys , som användaren kan komma åt genom att installera analysverktyget add- in , var programmet inte i första hand tänkt som en statistisk analys program . Principal komponent analys och faktoranalys är inte bland de funktioner i dataanalys verktyg .
Förebyggande /Lösning
p Det är ett program som användare kan ladda ner och installera för att förbättra Excels funktioner som ett verktyg för dataanalys . Addinsoft , ett mjukvaruföretag som specialiserat sig på analytiska program . XLSTAT gör Excel att utföra huvudkomponentanalys och andra förfaranden . Programmet har samma användarvänliga förfaranden som tillåter användare att välja de data att analysera genom att helt enkelt klicka på en cell och dra över fälten . Användare kan köpa och ladda XLSTAT från Addinsoft hemsida . Det finns också en gratis testversion som användarna kan prova innan du bestämmer dig för att köpa den . Addera