Kluster är en maskininlärning teknik fungerar genom att gruppera liknande data tillsammans . Kluster är en typ av oövervakad maskininlärning . Algoritmen behöver inte vara " utbildad " och kan gruppera data i sammanhållna grupper med en " förutfattad " föreställningen om det som hör samman . Detta skiljer sig från övervakade maskinen lärande system som måste vara " utbildad " för att märka data på rätt sätt . Kluster används främst som en dator mönsterigenkänning mekanism . Generativa eller Sannolikhet algoritmer
Generativa eller sannolikhet baserad klustring algoritmer försöka klassificera datamängder som något slags känd fördelning , en gemensam grupp av numeriska data . Denna typ av algoritm kan endast användas på numeriska data. Generativa algoritmer kommer med flera varningar . Problemet kan vara olösligt om uppgifterna tillåts variera alltför fritt . Generativa algoritmer förutsätter också att uppgifter förkroppsligar en känd fördelning , vilket inte alltid är sant . Dessa typer av algoritmer också beaktas inte " brus " i datan . Addera K -means klustring
K -means klustring var en av de första klustring metoder för utvecklas. Det är enkelt att implementera, men det har nackdelen av att vara extremt känsliga för dess utgångsmaterial ingångar. K -means klustring fungerar genom att dela upp data i en slumpmässig uppsättning kluster och sedan omberäkna mittpunkter varje kluster och upprepa processen tills det bara finns ett kluster . Detta kallas konvergens . Som tillhör specifika grupper , fuzzy kluster försök att identifiera vilken grad en data
Fuzzy klustring
Istället för identifierande data punkt tillhör en grupp . De algoritmer som används för att göra fuzzy kluster kallas " C- medel algoritmer . " I fuzzy klustring tillvägagångssätt , kan en datapunkt tillhöra mer än en grupp . Denna typ av klustring är användbar när datapunkter kan behöva tillhöra mer än en grupp .
Agglomerationstillstånd klustring
agglomerationstillstånd klustring var en av de första klustring algoritmer för att vara utvecklas. Det återstår i bruk , eftersom det är också en av de enklaste algoritmer utvecklats hittills . Agglomerationstillstånd klustring fungerar genom att behandla varje enskild datapunkt som ett kluster och gruppera den med den mest liknande datapunkt . Denna process upprepas tills uppgifterna " konvergerar ", eller det finns ett stort kluster som innehåller alla data . Processen kan också göras i omvänd till samma effekt . Börjar med ett kluster , kan alla data upprepade gånger delas tills varje datapunkt är sin egen kluster .