Beslut träd är föremål för en intensiv akademisk studie inom områdena verksamheten forskning och datavetenskap . Men inte nödvändigtvis det bästa sättet att strukturera information som behövs för att nå en slutsats , beslutsträd fungerar bra med vanliga algoritmer för beslutsstöd . Dessutom ger de en metod för att uttrycka affärsregler på ett sätt som personer utan tidigare erfarenhet av beslutsträd har möjlighet att följa . Ett beslutsträd är en liknande till ett flödesschema , vilket gör navigering genom en väg av val tills ett slutligt slutsats . Saker du behöver
uppsättning data för " lära " de träddatastruktur
vid testning resulterande trädet
Visa fler instruktioner
1
erhålla datamängder som kommer att användas för analys och kontroll av den slutliga trädet. Mer data som används i analysen kommer att ge en mer korrekt trädrepresentation av beslutsprocessen . Det finns många olika sätt att skapa och strukturera ett beslutsträd . Den ID3 -algoritmen är en tidig strategi på vilken mer sofistikerade varianter har baserats .
2
Lista alla attribut som används av datamängden . Till exempel , i en uppsättning av bankdata låneansökan kommer rekordet för varje sökande inkludera attribut såsom namn , adress , telefon , inkomster , hem värde , inteckning , bank-och kreditkort saldon .
P Om manuellt skapa ett beslut träd , naturligtvis utesluta attribut såsom namn , att du inte skulle förvänta sig att påverka beslutet om att bevilja ett lån . När du använder datorn data mining , är alla attribut ansåg , att lämna datorn för att avgöra vilka som har ingen relevans för det slutgiltiga resultatet . Ange vilka attribut är målattribut
3
. I exemplet på en låneansökan , är målattribut den som anger om lånet beviljas eller avslås.
4
Välj attribut för att ge störst informationen vinst för användning som root noden . Trädet består av beslutsfattare noder och noder blad . Vid beslutssteg noder , görs en förgrening skapas för varje möjliga värdet av målattribut . Varje gren representerar de dataposter som delar samma värde för målattribut .
Lövnod uppnås när alla poster övervägs vid den aktuella noden har samma resultat för målattribut . I lånet exempel om alla som ansöker om ett lån är godkänt , är hela beslutet trädet det triviala fallet med en enda lövnod utan grenar . Det är mer troligt att uppgifterna kommer att delas upp i två grenar : . Godkända och förnekade
Beräkningsmetoder välja attributet för att använda vid varje träd nod är extremt komplexa . Titta efter attribut som starkast förutsäger målet resultatet . Intuitivt " inkomster " skulle vara en bättre kandidat för root noden än " förnamn ".
5
bort roten attributet från listan över potentiella attribut att användas för grenen noder . Välj den kvarvarande attributet med störst informationen vinst tilldela gren noder .
I det aktuella exemplet , gren noder på varje punkt i trädet skapa grenar av godkända och förnekade lån . Det kan finnas ett antal grenar som härrör från ett beslut trädnod , beroende på hur många möjliga värden kan tilldelas målattribut .
6
Upprepa processen längs varje gren tills du har nått ett löv nod där alla data delar samma värde för målet attributet. Det maximala djupet av trädet vid någon punkt kommer att vara det totala antalet attribut som identifieras vid starten .
P Det är troligt att inte alla attribut är relevant för beslutet i varje gren och så vissa grenar blir kortare . När du har slutfört trädet , gå igenom den för att hitta de regler som den har framställts . Till exempel kanske du upptäcker att " ett lån kommer att godkännas om man har en hög inkomst , högt sparande och ingen skuld . "
7
Använd testdata som att validera trädet skapas . Trädet bör exakt förutsäga resultaten i de nya uppgifterna .