Besluit bomen zijn het onderwerp van intensief wetenschappelijk onderzoek binnen het gebied van operationeel onderzoek en informatica . Hoewel niet per se de beste manier om de structuur van informatie die nodig is om een conclusie te komen , beslisbomen werken goed met standaard computer algoritmes voor de ondersteuning van de besluitvorming . Daarnaast bieden ze een manier van uiten bedrijfsregels op een manier die mensen zonder enige ervaring met beslisbomen kunnen volgen . Een beslisboom is een vergelijkbaar met een stroomschema , waardoor navigatie door een pad van keuzes totdat een definitieve conclusie is gebaseerd . Wat je Gegevensverzameling voor "leren " de boomstructuur Gegevensverzameling voor het testen resulterende boom Need Toon Meer Aanwijzingen 1 Haal de datasets die wordt gebruikt voor analyse en verificatie van de uiteindelijke structuur . Meer gegevens die bij het onderzoek zal een nauwkeuriger boomrepresentatie van het beslissingsproces opleveren . Er zijn veel verschillende manieren om te creëren en structureren van een beslisboom . De ID3 algoritme is een vroege methode waarop meer geavanceerde varianten zijn gebaseerd . Lijst 2 alle attributen die worden gebruikt door de gegevensset . Bijvoorbeeld , in een set van de bank van lening aanvraag gegevens , zal het record voor elke aanvrager zijn attributen zoals naam , adres, telefoonnummer , inkomen , huis waarde , hypotheek- , bank-en creditcardgegevens saldi . Als handmatig creëren een beslisboom , uiteraard exclusief attributen zoals naam , die je niet zou verwachten dat het besluit om een lening te verstrekken beïnvloeden. Bij het gebruik van computer data mining technieken , worden alle attributen beschouwd , waardoor het computerprogramma om te bepalen welke niet relevant zijn voor het uiteindelijke resultaat . 3 Opgeven welke attribuut is het target attribuut . In het voorbeeld van een lening aanvraag , het target attribuut is degene die aangeeft of de lening werd toegestaan of geweigerd . 4 Selecteer het attribuut om de grootste informatie aanwinst voor gebruik als de root- knooppunt te bieden . De boom bestaat uit de beslissing knooppunten en leaf nodes . Bij besluit van knooppunten , wordt een tak gemaakt voor elke mogelijke waarde van het target attribuut . Elke tak vertegenwoordigt de data records die dezelfde waarde voor het target attribuut delen . Een blad knooppunt wordt bereikt wanneer alle records op het huidige knooppunt wordt overwogen hebben hetzelfde resultaat voor het target attribuut . In de lening bijvoorbeeld , als iedereen die geldt voor een lening is goedgekeurd , wordt de gehele beslisboom is het triviale geval van een enkel blad knooppunt met geen filialen . Het is waarschijnlijker dat de gegevens zullen worden verdeeld in twee takken : . Goedgekeurd en ontkend Rekenmethoden selecteren van de eigenschap te gebruiken op elk boomknooppunt zijn uiterst complex . Kijk voor de eigenschap die het sterkst voorspelt het doelwit resultaat . Intuïtief , " inkomen " zou een betere kandidaat voor de root- knooppunt dan wel een "voornaam . " 5 Verwijder het attribuut wortel uit de lijst van mogelijke attributen te gebruiken voor de branche knooppunten . Selecteer de resterende attribuut met de grootste informatiewinst toewijzen aan de tak knooppunten . In het huidige voorbeeld , de tak nodes op elk punt in de boom te creëren takken van en geweigerde leningen . Er kan een willekeurig aantal takken afkomstig van een beslisboom knooppunt , afhankelijk van het aantal mogelijke waarden kunnen worden toegewezen aan de doelgroep attribuut zijn. 6 Herhaal het proces langs elke tak totdat je een blad hebt bereikt knooppunt waar alle gegevens deelt dezelfde waarde voor het target attribuut . De maximale diepte van de boom op elk punt zal het totale aantal attributen die aan het begin zijn. Het is waarschijnlijk dat niet elke attribuut is om de beslissing in elke branche relevante en dus sommige branches zal korter zijn . Zodra je de boom hebt voltooid , door het lopen om de regels die zij heeft afgeleid vinden . Bijvoorbeeld , zou u merken dat " een lening zal worden goedgekeurd als u een hoog inkomen , hoge besparingen en geen schulden . " 7 Gebruik de testgegevens te stellen naar de boom gecreëerd valideren . De boom moet nauwkeurig voorspellen van de resultaten in de nieuwe data .
|