Frequent patroon mining , ook wel bekend als frequent itemset mijnbouw , is een techniek voor het ontdekken van groepen items die vaak samen voorkomen in een database . Volgens Dr Christian Borgelt , Principal onderzoeker aan het Europees Centrum voor Soft Computing , heeft frequent pattern mining is een van de meest actieve onderzochte onderwerpen in data mining sinds de vroege jaren 1990 en tal van wiskundige algoritmen ontwikkeld . Frequente Pattern Mining Frequente patroon mining is een elementair probleem in vele toepassingen . Een typisch transactionele database- - zoals een database die het gedrag van shoppers op Main Street beschrijft , via postorder of online - bevat een groot aantal itemsets en presenteert een uitdaging op het gebied van de ontwikkeling van efficiënte , schaalbare algoritmen . Frequent patroon algoritmes bekend als Apriori , Eclat en FP - groei behoren tot de meest bekende . Apriori algoritme Het Apriori algoritme , eerst door Rakesh Agrawal voorgesteld en Ramkrishnan Srikant van het IBM Almaden Research Center in 1994 , werkt op het principe dat itemsets worden geteld wanneer ze zich voordoen bij transacties . De databank wordt gescand om frequent 1 - itemsets vinden , worden de 1 - itemsets gebruikt om 2 - itemsets genereren en zo verder tot k - itemsets . Een k - itemset wordt gezegd dat het frequent als en slechts als al zijn subitemsets zijn frequent . Aangezien het eerst werd voorgesteld , hebben talrijke verbeteringen aan het Apriori algoritme gesuggereerd FP - groei Algoritme De FP - groei algoritme - . FP staat voor " frequent Pattern" - maakt gebruik van een techniek die bekend staat als het algoritme scant de database naar een lijst van frequente items in aflopende volgorde , die het gebruikt om de database te comprimeren in een FP - boom creëren " verdeel en heers . " . De FP - boom zelf wordt gewonnen , te beginnen met elke frequente lengte - 1 model - ook wel bekend als een achtervoegsel patroon - een voorwaardelijke FP - boom, die voorvoegsels die overeenkomen met items die co - optreden met de oorspronkelijke achtervoegsel patroon bevat. De oorspronkelijke achtervoegsel patroon wordt samengevoegd met de frequente patronen gevonden in de voorwaardelijke FP - boom tot patroon groei te realiseren . Eclat algoritme De Apriori en algoritmen FP - groei mine frequente patronen uit een reeks transacties die horizontaal zijn gerangschikt . De Gelijkwaardigheid klasse Transformation ( Eclat ) algoritme - door Mohammed J. Zaki , een hoogleraar informatica aan het Rensselaer Polytechnic Institute , stelde in 2000 - aan de andere kant , mijnen frequente patronen in een reeks transacties verticaal opgesteld . De Eclat algoritme begint met een enkel item en maakt gebruik van een set kruispunt aan frequente itemsets en herhaalt bepalen tot er geen frequente itemsets kan worden gevonden .
|