Clustering is een machine learning techniek werkt door het groeperen van soortgelijke gegevens samen . Clustering is een soort van ongecontroleerde machine learning . Het algoritme hoeft niet 'getraind' om te zijn en kan gegevens groeperen in coherente groepen met een " vooropgezet " idee van wat bij elkaar hoort . Dit verschilt van bewaakte machine learning systemen die juist 'getraind' om het etiket gegevens moeten worden . Clustering wordt voornamelijk gebruikt als een computer patroon mechanisme erkenning. Generatieve of Waarschijnlijkheid algoritmes generatieve of waarschijnlijkheid based clustering algoritmen proberen datasets classificeren als een soort bekend distributie , een gemeenschappelijke groepering van numerieke gegevens . Zo'n algoritme kan alleen worden gebruikt op numerieke gegevens . Generatieve algoritmen komen met verschillende restricties. Het probleem kan worden onoplosbaar als de gegevens is toegestaan om te vrij variëren. Generatieve algoritmen nemen ook aan dat de gegevens belichaamt een bekende verspreidingsgebied , wat niet altijd het geval . Deze types van algoritmen doen ook geen rekening met " ruis " in de data . K - means clustering K - means clustering was een van de eerste cluster methodes om worden ontwikkeld . Het is eenvoudig te implementeren , maar het heeft het nadeel dat het zeer gevoelig zijn uitgangspositie inputs . K - means clustering werken door het verdelen van de gegevens in een willekeurige reeks van clusters en herberekenen de middens van elke cluster en het proces te herhalen totdat er slechts een cluster . Dit staat bekend als convergentie . Fuzzy Clustering plaats van identificerende gegevens als behorend tot specifieke groepen , fuzzy clustering pogingen om de mate waarin een data identificeren punt behoort tot een groep . De algoritmen die worden gebruikt om fuzzy clustering doen staan bekend als " C -means algoritme . " In de fuzzy clustering benadering kan een gegevenspunt tot meer dan een groep . Dit type clustering is nuttig wanneer gegevenspunten wellicht tot meer dan een groep . Agglomeratie Clustering agglomeratieve clustering was een van de eerste clustering algoritmen te ontwikkeld . Het in gebruik blijft , want het is ook een van de eenvoudigste algoritmen ontwikkeld date . Agglomeratieve clustering werkt door het behandelen van elk individueel gegevenspunt als een cluster en groeperen met de meest vergelijkbare gegevens punt . Dit proces wordt herhaald totdat de data " convergeert ", of er is een grote cluster met alle gegevens . De werkwijze kan ook omgekeerd worden gedaan om hetzelfde effect . Beginnend met een cluster , kunnen alle gegevens herhaaldelijk worden verdeeld totdat elk gegevenspunt is zijn eigen cluster .
|