Clustering analyse is een statistische techniek voor gevallen categories regelen zodat de gevallen in elke categorie zijn vergelijkbaar met elkaar en verschillen van gevallen andere categorieën . Elke categorie is een cluster . Sociale wetenschappers gebruik van SPSS ( Statistical Package voor de Sociale Wetenschappen ) naar cluster analyses uit te voeren . In K - means clustering de onderzoeker wijst het aantal clusters gewenst . K is het aantal clusters onderzoekers aangeven dat ze willen . K -Means clustering stelt onderzoekers in staat om cluster zeer grote datasets . Instructies Analyseer data 1 Klik op "Analyze " aan de bovenkant van e SPSS scherm . Selecteer " classificeren " uit het drop - down menu en " K - Means Cluster . " Kopen van 2 Selecteer een steekproef van de gevallen . In het dialoogvenster , klikt u op " Variabelen " en markeer de variabelen die u wilt gebruiken in de eerste K - Means analyse . Klik op de pijl naar links om de variabele te bewegen in de doos . Stel het aantal clusters , meestal 5 in een gemiddelde grootte dataset , in het vak "Aantal Clusters . " Het aantal clusters moet meer dan twee en niet meer dan het aantal gevallen . Klik op " Iterate en classificeren " in het dialoogvenster om cluster -centra te verkrijgen . Klik op " Schrijf finale . " 3 Neem het hele databestand voor de laatste K - Means analyse . Klik op "Analyze " aan de bovenkant van de SPSS -scherm . Selecteer " classificeren " uit het drop - down menu en " K - Means Cluster . " In het dialoogvenster kies " Variabelen " en markeer de variabelen die u wilt gebruiken . Klik op de pijl naar links . Stel het aantal clusters op 5 in het vak "Aantal Clusters . " Klik op " classificeren " in het dialoogvenster . Kies " Lees Initial " om de cluster centra krijgen van het monster in stap 2 . Klik op 'Opslaan'. Klik op " Cluster -lidmaatschap . " Klik op "Doorgaan . " Lees de Output Beoordeling 4 de eerste tabel in de output , het label " Final Cluster Centers . " De bovenkant van de tabel de getallen 1 tot 5 op het, onder vermelding van de 5 clusters . De linkerkolom toont de " REGR factor score ' ( Regression factor score of hoe goed elke variabele voorspelt de score ) voor elk van de analyses . Als u de lijn naast de score 1 voor analyse 1 naar rechts , zal het u de factor score te geven voor elke cluster . 5 Lees de volgende tabel in de output geleid " Aantal Gevallen in elke cluster . " Het vak aan de linkerkant staan de clusters met nummer , 1 tot en met 5 . Volg het Cluster nummer naar rechts en je zal het aantal gevallen vinden in dat cluster . Kijk 6 aan de laatste tafel in de output , " Cluster lidmaatschap , " waaruit blijkt welke gevallen zijn in elke cluster . De zaken worden vermeld in de linkerkolom en het cluster nummer is te vinden in de kolom aan de rechterkant .
|