De rekenkracht van computers maakt het mogelijk onderzoekers en bedrijven om de gegevens in meer complexe manieren analyseren dan elke voorheen . Data mining is het proces van een poging om nuttige informatie te vinden in grote datasets . Data mining 's ETL proces verwijst naar de stappen die data opgenomen , gecodeerd en weggeschreven naar een gegevensbestand voor latere analyse . Definities Data mining wordt gedefinieerd als het proces van het analyseren van gegevens en het aggregeren van het in informatie die kan worden gezet om een nuttige doeleinden . Het data mining proces omvat het vinden van patronen in datasets die categoriale informatie over hoe de dataset wordt georganiseerd verschaffen . Data mining kan worden gebruikt om de relatie tussen vrijwel geen meetbare variabelen analyseren een paar echte wereld toepassingen van datamining omvat analyse van marketing strategieën productieprocessen en gedragstendensen mens. De term ETL is een acroniem voor extract , transformeren en laden . Extraheren , transformeren en laden verwijzen naar de drie processen die een database- systeem is gemaakt voor analyse . Extraction De eerste stap in het creëren van een data warehouse die kunnen worden ontgonnen voor analyse is om de gegevens te extraheren uit de originele bron . Extractieprocedures afhankelijk van het type gegevens dat wordt gedolven . Soms wordt geëxtraheerd lokaliseren en ophalen van een subset van data uit een of meer bestaande databases . In andere gevallen , de extractie proces vereist origineel onderzoek , zoals zoeken op het web voor sites die relevante informatie bevatten . Transform Zodra juiste data zich bevindt tijdens het extractieproces die data moeten worden gemanipuleerd zodat het kan worden opgeslagen in een gegevensbestand voor latere analyse . Het proces van het wijzigen van de gegevens van zijn oorspronkelijke vorm aan een geregulariseerde vorm heet transformatie . Transformatie kan een willekeurig aantal wijzigingen in de gegevens , waaronder relatief eenvoudige functies zoals het omzetten van letters naar kleine letters en het verwijderen van leestekens uit tekenreeksen betrekken . Het transformatieproces kan ook meer complexe procedures, zoals het uitvoeren van rekenkundige functies op bronwaarden , sorteren van gegevens en het controleren van de geldigheid van de brongegevens bevatten . Het doel van de transformatie fase is om de ongeraffineerde extractie gegevens te nemen en zet hem in de gegevens die nuttig is voor de doelstellingen van het data mining project . Load Eenmaal de data wordt omgezet in een passende vorm moet worden opgeslagen in een magazijn. De fase load verwijst naar het proces waardoor getransformeerde gegevens weggeschreven naar een computerdatabase . Zodra de informatie is opgeslagen in de database , kan dit worden onderworpen aan kwalitatieve en kwantitatieve analyse om te zoeken naar patronen van belangstelling .
|