De input voor dataverwerking en business intelligence (BI) is ontzettend gevarieerd, maar valt over het algemeen onder deze categorieën:
* Gestructureerde gegevens: Dit zijn gegevens die zijn georganiseerd in een vooraf gedefinieerd formaat, gemakkelijk toegankelijk en geanalyseerd door traditionele databasesystemen. Voorbeelden zijn onder meer:
* Relationele databases (RDBMS): Gegevens opgeslagen in tabellen met rijen en kolommen (bijvoorbeeld MySQL, PostgreSQL, Oracle, SQL Server).
* Spreadsheets: Gegevens georganiseerd in rijen en kolommen (bijvoorbeeld Excel-bestanden).
* CSV-bestanden (Comma Separated Values): Eenvoudige tekstbestanden met gegevens gescheiden door komma's.
* XML- (Extensible Markup Language) en JSON-bestanden (JavaScript Object Notation): Gegevens opgemaakt met behulp van tags of sleutel-waardeparen.
* Transactielogboeken: Registratie van zakelijke transacties.
* Semi-gestructureerde gegevens: Gegevens die niet voldoen aan een rigide tabelstructuur, maar enkele organisatorische eigenschappen hebben. Voorbeelden zijn onder meer:
* NoSQL-databases: Gegevensopslag zoals MongoDB of Cassandra.
* Logbestanden: Records van systeemgebeurtenissen.
* XML- en JSON-bestanden (indien niet strikt conform een schema).
* Ongestructureerde gegevens: Dit zijn gegevens die geen vooraf gedefinieerd formaat hebben en die moeilijk te verwerken zijn met traditionele methoden. Voorbeelden zijn onder meer:
* Tekstbestanden: Documenten, e-mails, posts op sociale media.
* Afbeeldingen: Foto's, scans.
* Audiobestanden: Opnames, podcasts.
* Videobestanden: Video's, opnames.
* Externe gegevensbronnen: Gegevens verkregen van buiten de organisatie, zoals:
* API's van derden: Toegang krijgen tot gegevens van andere bedrijven of diensten.
* Openbare datasets: Overheidsdata, onderzoeksdata.
* Sociale media: Gegevens geschraapt van sociale mediaplatforms.
Samenvattend kan de invoer variëren van zeer georganiseerde, netjes verpakte gegevens tot ruwe, chaotische informatie. De specifieke input zal afhangen van het bedrijf, de vragen die worden gesteld en de mogelijkheden van de gegevensverwerking en BI-tools die worden gebruikt. Het proces omvat vaak het opschonen, transformeren en integreren van gegevens uit meerdere bronnen voordat deze effectief kunnen worden gebruikt voor analyse en besluitvorming. |