Elektronisch opgeslagen informatie (ESI) omvat een breed scala aan gegevensformaten. Hier zijn enkele sleuteltypen, gecategoriseerd voor de duidelijkheid:
Ik. Gestructureerde gegevens: Deze gegevens zijn georganiseerd in een vooraf gedefinieerd formaat, meestal in een database of spreadsheet.
* Databases: Relationele databases (zoals MySQL, PostgreSQL, Oracle) slaan gegevens op in tabellen met rijen en kolommen. Deze bevatten gestructureerde informatie voor toepassingen zoals CRM, ERP en e-commerce.
* Spreadsheets: Programma's als Microsoft Excel of Google Spreadsheets slaan gegevens op in rijen en kolommen, vaak gebruikt voor financiële administratie, analyses en gegevensinvoer.
* XML (Extensible Markup Language): Een opmaaktaal die wordt gebruikt om gegevens in een hiërarchisch formaat te structureren, vaak gebruikt voor gegevensuitwisseling tussen systemen.
* JSON (JavaScript-objectnotatie): Een lichtgewicht formaat voor gegevensuitwisseling, dat vaak wordt gebruikt in webapplicaties en API's.
* CSV (door komma's gescheiden waarden): Een eenvoudig, op tekst gebaseerd formaat voor het weergeven van tabelgegevens.
II. Ongestructureerde gegevens: Deze gegevens hebben geen vooraf gedefinieerd formaat en zijn moeilijker te organiseren en analyseren.
* E-mails: Berichten inclusief de koptekst, hoofdtekst en bijlagen.
* Documenten: Tekstverwerkingsbestanden (.doc, .docx, .rtf), presentaties (.ppt, .pptx), PDF's (.pdf).
* Afbeeldingen: JPEG, PNG, GIF, TIFF, enz.
* Audiobestanden: MP3, WAV, enz.
* Videobestanden: MP4, AVI, MOV, enz.
* Socialemediaberichten: Tekst, afbeeldingen en video's van platforms zoals Facebook, Twitter, Instagram.
III. Semi-gestructureerde gegevens: Deze gegevens vallen tussen gestructureerd en ongestructureerd, bevatten enkele organisatorische elementen, maar voldoen niet aan een rigide schema.
* HTML (HyperText Markup Language): De opmaaktaal voor webpagina's. Hoewel gestructureerd, kan de inhoud behoorlijk gevarieerd zijn.
* Logbestanden: Records van systeemgebeurtenissen en -activiteiten, die vaak zowel gestructureerde als ongestructureerde componenten bevatten.
* XML-bestanden (met verschillende structuren): Hoewel XML zelf gestructureerd is, kan de manier waarop gegevens in een XML-bestand worden getagd sterk variëren.
IV. Metagegevens: Gegevens over gegevens. Dit biedt context en informatie over andere ESI-typen.
* Bestandseigenschappen: Aanmaakdatum, wijzigingsdatum, auteur, bestandsgrootte, enz.
* Databaseschema's: Definities van databasetabellen en hun velden.
* Systeemlogboeken: Informatie over wanneer en hoe gegevens zijn geopend, gewijzigd of gemaakt.
Deze lijst is niet uitputtend, aangezien er voortdurend nieuwe gegevensformaten ontstaan. Het bestrijkt echter de belangrijkste categorieën elektronisch opgeslagen informatie. De specifieke typen die relevant zijn voor een bepaalde situatie zullen afhangen van de context, zoals een juridisch ontdekkingsproces of een data-analyseproject. |