Er is geen enkel antwoord hierop, omdat het van verschillende factoren afhangt:
* Het formaat van de tekst: Een platte tekstbestand (zoals `.txt`) zal veel kleiner zijn dan een opgemaakt bestand (zoals` .doc`, `.docx`,` .pdf` of een EPUB). Opgemaakte bestanden bevatten extra gegevens voor dingen zoals lettertype -stijlen, afbeeldingen, paginakauzes, enz.
* De codering: De tekencodering (bijv. ASCII, UTF-8, UTF-16) beïnvloedt het aantal bytes per teken. UTF-8 is een codering met variabele lengte, wat betekent dat sommige tekens meer bytes nemen dan andere.
* Het specifieke boek: Verschillende edities van hetzelfde boek kunnen iets verschillende lengtes hebben.
Laten we enkele redelijke veronderstellingen maken:
* lengte: Een Harry Potter -boek is ongeveer 300.000 woorden.
* tekens per woord: Laten we aannemen dat gemiddeld 5 tekens per woord (inclusief spaties).
* bytes per teken: Met behulp van UTF-8 nemen we een gemiddelde van 1 byte per teken aan (dit is een vereenvoudiging; sommige tekens vereisen meer).
Berekening:
1. Totale tekens: 300.000 woorden * 5 tekens/woord =1500.000 tekens
2. Totale bytes (gewone tekst): 1.500.000 tekens * 1 byte/teken =1.500.000 bytes (ongeveer 1,5 MB)
Dit is echter een * zeer * lage schatting. Een opgemaakt e -boek (bijvoorbeeld EPUB) of een gescande PDF van een gedrukt boek zal aanzienlijk groter zijn vanwege de opname van opmaakinformatie, afbeeldingen (illustraties) en mogelijk ingebedde lettertypen. Een PDF kan gemakkelijk 5-10 MB of zelfs meer zijn, terwijl een EPUB misschien ongeveer 2-5 MB is.
Daarom zou een redelijke schatting voor een Harry Potter -boek in een gemeenschappelijk digitaal formaat tussen 2 en 10 MB zijn . |