Het is onmogelijk om tekst van een PDF naar woord te kopiëren zonder dat het wordt herkend. Dit is waarom:
* PDF's zijn ontworpen voor documentportabiliteit, niet bewerken. Ze slaan inhoud op op een manier die moeilijk is om direct te bewerken.
* OCR is de sleutel tot tekstextractie. Wanneer u tekst van een PDF kopieert, gebruikt uw computer optische tekenherkenning (OCR) om de afbeeldingen van letters om te zetten in bewerkbare tekst.
Hier zijn enkele veel voorkomende redenen waarom tekst "onherkenbaar" kan lijken in woord na het kopiëren van een PDF:
* De PDF werd gescand. Als de PDF is gemaakt door een papieren document te scannen, is het OCR -proces mogelijk niet nauwkeurig, wat leidt tot fouten in de gekopieerde tekst.
* complexe opmaak. PDF's met complexe opmaak, zoals kolommen, tabellen of afbeeldingen die zijn ingebed met tekst, kunnen OCR -fouten veroorzaken.
* niet-standaard lettertypen. Als de PDF ongewone lettertypen of lettertypen gebruikt die niet op uw computer beschikbaar zijn, kan OCR de tekens verkeerd interpreteren.
Wat te doen:
1. Gebruik een PDF tot woordconverter: Tools zoals Adobe Acrobat Pro, Nitro Pro of online converters kunnen OCR aan en bieden een meer accurate conversie.
2. Kopieer en plak rechtstreeks van de PDF: Als de PDF is gemaakt vanuit tekst, kunt u meestal kopiëren en rechtstreeks in een woord plakken, hoewel de opmaak verloren kan gaan.
3. Sla de PDF op als een Word -document: Veel PDF's hebben een optie om op te slaan als een Word -document (.docx) dat opmaak- en tekstherkenning behoudt.
Belangrijke opmerking: Zelfs met de beste tools hebben sommige PDF's misschien nog steeds tekst die niet perfect wordt herkend. Mogelijk moet u de gekopieerde tekst handmatig in Word bewerken. |