Ubuntu biedt grafische en command line tools om portable document bestanden ( PDF ) om te zetten in tekst formaat . De command line versie , " pdftotext " , automatiseert het proces , waaronder de conversie commando in een shell script . Op deze manier kunnen meerdere PDF -bestanden tegelijk worden gewijzigd . Een aantal command line opties voorzien van het commando in staat specifieke acties ( bijvoorbeeld alleen het omzetten van de eerste paar pagina's ) elke keer dat het wordt gerund plaats te nemen . Het verkrijgen pdftotext Het verkrijgen van de juiste pakketten en commando " pdftotext " van de Ubuntu -bibliotheken via het commando : sudo apt - get install poppler - utils Zorg ervoor dat het pakket correct installeert voordat u probeert om het te gebruiken . pdftotext Man Pagina Leer hoe de pdftotext opdracht werken en vertrouwd te raken met de command line opties beschikbaar . Kijk naar de man pagina voor de commando invoeren " man pdftotext " op de opdrachtregel shell prompt , en druk op "Enter " . De command line opties bestaan uit letters , voorafgegaan door een streepje , zoals " - l" , en ze bieden allemaal verschillende functies . De standaard commando voor pdftotext is " pdftotext " ( zonder aanhalingstekens ) waar is de naam van het PDF-bestand te extraheren , zoals " report.pdf " en is de naam van het tekstuitvoerbestand , zoals " report.txt " . U kunt een willekeurige naam van uw keuze te gebruiken . Batch PDF conversie Test het commando door te proberen het op een paar PDF bestanden afzonderlijk . Als het goed is wil je misschien proberen met behulp van het op een aantal PDF-bestanden in shell scripts om het proces te automatiseren . Een voorbeeld van een typische script wordt hieronder weergegeven : for i in * pdf doen pdftotext $ i $ i.txt gedaan < . br > Dit script neemt alle van de PDF-bestanden in de huidige directory en exporteert ze met hun naam in een tekstbestand , dus " report.pdf " zou " report.pdf.txt " geworden < br > beveiligde PDF -bestanden Sommige PDF's zijn ofwel beveiligd met wachtwoorden of opgericht om de export van de tekst te voorkomen dat het document . Dit is een poging om de bescherming van het auteursrecht en , indien dit het geval is misschien had je beter heroverwegen de conversie vanuit een juridisch perspectief . Als u het wachtwoord voor een PDF -bestand hebt , kan dit worden doorgegeven in de command line opties voor " pdftotext " .
|