PDF-bestanden bieden u een standaard formaat om programmatisch te openen en ontleden van gegevens van een alleen-lezen document . U kunt de Java PDF -bibliotheken gebruiken om een document te openen en lees de informatie in . Of je deze informatie in een database opslaan of weergeven van de informatie terug naar de lezer in uw Java-toepassing . Instructies 1 rechtermuisknop op het Java- bestand dat u wilt gebruiken om de PDF- gegevens ontleden . Klik op ' Openen met ' en selecteer uw Java-editor . Import 2 de PDF- reader library . Voeg de volgende code aan de bovenkant van uw Java- bestand naar de bibliotheek te importeren : import com.asprise.util.pdf.PDFReader ; 3 Open het PDF -bestand . De parser is gelegen in de " PDFReader " klasse in de bibliotheek die u zojuist hebt toegevoegd . Voeg de volgende code aan de functie die u wilt gebruiken om het bestand te ontleden , te vervangen " thepdf.pdf " met uw eigen PDF-bestand naam : PDFReader pdf = new PDFReader (nieuw bestand ( " thepdf.pdf " ;) ) ; pdf.open ( ) ; 4 Analyseer de tekst uit het PDF-bestand . De volgende code analyseert de inhoud van de pagina een in de PDF : String pdfcontent = pdf.extractTextFromPage ( 0 ) ; Vervang de " 0 " met het paginanummer dat u wilt extraheren uit het bestand . De eerste pagina begint bij 0 , dus elke extra pagina-index is het paginanummer dat u wilt uitpakken minus 1 te compenseren voor de offset . 5 Sluit het bestand nadat u klaar bent met het ontleden van de gegevens . De volgende code sluit het bestand : pdf.close ( ) op ;
|