Det kan vara väldigt frustrerande att försöka extrahera text från en PDF- fil för användning i ett annat program . Det är inte ovanligt för grafik för att komma i vägen eller för dokumentets layout för att göra det svårt för testet som ska överföras i meningsfulla meningar . Men det är inte omöjligt att extrahera text med en kopiera och klistra metoden , kan det vara tidskrävande och tillåter inte PDF -filen texten som ska exporteras som ett annat format . Det finns dock några sätt att extrahera text från en PDF-fil . Saker du behöver Review PDF -fil
Adobe Acrobat Reader
Gmail -konto ( valfritt ) katalog PDF till text konvertering programvara ( tillval )
Visa fler instruktioner Text
extraktet genom Acrobat Reader
1
Öppna filen i Acrobat Reader . I Windows väljer du " Arkiv - > Exportera dokumentet till text , " namnge dokumentet och spara det
2
Kopiera texten på en Mac eller Linux OS genom att gå till Visa-menyn och välja " . kontinuerlig " eller " Continuous -vända . " ( Den förstnämnda kommer att förse dig med den texten i en kolumn , medan den senare kommer att formatera texten som side -by - side sidor . ) Gå till " Redigera - > Markera alla " och sedan " Redigera - > Kopiera . " Addera 3
Använd markeringsverktyget om du bara vill extrahera en del av texten . Klicka på " Text Select " verktyget och sedan välja den information du vill ha . I ett dokument som formaterats i flera kolumner , måste du använda " Kolumn Välj " verktyg först . Gå till " Redigera - . > Kopiera " Addera Konvertera PDF till HTML
4
Använd Gmail som en genväg . Bifoga PDF- fil till ett e-postmeddelande och skicka det till ditt Gmail-konto . När du öppnar e-post kommer du att se ett antal alternativ bredvid den bifogade filen . Välj " Visa som HTML " och spara filen som öppnas i ett separat fönster . Även om du inte kommer att kunna se några bilder , kommer HTML- filen behåller dokumentets formatering .
5
extrahera och konvertera filer från kommandoraden . Linux-användare kan använda en grundläggande omvandling kommando som kommer att förändra en pdf-fil till en txt-fil : . . " . Pdftotext filename.pdf " Se till att byta filnamnet med namnet på PDF-filen .
6
Ladda ner en PDF till text konverteringsprogram . Det finns ett antal open source och freeware program tillgängliga som PDFBox och Lätt PDF till Text Converter ( se Resurser nedan ) . Många av dessa program kan även konvertera PDF-filer till HTML också.