Ubuntu erbjuder grafiska verktyg och kommandoradsverktyg för att konvertera bärbara dokumentfiler ( PDF ) i textformat . Kommandoraden versionen , " pdftotext " , automatiserar processen genom bland annat omstrukturering kommandot i ett script . På detta sätt kan flera PDF-filer ändras samtidigt . Ett antal kommandoradsväljare tillhandahålls med kommandot möjliggör särskilda åtgärder ( t.ex. endast omvandla de första sidorna ) att ske varje gång det körs . Skaffa pdftotext
få relevanta paketen och kommandot " pdftotext " från Ubuntus biblioteken via kommandot :
sudo apt - get install poppler - utils
Se till att paketet installerar korrekt innan du försöker använda den . Addera pdftotext Mannen Sida
lära sig hur pdftotext kommando fungerar och bekanta dig med kommandoradsväljare tillgängliga . Titta på manualsidan för kommandot in " mannen pdftotext " på kommandoraden prompten och tryck " Enter " . De Kommandoradsväljarna bestå av bokstäver , föregås av ett bindestreck , t.ex. " - l " , och alla ger olika funktioner .
Standard kommandot för pdftotext är " pdftotext " ( utan citationstecken ) där är namnet på PDF -filen för att extrahera , såsom " report.pdf " och är namnet på textproduktion filen , t.ex. " REPORT.TXT " . Du kan använda valfritt namn som du väljer .
Batch PDF konvertering
Testa kommandot genom att försöka det på några PDF- filer individuellt . Om det är okej att du kanske vill prova att använda den på ett antal PDF- filer i skalskript för att automatisera processen . Ett exempel på en typisk skript visas nedan :
for i in * do
pdftotext $ i $ i.txt
gjort pdf
< . br >
Detta skript tar alla PDF-filer i den aktuella katalogen och exporterar dem med deras namn till en textfil , så " report.pdf " skulle bli " report.pdf.txt "
skyddade PDF-filer
Vissa PDF-filer antingen skyddas med lösenord eller inrättats för att förhindra export av text från dokumentet . Detta är ett försök att skydda upphovsrätten och om så är fallet kanske du hade bättre ompröva omvandlingen från ett juridiskt perspektiv . Om du har lösenordet till en PDF-fil , kan detta föras in kommandoradsalternativen för " pdftotext " .