Dator
 |  Startsida |  Hårdvara |  Nätverk |  Programmering |  Programvara |  Felsökning |  System |   
Programvara
  • Adobe Illustrator
  • animation Software
  • antivirusprogram
  • ljudprogram
  • Säkerhetskopiera data
  • Bränn CD-skivor
  • Bränn DVD
  • Data Compression
  • Database Software
  • Desktop Publishing
  • Desktop Video
  • Digital Video Software
  • Drupal
  • Educational Software
  • Engineering Software
  • Filtillägg Typer
  • Financial Software
  • Freeware , Shareware & Abandonware
  • GIMP
  • Graphics Software
  • Home Recording Software
  • Microsoft Access
  • Microsoft Excel
  • Microsoft Publisher
  • Microsoft Word
  • Open Source Code
  • Andra datorprogram
  • PC-spel
  • Photoshop
  • Portable Document Format
  • PowerPoint
  • presentationsprogram
  • Produktivitet Software
  • quicktime
  • Remote Desktop Management
  • SQL Server
  • Skype
  • Programvara betaversioner
  • Programvara Konsulter
  • Software Development Companies
  • Software Licensing
  • Spreadsheets
  • Skatt förberedelse programvara
  • Utility Software
  • Web Clip Art
  • Windows Media Player
  • Ordbehandlingsprogram
  • * Dator Kunskap >> Programvara >> Portable Document Format >> Content

    Hur Index och Sök en PDF i Java med Lucene

    Apache Lucene är en fullfjädrad text sökmotor bibliotek skriven i Java . Du kan använda Lucene att indexera och söka någon form av textdokument . Att konvertera en Portable Document Format ( PDF ) -fil i ett textformat som Lucene kan indexera , kan du använda PDFBox öppen källkod klass som har speciella metoder specifikt för Lucene . Helt enkelt ge till PDF-filnamnet till PDFBox och få ett Lucene Document-objekt som kan läggas till i indexet och sökte precis som alla textfil . Instruktioner
    en

    Välj ett Lucene analysator för att använda för att skapa index , till exempel " StandardAnalyzer . " Skapa ett " IndexWriter " objekt för att hantera att lägga till nya objekt i index , till exempel :

    IndexWriter myWriter = ny IndexWriter ( " index " , ny StandardAnalyzer ( ) , true ) ;
    2

    Ring " LucenePDFDocument " för att få ett Lucene Dokument föremålet för din PDF-fil . Lägg till andra viktiga områden till objektet och lägg objektet till Lucene index . Till exempel :

    Dokument pdfDoc = LucenePDFDocument.getDoument ( filename ) ;

    pdfDoc.add ( nytt fält ( " titel " , pdf.getTitle ( ) , Field.Store.YES , Field . Index.TOKENIZED ) ) ;

    pdfDoc.add ( nytt fält ( " författare " , pdf.getAuthor ( ) , Field.Store.YES , Field.Index.TOKENIZED ) ) ;

    myWriter . addDocument ( pdfDoc ) ,
    3

    Använd " SearchEngine " klass för att söka Lucene index . " SearchEngine " returnerar ett Lucene " Hits " objekt med en lista över "hit" objekt . Till exempel :

    SearchEngine Mysearch = ny SearchEngine ( ) ;

    Hits myHits = mySearch.performSearch ( searchText ) ;

    System.out.println ( " Dokument matchas : " + myHits.length ( ) ) ;
    4

    iterera genom "hit" objekt för att få mer information om varje match . "Hit " objekt sorteras efter relevans för sökningen , och du kan även få den relativa sökning poäng med " getScore ( ) . " Till exempel :

    Iterator ITR = myHits.iterator ( ) ;

    samtidigt ( itr.hasNext ( ) ) {

    Hit theHit = itr.next ( ) ;

    Dokument theDoc = theHit.getDocument ();

    System.out.println ( theDoc.get ( "titel" ) + "-" + theHit.getScore ());

    } Addera

    Tidigare:

    nästa:
    relaterade artiklar
    ·Lista över PDF Tittare
    ·Konvertera Word-format till PDF Bokmärken
    ·Konvertera PDF till Excel Open Source
    ·Hur att ändra eller uppdatera sparade PDF-filer
    ·Hur man skriver ut en pdf doc
    ·Hur konvertera en OCR PDF till Excel
    ·PDF Problem i Chrome
    ·Hur man skriver ut en PDF-fil med VB Net
    ·Skriva ut till en PDF-fil på Windows Vista
    ·Lägga till en Adobe PDF Printer
    Utvalda artiklarna
    ·Hur konvertera MKV till AVI med Vdub
    ·Hur Riv ett ark från Excel -arbetsbok
    ·Kan jag ändra färg Lens Flare i Gimp
    ·Quake 4 PC Systemkrav
    ·Hur konvertera en WMV till iMovie
    ·Hur kan man överföra bilder till Google Docs
    ·NetMeeting Alternativ
    ·Hur att ta en bild på mig med en Mac-dator
    ·Hur du ändrar LiveUpdate Server
    ·Hur man installerar Microsoft Office 2000
    Copyright © Dator Kunskap http://www.dator.xyz