Programvaran iperms använder en mängd olika tekniker för att avgöra vilken domän varje dokument eller bild tillhör. Dessa tekniker inkluderar:
* Named entity recognition (NER) :NER identifierar och klassificerar enheter som personer, organisationer och platser i ett dokument. Denna information kan användas för att sluta sig till domänen för ett dokument, till exempel nyheter, ekonomi eller sport.
* Sökordsextraktion: Nyckelordsextraktion identifierar de viktigaste orden och fraserna i ett dokument. Dessa nyckelord kan användas för att matcha dokumentet med en relevant domän.
* Dokumentklassificering: Dokumentklassificering är processen att tilldela ett dokument till en fördefinierad uppsättning kategorier. Detta kan göras med hjälp av maskininlärningsalgoritmer som lär sig från märkta data.
* Ämnesmodellering: Ämnesmodellering är en teknik för att identifiera de underliggande ämnena i en samling dokument. Denna information kan användas för att gruppera dokument i relaterade domäner.
iperms använder en kombination av dessa tekniker för att bestämma domänen för varje dokument eller bild. Detta gör att programvaran kan organisera och hämta information mer effektivt.