Welche erweiterten Einstellungen gibt es für die Texterkennung (OCR)?
PaperOffice verfügt über eine umfangreiche Texterkennung. Diese extrahiert den Text ganz automatisch aus nahezu jeder beliebigen Datei oder Papierdokument und erstellt einen Volltextsuche-Katalog für kinderleichte Suche innerhalb des Systems.
Für diese perfekte Texterkennung sorgen umfangreiche branchentypische Wörterbücher in fast 160 Sprachen.
So können Sie unter „Texterkennung und Sprachen“ Ihre Einstellungen für die Texterkennung tätigen.
Dokumentsprache
PaperOffice versucht die Dokumentsprache zu erkennen, um so die Texterkennung zu optimieren.
Wählen Sie „Feste Dokumentsprache“ oder „Automatische Spracherkennung“ aus, indem Sie mit der linken Maustaste das entsprechende Optionsfeld anklicken.
Feste Dokumentsprache: Definieren Sie „Feste Dokumentsprache“ (schnellste Methode) so wird die Dokumentsprache aus den von Ihnen installierten verwendet, ohne dass die automatische Spracherkennung greift.
Jedes installierte Sprachpaket wird dabei für die Texterkennung verwendet. Falls mehr als eine Sprache installiert it, so werden alle installierten Sprachpakete für die Texterkennung verwendet.
Automatische Spracherkennung: Definieren Sie „Automatische Spracherkennung“ so versucht PaperOffice die Sprache automatisiert zu erkennen. Dabei wird beim zweiten Durchgang der Wörterkorrektur explizit die Dokumentensprache verwendet, was für Präzise und exakte Wörtererkennung führt. Bitte beachten Sie, dass die Dokumentsprachen dafür installiert sein müssen.
Texterkennung optimieren
Sie können durch manuelle Einstellung die Texterkennung Ihrer Dokumente und Dateien optimieren. Wählen Sie dafür diejenige Option aus, welche für Sie am relevantesten ist, indem Sie das entsprechende Optionsfeld betätigen.
Digitale Dokumente extrahieren
PaperOffice kann den Text aus Dateien direkt auslesen anstatt die Texterkennung durchzuführen. Dabei wird die SmartSpell Autokorrektur nicht verwendet. Verwenden Sie diese Option nur wenn Sie sich über die Folgen bewusst sind.
Installierte Sprachpakete
Um die Texterkennung Ihrer Dokumente und Dateien so präzise wie möglich zu machen benötigt PaperOffice für die Dokumentensprachen Sprachpakete. Installieren Sie diejenigen Sprachen, die in Ihren Dokumenten vorkommen werden, indem Sie neben jeder Sprache ein Häkchen setzen und den Vorgang im nächsten Schritt bestätigen und wählen im oberen Bereich „Dokumentsprache“ die Erkennungsmethode.
Alle Änderungen werden sofort übernommen und müssen nicht zusätzlich gespeichert werden.