Welche erweiterten Einstellungen gibt es für die Texterkennung (OCR)?

Michael Zimmermann
Michael Zimmermann

Erstellt: 16.03.2020 9:23 - Aktualisiert : 06.06.2020 9:59

PaperOffice verfügt über eine umfangreiche Texterkennung. Diese extrahiert den Text ganz automatisch aus nahezu jeder beliebigen Datei oder Papierdokument und erstellt einen Volltextsuche-Katalog für kinderleichte Suche innerhalb des Systems.

Für diese perfekte Texterkennung sorgen umfangreiche branchentypische Wörterbücher in fast 160 Sprachen.

So können Sie unter „Texterkennung und Sprachen“ Ihre Einstellungen für die Texterkennung tätigen.

Dokumentsprache

PaperOffice versucht die Dokumentsprache zu erkennen, um so die Texterkennung zu optimieren.

Dokumentsprache Methode festlegen

Wählen Sie „Feste Dokumentsprache“ oder „Automatische Spracherkennung“ aus, indem Sie mit der linken Maustaste das entsprechende Optionsfeld anklicken.

Feste Dokumentsprache: Definieren Sie „Feste Dokumentsprache“ (schnellste Methode) so wird die Dokumentsprache aus den von Ihnen installierten verwendet, ohne dass die automatische Spracherkennung greift.
Jedes installierte Sprachpaket wird dabei für die Texterkennung verwendet. Falls mehr als eine Sprache installiert it, so werden alle installierten Sprachpakete für die Texterkennung verwendet.

Automatische Spracherkennung: Definieren Sie „Automatische Spracherkennung“ so versucht PaperOffice die Sprache automatisiert zu erkennen. Dabei wird beim zweiten Durchgang der Wörterkorrektur explizit die Dokumentensprache verwendet, was für Präzise und exakte Wörtererkennung führt. Bitte beachten Sie, dass die Dokumentsprachen dafür installiert sein müssen.

Texterkennung optimieren

Sie können durch manuelle Einstellung die Texterkennung Ihrer Dokumente und Dateien optimieren. Wählen Sie dafür diejenige Option aus, welche für Sie am relevantesten ist, indem Sie das entsprechende Optionsfeld betätigen.

Texterkennung optimieren

Digitale Dokumente extrahieren

PaperOffice kann den Text aus Dateien direkt auslesen anstatt die Texterkennung durchzuführen. Dabei wird die SmartSpell Autokorrektur nicht verwendet. Verwenden Sie diese Option nur wenn Sie sich über die Folgen bewusst sind.

Dokumentsprache Methode festlegen

Installierte Sprachpakete

Um die Texterkennung Ihrer Dokumente und Dateien so präzise wie möglich zu machen benötigt PaperOffice für die Dokumentensprachen Sprachpakete. Installieren Sie diejenigen Sprachen, die in Ihren Dokumenten vorkommen werden, indem Sie neben jeder Sprache ein Häkchen setzen und den Vorgang im nächsten Schritt bestätigen und wählen im oberen Bereich „Dokumentsprache“ die Erkennungsmethode.

Sprachpakete installieren

Alle Änderungen werden sofort übernommen und müssen nicht zusätzlich gespeichert werden.

War dieser Artikel hilfreich?