Zum Hauptinhalt gehen
Von A bis Z: Unser Glossar

Glossar

A     B     C     D         F     G     H     I     J     K     L     M     N     O     P     Q     R     S     T     U     V     W     X     Y     Z     0-9  

OCR ist die Abkürzung für Optical Character Recognition, auf Deutsch „Optische Buchstabenerkennung“: Software zur Texterkennung.

OCR spielt eine wichtige Rolle beim Digitalisieren von Arbeitsprozessen. Für digitale Workflows müssen alle Dokumente, die auf Papier vorliegen, eingescannt werden. Der Scanner allerdings speichert jedes Dokument als Bilddatei. Damit sich der Text einer eingescannten Seite mit Programmen wie Word bearbeiten lässt, müssen die Bilder wieder in Text umgewandelt werden. Das gewährleistet OCR.

Die Software zerlegt die Seite in ihre Einzelteile. Per Layoutanalyse stellt OCR fest, an welchen Stellen sich auf einer Seite Text befindet und wo Elemente wie Bilder oder Grafiken stehen. Am Ende der Layoutanalyse erstellt die Software aus dem Dokument eine Sammlung einzelner Zeichen. Im nächsten Schritt müssen die Zeichen korrekt identifiziert werden, bevor aus den Zeichen der Text rekonstruiert und als Textdatei gespeichert wird.

Je unmissverständlicher die Buchstaben, desto fehlerfreier arbeitet die OCR-Software. Bei verschnörkelten Schriften und endgültig bei Handschriften stößt sie an Grenzen. Hier setzen Handprint Character Recognition (HCR) und Intelligent Character Recognition (ICR) an.

Wichtiger Sicherheitshinweis

Hier finden Sie Informationen über die Auswirkungen der Schwachstelle Log4Shell (CVE-2021-44228) auf unsere Produkte.
Sicherheitshinweise und Schwachstellen unserer Produkte

Download Center

Druckertreiber, Bedienungsanleitungen, Prospekte, PTS-Zertifikate, Utilities und vieles mehr können Sie hier herunterladen.
Download-Center

Karriere

Sie sind neugierig – haben aber trotzdem Bodenhaftung? Dann passen Sie zu TA Triumph-Adler!
Karriere Bewerbung Stellenausschreibung HR bei TA Triumph-Adler