pte20181120019 Technologie/Digitalisierung, Forschung/Entwicklung

Neue intelligente Software erkennt fast alles

Fraunhofer-Forscher haben hochkomplexe Engine für Optical Character Recognition trainiert


Zeichenerkennung: Neues System erkennt alles (Bild: IAIS, animaflora/fotolia.de)
Zeichenerkennung: Neues System erkennt alles (Bild: IAIS, animaflora/fotolia.de)

Sankt Augustin (pte019/20.11.2018/12:30) Forscher des Fraunhofer-Instituts für Intelligente Analyse- und Informationssysteme (IAIS) http://www.iais.fraunhofer.de haben zusammen mit der CIB software GmbH eine Künstliche Intelligenz entwickelt, die Zeichen mit menschenähnlicher Genauigkeit erkennt. Herzstück ist eine Engine für Optical Character Recognition (OCR).

Mit mehr als 2.000 Fonts sowie eigens erzeugten, schwer erkennbaren Zeichen haben die Forscher die künstlichen neuronalen Netze trainiert. So gelingt es der Technologie, neben gut lesbaren Materialien auch alte Schriften, Fotos mit mangelhafter Belichtung und schlecht erhaltene Dokumente zu entziffern.

Schwer Erkennbares deuten

Selbst Hinweisschilder auf Baustellen oder Plakattexte erkennt die Software laut den Experten problemlos, was ihren Einsatz über die klassische Dokumentenanalyse hinaus in anderen Bereichen ermöglicht, etwa dem Autonomen Fahren oder der Hilfe Sehbehinderter, denen künftig zum Beispiel Texte in ihrer Umgebung vorgelesen werden könnten.

"Eine Vielzahl der kommerziellen Engines ist offenbar primär auf gute Materialien ausgelegt. Hier liegt die Trefferquote bei nahezu perfekten 99 Prozent. Sobald die Qualität des Dokuments abnimmt, verringert sich die Erkennungsrate jedoch dramatisch. Deshalb haben wir uns insbesondere auf schwer erkennbare Dokumente konzentriert und so auf unserer Fraunhofer-Expertise im Maschinellen Lernen aufbauend eine schnelle und robuste Allzweck-OCR-Engine mit menschenähnlicher Genauigkeit geschaffen - auch bei schwierigen Scans", so IAIS-Projektleiter Iuliu Konya.

Ein Zeichen, 5.000 Variationen

In 27 Monaten haben die Forscher die OCR-Engine trainiert - jedes Zeichen wurde mindestens 5.000 Mal in verschiedenen Variationen zum Training verwendet. Historische und neue Texte, verschiedene Graustufen - dort, wo es an Trainingsdaten mangelte, erzeugten die Forscher zudem selbst synthetische Texte. Nachdem die Software zunächst anhand einzelner annotierter Zeichen trainiert wurde, erkennt sie jetzt innerhalb ganzer Zeilen selbstständig die jeweiligen Buchstaben und Satzzeichen. Binnen kürzester Zeit werden Zeitungsseiten, juristische Dokumente oder medizinische Akten erfasst.

(Ende)
Aussender: pressetext.redaktion
Ansprechpartner: Florian Fügemann
Tel.: +43-1-81140-313
E-Mail: fuegemann@pressetext.com
Website: www.pressetext.com
|