« Podcast: Office 2007 | Start | Podcast: Live von der Computex (1) »
01. Juni 06
Zu schade fürs Bundle: TextBridge Pro 11 im Test
Nahezu nur noch als Software-Zugabe vertreibt Nuance die Texterkennungs-Software TextBridge. Vereinzelt ist das Programm noch im Handel zu finden, dann allerdings meist zum Dumping-Preis von unter 50 Euro. Angesichts des Entwicklungsstandes, auf dem sich TextBridge Pro 11 befindet, ein durchaus faires Angebot.
Aktuell war das Originalprodukt des ehemaligen Herstellers ScanSoft im Jahr 2002. Damals diente ein OCR-Tool noch hauptsächlich zum Umwandeln von Papierdokumenten in digitale Daten. Diese Disziplin absolviert TextBridge mit zufrieden stellender Genauigkeit. Gemessen an heutigen Wettbewerbern wie Nuance OmniPage 15 oder Abbyy FineReader 8.0 Professional sieht TextBridge Pro 11 so alt aus wie es ist. Warum und wann sich der Einsatz des Produkts trotzdem lohnt, offenbart der PCpro-Test.
Die Vollinstallation von TextBridge benötigt knapp 60 MByte. Manch zwingend notwendiges Service-Pack erfordert heute den vielfachen Festplattenplatz. Den Testern steht es danach frei, das Programm online zu registrieren oder gleich zu verwenden. Von einer Aktivierung oder ähnlichen Schikanen müssen sich TextBridge-User nicht gängeln lassen.
Jedoch scheitern gleich die ersten Tests, die aus dem Erkennen von Text in PDF-Dateien bestehen. TextBridge liest zwar Bilder ein, ist dabei aber auf die Formate BMP, DCX, JPEG, MAX, PCX, PNG und TIFF beschränkt. Nicht verarbeitet werden allerdings unkomprimierte TIFF-Bilder. Freilich klappt im Test aber das Einlesen von Papierdokumenten.
Tabellen und Listings: Lästige Tipparbeit vermeiden
Als Stärke von TextBridge erweisen sich im Test das Extrahieren von Listings und Tabellen. Ist auf den Vorlagen ein Gitternetz vorhanden, wird es originalgetreu übernommen. Tabellen ohne Zellenbegrenzungen interpretiert die Software als formatierten Text, genau wie das Listing von Programm-Code. Der User muss in diesen Fällen allerdings die Word-Funktion verwenden, um den Text in eine Tabelle zu konvertieren.
Im Test scheitert dagegen das Wiederherstellen des Layouts von mehrspaltigen Dokumenten. Die Inhalte von Doppelseiten liest das Tool zwar korrekt formatiert aus, die zwei Textseiten werden aber ohne Umbrüche auf einer zusammengestaucht. Anwender, denen es lediglich auf die Weiterverwertung der Inhalte ankommt, sind zufrieden. Wer sich aber eine digitale Kopie seines Papierdokuments erwartet hat, wird enttäuscht. Diese Disziplin beherrscht OmniPage 15 aus dem Effeff.
Viele Fehler bei abfotografierten Texten
Die Texterkennung ist das Steckenpferd von Abbyy FineReader 8.0. Testanforderungen an TextBridge wie das Extrahieren von Schrift in Fontgröße 4, dem Einlesen von Faxen in geringer Auflösung oder dem Texterkennen auf Digitalfotos werden mit einer vergleichsweise hohen Fehlerquote bewältigt. Der Konkurrent FineReader leistet wesentlich mehr. Mit TextBridge auf der sicheren Seite ist, wer Papierdokumente mit mindestens 300 dpi einliest. Heute gängige Auflösungen zwischen 300 und 600 dpi gelten als ideal für die OCR (Optical Character Recognition).
Stolperstein für TextBridge ist im Test auch das Umwandeln mehrsprachiger Dokumente. In der verarbeiteten Textseite mit deutschen, englischen und französischen Absätzen fehlen die Akzente. Umlaute werden dagegen unabhängig von der Spracheinstellung komplett korrekt identifiziert. Um die Erkennungsgenauigkeit zu steigern kann der User wie OmniPage und FineReader auch in TextBridge manuell auswählen, welche Sprachen auf einem Blatt vorhanden sind.
Fazit
Wer auf die PDF-Verarbeitung verzichten kann und hauptsächlich Texte weiterverwenden will, kann ruhigen Gewissens zu TextBridge Pro 11 greifen. Eine wesentlich höhere Erkennungsgenauigkeit besonders bei verschmutzten oder niedrig aufgelösten Vorlagen und nützliche Zusatzfunktionen wie der Screenshot Reader von FineReader und der WAV-Export in OmniPage rechtfertigen allerdings den Erwerb von aktuellen OCR-Produkten.
Posted by Mark Schröder on Juni 1, 2006 at 04:44 nachm. | Permalink
TrackBack
TrackBack-Adresse für diesen Eintrag:
http://www.typepad.com/services/trackback/6a00d83451bdb469e200d8352d801753ef
Listed below are links to weblogs that reference Zu schade fürs Bundle: TextBridge Pro 11 im Test:




