Push-Nachrichten von MacTechNews.de
Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?
Forum>Software>Unsichtbare Textebene aus OCR in PDF editieren?

Unsichtbare Textebene aus OCR in PDF editieren?

Termi
Termi17.05.1212:26
Ich scanne PDFs mit OCR, wobei hinter dem Bild eine unsichtbare Textebene angelegt wird. Womit kann ich diese nachträglich editieren? Habe Acrobat Pro 8 & Readiris 12.
0

Kommentare

breaker
breaker18.05.1213:49
Mit dem "Objekt bearbeiten"-Werkzeug in Acrobat kannst du verschiedene Objekte editieren und rauslöschen, also auch deine unsichtbare Textebene.
0
Termi
Termi18.05.1217:35
Löschen wäre nicht das Problem. Ich will aber den per OCR erkannten Text möglichst einfach korrigieren.

Momentan kann ich nur den unsichtbaren Text editieren, was sehr schwer ist.
0
tifonex18.05.1221:54
Das OSC-Programm bietet doch bestimmt eine option zum Überprüfen des erkannten Textes an, oder? Ansonsten noch mal in Acrobat mit OCR drüber gehen, falls es dir direkt vom Scanner angeboten wird und der keine Optionen bietet. Acrobat bietet das an. Read Iris ja auch, aber ich weiß nicht, ob man damit auch den Hintergrundtext erstellen kann.
0
Termi
Termi19.05.1213:13
Die Texterkennung von Acrobat ist gelinde gesagt unterdurchschnittlich. Mein Canon Multifunktionsgerät erkennt da ja besser.
Die Texterkennung von Readiris 12 ist schon sehr gut. Wenn ich mir beim Scannen alle nicht eindeutigen Stellen zeigen lasse, ist das Ergebnis auch akzeptabel. Leider sind trotzdem 1-3 Fehler pro Seite. Nachträglich kann ich diese nicht mit Readiris editieren. Dies würde ich aber gerne irgendwie hin bekommen, um einen absolut korrekten Text zu erhalten und weiß nicht, womit und wie.

Wenn ich das Dokument als Text in ein PDF umwandle kann ich diesen natürlich sehen und editieren. Dann entspricht aber Das Endergebnis optisch nicht zu 100% dem Original.

Da kauft man für rund 1.000 Euro Software und scheitert an sowas. Vielleicht bin ich aber auch nur zu perfektionistisch.
0
tifonex19.05.1214:52
Na gut, ich hab Acrobat X, das erkennt sehr gut.

Aber wenn ich dich jetzt richtig verstehe, dann ist dein Problem mehr, dass du zwar editieren kannst in Acrobat, aber eben den falsch erkannten Text nichts direkt siehst sondern nur, wenn du schon weißt wo er steht und ihn markierst?
Dann könntest du doch auch den Text als solchen abspeichern und dann die Position im PDF suchen. Aber ob sich der Aufwand dann noch lohnt? Bei 1-3 Fehlern pro Seite, wenn Readiris das macht?
0
Termi
Termi19.05.1221:15
Ich biete das auch nebenberuflich an und würde gerne die Qualität erhöhen. Wenn Kunden den Text aufgrund fehlerhafter OCR nicht beim Suchen finden, ist das halt suboptimal.

Ich biete halt gerne optimale Lösungen (Webseiten mit validem XHTML, Mobile Websites bei Aufruf per Smartphone, ordentliche PDF Formulare, usw.)

Dachte, ein nachträgliches Editieren MUSS doch irgendwie gehen...
0

Kommentieren

Diese Diskussion ist bereits mehr als 3 Monate alt und kann daher nicht mehr kommentiert werden.