Forum>Software>OCR mit Vorschau

OCR mit Vorschau

hakken
hakken17.02.1715:24
Vorschau war doch mal in der Lage eine OCR-Erkennung durchzuführen.

Leider finde ich diese Funktion nicht mehr.

Wo muss ich suchen?
0

Kommentare

jogoto
jogoto17.02.1715:47
Das wäre mir neu. Eventuell ein Plugin eines OCR-Herstellers?
„Genaue Angaben zum Problem sind unnötig. Funzt net reicht völlig.“
0
Weia17.02.1715:49
hakken
Vorschau war doch mal in der Lage eine OCR-Erkennung durchzuführen.
Nein, das war nie der Fall.
+1
ctd17.02.1715:51
Stimme da meinen Vorredner zu. Vorschau hatte die Funktion noch nie. PDFPenPro bietet das aber. Oder direkt sowas wie Abby Finereader.
0
johnnybpunktone17.02.1715:52
Leider ist das einzige, was Vorschau mit OCR macht, es kaputtzumachen, wenn es sich um Adobe Clearscan handelt...
0
Weia17.02.1715:55
johnnybpunktone
Leider ist das einzige, was Vorschau mit OCR macht, es kaputtzumachen, wenn es sich um Adobe Clearscan handelt...
Wieso leider? Das Verhalten in Bezug auf Adobe ist völlig korrekt: Macht kaputt, was Euch kaputt macht!
-2
johnnybpunktone18.02.1712:18
Weia
johnnybpunktone
Leider ist das einzige, was Vorschau mit OCR macht, es kaputtzumachen, wenn es sich um Adobe Clearscan handelt...
Wieso leider? Das Verhalten in Bezug auf Adobe ist völlig korrekt: Macht kaputt, was Euch kaputt macht!

Ist halt nur scheisse, Adobe oder nicht, wenn das OCR-Layer irreparabel zerstört wird, wenn man ein PDF mit Vorschau bearbeitet.
Aber klar: IT-Politik ist auch viel wichtiger als funktionierende IT...
0
nacho
nacho18.02.1719:35
johnnybpunktone
Leider ist das einzige, was Vorschau mit OCR macht, es kaputtzumachen, wenn es sich um Adobe Clearscan handelt...

Was macht Vorschau kaputt?
0
ela20.02.1709:13
nacho
johnnybpunktone
Leider ist das einzige, was Vorschau mit OCR macht, es kaputtzumachen, wenn es sich um Adobe Clearscan handelt...

Was macht Vorschau kaputt?


Betrifft macOS Sierra und ist einer der Gründe, warum es nicht auf meine Macs kommt.
+1
DefiLover20.02.1709:38
hakken
Vorschau war doch mal in der Lage eine OCR-Erkennung durchzuführen.

Leider finde ich diese Funktion nicht mehr.

Wo muss ich suchen?
In den Analen des MacOS ... ja, es gab mal Versionen die das konnten, aber nein, heute kann Vorschau das nicht mehr ohne PlugIn.
+1
johnnybpunktone20.02.1710:04
ela
nacho
johnnybpunktone
Leider ist das einzige, was Vorschau mit OCR macht, es kaputtzumachen, wenn es sich um Adobe Clearscan handelt...

Was macht Vorschau kaputt?


Betrifft macOS Sierra und ist einer der Gründe, warum es nicht auf meine Macs kommt.

Tatsächlich betrifft das im Bezug auf die OCR-Technologie „ClearScan“ von Adobe alle Vorschau-Versionen (und alle PDFkit-Versionen) seit *mindestens* Snow Leopard.
Der Grund: PDFkit ersetzt ungefragt nicht systemweit vorhandene Schriften durch solche um Dokumente „kompatibler“ zu machen (war ungefähr 2009 noch relevanter als heute). Clearscan funktioniert aber genau so: Es ließt das Dokument und generiert aus dem „Gesehenen“ nicht nur maschinenlesbaren Text sondern angepasste Schriftarten, in denen das Erkannte dann wiedergegeben wird. Das PDF strotzt also nur so vor eigenen Schriften, die alle von Preview überschrieben werden, allerdings aufgrund mangelnder Übersetzbarkeit in normale TT-Fonts ausnahmslos durch abseitige Sonderzeichen. Der Text ist nicht mehr vom Computer lesbar, lässt sich aber nicht mehr erneut mit Clearscan bearbeiten, das Dokument ist kaputt.
(übrigens, ein Grund, diese Technologie einzusetzen, kann sein, Speicher zu sparen, macht Dokumente aber auch weitestgehend auflösungsunabhängig, da Vektorfonts bekanntlich viel besser vergrößerbar sind als Bilder von Schrift )
0
Weia20.02.1711:46
johnnybpunktone
Ist halt nur scheisse, Adobe oder nicht, wenn das OCR-Layer irreparabel zerstört wird, wenn man ein PDF mit Vorschau bearbeitet.
Aber klar: IT-Politik ist auch viel wichtiger als funktionierende IT...
Korrekt implementierte OCR-Layer gehen aber durch eine Bearbeitung mit Vorschau nicht verloren, nur OCR-Layer erstellt mit Software von Adobe. Wer trägt nun also die Schuld?
johnnybpunktone
Tatsächlich betrifft das im Bezug auf die OCR-Technologie „ClearScan“ von Adobe alle Vorschau-Versionen (und alle PDFkit-Versionen) seit *mindestens* Snow Leopard.
Der Grund: PDFkit ersetzt ungefragt nicht systemweit vorhandene Schriften durch solche um Dokumente „kompatibler“ zu machen (war ungefähr 2009 noch relevanter als heute).
Wie kommst Du denn darauf? Ein Gag von PDF ist doch gerade, dass die verwendeten Fonts eingebettet werden und also nicht auf dem System vorhanden sein müssen, und natürlich ersetzt PDFKit die nicht.

Adobe hat sich bei ClearScan einfach nicht an die eigenen PDF-Spezifikationen gehalten, getreu dem Motto le roi c’est moi. Typisch für dieses unerträgliche Unternehmen.
0
ela20.02.1712:00
nanana - Die PDFKit-Sorgen in Sierra habe nicht (nur) mit Adobe zu tun
Apple wollte dieselbe Basis für iOS und macOS schaffen und hat - sage ich jetzt mal, wie bei iWork - die schwächere iOS-Version als Basis auf macOS gezogen... ja schade wenn da ein paar Dinge jetzt nicht mehr funktionieren...

So ziemlich jede Firma, die auf PDFKit setzt, hat im Augenblick ein Problem an der Backe. Schau mal in den News von DevonThink z.B. oder in die diversen News-Meldungen der letzten Wochen/Monate - Zunächst dachte man noch, es läge an ScanSnap, dem war und ist aber nicht so. PDFs waren plötzlich "leer" ... manches davon hat Apple mit einem Update behoben aber eben längst nicht alles.

Mir als User ist übrigens egal wer Schuld ist - Ich weiß, dass Apple etwas grundlegendes(!) geändert hat (das haben sie schon mal getan, seitdem konnte eine Druckerrei meine PDF nicht mehr fehlerfrei lesen und hat mir diverse Fehler gemeldet oder falsch gedruckt... seitdem rendere ich alles als Pixel in passender Auflösung und schicke riesige Dateien)

Sierra kommt mir nicht auf den Mac solange Apple das nicht wieder ernst nimmt
+1
Weia20.02.1712:00
DefiLover
In den Analen des MacOS ... ja, es gab mal Versionen die das konnten
Wann? Ich nutze macOS seit der Beta im Jahre 2000, und Vorschau konnte das meiner Erinnerung nach nie.
0
Weia20.02.1712:11
ela
nanana - Die PDFKit-Sorgen in Sierra habe nicht (nur) mit Adobe zu tun
Da hast Du völlig recht. Mit PDFKit in Sierra hat Apple richtig Mist gebaut, und auch ich nutze Sierra deshalb nicht.

Das ist aber ein anderes Problem als das mit ClearScan.
Mir als User ist übrigens egal wer Schuld ist
Das sollte es aber nicht, denn so kannst Du viele Probleme aus Unkenntnis nicht vermeiden. Dass Du gezielt (und völlig zurecht) Sierra meidest, ist doch das beste Beispiel dafür, dass Dir das eben nicht egal ist.

Ich habe ein viel sorgenfreieres Leben, seit ich konsequent alles von Adobe von meinen Macs verbannt habe.
0
ela20.02.1713:20
Das Problem ist mir auch NICHT egal (darum nutze ich Sierra nicht - gibt auch noch andere Fehler)

Auf einen Schuldigen zu zeigen ist mir aber egal - oder einfacher: Für mich ist Apple "schuld" (ich weiß sie haben etwas geändert und jetzt gehen Dinge nicht mehr).
Ob das am Ende andere verbockt haben? Für das Ergebnis egal - Sierra nicht nutzen bis durch die Newsticker die Meldung kommt: ALLE Probleme gelöst

Ich als Kunde, der mit dem System arbeiten möchte, muss nicht recherchieren WER etwas verbockt hat. Natürlich gucke ich mal kurz links und rechts ob ein Update etwas löst. Wenn aber so ziemlich alle mit dem Finger auf Apple zeigen, dann suche ich auch nicht mehr weiter
0
johnnybpunktone20.02.1713:27
Weia
Korrekt implementierte OCR-Layer gehen aber durch eine Bearbeitung mit Vorschau nicht verloren, nur OCR-Layer erstellt mit Software von Adobe. Wer trägt nun also die Schuld?

Wie kommst Du denn darauf? Ein Gag von PDF ist doch gerade, dass die verwendeten Fonts eingebettet werden und also nicht auf dem System vorhanden sein müssen, und natürlich ersetzt PDFKit die nicht.

Adobe hat sich bei ClearScan einfach nicht an die eigenen PDF-Spezifikationen gehalten, getreu dem Motto le roi c’est moi. Typisch für dieses unerträgliche Unternehmen.

Die mögliche Implementierung von Fonts in PDFs ist natürlich Standard, es gibt aber schlicht keine einheitliche Regelung, welche Fonts da enthalten sein dürfen und welche nicht (und Apple zwingt die Dateien dazu TT und OT und zu nutzen, Adobe Clearscan Fonts werden überschrieben). Was Apple macht mit PDFKit ist „Performance mit Brecheisen“, das war vor vielen Jahren vielleicht mal nötig um Spotlight vernünftig nutzbar zu machen (Steve Jobs damals sinngemäß auf der Keynote: „you hit return and boom, your search results“), sollte aber eigentlich kein Thema mehr sein und ist vermutlich aus Faulheit und/oder Geiz nie geändert worden.
Ganz abgesehen davon: Preview sollte zumindest darauf hinweisen, dass es destruktive Änderungen am Dokument vornehmen wird. Dann kann man sich entscheiden, ob man lieber auf PDF Expert setzt, dort klappt es nämlich mit der Kombination aus Performance und Respekt vor den Dateien des Nutzers. Diese Anwendung überschreibt nämlich nicht einfach die Kodierung der Datei mit den eigenen vermeintlichen „Standards“.
Zur Glaubensfrage: In der Tat ist Acrobat das einzige Produkt von Adobe das ich nutze, und zwar wegen Clearscan. Es gibt schlicht (zumindest für den Mac) kein Produkt, das vergleichbar gute Ergebnisse liefert. Clearscan produziert aus großen Scans kleine, leichte, problemlos auch mit niedriger Uploadrate in der Cloud nutzbare Dateien, die scharf gerendert werden, egal wie die Bildschirmauflösung ist. Wenn Apple oder ein anderer Hersteller das auch liefern würde, könnte ich umsteigen. Tun sie aber nicht und lassen meine Dokumente noch nicht einmal in Ruhe. Das ist einfach nur unverschämt und bad practice...
+1
Weia20.02.1713:51
johnnybpunktone
Die mögliche Implementierung von Fonts in PDFs ist natürlich Standard, es gibt aber schlicht keine einheitliche Regelung, welche Fonts da enthalten sein dürfen und welche nicht
Na, eben Fonts in standardisierten Formaten. PostScript, OpenType, TrueType – geht alles wunderbar mit Vorschau.
(und Apple zwingt die Dateien dazu TT und OT und zu nutzen, Adobe Clearscan Fonts werden überschrieben).
Wie gesagt, PostScript geht ebenso gut. Die ClearScan-Fonts sind aber eben nicht in einem standardisierten Format, und das ist Adobes Schuld, nicht Apples. Apple verhält sich völlig stndardkonform, aber Adobe gebärdet sich wieder einmal als derjenige, dem alle folgen müssen, weil er so toll ist, egal ob Standard oder nicht. Und da macht Apple (zurecht, wie ich finde) eben nicht mit.
Was Apple macht mit PDFKit ist „Performance mit Brecheisen“, das war vor vielen Jahren vielleicht mal nötig um Spotlight vernünftig nutzbar zu machen (Steve Jobs damals sinngemäß auf der Keynote: „you hit return and boom, your search results“), sollte aber eigentlich kein Thema mehr sein
Die paar Megabytes von PDFs mit Pixelscans sollten heute aber erst recht kein Thema mehr sein …
-2
gfhfkgfhfk20.02.1715:22
Weia
Wie gesagt, PostScript geht ebenso gut. Die ClearScan-Fonts sind aber eben nicht in einem standardisierten Format,
Clearscan erzeugt je nach Version entweder Type3 oder Type1 CID Fonts, und die sind noch immer in PDFs erlaubt.
+2
johnnybpunktone20.02.1715:53
gfhfkgfhfk
Weia
Wie gesagt, PostScript geht ebenso gut. Die ClearScan-Fonts sind aber eben nicht in einem standardisierten Format,
Clearscan erzeugt je nach Version entweder Type3 oder Type1 CID Fonts, und die sind noch immer in PDFs erlaubt.

Danke! Damit erübrigt sich eine weitere ausführliche Antwort meinerseits.
Dass Apple sich nicht standardkonform verhält, sogar ohne guten Grund, und damit Dateien von Benutzern beschädigt, lässt sich einfach nicht wegdiskutieren.
0
Weia20.02.1716:27
gfhfkgfhfk
Clearscan erzeugt je nach Version entweder Type3 oder Type1 CID Fonts, und die sind noch immer in PDFs erlaubt.
CID-Fonts haben es nie über Adobe hinaus in die Welt geschafft und sind durch OpenType zurecht auf dem Müllhaufen der Geschichte gelandet.
-1
gfhfkgfhfk20.02.1716:45
CID Fonts sind mit Sicherheit in Asien weit verbreitet gewesen. Das Format selbst ist dokumentiert und in der PDF Dokumentation von Adobe immer noch als erlaubt deklariert.
+1
johnnybpunktone20.02.1719:11
Weia
gfhfkgfhfk
Clearscan erzeugt je nach Version entweder Type3 oder Type1 CID Fonts, und die sind noch immer in PDFs erlaubt.
CID-Fonts haben es nie über Adobe hinaus in die Welt geschafft und sind durch OpenType zurecht auf dem Müllhaufen der Geschichte gelandet.

Willst du jetzt wegerklären, dass es sich nicht um einen spezifizierten Standard handelt, weil dieser nicht mehr so häufig verwendet wird? Schneidet Apple am Ende sogar alte Zöpfe ab? Aber damit verhalten sich ja gerade die nicht standardkonform... Ein ausgemachtes Paradox!
(Sollte Apple dem am besten beikommen, indem sie PDF gar nicht mehr unterstützen, denn schließlich ist das Format an sich lediglich defacto Standard und nicht durch institutionelle Übereinkunft etabliert worden? Das wäre die Lösung.
Dann müsste Apple aber vielleicht was besseres unterstützen oder gar erfinden, das auch das Zeug zum Standard hat. Und das wiederum machen sie ja nun schon länger nicht mehr...)
+1
Weia20.02.1719:47
johnnybpunktone
Schneidet Apple am Ende sogar alte Zöpfe ab?
Ja, das würde ich in dem Falle so sehen.
-1
johnnybpunktone20.02.1719:54
Weia
johnnybpunktone
Schneidet Apple am Ende sogar alte Zöpfe ab?
Ja, das würde ich in dem Falle so sehen.

Das war eigentlich ironisch gemeint, hätte jetzt nicht mit einer ernsthaften Antwort gerechnet.
Aber ok: sie schneiden keine alten Zöpfe ab, sie haben nur was gekillt, was ihnen nicht in den Kram gepasst hat. Damit verhalten sie sich NICHT standardkonform, was du uns aber die ganze Zeit erzählen wolltest...
Es gibt keinen einzigen Vorteil durch das Weglassen dieser Font-Typen, nur Nachteile.
Aber klar, gerne darfst du meinen Witz als Argument übernehmen...
+1
Weia20.02.1720:09
johnnybpunktone
Aber ok: sie schneiden keine alten Zöpfe ab, sie haben nur was gekillt, was ihnen nicht in den Kram gepasst hat.
Unsinn. Kein Mensch verwendet mehr dieses archaische Font-Format.

Apple hat ja nichts entfernt, was schonmal ging, sie hätten einen ziemlichen Extra-Aufwand treiben müssen, um dieses Font-Format in PDFKit zu integrieren, und das alles nur, damit eine einzelne, einsame, seltsame Adobe-Software noch funktioniert, die – ganz wichtig im Jahre 2017 – ein paar Megabyte bei Scans einspart?

Das kann nicht Dein Ernst sein.

Zumal Dich doch niemand auf der Welt zwingt, ClearScan-PDFs mit Vorschau nachzubearbeiten – Vorschau ist ja primär ein Viewer, es gibt x andere macOS-Programme, die PDFs bearbeiten können, wenn das für Dich so eine wichtige Funktion ist.

Deine Probleme hätte ich echt gerne …
Es gibt keinen einzigen Vorteil durch das Weglassen dieser Font-Typen,
Doch, sogar einen entscheidenden: Das Weglassen von unnützem Code ist auch immer das Eliminieren von Fehlermöglichkeiten und Ballast.
nur Nachteile.
Nur für Leute, die Adobe-Produkte benutzen. Und denen ist eh nicht zu helfen.
-1
PythagorasTraining
PythagorasTraining20.02.1722:49
mmmh, zur Lagzeitarchivierung ist ClearScan nicht geeignet. Zumindest in meiner Acrobat X Version kann ich keine ClearScans mit PDF/A speichern. Deswegen bin ich wieder weg vom ClearScan.
0
johnnybpunktone21.02.1702:39
PythagorasTraining
mmmh, zur Lagzeitarchivierung ist ClearScan nicht geeignet. Zumindest in meiner Acrobat X Version kann ich keine ClearScans mit PDF/A speichern. Deswegen bin ich wieder weg vom ClearScan.

Auch das könnte mitunter mit der Art der Fonts zu tun haben, die Clearscan ausspuckt. Es muss aber auch nicht jedes Dokument langzeitarchiviert werden, und solange die Lesbarkeit gegeben ist, ist das Dokument ja geeignet. PDF/A-Varianten sind ja wesentlich restriktiver genormt als normale PDFs...
0
gfhfkgfhfk21.02.1709:16
Weia
Unsinn. Kein Mensch verwendet mehr dieses archaische Font-Format.
Das ist vollkommen belanglos, da laut Adobe PDF 1.7 Spezifikation (Kapitel 5.5.4) es ein erlaubtes Fontformat ist. Du darfst Dich gerne durch die Doku bei Adobe lesen, in welcher PDF Revision es eingeführt wurde.
Weia
Apple hat ja nichts entfernt, was schonmal ging, sie hätten einen ziemlichen Extra-Aufwand treiben müssen, um dieses Font-Format in PDFKit zu integrieren, …
Somit hat Apple noch nie eine konforme Implementation besessen! Apple kann nicht von sich aus entscheiden, welche Teile der Spezifikation sie implementieren und welche nicht. Ende der Diskussion
+1
Weia21.02.1714:30
gfhfkgfhfk
Somit hat Apple noch nie eine konforme Implementation besessen!
Hat das jemand behauptet? Interessiert das jemanden?
Apple kann nicht von sich aus entscheiden, welche Teile der Spezifikation sie implementieren und welche nicht.
Sie können es ganz offensichtlich, denn sie tun es ja.

Genauso wie sie Flash verbannen konnten.
0

Kommentieren

Diese Diskussion ist bereits mehr als 3 Monate alt und kann daher nicht mehr kommentiert werden.

OK MacTechNews.de verwendet Cookies unter anderem für personalisierte Inhalte, Seitenanalyse und bei der Auslieferung von Google-Anzeigen. Dies war zwar schon immer so, auf Wunsch der EU muss nun jedoch explizit darauf hingewiesen werden. Durch Nutzung der Website erklären Sie sich damit einverstanden. Weitere Informationen