Push-Nachrichten von MacTechNews.de
Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?
Forum>Software>OCR auf Dateien in Ordner anwenden

OCR auf Dateien in Ordner anwenden

stephanr17.11.2209:27
Hallo liebe Forumsmitglieder,

ich möchte euch gerne um Hilfe für folgendes Problem bitten:

Ich bin dabei, meinen gesamten Papierschriftverkehr, den man heute so per Post bekommt, einzuscannen und dann die Dokumente digital zu verwalten.

Dazu habe ich folgendes Setting eingerichtet:

a) mein Drucker/Scanner Brother MFC-L3770CDW verfügt über eine Duplex-Scan-Funktion, die die Dokumente direkt mit einem Tastendruck via FTP auf mein NAS in den Ordner "scan" schiebt. Toll dabei: es werden gleich die leeren Seiten eliminiert

b) da das alles so einfach am Drucker geht, benutzt das auch meine Frau und wir brauchen bis hierher keinen Computer

c) es sammeln sich erstmal alle Scans in diesem "scan"-Ordner


d) von Zeit zu Zeit räum ich dann den Ordner auf: also benenn die Dateien um und zieh sie in den richtigen Ablageordner

Jetzt suche ich folgende "Automatisierung":
1) (nice to have but not essential) der Scanner benennt die Dateien immer mit dem Prefix "Scan_", das lässt sich auch nur in andere Varianten ändern, aber nicht abschalten, das Präfix bleibt immer. Ich benenn die Dateien aber mit dem Datum beginnend zB. 2022-11-17_xyz. Lässt sich das mit einem Programm, welches den Ordner "scan" überwacht, automatisieren? Merke: die Dateien liegen aber danach noch länger im Ordner, die schiebe ich nur alle 4 Wochen weg

2) (wichtig) die PDFs sind alle bis jetzt nicht nach Inhalt durchsuchbar, der Scanner hat keine OCR-Funktion. Gibt es hier ein Programm, welches den Ordner "scan" nach neuem Inhalt überwachen kann und turnusmäßig ein OCR über die Dateien laufen lassen kann? Auch hier gilt: ich schiebe die Dateien nicht gleich weg in einen anderen Ordner, es liegen also dann kurze Zeit später schon "geOCRte" (gibt es das??) Dateien im "scan"-Ordner

Hat von euch jemand eine Idee, wie ich das am besten bewerkstelligen kann?

Ich sag jetzt schon Danke für alle Helfer und wünsche euch einen angenehmen Tag

Stephan
+1

Kommentare

MetallSnake
MetallSnake17.11.2209:48
Klingt nach einer Aufgabe für "Ordneraktion"

Dann per shell script oder Automator Skript die Datei umbenennen und OCR drüber laufen lassen.


Ich habe gerade keinen Mac vor mir, ich kann daher nicht mit den Details dienen, aber damit sollte sich das relativ einfach zusammen bauen lassen.
„Das Schöne an der KI ist, dass wir endlich einen Weg gefunden haben, wie die Wirtschaft weiter wachsen kann, nachdem sie jeden Einzelnen von uns getötet hat.“
+2
!&all17.11.2209:55
Was für ein NAS hast du denn?

Sollte es eine Synology sein, kann ich dir synOCR empfehlen. Das ist ein Script, dass serverseitig auf dem NAS läuft und all deine Wünsche erledigt. Ich scanne auch per Netzwerk auf einen Inbox Ordner. Dort werden die Scans umbenannt, OCR durchgeführt, durchsucht und danach entsprechend verschoben.
+1
stephanr17.11.2210:00
!&all
Was für ein NAS hast du denn?

Sollte es eine Synology sein, kann ich dir synOCR empfehlen. Das ist ein Script, dass serverseitig auf dem NAS läuft und all deine Wünsche erledigt. Ich scanne auch per Netzwerk auf einen Inbox Ordner. Dort werden die Scans umbenannt, OCR durchgeführt, durchsucht und danach entsprechend verschoben.

Hallo !&all, das klingt ja interessant, das muss ich mir anschauen. Ja, ist ein Synology NAS. Danke schonmal für den Tip
0
marm17.11.2210:13
  • Die Software ExactScan kann scannen, führt ein OCR durch und benennt die Datei wie gewünscht. Leider antwortet mir der Entwickler nicht, wann die Software auf Apple Silicon portiert wird.
  • Devonthink Pro hat Abbyy OCR Scan und OCR eingebaut.
  • Paperless-ngx ist eine Docker-Lösung für Synology mit Dokumentenmanagement und OCR. . Installationsanleitung:
  • Mit Hazel lassen sich Ordner überwachen und Dateien umbenennen
+3
stephanr17.11.2210:22
marm
  • Die Software ExactScan kann scannen, führt ein OCR durch und benennt die Datei wie gewünscht. Leider antwortet mir der Entwickler nicht, wann die Software auf Apple Silicon portiert wird.
  • Devonthink Pro hat Abbyy OCR Scan und OCR eingebaut.
  • Paperless-ngx ist eine Docker-Lösung für Synology mit Dokumentenmanagement und OCR. . Installationsanleitung:
  • Mit Hazel lassen sich Ordner überwachen und Dateien umbenennen

Hallo marm, herzlichen Dank für deine Hilfe und den vielen Input. Ich werde mir alles mal anschauen
0
stephanr17.11.2210:29
MetallSnake
Klingt nach einer Aufgabe für "Ordneraktion"

Dann per shell script oder Automator Skript die Datei umbenennen und OCR drüber laufen lassen.


Ich habe gerade keinen Mac vor mir, ich kann daher nicht mit den Details dienen, aber damit sollte sich das relativ einfach zusammen bauen lassen.

Hallo MetallSnake, auch dir danke für die Idee mit den Ordneraktionen und dem Automator. Da muss ich mal rumspielen ob ich das hinbekommen, bin kein Skript-firmer-Mensch, sondern eher einfacher Anwender
0
momirv17.11.2210:35
marm hat es schon erwähnt und ich kann es bekräftigen. Perperless-ngx ist DAS Tool dafür.

Sobald ein Brief eintrödelt, wird er durch den Scanner geschickt und ich kann mit dem iPhone/iPad/Mac von überall (per VPN) alle Dokument einsehen/durchsuche/etc.
+1
KJM
KJM17.11.2212:19
Prizmo ist ein empfehlenswertes OCR-Programm.
Mehrere Dateien umbenennen kannst du schon mit macOS-Bordmitteln im Finder oder noch ausgefeilter mit A Better Finder Rename .
+1
Kapeike
Kapeike17.11.2213:44
eines würde ich auch noch tun: Melde dich bei denen, die noch Papier schicken! Ich erhalte nur noch Steuerkram per Post, alle Rechnungen sind längst digital
+1
slmnbey
slmnbey17.11.2214:52
Hej, ich finde ja die Fülle an OCR Möglichkeiten insbesondere die NAS intern laufen richtig cool. Das eine oder andere werde ich mir auch mal anschauen.

Für den letzten Punkt, und zwar das umbenennen möchte ich eine Anmerkung machen;
das umbenennen und einsortieren in entsprechende Ordner, quasi der logische Aufbau(m) macht für unser Gehirn Sinn. Aber es ist ein aufwendiger Prozess. Wie wäre es -so wie man heute auch keine Mails mehr in gesonderte Postfächer/Ordner steckt, die fertig gescannten -einschl OCR durchlaufene Dateien mit mehreren -zuvor generierten Tags zu versehen und Dateien per Spotlight Funktion (Textinhalte werden auch durchsucht) ausfindig zu machen?
„Gefundene Rechtschreibfehler dürfen behalten werden!“
+1
slmnbey
slmnbey17.11.2215:21
…vergessen zu erwähnen. Alle Dateien bleiben natürlich somit in einem Ordner bzw. Pool. Unser Gehirn möchte die graphische Ordnung sehen, aber der Mac nimmt dir dieses einsortieren bzw. wieder auffinden ab. Das Spart Zeit und Arbeit. Du erschaffst Dir quasi ein DMS. Vielleicht kannst du für das weiter verarbeiten auf weitere Software dann nutzen. Es sei denn, es dient nur der Archivierung der Dokumente.
slmnbey
Hej, ich finde ja die Fülle an OCR Möglichkeiten insbesondere die NAS intern laufen richtig cool. Das eine oder andere werde ich mir auch mal anschauen.

Für den letzten Punkt, und zwar das umbenennen möchte ich eine Anmerkung machen;
das umbenennen und einsortieren in entsprechende Ordner, quasi der logische Aufbau(m) macht für unser Gehirn Sinn. Aber es ist ein aufwendiger Prozess. Wie wäre es -so wie man heute auch keine Mails mehr in gesonderte Postfächer/Ordner steckt, die fertig gescannten -einschl OCR durchlaufene Dateien mit mehreren -zuvor generierten Tags zu versehen und Dateien per Spotlight Funktion (Textinhalte werden auch durchsucht) ausfindig zu machen?
„Gefundene Rechtschreibfehler dürfen behalten werden!“
+1
stephanr18.11.2212:34
KJM
Prizmo ist ein empfehlenswertes OCR-Programm.
Mehrere Dateien umbenennen kannst du schon mit macOS-Bordmitteln im Finder oder noch ausgefeilter mit A Better Finder Rename .

Hallo KJM, danke, der A Better Finder Renamer sieht gut aus
0
stephanr18.11.2212:36
slmnbey
Hej, ich finde ja die Fülle an OCR Möglichkeiten insbesondere die NAS intern laufen richtig cool. Das eine oder andere werde ich mir auch mal anschauen.

Für den letzten Punkt, und zwar das umbenennen möchte ich eine Anmerkung machen;
das umbenennen und einsortieren in entsprechende Ordner, quasi der logische Aufbau(m) macht für unser Gehirn Sinn. Aber es ist ein aufwendiger Prozess. Wie wäre es -so wie man heute auch keine Mails mehr in gesonderte Postfächer/Ordner steckt, die fertig gescannten -einschl OCR durchlaufene Dateien mit mehreren -zuvor generierten Tags zu versehen und Dateien per Spotlight Funktion (Textinhalte werden auch durchsucht) ausfindig zu machen?
Danke slmnbey, das mit den Tags finde ich spannend, das könnte eine sehr gute Idee sein. Bleiben mir den die Tags langfristig für die Dateien erhalten, also unabhängig vom Mac-Betriebssystem? Kann meine Frau die Tags auf auf ihrem Mac nutzen?
0
marm18.11.2213:26
stephanr
das mit den Tags finde ich spannend, das könnte eine sehr gute Idee sein. Bleiben mir den die Tags langfristig für die Dateien erhalten, also unabhängig vom Mac-Betriebssystem? Kann meine Frau die Tags auf auf ihrem Mac nutzen?
Tagging nutze ich auch, aber ich wäre vorsichtig. Nicht alle Clouds sichern die Attribute (siehe ). Wenn Du Deine Dateien an Dritte weitergibst, können die mit deinem Schlagwortsystem nichts anfangen. An eine systematische Benennung von Dateien führt kein Weg vorbei.
+1

Kommentieren

Diese Diskussion ist bereits mehr als 3 Monate alt und kann daher nicht mehr kommentiert werden.