Push-Nachrichten von MacTechNews.de
Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?
Forum>Software>OCRmyPDF auf Synology NAS

OCRmyPDF auf Synology NAS

luhcu
luhcu07.05.1909:22
Hallo zusammen,
ich bin kurz vor der Vollendung eines perfekten Workflows für das papierlose Büro. Dazu fehlt mir lediglich dieser letzte Schritt:

Ich möchte gerne das Programm OCRmyPDF auf meinem NAS laufen lassen, welches dafür sorgt, dass jedes neue PDF, welches direkt vom Scanner kommt, geOCRt wird und anschließend in ein anderes Verzeichnis verschoben wird.

Bei Google konnte ich bereits eine Anleitung finden, jedoch kenne ich mich mit Docker nicht wirklich aus. Hat jemand vielleicht gute Tipps oder eine Anleitung für mein Vorhaben?
Gibt es vielleicht sogar eine ganz andere Lösung als OCRmyPDF?

Vielen Dank
0

Kommentare

Liebling
Liebling07.05.1909:34
Das hört sich grundsätzlich interessant an... magst du mal schreiben was du alles anstellst, um papierlos zu arbeiten?
0
luhcu
luhcu08.05.1914:33
Liebling
Das hört sich grundsätzlich interessant an... magst du mal schreiben was du alles anstellst, um papierlos zu arbeiten?

Ich habe mir vor kurzem den Dokumentenscanner Brother ADS-1700W angeschafft. Dieser scannt meine Dokumente unkompliziert und legt sie in einem entsprechenden Ordner auf meinem NAS ab.

Hier soll dann automatisiert die OCR-Software zum Einsatz kommen, welche das neu eingegangene Dokument untersucht.

Wenn ich dann das nächste mal am Mac bin benenne ich die neuen Dokumente und das Tool "Hazel" sortiert diese dann entsprechend des vergebenen Namens in das richtige Verzeichnis.
0
piik
piik08.05.1914:55
Bist Du sicher, ob die Software OCRmyPDF überhaupt für Deinen NAS bzw. dessen OS kompiliert zur Verfügung steht?
Allgemein zu wenig Infos übrigens...
0
PythagorasTraining
PythagorasTraining08.05.1914:56
Es muss für die Langzeitarchivierung auch noch das PDF/A Format benutzt werden.
Eine einfache Ablage als "nur" PDF egal ob mit oder ohne OCR reicht da nicht.
Wurde das bedacht?

Ich habe mir in Acrobat ein Werkzeug im Aktionsassistent erstellt. Mit nur einem Klick wird ein gesamter Ordner mit OCR in ein PDF/A umgewandelt.

Eine Automatik hat nicht funktioniert, da die gescannte Datei noch nicht fertig gespeichert war, aber die Automatik schon umwandeln wollte und das führte zu Dateifehlern.
0
rmayergfx
rmayergfx08.05.1915:04
Anleitung gibt es im Synology Forum:
„Der Computer soll die Arbeit des Menschen erleichtern, nicht umgekehrt !“
0
pacolov08.05.1915:11
OCRmyPDF kann wunderbar PDF/A-Dateien erzeugen, obwohl das für den Privatgebrauch auch Jacke wie Hose ist. Habe das Tool schon selbst (in einem anderen Kontext) für über 100.000 Seiten verwendet und die Ergebnisse sind klasse.

Auf einem Synology NAS mit Intel-CPU wird Dein Vorhaben mit Docker auf jeden Fall umsetzbar sein. Es braucht also schon ein Plus-Modell, dann sollte das aber kein Problem sein. Direkt auf dem NAS kann man das auch zum laufen bekommen, würde aber deutlich fummeliger als mit Docker.

Hatte mir selbst das gleiche schon länger vorgenommen, hatte bisher aber nicht die Zeit gefunden ein entsprechendes Docker-Image zu erstellen. Hab eine DS716+ zu Hause und bereits diverse Docker-Images (Unifi, Plex, usw.) laufen.

Grundsätzlich muss man bedenken, dass OCRmyPDF aktiv angestoßen werden muss, es ist ein Script, kein Daemon. Es gibt aber relativ einfache Möglichkeiten einen Ordner zu überwachen und neue Dateien OCRmyPDF zuzuführen, ist in der Doku selbst schon genannt:

Da müsste man sich halt einfach mal ran trauen
0

Kommentieren

Diese Diskussion ist bereits mehr als 3 Monate alt und kann daher nicht mehr kommentiert werden.