Push-Nachrichten von MacTechNews.de
Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?
Forum>Software>Paperless ai mit paperless-ngx betreiben.

Paperless ai mit paperless-ngx betreiben.

aggi
aggi21.11.2512:21
Hallo zusammen,

nachdem ich anfänglich mit vielen Problemen beim installieren und einrichten von paperless-ngx zu kämpfen hatte, läuft das Projekt nun sehr stabil. Nun habe ich die nächste Stufe der Kategorisierung implementiert in Form von paperless ai.
Wollte mal in die Runde fragen, ob das noch jemand macht und mit welchem LLM Model.
Ich nutze die lokale LLM Version Ollama mit Llama3.2. Die Ergebnisse sind so gemischt. Die Prompt-Vorgaben werden nicht unbedingt so umgesetzt, wie von mir vorgegeben. Werde mal andere Modelle von Ollama testen.
Falls jemand andere Erfahrungen gemacht hat, gerne her damit. Gerne auch die Prompts, die man einsetzt.

Danke ...
0

Kommentare

elruti21.11.2517:24
Ich hatte das mal ausprobiert aber irgendwie werde ich damit nicht so richtig warm.
Er erstellt mir auch immer neue Tags obwohl ich explizit ausgewählt habe das er die existierenden benutzen soll.

Habe jetzt aber die standardprompts verwendet die bereits hinterlegt waren.

Getestet hatte ich es ausschließlich mit lokalen Modellen (Gemma3 27B, Qwen3-32B, Qwen3-30B-A3B, Qwen3-8B, Granite Small und GPT-OSS-20B)

GPT-OSS war das schlechtestete was das tagging anging, Granite Small das beste der getesteten allerdings erstellt er mir wie gesagt jedesmal neue Tags auch wenn ich ihm im prompt sage das er das nicht tun soll.
0
aggi
aggi21.11.2517:33
Danke für die Info. Habe jetzt mal Grok gefragt und da war der Vorschlag mistral7b zu nehmen. Das Modell soll explizit auf den Prompt hören. Ich teste das mal am Wochenende.
0
aggi
aggi26.11.2510:44
Spiele immer noch mit beiden Tools und strapaziere dabei enorm Gemini. Habe mit Gemini die Tools noch einmal neu aufgesetzt (neue Docker-Compose.yml) und 3 Modelle für Ollama geladen(llama3, Mistral und Gemma). Nun teste ich mit In- und Output an Informationen an den Einstellungen der beiden Tools und dem bestmöglichen Prompt für meine Bedürfnisse.
Nutzen tue ich gerade das Modell llama3 und das Prompt ist mittlerweile von Gemini so überarbeitet, dass die Titel, Korrespondenten und Dokumententypen gut bis sehr gut bezeichnet und damit überhaupt richtig erkannt werden. Als nächstes sitze ich gerade an der Optimierung der Tag-Vergabe. Da macht das System noch Fehler, die zwar nicht schlimm sind, aber auch die werde ich mit Gemini wegbekommen.
Echt krass, was ein Newbie wie ich mit einer KI alles umsetzen kann! Vor Monaten habe ich krampfhaft überhaupt paperless-ngx zum laufen gebracht und hatte bei jeglichen Problemen fast immer einen Totalausfall, weil ich eigentlich fast gar kein Hintergrund Wissen habe. Wenn jetzt eine Fehlermeldung kommt, Kopie davon in die KI und schon kann man es beheben.
Sorry für mein Gelaber, ich bin anscheinend ein wenig KI gehypte!
+3
mateteetasse
mateteetasse26.11.2513:05
aggi
… Echt krass, was ein Newbie wie ich mit einer KI alles umsetzen kann! …und hatte bei jeglichen Problemen fast immer einen Totalausfall, …
Sorry für mein Gelaber, ich bin anscheinend ein wenig KI gehypte!

bei einem macbook ist eine app immer beim starten abgestürzt, die auf einem anderen tadellos lief.
nun habe ich die absturzberichte am mac noch nie richtig lesen können, aber über's llm kam heraus, dass die gleichzeitig installierte canon eos steuerungsextension daran schuld war.
das wäre früher ein tagelanger ritt durch irgendwelche app-support-kontakte gewesen, erfolg unklar.
die analysen von fehlermeldungen können manchmal richtig gut funktionieren.
ich bin echt dankbar um solche hilfestellungen, bei denen man früher völlig anders herangegangen wäre und dafür weit mehr zeit benötigt hätte.
+1
appel-sam28.12.2512:56
Hallo Zusammen, ich habe über Weihnachten mir auch eine Docker-Instanz mit paperless-ngx aufgebaut und überlege, ob die KI Integration (Ausbaustufe) sinnvoll ist. Bei mir geht die Klassifizierung und das Taggen von Dokumenten ganz gut über die Arbeitsabläufe. Wie sind Eure Erfahrungen nach einigen Monaten? Viele Grüße! Arne
0
Sputnik123
Sputnik12329.12.2509:13
wie habt ihr Paperless auf einem Mac zum laufen gebracht?
„cum hoc ergo propter hoc“
0
rmayergfx
rmayergfx29.12.2510:38
appel-sam
Hallo Zusammen, ich habe über Weihnachten mir auch eine Docker-Instanz mit paperless-ngx aufgebaut und überlege, ob die KI Integration (Ausbaustufe) sinnvoll ist. Bei mir geht die Klassifizierung und das Taggen von Dokumenten ganz gut über die Arbeitsabläufe. Wie sind Eure Erfahrungen nach einigen Monaten? Viele Grüße! Arne
Weniger ist manchmal mehr. Je nach gewählten Tags kommt man schneller ins Ziel. KI ist für meinen Anwendungsfall reine Resourcenverschwendung. Zumal man mit der Erweiterten Suche bei Paperless-ngx eigentlich schon fast alles an der Hand hat. Wenn der Workflow einmal sauber steht benötigt man aus meiner Sicht nicht wirklich eine KI die einem die Dokumente heraussucht. Das mag interessant sein wenn man Paperless-ngx ganz frisch aufgesetzt hat und hunderte von Dokumenten auf einmal dem System übergibt.
Aber auch hier gibt es einiges zu beachten, denn wenn z.B. das OCR nicht sauber funktioniert, da mit zu geringer Auflösung gescannt wurde hat man sehr viele inkorrekte Daten bzw. Tags. Ist wie überall, ohne sauberen Datenbestand kann das gewaltigen Mehraufwand bedeuten.
„Der Computer soll die Arbeit des Menschen erleichtern, nicht umgekehrt !“
+1
Maecki_081529.12.2515:22
Sputnik123
wie habt ihr Paperless auf einem Mac zum laufen gebracht?
Ich habe eine Docker-Instanz von paperless-ngx auf einer Synology Diskstation laufen und greife mit meinem MacBook darauf zu. Gescannt wird über einen Epson-Einzugsscanner ES-580W mittels WLAN. Ansonsten landen auch E-Mails über die Automatisierung in paperless-ngx.

Möchte das nicht mehr missen.
0
rmayergfx
rmayergfx29.12.2515:37
Sputnik123
wie habt ihr Paperless auf einem Mac zum laufen gebracht?
Einfach im alten Thread schauen:
„Der Computer soll die Arbeit des Menschen erleichtern, nicht umgekehrt !“
+1
appel-sam29.12.2518:00
rmayergfx
Weniger ist manchmal mehr. Je nach gewählten Tags kommt man schneller ins Ziel. KI ist für meinen Anwendungsfall reine Resourcenverschwendung. Zumal man mit der Erweiterten Suche bei Paperless-ngx eigentlich schon fast alles an der Hand hat. Wenn der Workflow einmal sauber steht benötigt man aus meiner Sicht nicht wirklich eine KI die einem die Dokumente heraussucht. Das mag interessant sein wenn man Paperless-ngx ganz frisch aufgesetzt hat und hunderte von Dokumenten auf einmal dem System übergibt.

Danke für Dein Einschätzung. Das deckt sich komplett mit meiner Meinung. Ich habe heute die KI auf meinem Docker-Stack installiert und zur "Überarbeitung" von Tags, explizit aktiviert, sprich sie läuft nur bei Bedarf. Herausgekommen ist wenig und -wichtiger- die Anpassung von Vergabe-Regeln in der KI ist schwieriger als in den paperless Workflows. Ich werde es spaßeshalber noch etwas optimieren, aber der Mehrwert der AI hier, ist gering.

Es war aber auf jeden Fall ein schönes Weihnachtsprojekt und man konnte einiges über AIs lernen... Hintergrund war, dass mein MacMini 2018 ein 2. Leben im Keller als Server eingehaucht bekam durch paperless und grafana...
0
toastbrot
toastbrot30.12.2516:23
Hier läuft das Doppel inzwischen stabil in Docker-Containern auf einer Syno (paperless-ngx) und auf einem Proxmox-Server.

Nach vielen wenig produktiven Versuchen mit lokalen LLMs hab ich probehalber mal die chatgpt-API eingebunden -- und selbst mit dem "kleinen" Modell 4o-mini sind die Ergebnisse so viel besser als mit allen getesteten lokalen Modellen, dass ich das allen, die das für sich und ihre Dokumente vertreten können, nur empfehlen kann. Zuweisung von sinnvollen Dateinamen zum Beispiel mit minimaler Veränderung der Vorgabe für hiesige Zwecke absolut brauchbar.

Kosten nach etwa 100 Testdokumenten mit < 0,50 EUR absolut okay.

Die RAG-Chatfunktion hab ich nicht getestet.
-1
appel-sam01.01.2617:26
toastbrot: Habe heute paperless auf OpenAI umgestellt und einige meiner Dokumente neu Taggen lassen... Das funktioniert wunderbar! Danke für den Tipp! Nur für die Zuordnung zu Personen (wir sind zu 3.) musste eine eigene Logik für das Taggen geschrieben werden. Läuft super mit dem 4o-mini und ist zuverlässig - zumindest ist mir bei meinen 35 Dokumenten bisher kein Fehler aufgefallen. Eigene Tags lasse ich nicht anlegen.

RAG wäre auch noch eine Überlegung wert, aber erstmal kommt noch ein anderes Projekt dran... Automatische Erzeugung von Einkaufslisten.
0
Benjamin-Do01.01.2620:13
Hat von Euch jemand Paperless auf einem externen Server wie zB bei Hetzner laufen?
0
aggi
aggi06.01.2610:09
ich habe jetzt echt eine lange weile mit der ai rumgespielt und dabei viele Modelle getestet. Wollte wenn schon nur das lokale Angebot, also Ollama nutzen. Aber das Teil macht mir mehr Arbeit als gedacht. Habe viele Prompts benutzt mit Hilfe von Gemini und ChatGPT erstellt, aber es waren immer viele Fehler beim konsumieren. Obwohl viele Verbote in dem Prompt standen, hat sich das Modell anscheinend seine eigenen Rechte erstellt.
Ich lege das mal ein wenig aus Eis. Ai und Ollama sind bei mir jetzt deaktiviert. Vielleicht teste ich es irgendwann mal wieder!
+2

Kommentieren

Sie müssen sich einloggen, um sich an einer Diskussion beteiligen zu können.