Paperless Ollama Integration

Deutsch. For English, see README.en.md.

Lokale Integration von paperless-ngx mit Ollama fuer KI-gestuetzte Nachbearbeitung von Dokumenten.

Kurzuebersicht

Native VM / Server

erkennt /opt/paperless/paperless.conf
installiert Hook, Prompt und Backfill nach /opt/paperless
aktualisiert paperless.conf
kann optional die Port-3000-Webkonsole installieren

Docker / Compose

erkennt typische Compose-Dateien
erstellt paperless-ai.env
erstellt docker-compose.override.yml
bindet Hook, Prompt und Backfill per Volume Mount ein

NAS / Voller Compose-Stack

scripts/bootstrap-nas-stack.sh scaffoldet den aktuellen NAS-Stack
legt alle benoetigten Daten- und Konfigurationspfade fuer paperless-ngx, ollama, paperless-ai-web, open-webui, tika-ocr-proxy und die optionalen Image-/OCR-Dienste an
kopiert nur fehlende Beispielkonfigurationen
bietet --dry-run und --validate, damit ein Setup vor dem ersten Start pruefbar bleibt

Was du bereithalten solltest

Paperless API URL
Paperless API Token
Ollama URL
Primaermodell
optionales Fallback-Modell
bei Docker: Compose-Datei und Service-Name

Der aktuelle Stand dieses Projekts bildet eine funktionierende Installation mit folgenden Bausteinen ab:

paperless-ngx als native Systemd-Installation
Ollama lokal auf 127.0.0.1:11434
konfigurierbare lokale Modelle in Ollama
produktiv erprobte Varianten (Vulkan/MI50):
- qwen2.5-coder:7b (schnelles Coding)
- qwen2.5-coder:14b (tiefe Coding-Analyse)
- qwen2.5:14b (komplexe Sach-/Rechtstexte, lange Zusammenhaenge)
- qwen2.5:3b (schnelles Tagging/Korrespondenz)
- deepseek-ocr:3b (Vision/OCR-Aufgaben)
Hook nach erfolgreichem Dokumentimport
automatische Vergabe von:
- Titel
- Korrespondenz
- Dokumenttyp
- Tags
Review- und Steueroberflaeche auf Port 3000
getrennte Preview-/Vision-Regeln fuer die Review-Oberflaeche
optionaler Vision-Autopilot im Hook fuer scanlastige PDFs (OCR + Vision)
OCR fuer Scan-PDFs mit force, deu+eng und optionalem tessdata_best

Fuer den NAS-Pfad gilt zusaetzlich:

Vulkan-first auf MI50 ist derzeit die robuste Betriebsstrategie
qwen3.5:* kann auf Vulkan laufen, ist aber fuer Agent-Workflows nicht der bevorzugte Standard
ein separater llama.cpp-Pfad mit kompatiblen externen GGUFs ist auf dem NAS erfolgreich verifiziert
Open WebUI kann als optionaler Chat-/Vergleichsdienst neben paperless-ai-web betrieben werden
Open WebUI ist fuer Datei-Uploads (u. a. txt, md, pdf, doc, docx, pptx) mit festen RAG-Limits vorkonfiguriert
Details dazu stehen in docs/NAS_RUNTIME_FINDINGS.md
Modellrollen und konkrete Defaults stehen in docs/VULKAN_MODEL_STRATEGY.md
Open-WebUI-Routing und Upload-Details stehen in docs/OPEN_WEBUI.md

Projektinhalt

hooks/ai_enrich.py
- produktiver Hook fuer Paperless
- unterstuetzt Modell-Fallback, konfigurierbare Timeouts, Qwen 3.5 mit deaktiviertem Thinking und eine begrenzte Ollama-Thread-Zahl fuer CPU-VMs
prompts/ai_enrich_prompt.txt
- externer Prompt, getrennt vom Python-Code
web/server.py
- lokale Weboberflaeche fuer:
  - Chat mit lokalen Modellen
  - Paperless-Konfiguration
  - eigene Preview- und Vision-Konfiguration fuer die Review-Vorschau
  - Prompt-Bearbeitung
  - Review einzelner Dokumente
  - Backfill fuer Bestandsdokumente
  - Task-Manager mit GPU-Trends und Qualitaetscheck der letzten Dokumente
  - OpenClaw-MCP-Verwaltung (set/show/unset)
- uebernimmt dieselbe Ollama-Thread-Begrenzung fuer Chat, Preview und Vision
systemd/paperless-scheduler.service
- korrigierte Scheduler-Unit auf celery beat
systemd/ollama-web.service
- Systemd-Unit fuer die lokale Weboberflaeche
scripts/paperless-ai-admin
- Root-Helfer fuer Prompt, Konfiguration und Worker-Neustarts
scripts/paperless-set-ollama-model
- Hilfsskript zum Umschalten des aktiven Paperless-Modells
scripts/install-paperless-ai.sh
- gefuehrter Installer fuer Hook-/Prompt-Integration in native und einfache Docker-basierte Paperless-Setups
scripts/bootstrap-nas-stack.sh
- Scaffold- und Validierungsskript fuer den vollstaendigen NAS-/Compose-Stack dieses Repos
scripts/set-ollama-rocm-profile.sh
- schaltet per Profil zwischen rocm-stable und rocm-next fuer Ollama/MI50 um
scripts/nas/run_ollama_benchmark.py
- fuehrt reproduzierbare Modell-/Power-Benchmarks aus und schreibt JSON, CSV und Markdown
scripts/configure-paperless-ai-ollama.sh
- Konfigurationshilfe fuer paperless.conf
docs/
- Installations-, Betriebs- und Sicherheitsdokumentation
- NAS-Runtime-Befunde und Modellvergleiche in docs/NAS_RUNTIME_FINDINGS.md
- optionale Open WebUI-Integration in docs/OPEN_WEBUI.md
- Major-Release-Aufteilung in docs/MAJOR_RELEASE_PLAN.md
- MI50-ROCm-Fork- und Teststrategie in docs/ROCM_FORK_PLAN.md
- ROCm-Profil-Umschaltung in docs/ROCM_PROFILES.md
- Benchmark-Durchfuehrung und Veroeffentlichung in docs/BENCHMARKING.md
docker/paddleocr-api/
- optionaler PaddleOCR-API-Container fuer OCR-Experimente und spaetere Integration
scripts/install-paddleocr-api.sh
- einfacher Docker-Installer fuer die optionale PaddleOCR-API

Architektur

paperless-ngx importiert ein Dokument.
OCR/Textinhalt und Metadaten stehen in der Paperless-API bereit.
PAPERLESS_POST_CONSUME_SCRIPT startet hooks/ai_enrich.py.
Der Hook liest das Dokument per API.
Ollama erzeugt eine strukturierte JSON-Antwort.
Der Hook schreibt Titel, Korrespondenz, Dokumenttyp und Tags zurueck.

Schnellstart

Native oder einfache Hook-Integration

Empfohlener Einstieg:

curl -fsSL https://raw.githubusercontent.com/zonfacter/paperless-ollama-integration/main/scripts/install-paperless-ai.sh -o /tmp/install-paperless-ai.sh
sudo bash /tmp/install-paperless-ai.sh

Erst pruefen, was gemacht wuerde:

curl -fsSL https://raw.githubusercontent.com/zonfacter/paperless-ollama-integration/main/scripts/install-paperless-ai.sh -o /tmp/install-paperless-ai.sh
sudo bash /tmp/install-paperless-ai.sh --dry-run

Der Installer:

erkennt typische native und Docker-Setups
sagt frueh, welche Zugangsdaten und Pfade benoetigt werden
fragt die noetigen Werte interaktiv ab
schreibt die passenden Dateien fuer den gewaehlten Modus

Voller NAS-/Compose-Stack

Fuer den repo-gepflegten NAS-Stack ist bootstrap-nas-stack.sh der Referenzpfad:

git clone https://github.com/zonfacter/paperless-ollama-integration.git
cd paperless-ollama-integration
./scripts/bootstrap-nas-stack.sh --dry-run
./scripts/bootstrap-nas-stack.sh

Das Skript:

legt die aktuellen Daten- und Konfigurationspfade an
kopiert nur fehlende Beispieldateien
validiert .env, die benoetigten JSON-/ENV-Dateien und den Compose-Stand
prueft optionale Bildpfade gegen die aktuelle OPEN_WEBUI-Konfiguration

Details dazu stehen in docs/NAS_DEPLOYMENT.md.

Aktueller Workflow

Neue Dokumente

Dokument in paperless-ngx hochladen oder in den consume-Ordner legen.
paperless-ngx importiert das Dokument und erzeugt OCR.
PAPERLESS_POST_CONSUME_SCRIPT startet ai_enrich.py.
Der Hook liest Dokumentinhalt und Metadaten ueber die Paperless-API.
Das konfigurierte Ollama-Modell erzeugt einen JSON-Vorschlag.
Der Hook schreibt das Ergebnis direkt in paperless-ngx zurueck.

Bestehende Dokumente

Port 3000 bietet einen Review Workspace fuer Einzeldokumente:
- Dokument suchen
- OCR und aktuelle Metadaten ansehen
- KI-Vorschau erzeugen
- optional Hybrid OCR + Vision fuer kurze PDFs
- Vorschlag uebernehmen oder verwerfen
Port 3000 bietet einen Backfill fuer Bestandsdokumente:
- nur fehlende Metadaten
- alle Dokumente
- nur ausgewaehlte Dokumente
Port 3000 bietet im Task Manager zusaetzlich einen Qualitaetscheck der letzten Dokumente:
- OCR-Qualitaet (Zeichenumfang)
- fehlende Metadaten
- Review-Tag-Anteil
- potenzielle Dubletten

Wichtige Pfade im produktiven Aufbau

Hook: /opt/paperless/ai_enrich.py
Prompt: /opt/paperless/ai_enrich_prompt.txt
Paperless-Konfiguration: /opt/paperless/paperless.conf
Ollama-API: http://127.0.0.1:11434
lokale Weboberflaeche: http://<host>:3000

Wichtige Funktionen

konfigurierbarer Prompt ohne Codeaenderung
konfigurierbarer OCR-Kontext und Timeout
OCR-Tuning fuer Scan-PDFs mit force, deu+eng und tessdata_best
Fallback-Modell fuer Ollama
Schutz vor halluzinierten Personentags
Qwen 3.5-Unterstuetzung mit standardmaessig deaktiviertem Thinking
Review-Workflow vor dem Schreiben fuer einzelne Dokumente
asynchrone Hybrid-Vorschau mit OCR-Entwurf und optionaler Vision-Nachpruefung
getrennte Web-Konfiguration fuer Vorschau-OCR-Modell, Vision-Modell, Seitenlimit und Vision-Tag

Getestete Modellanbindung

Die Anbindung mehrerer lokaler KI-Modelle an Hook, Vorschau und Review funktioniert in diesem Projekt grundsaetzlich sauber.

Moeglich sind getrennte Modelle fuer:

normalen Paperless-Hook
Vorschau-OCR
Vision-Review
Tag-Review

Praktisch erfolgreich angebunden und ueber denselben Integrationspfad getestet wurden unter anderem:

qwen3.5:4b
qwen3.5:9b
qwen2.5:7b-instruct
qwen2.5:14b-instruct
glm-ocr
glm-ocr:q8_0
gemma3:4b
qwen3-vl:4b
openbmb/minicpm-v2.5:q4_K_S

Die entscheidende Erkenntnis daraus:

die technische Anbindung funktioniert
die praktische Nutzbarkeit haengt stark von der Laufzeit auf der Zielhardware ab

OCR-Hinweise

Fuer echte Scan-PDFs hat sich in diesem Projekt PAPERLESS_OCR_MODE=force als robuster erwiesen als redo, sobald zusaetzlich Bereinigung wie clean, deskew und rotate-pages aktiv sein soll.

Empfohlene OCR-Basis fuer deutschsprachige Scans:

PAPERLESS_OCR_LANGUAGE=deu+eng
PAPERLESS_OCR_MODE=force
PAPERLESS_OCR_IMAGE_DPI=300
PAPERLESS_OCR_CLEAN=clean
PAPERLESS_OCR_DESKEW=true
PAPERLESS_OCR_ROTATE_PAGES=true

Wenn tessdata_best genutzt wird, muessen neben den .traineddata-Dateien auch die normalen Tesseract-Zusatzdateien im Zielpfad liegen:

configs/
tessconfigs/
pdf.ttf

Ein reiner Sprachdaten-Ordner ohne diese Dateien kann OCRmyPDF bei hocr- und txt-Ausgaben scheitern lassen.

Erkenntnisse Zu Vision- und OCR-Modellen Auf CPU-VMs

Die wichtigsten praktischen Erkenntnisse aus den Modelltests:

kleine bis mittlere Textmodelle bleiben fuer diese Architektur am alltagstauglichsten
reine Textpfade mit OCR-Bereinigung, Strukturierung und Regeln funktionieren lokal deutlich robuster als voll multimodale Bild+OCR-Prompts
kleine Vision-/OCR-Modelle liessen sich technisch problemlos anbinden, waren auf der getesteten CPU-VM aber dennoch oft zu langsam fuer interaktive oder synchrone Review-Pfade
ein kleineres multimodales Modell bedeutet nicht automatisch eine brauchbare Dokumentlaufzeit

Dieses Projekt dokumentiert deshalb bewusst zwei Ebenen:

lokal sinnvoll auf CPU:
- paperless-ngx OCR
- OCR-Bereinigung
- OCR-Strukturierung
- regelbasierte Nachlogik
- Textmodelle fuer Titel, Korrespondenz, Dokumenttyp und Tags
spaeter oder auf staerkerer Hardware sinnvoll:
- dedizierte Vision-/OCR-Modelle fuer Seitenbilder
- GPU-Passthrough
- externer oder Cloud-basierter Review-Schritt

Kurz gesagt:

die Integration von Vision-/OCR-Modellen funktioniert
die CPU-VM ist der begrenzende Faktor
deshalb bleibt die Default-Architektur dieses Projekts text- und OCR-zentriert

Dokumentation

Hinweise

Dieses Repository enthaelt keine Tokens oder geheimen Schluessel.
Host-spezifische Benutzer, Ports und Pfade koennen je nach System angepasst werden.
Der Prompt ist bewusst als Textdatei ausgelagert, damit er ohne Codeaenderung angepasst werden kann.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Paperless Ollama Integration

Kurzuebersicht

Native VM / Server

Docker / Compose

NAS / Voller Compose-Stack

Was du bereithalten solltest

Projektinhalt

Architektur

Schnellstart

Native oder einfache Hook-Integration

Voller NAS-/Compose-Stack

Aktueller Workflow

Neue Dokumente

Bestehende Dokumente

Wichtige Pfade im produktiven Aufbau

Wichtige Funktionen

Getestete Modellanbindung

OCR-Hinweise

Erkenntnisse Zu Vision- und OCR-Modellen Auf CPU-VMs

Dokumentation

Hinweise

About

Uh oh!

Releases 5

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 73 Commits
config		config
docker		docker
docs		docs
hooks		hooks
prompts		prompts
scripts		scripts
systemd		systemd
web		web
.env.example		.env.example
.gitignore		.gitignore
AI_INSTALL.md		AI_INSTALL.md
CHANGELOG.md		CHANGELOG.md
README.en.md		README.en.md
README.md		README.md
ROADMAP.md		ROADMAP.md
compose.override.example.yml		compose.override.example.yml
compose.yml		compose.yml

Folders and files

Latest commit

History

Repository files navigation

Paperless Ollama Integration

Kurzuebersicht

Native VM / Server

Docker / Compose

NAS / Voller Compose-Stack

Was du bereithalten solltest

Projektinhalt

Architektur

Schnellstart

Native oder einfache Hook-Integration

Voller NAS-/Compose-Stack

Aktueller Workflow

Neue Dokumente

Bestehende Dokumente

Wichtige Pfade im produktiven Aufbau

Wichtige Funktionen

Getestete Modellanbindung

OCR-Hinweise

Erkenntnisse Zu Vision- und OCR-Modellen Auf CPU-VMs

Dokumentation

Hinweise

About

Topics

Resources

Security policy

Uh oh!

Stars

Watchers

Forks

Releases 5

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages