OCR — PDFs durchsuchbar machen
Jedes PDF, das Du in aqm3 hochlädst, wird automatisch mit Volltext erfasst — sogar gescannte Papier-Dokumente. So findet „Ask aqm3" Antworten auch in alten Handbuch-Scans.
Stand 23.4.2026 · 📋 Im Alltag
Wie es funktioniert
- 1UploadDu lädst ein PDF hoch (im Workspace, bei Dokumenten oder als Audit-Beleg).
- 2Worker-QueueEin Hintergrund-Job landet in der BullMQ-Queue
ocr. - 3Text-ExtraktionDer OCR-Worker läuft mit
pdf-parseüber alle Seiten und extrahiert den Volltext. - 4GespeichertDas Ergebnis landet als
documents.ocr_extracted_textund fließt in die Volltextsuche, in Ask aqm3 und in den Knowledge-Graph ein.

+Funktioniert das auch bei gescannten PDFs?
Ja — pdf-parse erkennt eingebetteten OCR-Text. Für reine Scan-PDFs ohne OCR-Layer folgt ein Tesseract-Worker in einer späteren Iteration.
+Sehe ich, ob das OCR erfolgreich war?
Ja — im Workspace erscheint bei erfolgreich erfassten Dateien ein Text-Icon. Die Treffer-Liste in der Suche zeigt Snippets aus dem OCR-Text.
+Welche Dateitypen werden unterstützt?
Aktuell PDF. Word/Excel/Markdown werden direkt beim Upload als content_markdown hinterlegt — ohne OCR-Schritt.
Weiterlesen
Dokumente anlegen und pflegen
QM-Handbuch, Verfahrensanweisungen, Formblätter — alles an einem Ort.
Öffnen
Workspace — Dein Firmen-Wiki
Notizen, Wiki, Links, Uploads — mit Volltext- und KI-Suche.
Öffnen
Ask aqm3 — Fragen an Dein QM stellen
Stell in Prosa eine Frage, aqm3 antwortet aus Deinen Dokumenten.
Öffnen