Systemvoraussetzungen
Um biffo betreiben zu können, müssen folgende Voraussetzungen gegeben sein:
– Java >= 17
– OpenSearch 2.x (evtl. Elastic, wurde aber nicht getestet)
– PostgreSQL >= 9.x
– Tesseract 4.x
– Tomcat 7 (oder vergleichbar)
Da biffo die Dokumente als PDF abgelegt und bei der OCR Erkennung auch TIFF Bilder erstellt, sollte ein gewisser Plattenplatz eingeplant werden. In der Datenbank werden die Dokumente nicht abgelegt, sondern nur auf die jeweilige Version referenziert.
Bei einer trägen OCR Erkennung, sollte für Tesseract die Fast-Trainingsdaten verwendet werden!
Browser
Eine passende Antwort auf die Frage nach einem geeigneten Web-Browser kann ich nicht geben. Ich selbst habe bei der Entwicklung versucht, möglichst ältere Programme zum Testen zu verwenden. Daher folgende von mir getestete Browser:
Browser | Version |
Firefox | 123.0 |
Chromium | 107.0.5275.0 |
biffo wurde von mir auch auf meinem IPad getestet, allerdings ist die Nutzung auf min 1920*1024 optimiert worden. Ein Test mit meinem MacBook Mid 2012 und dem Safari-Browser liefert z.B. keine PDF Ansicht. Mit einem Chrome-Browser ist die Nutzung aber wieder möglich.
Leistungsfähigkeit
Um die Frage nach der Anzahl der möglichen Dokumente direkt zu beantworten, es hängt davon ab. Die bisher größte von mir getestet Menge an Dokumenten beläuft sich derzeit auf 11.669 mit einer Gesamtseitenanzahl von 37.352. Die Geschwindigkeit bei der Suche kann auch bei dieser Anzahl als absolut vertretbar angesehen werden.
Meine Umgebung
Ich selbst betreibe das System auf einem s.g. Home-Server. Hierzu nutze ich einen bereits bestehenden Lenovo ThinkCentre M715q. Das System verfügt über einen AMD PRO A10-8770E und 20GB RAM. Die Dokumente werden mittels NFS auf einer NAS (MyCloudEX2) abgelegt.