Importers

Ohne einen Import-Prozess, können keine Dokumente in biffo importiert werden. Mittels einem Import-Prozess wird festgelegt, was im Falle eines Dokumenteingangs (über einen Import-Server) mit dem Dokument geschehen soll. Neben der Festlegung auf einen Import-Server, können Benutzer, Tags und/oder Module bei der Verarbeitung festgelegt werden.

Bei der Konfiguration wurde bereits der „Default PDF Importer“ als einzelne Web-Upload Möglichkeit festgelegt.

Die Darstellung der Import-Liste gliedert sich wie folgt:

NummerSpalteBeschreibung
1NAAuswahlmöglichkeit/Selektion für Massenänderungen
2NameName des Import-Prozesses
3AutostartSoll der Import-Prozess bei einem evtl. Neustart des Applikation-Servers (tomcat) auch gestartet werden.
4NASteuerung des Importers (Start, Stop, Refresh). Abhängige Server-Prozesse, werden direkt mit gestartet.
5BeschreibungKommentar zum Import-Prozess
6QuelleSteuerung des Servers (Start, Stop, Refresh)
7BenutzerListe mit Benutzern die nach einem erfolgreichen Import dem Dokument zugeordnet werden.
8Tag(s)Liste mit Tags die nach einem erfolgreichen Import zum Dokument vergeben werden.
9Modul(e)Liste mit Modulen die nach einem erfolgreichen Import angewendet werden.

Ähnliche wir bei den Server-Prozessen, können über die Symbolleiste folgende Prozesse ausgeführt werden.

ButtonFunktionBeschreibung
Alle markierenMarkiert alle Zeilen auf der aktuell angezeigten Seite.
Markierung aufhebenHebt die Markierung der Liste wieder auf.
Neuen Import Prozess hinzufügenStartet einen Dialog für die Anlage eines neuen SMTP-Servers.
Prozess(e) löschenLöscht die markierten SMTP-Server. Verbundene Server können nur nach Löschen der Verbindung gelöscht werden.
AktualisierenFührt einen Refresh der Liste durch.
Markierte Prozesse startenStartet die markierten Import-Prozesse. Sollte ein Server-Prozess verbunden sein, so wird dieser mit gestartet.
Markierte Prozesse stoppenStoppt die markierten Import-Prozesse

Import-Prozesse bearbeiten/hinzufügen

Über einen Klick auf den Button „Neuen Import-Prozess hinzufügen“ bzw. über einen Klick auf den Namen selbst, öffnet sich hierzu das entsp. Fenster.

Im Vergleich zu den einzelnen Server-Prozessen, können Import-Prozesse weitläufiger parametrisiert werden.

ParameterBeschreibung
Process Name:Name des Import-Prozesses
Import Source:Auswahl (Selektion) der Import-Quelle. Diese kann entweder ein zuvor festgelegter Server-Prozess oder der „Web (Default)“-Upload sein.
Beschreibung:Kommentar
Automatischer Start:Legt fest, ob der Import-Prozess bei einem Neustart des Applikation-Server direkt gestartet werden soll.
Archive Input:Sollen die importierten Dateien nach Beendigung archiviert werden. Die Speicherung erfolgt im festgelegten Archiv-Order (Config->ArchiveFolder) unter der Bezeichnung „yyyyMMdd_HHmmss_SSS“ als Zip-Archiv.
Rebuild PDF:Legt fest ob bei empfangenen PDF-Dokumente eine Texterkennung durchgeführt werden soll. Manche PDF-Dokumente sind zwar als lesbar definiert, allerdings ist die Textextraktion aufgrund der Speicherung nicht lesbar (z.B. Rechnungen von Vodafone)
ProzessQueue Size:Anzahl der parallel arbeitenden Tesseract-Prozesse. Mitunter ist eine Begrenzung der gleichzeitig arbeitenden Prozesse sinnvoll, sollte der biffo-Server nicht über eine ausreichende Performance verfügen.
Benutzer hinzufügenSollen Benutzer hinzugefügt werden?
Multi-Selection (o.B.)Mehrfachauswahl von Benutzern, die nach Abschluss des Import-Vorgangs Dokument zugeordnet werden.
Tag(s) hinzufügenSollen Tag(s) hinzugefügt werden?
Multi-Selection (o.B.)Mehrfachauswahl von Tag(s), die nach Beendigung des Import-Vorgangs dem Dokument hinzugefügt werden.
Module anwendenSollen Module angewendet werden?
Multi-Selection (o.B.)Mehrfachauswahl von Modulen, die auf ein Dokument angewendet werden.
o.B. = ohne Bezeichnung

Beispiel Import Prozess IBAN-Erkennung

Es wird ein Import-Prozess konfiguriert, der Dokumente vom SFTP-Server „sftp2224“ entgegen nimmt, diese dem User „user1“ und „user2“ zuordnet und gleichzeitig noch eine IBAN-Erkennung mittels einem Modul vornimmt.

Voraussetzungen:

  1. „user1“ und „user2“ müssen im Vorfeld definiert worden sein.
  2. Der SFTP Server „sftp2224“ muss konfiguriert sein
  3. Das Modul „org.biffo.dms.ki.modules.ibantagger.IbanTagger“ ist installiert.

Nachdem der Import-Prozess gespeichert wurde, kann dieser in der Übersichtsseite direkt durch einen Klick auf den Start-Button gestartet werden.

Sollten nun Dokumente auf den SFTP Server übertragen werden, so erfolgt automatisch ein Start des Import-Prozesses.

Nach Übertragung und Verarbeitung eines Dokumentes, ist dieses in der Dokumentenansicht den definierten Benutzern „user1“ und „user2“ zugeordnet worden.

Das geöffnete Dokument enthält zusätzlich auch noch die gefundene IBAN-Nummer. Gefundene und ermittelte Fragmente befinden sich innerhalb des Tabs „Fragments“.

Beispiel Rechnung’s Importer Vodafone

Rechnungen von Vodafone (mein Provider) sind zwar irgendwie lesbar, dennoch ist bei einer Textextraktion mittels Copy&Paste der Text nicht wirklich brauchbar.

Ein Import-Prozess würde wie folgt aussehen:

Ausschlaggebend ist hier das setzen der Option „Rebuild PDF“. Diese sorgt unabhängig bei PDF-Dokumenten für eine OCR-Erkennung.

Der Import Prozess kann dann von der „Home“-Page oder der „Dokumente“-Seite gestartet werden.

Das Dokument enthält dann „vernünftigere“ Texte und ist zusätzlich besser suchbar.