Importers
Ohne einen Import-Prozess, können keine Dokumente in biffo importiert werden. Mittels einem Import-Prozess wird festgelegt, was im Falle eines Dokumenteingangs (über einen Import-Server) mit dem Dokument geschehen soll. Neben der Festlegung auf einen Import-Server, können Benutzer, Tags und/oder Module bei der Verarbeitung festgelegt werden.
Bei der Konfiguration wurde bereits der „Default PDF Importer“ als einzelne Web-Upload Möglichkeit festgelegt.
Die Darstellung der Import-Liste gliedert sich wie folgt:
Nummer | Spalte | Beschreibung |
1 | NA | Auswahlmöglichkeit/Selektion für Massenänderungen |
2 | Name | Name des Import-Prozesses |
3 | Autostart | Soll der Import-Prozess bei einem evtl. Neustart des Applikation-Servers (tomcat) auch gestartet werden. |
4 | NA | Steuerung des Importers (Start, Stop, Refresh). Abhängige Server-Prozesse, werden direkt mit gestartet. |
5 | Beschreibung | Kommentar zum Import-Prozess |
6 | Quelle | Steuerung des Servers (Start, Stop, Refresh) |
7 | Benutzer | Liste mit Benutzern die nach einem erfolgreichen Import dem Dokument zugeordnet werden. |
8 | Tag(s) | Liste mit Tags die nach einem erfolgreichen Import zum Dokument vergeben werden. |
9 | Modul(e) | Liste mit Modulen die nach einem erfolgreichen Import angewendet werden. |
Ähnliche wir bei den Server-Prozessen, können über die Symbolleiste folgende Prozesse ausgeführt werden.
Button | Funktion | Beschreibung |
Alle markieren | Markiert alle Zeilen auf der aktuell angezeigten Seite. | |
Markierung aufheben | Hebt die Markierung der Liste wieder auf. | |
Neuen Import Prozess hinzufügen | Startet einen Dialog für die Anlage eines neuen SMTP-Servers. | |
Prozess(e) löschen | Löscht die markierten SMTP-Server. Verbundene Server können nur nach Löschen der Verbindung gelöscht werden. | |
Aktualisieren | Führt einen Refresh der Liste durch. | |
Markierte Prozesse starten | Startet die markierten Import-Prozesse. Sollte ein Server-Prozess verbunden sein, so wird dieser mit gestartet. | |
Markierte Prozesse stoppen | Stoppt die markierten Import-Prozesse |
Import-Prozesse bearbeiten/hinzufügen
Über einen Klick auf den Button „Neuen Import-Prozess hinzufügen“ bzw. über einen Klick auf den Namen selbst, öffnet sich hierzu das entsp. Fenster.
Im Vergleich zu den einzelnen Server-Prozessen, können Import-Prozesse weitläufiger parametrisiert werden.
Parameter | Beschreibung |
Process Name: | Name des Import-Prozesses |
Import Source: | Auswahl (Selektion) der Import-Quelle. Diese kann entweder ein zuvor festgelegter Server-Prozess oder der „Web (Default)“-Upload sein. |
Beschreibung: | Kommentar |
Automatischer Start: | Legt fest, ob der Import-Prozess bei einem Neustart des Applikation-Server direkt gestartet werden soll. |
Archive Input: | Sollen die importierten Dateien nach Beendigung archiviert werden. Die Speicherung erfolgt im festgelegten Archiv-Order (Config->ArchiveFolder) unter der Bezeichnung „yyyyMMdd_HHmmss_SSS“ als Zip-Archiv. |
Rebuild PDF: | Legt fest ob bei empfangenen PDF-Dokumente eine Texterkennung durchgeführt werden soll. Manche PDF-Dokumente sind zwar als lesbar definiert, allerdings ist die Textextraktion aufgrund der Speicherung nicht lesbar (z.B. Rechnungen von Vodafone) |
ProzessQueue Size: | Anzahl der parallel arbeitenden Tesseract-Prozesse. Mitunter ist eine Begrenzung der gleichzeitig arbeitenden Prozesse sinnvoll, sollte der biffo-Server nicht über eine ausreichende Performance verfügen. |
Benutzer hinzufügen | Sollen Benutzer hinzugefügt werden? |
Multi-Selection (o.B.) | Mehrfachauswahl von Benutzern, die nach Abschluss des Import-Vorgangs Dokument zugeordnet werden. |
Tag(s) hinzufügen | Sollen Tag(s) hinzugefügt werden? |
Multi-Selection (o.B.) | Mehrfachauswahl von Tag(s), die nach Beendigung des Import-Vorgangs dem Dokument hinzugefügt werden. |
Module anwenden | Sollen Module angewendet werden? |
Multi-Selection (o.B.) | Mehrfachauswahl von Modulen, die auf ein Dokument angewendet werden. |
Beispiel Import Prozess IBAN-Erkennung
Es wird ein Import-Prozess konfiguriert, der Dokumente vom SFTP-Server „sftp2224“ entgegen nimmt, diese dem User „user1“ und „user2“ zuordnet und gleichzeitig noch eine IBAN-Erkennung mittels einem Modul vornimmt.
Voraussetzungen:
- „user1“ und „user2“ müssen im Vorfeld definiert worden sein.
- Der SFTP Server „sftp2224“ muss konfiguriert sein
- Das Modul „org.biffo.dms.ki.modules.ibantagger.IbanTagger“ ist installiert.
Nachdem der Import-Prozess gespeichert wurde, kann dieser in der Übersichtsseite direkt durch einen Klick auf den Start-Button gestartet werden.
Sollten nun Dokumente auf den SFTP Server übertragen werden, so erfolgt automatisch ein Start des Import-Prozesses.
Nach Übertragung und Verarbeitung eines Dokumentes, ist dieses in der Dokumentenansicht den definierten Benutzern „user1“ und „user2“ zugeordnet worden.
Das geöffnete Dokument enthält zusätzlich auch noch die gefundene IBAN-Nummer. Gefundene und ermittelte Fragmente befinden sich innerhalb des Tabs „Fragments“.
Beispiel Rechnung’s Importer Vodafone
Rechnungen von Vodafone (mein Provider) sind zwar irgendwie lesbar, dennoch ist bei einer Textextraktion mittels Copy&Paste der Text nicht wirklich brauchbar.
Ein Import-Prozess würde wie folgt aussehen:
Ausschlaggebend ist hier das setzen der Option „Rebuild PDF“. Diese sorgt unabhängig bei PDF-Dokumenten für eine OCR-Erkennung.
Der Import Prozess kann dann von der „Home“-Page oder der „Dokumente“-Seite gestartet werden.
Das Dokument enthält dann „vernünftigere“ Texte und ist zusätzlich besser suchbar.