Dokumentenmanagement mit KI

jensche

Korbinians Apfel
Registriert
27.10.04
Beiträge
6.948
Hallo zusammen

Ich möchte mein Büro digitalisieren. Hierbei suche ich schon lang eine Lösung welche nicht nur OCR kann sondern auch sauber alles ablegt und im Idealfall mit KI automatisch die wichtigen Infos aus einem Dokument rauszieht.
Filee trifft es sehr gut auf deun Punkt:

  • Automatische Meta Daten
  • Automatisches Benennen
  • Automatisches Zuordnen


    Das oben genannte Tool kann das. Kostet etwas ist es mir aber Wert. Gibts jemand der das nutzt? oder gibts bessere Alternativen.
 

Keef

Gestreifter Böhmischer Borsdorfer
Registriert
17.07.09
Beiträge
3.420
Geschäftlich oder privat?

Als Privatier reicht mir ein vernünftiger Dokumentenscanner (Fujitsu) mit enthaltenem OCR-Programm, Hazel und die normale Suche über den Desktop.
 

ottomane

Golden Noble
Registriert
24.08.12
Beiträge
16.375
Die Dokumente werden in deren Cloud gespeichert. Für mich wäre das ein Ausschlusskriterium, vor allem vor dem Hintergrund der sehr persönlichen Daten und auch dem Gedanken, dass ich die Papierdokumente entsorgen wollen würde.

Der Platzhirsch ist DevonThink. Da kann man die Daten selbst speichern (NAS). Es bringt allerdings nicht genau diese Automatismen mit, wobei ich denen ohnehin nicht über den Weg traue.
 

MACaerer

Charlamowsky
Registriert
23.05.11
Beiträge
12.987
Ich glaube bei OCR scheiden sich die Geister, wenn es um Automatisation geht. Ein OCR-Programm, das gescannte Dokumente wirklich zu 100% fehlerfrei übersetzt ist wohl noch nicht erfunden/entwickelt.
 

Wuchtbrumme

Golden Noble
Registriert
03.05.10
Beiträge
21.417
also zusammenfassend:
OCR nicht 100% - keine Ahnung, wie viel.
Und dann noch KI zum Ablegen. KI ist nicht intelligent, KI ist trainiert. Keine Ahnung, was dann dabei herauskommt.

...dann müsste schon alles redundant und egal sein, dass ich dem traue. Und vor allem keine Zeit kosten, wenn der Ausgang fraglich ist. Sonst kann ich es ja auch gleich selbst machen, weiß dann aber wenigstens, was falsch ist.

Kurzum: Modeerscheinung. Wird vielleicht besser, aber die Frage ist, was bis dahin noch alles passiert.
 

MacAlzenau

Golden Noble
Registriert
26.12.05
Beiträge
22.478
Ein OCR-Programm, das gescannte Dokumente wirklich zu 100% fehlerfrei übersetzt ist wohl noch nicht erfunden/entwickelt.
Das hat schon bei den abschreibenden Mönchen nicht perfekt funktioniert mit dem Lesen-Erkennen-Schreiben.
Und auch Lektoren, selbst in klassischen Hochqualitäts-Verlagen entgeht manches, und da geht es nicht nur um Tippfehler, auch um Übersetzungsfehler (auch wenn das hier nicht das Thema ist).
Ich würde eingescannte Dokumente sicherheitshalber immer wenigstens doppelt aufbewahren, einmal als OCR-bearbeitete Datei, aber immer noch als Bild. Und gerne als Papier im Keller (oder ganz altmodisch klassisch, wenn es professionell sein soll, als Mikofiche - aufwendig, dafür platzsparend und absolut sicher gegen EMP).
 

MACaerer

Charlamowsky
Registriert
23.05.11
Beiträge
12.987
Das Problem bei OCR ist und bleibt die Qualität der Vorlage. Selbst wenn man hochauflösende Scans macht ist der Scan zwangsläufig nicht besser als die Vorlage. Probleme für OCR sind oft zusammenhängende Buchstaben oder irgendwelche Partikel auf der Vorlage, bei denen OCR verzweifelt versucht irgend etwas daraus zu generieren. Das Ergebnis ist den meistens etwas, mit dem man nichts anfangen kann, bzw.das eine Nachbearbeitung erfordert. Für eine echte KI sind halt die derzeit verfügbaren Rechenleistungen, egal ob Mac- oder Win-PC wohl noch nicht ausreichend genug. Das wird vermutlich noch ein paar Jährchen dauern.
 

ottomane

Golden Noble
Registriert
24.08.12
Beiträge
16.375
Für eine echte KI sind halt die derzeit verfügbaren Rechenleistungen, egal ob Mac- oder Win-PC wohl noch nicht ausreichend genug. Das wird vermutlich noch ein paar Jährchen dauern.
Das läuft bei filee m.E. in der Cloud. Das ist ein Classifier mit 10 Klassen (=verschiedene Dokumenttypen).
 
Zuletzt bearbeitet:

jensche

Korbinians Apfel
Registriert
27.10.04
Beiträge
6.948
ja. Papiervarianten werden sicherlich noch im Keller zum abkühlen einige jährchen verbleiben. Mir gehts vorallem darum schnell ein Dokument zu finden. Dies ist sicherlich mit OCR möglich.

Filee sieht aber cool aus weil es eben KI unterstützt ordnet und wichtige infos rauszieht.

Devon Think scheint wirklich nicht das wahre vom Ei zu sein. Ein PDF welches aus reinem Text besteht wandelt Devon Think in ein Bild um und wendet dann OCR an. Dümmer gehts kaum.
 
Zuletzt bearbeitet: