Software für PDF Batch OCR Erkennung gesucht.

Nützliche Programme zu Zeiterfassung, Dokumentenmanagement etc.
Antworten
Benutzeravatar
koshop
PLUS-Mitglied
PLUS-Mitglied
Beiträge: 6566
Registriert: 4. Sep 2012 13:23

Software für PDF Batch OCR Erkennung gesucht.

Ich habe ca. 1000 PDF-Dateien bei denen eine OCR Erkennung gemacht werden müsste. D.h. ich suche eine Software bei der ich die Einstellungen konfiguriere und die dann das ganze Verzeichnis mit den 1000 Dateien abarbeitet und ohne weitere Nutzer-Interaktion die PDF-Dateien in durchsuchbare PDF-Dateien umwandelt.

Hat jemand eine Empfehlung? Muss kein kostenloses Programm sein. Da das aber eine einmalige Aktion ist, keine Software mit Abo.


3 Monate gratis Händlerbund
Patchwork (R.i.P.)

Re: Software für PDF Batch OCR Erkennung gesucht.

ein Batchprogramm ist evtl gar nicht erforderlich:
mit Acrobat Pro kannst Du die 1000 Dokumente in ein Dokument zusammenführen und das OCR-Programm drüber laufen lassen.
Dann ggf. diese Datei wieder in 1000 Dateien zerlegen.
Acrobar Pro kannst Du 7 Tage kostenlos testen.
Benutzeravatar
hissenit
PLUS-Mitglied
PLUS-Mitglied
Beiträge: 465
Registriert: 16. Mär 2021 15:52
Land: Deutschland
Firmenname: Hissen IT
Branche: Datenverarbeitung | PaketConnector | InvoiceCreator | Webservices
Wohnort: Bensheim / Südhessen
Kontaktdaten:

Re: Software für PDF Batch OCR Erkennung gesucht.

Was sind denn "durchsuchbare PDF-Dateien" im Vergleich zu den Originaldateien? Sind die verschlüsselt?
PaketConnector und InvoiceCreator: Lösungen für kleine und mittelständische Unternehmen https://hissenit.com/pcic
Benutzeravatar
koshop
PLUS-Mitglied
PLUS-Mitglied
Beiträge: 6566
Registriert: 4. Sep 2012 13:23

Re: Software für PDF Batch OCR Erkennung gesucht.

Ne die Orginaldateien sind Scans.
Benutzeravatar
hissenit
PLUS-Mitglied
PLUS-Mitglied
Beiträge: 465
Registriert: 16. Mär 2021 15:52
Land: Deutschland
Firmenname: Hissen IT
Branche: Datenverarbeitung | PaketConnector | InvoiceCreator | Webservices
Wohnort: Bensheim / Südhessen
Kontaktdaten:

Re: Software für PDF Batch OCR Erkennung gesucht.

Ja, aber geht es um die textuelle Durchsuchbarkeit oder sollen die "durchsuchbaren" PDFs hinterher so aussehen wie die Originale (Scans)?
PaketConnector und InvoiceCreator: Lösungen für kleine und mittelständische Unternehmen https://hissenit.com/pcic
Benutzeravatar
koshop
PLUS-Mitglied
PLUS-Mitglied
Beiträge: 6566
Registriert: 4. Sep 2012 13:23

Re: Software für PDF Batch OCR Erkennung gesucht.

Ich hab PDFs die eigentlich nur Bilddateien sind. Da soll eine OCR Erkennung gemacht werden, dabei wird im Prinzip über die Bildebene eine zusätzliche Textebene gelegt.
Benutzeravatar
hissenit
PLUS-Mitglied
PLUS-Mitglied
Beiträge: 465
Registriert: 16. Mär 2021 15:52
Land: Deutschland
Firmenname: Hissen IT
Branche: Datenverarbeitung | PaketConnector | InvoiceCreator | Webservices
Wohnort: Bensheim / Südhessen
Kontaktdaten:

Re: Software für PDF Batch OCR Erkennung gesucht.

Wondershare hat da ja eine Lösung, aber ich kenne sie nicht (gibt wohl eine Testversion). Ansonsten kann man im Open-Source-Bereich scripten: PDF zu JPG, JPG zu TXT.
Ich weiß nicht, was Du mit "zusätzliche Textebene" meinst, daher die Frage. Per Script würde dann neben dem PDF eine Textdatei (oder mehrere) liegen, die eben dann durchsuchbar ist (mit Tools oder einfach im Windows-Explorer).
PaketConnector und InvoiceCreator: Lösungen für kleine und mittelständische Unternehmen https://hissenit.com/pcic
dp_
Beiträge: 256
Registriert: 26. Jan 2013 11:23

Re: Software für PDF Batch OCR Erkennung gesucht.

Die ScanSnap Software von Fujitsu kann das. Die PDFs einfach in die Programmoberfläche ziehen und automatisch in durchsuchbare PDFs konvertieren lassen. Sollte auch mit PDFs funktionieren, die nicht mit einem ScanSnap Scanner gescannt wurden.
Benutzeravatar
koshop
PLUS-Mitglied
PLUS-Mitglied
Beiträge: 6566
Registriert: 4. Sep 2012 13:23

Re: Software für PDF Batch OCR Erkennung gesucht.

Hab das ganze jetzt mit dem Foxit PDF Editor gelöst.
Antworten

Zurück zu „Office-Programme & Tools“

  • Information