- Registriert
- 09.06.10
- Beiträge
- 20
Hallo zusammen,
ich wende mich heute mit einer echten Krise an die Spezialisten der Dateiformate. Im Rahmen meiner Arbeit an meiner Dissertation analysiere ich qualitativ Bilderbücher. Die Bücher für das Korpus habe ich eingescannt und die entstandenen JPGs in mehrseitige PDFs umgewandelt.
Dabei habe ich nicht bedacht, dass der Text in dem PDF dann gar nicht als Text wahrgenommen wird. Das eine Programm zur qualitativen Datenanlyse, das ich benutzen könnte (MaxQDA), kann eh nur rtf lesen. Wenn ich aber das PDF jetzt in ein RTF umwandle, habe ich nur ein Text-Dokument mit riesen großen Bildern - ist nicht analysierbar (Suche nach bestimmten Wörtern etc.). Das andere Programm kann PDFs laden (Atlas.Ti), aber auch hier wird jede Seite nur als ein Bild angezeigt.
Irgendwie will ich verhindern, den ganzen Text abtippen zu müssen. Kennt jemand eine OCR-Software (am besten kostenlos), die Texte aus PDFs filtern kann? Oder hat sonst noch nen vernünftigen Tipp für mich?
Wäre für jeden Lösungsvorschlag mega dankbar.
ich wende mich heute mit einer echten Krise an die Spezialisten der Dateiformate. Im Rahmen meiner Arbeit an meiner Dissertation analysiere ich qualitativ Bilderbücher. Die Bücher für das Korpus habe ich eingescannt und die entstandenen JPGs in mehrseitige PDFs umgewandelt.
Dabei habe ich nicht bedacht, dass der Text in dem PDF dann gar nicht als Text wahrgenommen wird. Das eine Programm zur qualitativen Datenanlyse, das ich benutzen könnte (MaxQDA), kann eh nur rtf lesen. Wenn ich aber das PDF jetzt in ein RTF umwandle, habe ich nur ein Text-Dokument mit riesen großen Bildern - ist nicht analysierbar (Suche nach bestimmten Wörtern etc.). Das andere Programm kann PDFs laden (Atlas.Ti), aber auch hier wird jede Seite nur als ein Bild angezeigt.
Irgendwie will ich verhindern, den ganzen Text abtippen zu müssen. Kennt jemand eine OCR-Software (am besten kostenlos), die Texte aus PDFs filtern kann? Oder hat sonst noch nen vernünftigen Tipp für mich?
Wäre für jeden Lösungsvorschlag mega dankbar.