• Apfeltalk ändert einen Teil seiner Allgemeinen Geschäftsbedingungen (AGB), das Löschen von Useraccounts betreffend.
    Näheres könnt Ihr hier nachlesen: AGB-Änderung
  • Es regnet, ist neblig und kalt, alle sind krank und der Chef wird zunehmend cholerisch. Das Thema des Monats ist also folgerichtig --> Das Grau(en)
    Wir sind gespannt, war Euch dazu einfällt! Zum Wettbewerb --> Klick
  • Auch in diesem Jahr möchten wir auf unserer Webseite mit einem passenden Banner etwas weihnachtliche Stimmung verbreiten. Jeder Apfeltalker kann, darf und sollte uns einen Banner-Entwurf zusenden, wie und wo das geht, könnt Ihr hier nachlesen --> Klick

Doppelte Seiten in PDFs finden

  • Ersteller Mitglied 231572
  • Erstellt am

Mitglied 231572

Gast
Ich digitalisiere alles, was mir in den echten Briefkasten kommt.
Aus reiner Bequemlichkeit sind nun thematische PDFs entstanden (anstelle EinzePDFs und Ordner).
D.h. ich habe zB ein "Banking.pdf" in dem alle meine Bankdokumente drin sind.

Da ich durch Datei-Sync-Probleme aber manche Einzelseiten PDFs mehrfach in so ein Sammelpdf gemerged habe, sind in diesen teilweise rund 100 Seiten langen PDFs aber auch doppelte (sprich: identische) Seiten drin.

Kann ich die automatisch finden - und entfernen - lassen?
 

MACaerer

Charlamowsky
Registriert
23.05.11
Beiträge
13.008
Nein, das wird nicht funktionieren. Scans sind BitMap-Dateien und wenn die in ein pdf umgewandelt werden bleiben es immer noch BitMaps, da lediglich der Datei-Header geändert wird. Eine Text-Suche, die hierfür in Frage kommen könnte, funktioniert bei BitMaps naturgemäß nicht.
Unabhängig davon: Es ist natürlich deine private Angelegenheit wie du Daten archivierst. Aber bist du dir wirklich sicher, dass deine Vorgehensweise, nämlich alle Dokumente in eine Datei zu packen, eine gute Idee ist? Eine Datei kann immer mal beschädigt oder überschrieben werden und dann ist alles weg und nicht nur ein einzelnes Dokument. Man kann dir nur raten immer und oft genug für ein aktuelles BackUp zu sorgen. Mit Ordnern und Unterordnern lässt sich auch sehr einfach eine gute Verwaltungsstruktur machen. Abgesehen davon dürfte es gar nicht so einfach sein einzelne Dokumente in einer umfangreichen Datei zu finden.