Dubletten finden

Thread Status
Hello, There was no answer in this thread for more than 30 days.
It can take a long time to get an up-to-date response or contact with relevant users.

granville

Aktives und bekanntes NF Mitglied
Registriert
Hab hier alles gelesen, nix gefunden, daher müsstet ihr das Problem gelöst haben :)

Habe diverse externe Festplatten mit Unmengen eigener Bilder (jpg, nef)

Inzwischen hab ich den Überblick verloren und will nun die Dateien ordentlich zusammenführen und archivieren.

System ist Windows 7 ff.

In den einzelnen Verzeichnisbäumen finden sich jede Menge Dubletten und die Windows Datei Informationen hinsichtlich Datum etc. sind nicht zuverlässig.

Wie erzeuge ich also von all den Dateien einen Referenzsatz den ich dann als Basis für Archivierung und Bearbeitung nutzen kann.

Theorie: Ein Tool welches Checksummen aller Dateien anlegt und dann mittels der Checksummen die Dupletten identifiziert und löscht.


Danke für Hinweise
 
Anzeigen



Wundert mich nicht, daß Du nix findest … :cool:


Eine simple Google-Suche "Fotos Dubletten finden"
erbrachte ungefähr 15.300 Ergebnisse … :motz:

Hier findest Du Programme, hier was zu VisiPics … :lupe:



 
Kommentar
Ich stelle mir das schon schwierig vor.

Einzelne Doubletten wird man schon automatisch finden können.

Aber die Entscheidung, was damit zu tun ist nimmt einem ja keiner ab.
Wenn man also 3000 Doubletten findet muss man 3000mal entscheiden - das geht nicht.

Ich denke daher, man muss eher über Verzeichnisse vorgehen, also "Top Down".

Eine leere Zielstruktur (*) schaffen, und dann alle Festplatten Verzeichnis für Verzeichnis dort hineinschieben.

Aus diese Weise müssten Doubletten irgendwann im gleichen Verzeichnis landen.

Und dann (und nicht vorher) kann man sie aufspüren und (bis auf eine) auch problemlos löschen.
 
Kommentar
Beispiel:

Du baust die neue Masterstruktur so auf:
Jahr
- Ereignis

Zum Beispiel so:
2012
2013
2014
-20140203 Urlaub Bodensee
-20140305 Shooting mit Oma
-20140606 ebay-Fotos
2015
usw


Jetzt nimmst Du Dir Deine HDD's verzeichnis für Verzeichnis vor und probierst das einzusortieren.
Die meisten Verzeichnisse sind solche Ereignisse, weil man normalerweise alle Bilder vom Chip in einen Ordner speichert

Andere Verzeichnisse hat man vielleicht mal als Auswahl für Prints, Album oder so erstellt. Das sind dann häufig Doubletten von Bildern die in Ereignisordnern schon sind. Oder aber vermutlich bearbeitete Varianten. Ich würde solche Ordner erst am Schluss zuordnen. Wenn die Ereignisse komplett sind. Dann kann man entscheiden ob man die noch als Unterordner behält oder wie man sie in die Ereignisse einsortiert.
 
Kommentar
Für die von Frank beschriebene Vorgehensweise hat mir das Programm "Beyond Compare" mal sehr gute Dienste geleistet.

Damit sind sehr ausgeklügelte Regeln und Filter definierbar, nach denen Dateien behalten, gelöscht oder überschrieben werden können.

Obwohl das Programm auch einen Prüfsummenvergleich o.ä. enthält, sollte man so etwas nicht vollautomatisch ablaufen lassen. Zu leicht wird etwas übersehen. Das letzte Wort sollte man sich selbst vorbehalten.

Beyond Compare erleichtert die Arbeit aber mit seinen mächtigen Werkzeugen schon sehr. Es gibt auch eine 30-Tage Testversion.

Herzliche Grüße Nic
 
Kommentar
Kann man sich nicht einfach ALLE Bilder nach Aufnahmedatum sortiert anzeigen lassen? Dann müsste die Doppelten ja gleich hintereinander folgen und wären leicht zu finden.

Und dann gleich einsortieren wie Wuxi sagt.

Wenn ich Bilder übertrage, kommen die sofort in einen Ordner mit Datum und Ereignis
2016 10 15 Tante Erika Geburtstag
oder so.
Da sind die RAW drin und in einen Unterordner kommen dann die JPG und darin in einen Unterordner evtl. komprimierte Bilder oder Bilder für flickr oder zum Vergrößern oder ...


So finde ich eigentlich immer alles gut wieder.

Viel Erfolg!
Sylvia
 
Kommentar
Theorie: Ein Tool welches Checksummen aller Dateien anlegt und dann mittels der Checksummen die Dupletten identifiziert und löscht.

Unter Mac OSX bzw. Unix ist das ein einzeiliges Skript.

md5: zum Erzeugen der Checksummen
sort: zum Sortieren nach Checksummen
uniq: zum Finden aller Mehrfachtreffer

In der Praxis ist das Skript ein wenig länger, man muss sich noch die Verzeichnisse merken und festlegen, aus welchen Verzeichnissen Dubletten gelöscht werden sollen (Vorrangregel). Ca. 1h Arbeit.

LG Falk
 
Kommentar
Kann man sich nicht einfach ALLE Bilder nach Aufnahmedatum sortiert anzeigen lassen? Dann müsste die Doppelten ja gleich hintereinander folgen und wären leicht zu finden.
Und dann gleich einsortieren wie Wuxi sagt.

Ich habe vorgeschlagen immer mit ganzen Ordnern zu hantieren damit man sich NICHT alle Doubletten ansehen muss.
Kommt halt drauf an ob es 5 Doubletten sind oder 3000.
 
Kommentar
-Anzeige-
Zurück
Oben Unten