Kabosu - Creando cosas
Publicado: 2025-03-12
Etiquetas: Blog, Linux, Software
Hace un tiempo hablé de la cantidad de fotos que había acumulado cientos de gigas de fotos a lo largo de los años. Gracias al blog de Joel descubrí la aplicación Czkawka. Czkawka es un programa que yo tenía en mente desarrollar desde hace varios años pero solo llegué a crear una versión muy básica: sirve para limpiar una colección de fotos buscando repetidos, similares, ficheros rotos, etc. Hace todo lo que siempre había pensado implementar y más.
Sus opciones de análisis son:
Para cada análisis muestra una lista y te permite seleccionar los ficheros y borrarlos.
La opción de buscar ficheros duplicados muestra grupos de imágenes que son iguales y te deja elegir todas menos una para borrarla. Gracias a esta opción borré miles de fotos. Este análisis tardaba unos pocos segundos en analizar más de 500GB de ficheros en un disco SSD.
Las otra opción interesante es la de buscar imágenes similares. Tiene diversos algoritmos (Lanczos3, Nearest, Triangle, Gaussian y CatmullRom) y me tardaba hasta media hora en hacer el análisis pero puede ser interesante ejecutar esta búsqueda una vez con cada uno de los algoritmos porque parece que detectan cosas diferentes. Por ejemplo Lanczos3 parecía detectar fotos casi iguales, hechas en el mismo segundo, pero Triangle era capaz de detectar que fotos de distintos tamaños eran iguales pero habían sido escaladas.
El caso es que, tras una tarde trasteando con Czkawka, he conseguido reducir el tamaño de mi directorio de fotos de 506 a 382GB.
Una detalle que me ha gustado mucho y me quito el sombrero por ello es que en el propio repositorio hay una lista de programas alternativos a Czkawka por si queremos probar alguno de sus competidores:
Other apps
There are many similar applications to Czkawka on the Internet, which do some things better and some things worse:
Tras eso pasa a enlazar 8 programas similares creados por otra gente. Creo que esto debería ser la norma en el software libre pero creo que ocurre todo lo contrario. A veces incluso forks ni mencionan al programa original como si eso les fuera a quitar popularidad o algo.
En resumen: si tienes una colección de fotos en el disco duro prueba a ejecutar los análisis de Czkawka. Quizá liberes algo de disco duro como yo. Quiero recalcar que Czkawka no elimina fotos automáticamente. Te muestra fotos que cree que están duplicadas y puedes verlas y elegir si quieres borrar alguna o no. También lo he probado con documentos y otros formatos de ficheros y sirve para encontrar duplicados por tamaño y hash pero la interfaz está más pensada para imágenes.