Los hashes de archivos en la informática, en los tribunales y en la vida real (y un vistazo a las herramientas que aún se usan)
Cada vez que descargas un programa y tu ordenador comprueba que ha llegado intacto, un hash ha hecho el trabajo. Cada vez que un sistema de copias de seguridad omite un archivo que ya tiene, un hash ha tomado la decisión. Y cada vez que un archivo digital se presenta como prueba en un tribunal, en algún lugar de la documentación hay, o debería haber, un hash.
Para algo tan central en la forma en que confiamos en la información digital, las herramientas que la gente usa para calcular hashes son sorprendentemente antiguas. Llegaremos a eso, porque es la parte extraña de esta historia. Primero, lo básico.
Qué es realmente un hash
Un hash es una huella digital de longitud fija calculada a partir del contenido de un archivo. Dale el mismo archivo al algoritmo y obtendrás la misma huella, todas las veces, en cualquier máquina. Cambia un solo byte, aunque sea una coma en un documento de 500 páginas, y la huella cambia por completo.
Eso te da una prueba sencilla pero poderosa: si dos huellas coinciden, los archivos son idénticos. Si difieren, algo ha cambiado. Nunca necesitas comparar los archivos en sí, y nunca necesitas enseñárselos a nadie.
Si quieres la historia completa de cómo las huellas se combinan con sellos de tiempo públicos para demostrar cuándo existió algo, eso es precisamente lo que cubre nuestro artículo pilar sobre el sellado de tiempo. Aquí nos quedamos con la huella en sí, porque tiene una vida ajetreada propia.
Donde los hashes hacen el trabajo silencioso en la informática
Los hashes son la fontanería de la confianza digital. Algunos lugares donde trabajan cada día:
- Distribución de software. Los proyectos publican el hash de cada versión junto al enlace de descarga. Si el archivo que recibiste produce el mismo valor, no se corrompió ni fue manipulado por el camino.
- Control de versiones. Git identifica cada commit con un hash. Cuando dos desarrolladores ven
e6b41d, saben que están mirando exactamente el mismo código. - Copias de seguridad y deduplicación. Los sistemas de almacenamiento calculan hashes para detectar duplicados y verificar que lo restaurado es lo que se guardó.
- Herramientas de seguridad. Los antivirus y los servicios de inteligencia de amenazas identifican archivos maliciosos por sus hashes.
Nada de esto es exótico. Funciona porque la prueba de la huella es rápida, barata e inequívoca.
Donde los hashes se encuentran con los tribunales y la vida real
La misma propiedad importa fuera de la informática. Cuando un archivo digital se convierte en prueba, una foto, una exportación de chat, un archivo de correos, un contrato, la primera pregunta que hace un examinador serio es: ¿es este exactamente el archivo que se recogió, o ha sido alterado por el camino?
La respuesta es un hash. El examinador registra la huella cuando se recoge la prueba. Cualquiera puede recalcularla después, en cualquier fase del procedimiento, y confirmar que el archivo está intacto byte a byte. Los peritos informáticos lo hacen de forma rutinaria, y también los notarios, los auditores y los peritos de seguros. En la vida cotidiana, la misma lógica te protege cuando documentas un accidente de coche, el estado de una vivienda o un trabajo entregado: calcula la huella ahora, y nadie podrá cambiarlo o editarlo discretamente después.
La parte extraña: las herramientas
Esto es lo que nos sorprendió. Hablando con una pequeña muestra de profesionales, encontramos que una herramienta todavía en uso para este trabajo es HashCalc de SlavaSoft, una utilidad para Windows de principios de los 2000.
La probamos, y los problemas empiezan antes incluso de ejecutarla. SlavaSoft, la empresa que la creó, no parece estar activa: su sitio web ahora muestra publicidad y, según la Wayback Machine, no da señales de vida desde enero de 2020. Con el sitio web oficial desaparecido, en la práctica el programa se descarga desde grandes portales de software como Softonic, esperando que la copia sea fiel. Solo funciona en Windows. Y sufre mucho con los archivos grandes, porque intenta procesarlos de una sola vez en lugar de leerlos por bloques: en nuestras pruebas con archivos de vídeo de varios gigabytes, o se cuelga o tarda más de veinte minutos.
¿Por qué una herramienta huérfana de hace 20 años persiste en el trabajo serio? Las herramientas evolucionan; los hábitos evolucionan más despacio. Es comprensible que los profesionales se queden con lo que aprendieron y en lo que llevan años confiando, a menudo desde la universidad, y esa comodidad es parte de cómo funciona cualquier práctica. Nuestra muestra es pequeña, y seguramente esto no describe a todo el mundo. Pero es un patrón real, lo hemos visto de primera mano, y merece la pena hacerse la pregunta en serio: cuando el desarrollador ha desaparecido, la descarga viene de un espejo cualquiera y el código fuente nunca fue público, ¿en qué estás confiando exactamente? Hay una verdadera ironía en verificar la integridad de una prueba con un programa cuya propia integridad no puedes verificar.
Cómo es una herramienta de hash moderna
Los navegadores se han vuelto, casi sin que nos demos cuenta, capaces de ejecutar aplicaciones serias. Algunas de esas aplicaciones siguen enviando tus datos a un servidor para el trabajo pesado. Otras lo hacen todo en tu máquina, y ese es el caso de la Calculadora de Hash Gratis que construimos.
Se apoya en dos tecnologías bien establecidas: WebAssembly, que permite a los navegadores ejecutar código a velocidad casi nativa, y hash-wasm, una librería de hashing de código abierto ampliamente utilizada cuyo código fuente es público e inspeccionable. El archivo se lee por bloques, como un flujo, así que no hay límite teórico de tamaño: un vídeo de 2 GB se procesa con la misma comodidad que un texto de 2 KB.
Y lo más importante: la privacidad es lo primero. El archivo nunca sale de tu dispositivo. No se sube nada a ningún servidor ni a la nube, lo cual importa mucho cuando el archivo es una prueba, un contrato o un trabajo inédito. Tampoco tienes que fiarte de nuestra palabra: abre las herramientas de desarrollador de tu navegador mientras se calculan los hashes y comprueba tú mismo que no se transmite nada.
Sin instalación y sin depender de la plataforma. Funciona igual desde un escritorio con Windows, un Mac, un portátil con Linux o una tablet, hoy y en lo que uses el año que viene.
Un informe hecho para trabajo serio
Calcular las huellas es la mitad del trabajo; documentarlas es la otra mitad. La calculadora genera un informe PDF y, antes de descargarlo, puedes identificar opcionalmente quién lo produce: una persona o una empresa, con identificación fiscal y dirección, una referencia de expediente y la propia sesión de hashing.
El informe no se almacena en línea. Puede reproducirse en cualquier momento volviendo a calcular los hashes del mismo archivo, y esa es la belleza de cómo funcionan los hashes: la prueba está en las matemáticas, no en nuestra base de datos.
De demostrar integridad a demostrar tiempo
Un hash responde con certeza a una pregunta: ¿es este archivo exactamente el mismo archivo? Lo que no puede decirte por sí solo es cuándo existió. Para eso necesitas anclar la huella a un momento en el tiempo que nadie pueda antedatar, y eso es exactamente lo que hace EMOZ: escribe la huella en una blockchain pública, creando un registro a prueba de manipulaciones y verificable de forma independiente de que tu archivo existió, exactamente como es, en una fecha concreta.
Esta es precisamente la dirección en la que estamos construyendo: herramientas que hacen que la información digital sea demostrable, con privacidad y sin fricción, en un mundo donde cualquier cosa puede copiarse, editarse o generarse. La Calculadora de Hash Gratis es el caballo de batalla del día a día, gratis para siempre y sin registro. El sellado de tiempo es el siguiente paso cuando «intacto» tiene que convertirse en «intacto desde esta fecha».
Prueba la calculadora con cualquier archivo, incluso uno enorme. No cuesta nada, y tu archivo no va a ninguna parte.