← Retour au calculateur de hash AdminTools.fr — Guide sécurité

Comprendre les fonctions de hash et l'intégrité des fichiers

Vérifier le hash d'un fichier téléchargé est l'un des réflexes de sécurité les plus simples et les plus négligés. Ce guide explique ce qu'est une fonction de hash, comment l'utiliser pour vérifier l'intégrité d'un téléchargement, et pourquoi MD5/SHA-1 ne suffisent plus pour de la sécurité.

Sommaire

Qu'est-ce qu'une fonction de hash ? Vérifier l'intégrité d'un fichier téléchargé MD5, SHA-1, SHA-256, SHA-512 : quelles différences ? Le problème des collisions Intégrité n'est pas authenticité Autres usages courants des fonctions de hash Erreurs courantes Questions fréquentes

Qu'est-ce qu'une fonction de hash ?

Une fonction de hash transforme n'importe quelle donnée (un mot, un fichier de plusieurs gigaoctets, une image) en une empreinte de taille fixe, généralement représentée comme une chaîne hexadécimale. Trois propriétés la rendent utile pour vérifier l'intégrité :

Déterminisme : la même entrée produit toujours exactement la même empreinte.
Effet avalanche : changer un seul bit dans le fichier d'origine produit une empreinte complètement différente, sans aucune ressemblance avec l'originale.
Irréversibilité : il est impossible (en pratique) de retrouver les données d'origine à partir de leur seule empreinte.

Vérifier l'intégrité d'un fichier téléchargé

Quand un éditeur logiciel publie un fichier (un installeur, une image ISO, une archive), il publie souvent aussi son hash sur la page de téléchargement. Cela permet à quiconque télécharge le fichier de vérifier qu'il n'a pas été corrompu pendant le transfert ou altéré entre le serveur d'origine et l'utilisateur final :

Télécharger le fichier.
Calculer son hash localement (avec un outil comme celui de cette page).
Comparer le résultat avec le hash publié par la source officielle.
Si les deux empreintes correspondent exactement, le fichier reçu est bit pour bit identique à celui publié.

Si les hash ne correspondent pas, ne fais jamais confiance au fichier — supprime-le et retélécharge-le depuis la source officielle. Un hash différent peut signaler une corruption réseau, mais aussi une altération malveillante (fichier piégé, attaque de la chaîne d'approvisionnement).

MD5, SHA-1, SHA-256, SHA-512 : quelles différences ?

Algorithme	Taille de l'empreinte	Statut cryptographique	Usage recommandé
MD5	128 bits (32 caractères hex)	Cassé — collisions faciles à générer	Vérification d'intégrité non critique uniquement
SHA-1	160 bits (40 caractères hex)	Cassé — collisions démontrées (2017)	À éviter, encore présent par héritage
SHA-256	256 bits (64 caractères hex)	Solide, recommandé	Vérification d'intégrité et usages cryptographiques
SHA-512	512 bits (128 caractères hex)	Solide, recommandé	Vérification d'intégrité et usages cryptographiques

Pour vérifier l'intégrité d'un téléchargement, utilise toujours l'algorithme le plus fort proposé par la source — si un éditeur publie à la fois un MD5 et un SHA-256, préfère systématiquement le SHA-256.

Le problème des collisions

Une collision se produit quand deux entrées différentes produisent le même hash. Pour MD5 et SHA-1, des chercheurs ont démontré qu'il est possible de construire intentionnellement deux fichiers différents partageant le même hash — ce qui permettrait, en théorie, de faire passer un fichier malveillant pour un fichier légitime si seul le hash est vérifié.

C'est précisément pour cette raison que MD5 et SHA-1 sont aujourd'hui déconseillés pour tout usage où la sécurité compte (signatures, certificats), même s'ils restent largement utilisés pour de la simple détection de corruption accidentelle, où le risque d'une collision intentionnelle n'est pas pertinent.

Intégrité n'est pas authenticité

Vérifier un hash prouve que le fichier reçu correspond exactement à celui dont le hash a été publié. Cela ne prouve pas que ce fichier est lui-même légitime : si un attaquant compromet le serveur de téléchargement et remplace à la fois le fichier et le hash affiché sur la page, la vérification "réussira" alors que le fichier est piégé.

Pour une vraie garantie d'authenticité (que le fichier provient bien de l'éditeur annoncé), il faut une signature cryptographique vérifiée avec la clé publique de l'éditeur — un mécanisme différent et complémentaire du simple hash.

Autres usages courants des fonctions de hash

Stockage de mots de passe : jamais en clair, toujours via une fonction de hash spécialisée et lente (bcrypt, Argon2 — pas MD5/SHA, trop rapides et donc vulnérables au brute-force).
Détection de doublons : comparer des hash de fichiers est plus rapide que comparer leur contenu intégral.
Git et contrôle de version : chaque commit est identifié par un hash SHA-1 (historiquement) de son contenu.
Preuve d'intégrité dans une chaîne de blocs : chaque bloc référence le hash du précédent.

Utiliser le calculateur de hash →

Erreurs courantes

Comparer des hash de types différents sans s'en rendre compte (un MD5 de 32 caractères ne sera jamais égal à un SHA-256 de 64 caractères).
Ignorer la casse : les hash hexadécimaux sont insensibles à la casse (majuscules/minuscules), mais une comparaison de texte brut mal faite peut donner un faux négatif.
Faire confiance à un hash publié sur le même site potentiellement compromis que le fichier lui-même, sans recouper avec une source indépendante (miroir, communiqué officiel séparé).
Utiliser MD5/SHA-1 pour un usage de sécurité (signature, mot de passe) alors qu'ils ne sont plus considérés sûrs pour cela.

Questions fréquentes

Pourquoi MD5 est-il encore aussi répandu si c'est "cassé" ?

Sa rapidité de calcul et sa large adoption historique en font encore un standard pour la détection de corruption accidentelle (où personne ne cherche activement à provoquer une collision). Il reste en revanche à proscrire pour tout usage de sécurité réelle.

Le hash d'un fichier change-t-il si je le renomme ?

Non — le hash dépend uniquement du contenu binaire du fichier, jamais de son nom, de sa date de modification ou de ses métadonnées de système de fichiers.

Deux fichiers identiques sur deux ordinateurs différents auront-ils le même hash ?

Oui, systématiquement, à condition d'utiliser le même algorithme — c'est précisément le principe qui permet de vérifier l'intégrité entre deux machines sans avoir à comparer les fichiers eux-mêmes.

L'outil de cette page peut-il hacher de très gros fichiers ?

Oui, le calcul se fait entièrement dans le navigateur sans limite stricte de taille, mais le temps de calcul augmente avec la taille du fichier (le MD5 implémenté en JavaScript pur est plus lent que les algorithmes SHA, qui bénéficient d'une implémentation native via le navigateur).