Les détecteurs d’images IA se trompent et alimentent la désinformation : voici pourquoi vous ne devez pas leur faire confiance

Matilde

il y a 2 mois

Les outils censés démasquer les images générées par l’IA ont un défaut inquiétant : ils peuvent accuser à tort des photos réelles d’être synthétiques. Et cette faiblesse n’est pas anodine — elle offre une arme redoutable aux acteurs de la désinformation, capables d’exploiter de faux positifs pour semer le doute sur des preuves authentiques. Un audit récent met en lumière l’ampleur du problème et les risques concrets quand ces détecteurs deviennent des « preuves » utilisées sur les réseaux.

Ce que révèle l’audit

Un audit a testé cinq outils de détection (Hive, AI or Not, ZeroGPT, Sightengine, ScamAI) sur un corpus de 15 photographies authentiques issues d’agences reconnues et liées à des événements sensibles. Résultat : dans 13,33 % des cas, un outil a classé une image réelle comme « générée par l’IA ». Pire encore, les performances varient énormément d’un outil à l’autre — certains n’ont commis aucun faux positif sur l’échantillon, d’autres en ont jusqu’à 40 %.

Des faux positifs qui deviennent armes de confusion

Le cas le plus parlant : une vidéo authentique montrant une personnalité politique dans un lieu public a été évaluée par l’un des outils comme « probablement générée par l’IA » (probabilité annoncée à 96,9 %). Des comptes partisans ont utilisé ce résultat pour affirmer que la vidéo était un faux, alimentant des vagues de désinformation. La détection automatique, au lieu d’éclairer la situation, devient un prétexte pour invalider une vérité vérifiable.

Pourquoi ces erreurs surviennent

Variations matérielles et compression : des réductions de résolution, des recompressions et des filtres communs sur les images journalistiques peuvent ressembler à des signatures de synthèse.

Seuils et objectifs différents : certains détecteurs veulent repérer toute trace de retouche (même légère), d’autres cherchent uniquement des images entièrement générées. Cette divergence explique des taux de détection très différents.

Absence de standardisation : chaque solution applique sa propre idée de ce qu’est une « image AI », sans référence commune.

Performance contrastée selon les outils

L’audit montre une cassure nette :

Hive et Sightengine n’ont pas produit de faux positifs sur l’échantillon testé, mais ils reconnaissent moins bien les images fortement manipulées.

ScamAI et ZeroGPT ont détecté la plupart des images altérées mais ont également multiplié les faux positifs, parfois sur des photos prises par des agences reconnues.

AI or Not a obtenu des scores élevés sur certains aspects, mais ces résultats fluctuants soulignent l’absence d’un critère unifié et fiable.

Le paradoxe : détection sensible vs discernement

Il existe un compromis difficile : un détecteur très sensible repèrera de petites retouches — utiles pour signaler une manipulation — mais sera plus enclin à marquer des photos réelles trafiquées légèrement (ex : ajustement de contraste, flou). À l’inverse, un modèle calibré pour repérer de grosses synthèses passera à côté de manipulations subtiles. Aucun des deux extrêmes n’est satisfaisant seul.

Les conséquences pour le journalisme et la vérification

Risque d’instrumentalisation : des acteurs malveillants peuvent sortir des captures d’outil et prétendre avoir « prouvé » qu’un contenu authentique est faux.

Perte de confiance : si le public voit des contradictions entre outils, la vérification automatique perd sa crédibilité.

Charge pour les fact‑checkers : la nécessité d’une vérification humaine et contextuelle reste impérative, et ces outils ne remplacent pas l’analyse de provenance, métadonnées et recoupements.

Bonnes pratiques recommandées

Ne pas se fier à un seul outil : croiser plusieurs outils tout en gardant un esprit critique.

Prioriser la vérification contextuelle : recherche inversée d’images, analyse des métadonnées, recoupement avec des sources fiables et chronologie de publication.

Traiter les résultats comme indicateurs, pas comme preuves : un « résultat AI » doit déclencher une investigation, pas une condamnation automatique.

Former les équipes : journalistes, ONG et modérateurs doivent apprendre à interpréter ces scores et à repérer les faux positifs.

Quelles réponses pour l’écosystème ?

Plusieurs pistes doivent être travaillées simultanément :

Standardisation des métriques : définir des critères communs sur ce qu’est une image « synthétique » et comment présenter un score.

Amélioration des modèles : entraîner sur des corpus incluant photos de presse, images compressées et scénarios de guerre où la qualité est souvent médiocre.

Transparence des outils : les fournisseurs doivent documenter limites, taux d’erreur et conditions d’utilisation.

Intégration humaine : développer des workflows mêlant détection automatique et vérification experte rapide.

Le mot d’ordre : prudence et humilité technologique

Ces outils ont leur place comme première ligne de détection et d’alerte, mais ils ne sont pas des arbitres de la réalité. L’audit rappelle une chose fondamentale : la technologie ne remplace pas le sens critique humain. Dans un paysage informationnel saturé, les outils doivent être conçus et déployés avec conscience, transparence et une forte collaboration entre ingénieurs, journalistes et chercheurs pour limiter les dégâts d’éventuelles erreurs.

Jusqu’à ce que les détecteurs atteignent une robustesse et une cohérence satisfaisantes, la meilleure défense contre la désinformation reste une méthode de vérification combinant outils automatiques, analyse contextuelle et recoupements humains — tout simplement parce que la réalité est souvent plus nuancée que ce qu’un algorithme peut affirmer en un seul score.