#9 Validalab, Augmenter l’information pour lutter contre la mésinformation

Data for Good
4 min readJul 8, 2021
Screenshot 1: site internet version Beta Validalab

Article écrit par Jean-Marc Guerin

Ces dernières années, nous avons tous reçu, par mail ou via les réseaux sociaux, des articles ou des vidéos douteux. Des proches qui, croyant bien faire, ont partagé une information qui les a touchés, mais dont le contenu, par la suite, s’est avéré trompeur ou carrément faux.

Pour lutter contre ces fausses rumeurs, de multiples initiatives ont vu le jour. Les grands médias ont désormais des équipes dédiées à la vérification d’information, les fact-checkers. Ils font suite aux initiatives citoyennes plus anciennes comme hoaxbuster ou hoax-net, et appellent à de nouvelles vocations de fact-checkers amateurs ou professionnels sur Facebook, Youtube, Twitter ou même Tiktok.

Malgré la diversité des fact-checkers, il reste difficile et chronophage pour le grand public de savoir si une information est fiable ou non. La confiance dans les médias en France reste une des plus basses en Europe.

Validalab part du constat qu’il existe des méthodes simples pour confirmer ou non une information :

  • Qualifier la source d’information
  • Accéder à d’autres points de vue
  • Tracer les citations, remonter à l’origine de l’information

Nous nous sommes ainsi donnés pour mission de faciliter et d’accélérer ces étapes par des outils technologiques et collaboratifs. Grâce à Data for Good, Validalab est maintenant une équipe de 10 bénévoles motivés et passionnés par la data et la lutte contre la mésinformation.

Screenshot 2 : le plugin Validalab pour chrome indique que le site covidinfos.net est jugé comme “essentiellement faux” par un collectif de journalistes : journalistessolidaires.com

Ce sprint de 3 mois nous a permis de construire, en version beta, une extension pour le navigateur Chrome et un site web de type moteur de recherche, app.validalab.fr, qui centralisent les signaux de crédibilités les plus courants pour juger de la fiabilité d’un site internet :

  • Qui sont les propriétaires finaux du site
  • Quels sont les autres sites du même propriétaires
  • Quels sont les sites amis (avec quels autres sites se citent-ils mutuellement)
  • La popularité et diffusion du site et de ses réseaux sociaux
  • Et surtout, qui recommande ce site ou qui met en garde contre ses informations.

C’est à partir de ces recommandations que nous calculons une fiabilité (plutôt fiable, peu fiable ou pas fiable)

Screenshot 3: le site app.validalab.fr centralise les critères de crédibilités les plus courants

Toutes les informations sont sourcées et les liens permettent aux curieux de creuser. Le site permet en plus de visualiser sous forme de carte de co-citation l’écosystème médiatique francophone et de l’explorer en sélectionnant les nœuds de la carte.

Screenshot 4: le site app.validalab.fr permet d’explorer les liens entre les sites sous forme de carte. Les sites classés comme “pas fiables” sont regroupés dans une branche (en rouge).

Ce sprint data for good nous a permis de poser des bases solides pour construire un projet qui va durer. Notre vision, c’est que personne ne peut être expert en tout, et que vérifier une information consiste à étudier son contexte et à trouver les bons experts capables de mieux nous renseigner sur la fiabilité de cette information. C’est aider les citoyens responsables, grâce à la data science, à retrouver confiance en une industrie disruptée et attaquée, celle de l’information.

Et notre ambition, c’est de pouvoir construire une plateforme qui permette de calculer et d’expliquer la fiabilité de n’importe quelle information en ligne à partir de son contexte. La route sera longue, nous aurons besoin d’aide et nous réservons déjà notre place pour le prochain sprint Data for Good de septembre !

Et pour tester Validalab :

Parce que c’est un projet Data For Good, Validalab est open source, ici le GitHub : https://github.com/dataforgoodfr/batch9_validalab

“La bonne information est un enjeu de taille dans un monde de plus en plus imprévisible avec notamment l’apparition de la crise covid. Le rôle joué par les médias dans ce cycle d’informations reste toujours déterminant. Le projet Validalab vise à donner une idée plus claire de la structure médiatique Française en mettant en relation propriétaires des médias, liens et bien d’autres thématiques.

Serge NANOU

“A l’ère de l’information, l’acte de s’informer n’a plus pour enjeux la recherche de l’information qui est facilement disponible. C’est sur la pertinence et la précision de l’information que tout citoyen se voit contraint de devenir ‘expert en tout’. Validalab propose d’aider chacun de nous en mettant à disposition toutes les informations contextuelles autour d’une source d’information disponible.

En récoltant et structurant les informations des médias disponibles , en nous renseignant sur leur postures , leurs intérêts, leur certification , les citoyens que nous sommes peuvent enfin simplement effectuer leur maïeutique , consommer de l’information d’une façon éclairée’.

Yann GIRARD

Aujourd’hui il suffit de quelques clics, retweets ou partages pour qu’une information soit diffusée à des milliers de personnes. Les infox, fake-news ou tout simplement informations mensongères n’échappent pas à cette réalité. Il est donc très important de s’assurer de la pertinence des informations que nous consultons. Validalab propose une solution intéressante qui permet de prendre du recul et d’évaluer la fiabilité d’une source d’information.”

Brice FOTZO

--

--

Data for Good

Data For Good est une communauté de data scientists bénévoles mettant leurs compétences au profit de la résolution de problèmes sociaux.