Lancement de la Saison 9 Data For Good

Data for Good
8 min readMar 30, 2021
Le martin-pĂȘcheur de Data For Good

🌎 Data For Good France c’est 61 projets d’intĂ©rĂȘt gĂ©nĂ©ral accompagnĂ©s ces 6 derniĂšres annĂ©es, grĂące Ă  +2500 bĂ©nĂ©voles artisans de la Data.

Pour cette 9Úme saison, nous sommes ravis de vous présenter les projets sélectionnés :

∘ 1.OPENGEOSCALES
∘ 2. OLVO
∘ 3. CRATer
∘ 4. GEOWATCH LABS
∘ 5. DYSLEX’IA
∘ 6. SUBSTRA FOUNDATION
∘ 7. CODECARBON
∘ 8. VALIDALAB
∘ 9. SCIENCE FEEDBACK
∘ 10. OPEN FAKE FACTS
∘ 11. COMPLOTISME NOUS VOILÀ !

Vous ĂȘtes Data Scientists, Data Engineers, Data Analysts, dĂ©veloppeurs, UX designers, ou bien juste curieux et passionnĂ©s par ces enjeux ? Vous avez de 30 minutes Ă  quelques heures par semaine Ă  consacrer Ă  des projets de bien commun ? Alors lisez cet article et rejoignez-nous !

1.OPENGEOSCALES — Simplifier et faciliter l’accĂšs et l’usage des donnĂ©es ouvertes liĂ©es aux enjeux environnementaux et climatiques

OpenGeoScales croit en l’analyse collaborative et aux donnĂ©es gĂ©ospatiales pour aider Ă  rĂ©soudre des dĂ©fis environnementaux. Cette association a pour objectif de faire face aux impacts du changement climatique sur les villes, en fournissant s un point d’accĂšs centralisĂ© Ă  des donnĂ©es environnementales standardisĂ©es et agrĂ©gĂ©es Ă  diffĂ©rentes Ă©chelles gĂ©o-spatiales En plus de gĂ©nĂ©rer des donnĂ©es environnementales fiables et normalisĂ©es, OpenGeoScales propose un accĂšs libre aux traitements implĂ©mentĂ©s sur les donnĂ©es brutes collectĂ©es de diverses sources.

Pour cette saison 9, Data For Good et OpenGeoScales vont travailler ensemble pour harmoniser les donnĂ©es liĂ©es aux Ă©missions de gaz Ă  effet de serre Ă  diffĂ©rentes Ă©chelles gĂ©ographiques et fournir une API permettant un accĂšs facile et libre Ă  ces donnĂ©es.Ils ont besoin de Data Scientists/Engineers pour les aider dans l’exploration, l’intĂ©gration et la transformation des donnĂ©es collectĂ©es d’émissions de gaz Ă  effet de serre et de dĂ©veloppeurs Backend pour le dĂ©veloppement de l’API.

Pour les rejoindre c’est ici

2. OLVO — DĂ©velopper un algorithme de dispatch des missions pour soutenir une nouvelle vision de la livraison Ă©cologique & sociale

OLVO propose un service de livraison en vĂ©los cargos. Pourquoi OLVO ? Pour prendre le contre-pied de l’ubĂ©risation du secteur, en proposant une solution environnementale (plus de vĂ©los cargos c’est moins de scooters, camionnettes) & une mission sociale : les coursiers possĂšdent l’entreprise. Aujourd’hui, OLVO compte une trentaine de salariĂ©s et effectue environ 8000 livraisons par mois.

Pour ce faire, OLVO a dĂ©veloppĂ© son logiciel in-house PÉDALO — et c’est lĂ  que Data For Good intervient. Dans le cadre de cette saison 9, OLVO a 2 objectifs :

  1. Aujourd’hui PEDALO est dĂ©pendant d’un logiciel de SaaS pour tout ce qui touche Ă  la rĂ©partition des missions entre les coursiers → DĂ©velopper une solution in-house đŸ’Ș (algorithme de dispatch intelligent).
  2. Muscler & faire passer PÉDALO en open source pour en faire bĂ©nĂ©ficier d’autres entreprises.

En termes de technos, le projet sera principalement sur du Ruby on Rails via Hotwire.

L’équipe a notamment besoin de dĂ©veloppeurs Ruby & de data scientists/engineers 🚮

Pour les rejoindre c’est ici

3. CRATer — Analyser la rĂ©silience alimentaire du territoire français

Les Greniers de l’Abondance, est une association qui Ă©tudie, sensibilise et accompagne sur le sujet de la rĂ©silience alimentaire.

En cette saison 9, c’est sur le projet CRATer que des bĂ©nĂ©voles Data For Good vont donner de leur temps. Ce dernier a pour objectif de construire un outil numĂ©rique d’aide au diagnostic de la rĂ©silience alimentaire, notamment en traitant et montrant des donnĂ©es de sĂ©ries temporelles pour illustrer les dynamiques Ă  l’Ɠuvre dans nos systĂšmes alimentaires. Ainsi, ce nouvel outil qui se voudra accessible et simple, outillera les acteurs de terrain pour aider Ă  la rĂ©flexion sur ce sujet, Ă  l’échelle de leur territoire.

Pour les rejoindre c’est ici

4. GEOWATCH LABS — Lutter contre l’insĂ©curitĂ© alimentaire en Mauritanie en dĂ©veloppant un algorithme de prĂ©diction des rendements agricoles

GEOWATCH LABS travaille Ă  lutter contre l’insĂ©curitĂ© alimentaire. Pour ce faire, ils travaillent Ă  dĂ©velopper une solution pour prĂ©dire le rendement agricole Ă  l’échelle locale afin d’identifier les populations vulnĂ©rables et permettre une meilleure rĂ©partition de l’aide.

ConcrĂštement, pour une zone donnĂ©e, GEOWATCH LABS repĂšre Ă  l’aide d’images satellitaires les champs cultivĂ©s, caractĂ©rise le type de cultures et estime la production agricole.

GEOWATCH LABS rejoint la saison 9 de Data For Good pour :

  1. Lancer un projet pilote en Mauritanie (suite à la sécheresse de 2012, 1/3 de la population ne parvient pas à manger sa faim) ;
  2. Affiner le modĂšle pour passer d’une estimation de rendements agricoles Ă  des taux de sĂ©curitĂ© alimentaire.

Le projet est soutenu par la Banque Mondiale et le gouvernement mauritanien.

Pour les rejoindre c’est ici

5. DYSLEX’IA — DĂ©velopper des algorithmes de scan de devoirs pour aider les enfants dyslexiques

La dyslexie est un trouble du langage Ă©crit, affectant la lecture, l’orthographe et/ou l’écriture. 4 Ă  5% d’enfants d’une mĂȘme classe d’ñge en France sont dyslexiques. Malheureusement, il n’existe pas encore d’outil ludique et abordable qui permet d’adapter le contenu pĂ©dagogique en temps rĂ©el pour les dyslexiques.

C’est de ce constat que Dyslex’IA est nĂ©e (dans le cadre d’AI For Tomorrow) et nous a proposĂ© un dĂ©fis pour cette 9Ăšme saison : rendre accessible l’éducation pour tous en adressant la dyslexie dans sa globalitĂ©. Ainsi, une Ă©quipe travaillera pour exploiter l’IA, l’UX et la data pour continuer Ă  dĂ©velopper la plateforme, notamment en crĂ©ant un algorithme de reconnaissance visuelle de l’écriture tapuscrite et manuscrite.

Pour les rejoindre c’est ici

6. SUBSTRA FOUNDATION — CrĂ©er la premiĂšre formation sur la Data Science Responsable

Si l’IA permet des innovations formidables, son dĂ©veloppement — notamment fondĂ© sur des stratĂ©gies de collecte d’informations,de donnĂ©es et de prise de dĂ©cision automatisĂ©e — doit ĂȘtre dirigĂ© dans un but Ă©thique. Et cela repose sur l’adoption, par le secteur, de pratiques data responsables et respectueuses.

Lors de la saison 8 de Data For Good (leur projet a Ă©tĂ© nommĂ© vainqueur de la saison 🏆), SUBSTRA FOUNDATION a ainsi dĂ©veloppĂ© un rĂ©fĂ©rentiel d’évaluation en matiĂšre de data science responsable et de confiance qui s’accompagne d’une plateforme d’auto-Ă©valuation.

Pour cette nouvelle saison, SUBSTRA FOUNDATION veut aller encore plus loin et a pour ambition de monter un vĂ©ritable MOOC sur « Une data science responsable » (respect et protection des donnĂ©es personnelles, transparence, biais algorithmiques
). La formation sera destinĂ©e Ă  un public gĂ©nĂ©raliste, mais proposera Ă©galement des briques techniques pour guider les professionnels dans leur pratique.

Pour les rejoindre c’est ici

7. CODECARBON — Mesurer l’empreinte carbone de l’IA et la Data Science

La pollution numĂ©rique est responsable de 4% des Ă©missions mondiales de gaz Ă  effet de serre (source: Aurelia F). Il peut ĂȘtre difficile de mesurer sa contribution Ă  son Ă©chelle.

C’est pourquoi, CodeCarbon a dĂ©veloppĂ© un outil accessible permettant aux individus et aux organisations de mesurer leurs Ă©missions de CO2 de leur Machine Learning. Aujourd’hui, c’est un package Python qui s’intĂšgre directement Ă  votre base de code et calcule votre production de CO2 produite par votre cloud et votre activitĂ© numĂ©rique.

Pendant cette saison, nous allons associer nos forces pour continuer à développer cet outil afin de le rendre encore plus pertinent, accessible et performant.

Pour les rejoindre c’est ici

8. VALIDALAB — CrĂ©er un graphe de connaissances des sources d’infos francophones pour lutter contre les fake news

VALIDALAB vise Ă  lutter contre la dĂ©sinformation en simplifiant le process de vĂ©rification d’une info. A terme, VALIDALAB ambitionne de dĂ©velopper une application permettant Ă  tous de vĂ©rifier facilement & rapidement la vĂ©racitĂ© de l’information.

Leur mĂ©thode est fondĂ©e sur la recontextualisation de l’info et le recoupage des sources đŸ•”.

Pour cette saison 9 de Data For Good, VALIDALAB va s’intĂ©resser au comportement de la sphĂšre mĂ©diatique francophone, avec l’objectif d’établir un graph de connaissance des diffĂ©rentes sources d’information (mĂ©dias, blogs, rĂ©seaux sociaux
). Leur projet comportera 3grands axes :

  1. Qualifier la crédibilité des sources
  2. Accéder à de meilleurs points de vue
  3. Tracer les documents, vidéos, citations

Pour les rejoindre c’est ici

9. SCIENCE FEEDBACK — DĂ©velopper un systĂšme et des outils pour aider au fact-checking

Science Feedback est un rĂ©seau international de 500 scientifiques vĂ©rifiant collaborativement la crĂ©dibilitĂ© d’informations virales dans les domaines scientifiques. L’organisation travaille notamment en partenariat avec Facebook et TikTok et a ainsi pu informer des dizaines de millions d’utilisateurs en 2020. Leur objectif est d’aider les lecteurs Ă  vĂ©rifier les informations mais aussi de contribuer Ă  une meilleure visibilitĂ© des informations fiables sur Internet.

Data For Good va se lancer dans cette aventure pour aider Ă  dĂ©velopper des outils utiles Ă  Science Feedback et aux autres fact-checkers notamment dans le monitoring quotidien des affirmations faites par les sites de dĂ©sinformation et la recherche d’experts scientifiques pour les vĂ©rifier.

Pour les rejoindre c’est ici

10. OPEN FAKE FACTS — Lutter contre la diffusion des fake news en France grñce à la data

Toujours dans l’optique de lutter contre la dĂ©sinformation, OPEN FAKE FACTS a pour objectif de simplifier la dĂ©tection de fake news en France.

Pour ce faire, ils proposent de dĂ©velopper des algorithmes de NLP permettant d’identifier les fake news en français et de crĂ©er une base de donnĂ©es open-source rassemblant les derniĂšres infox publiĂ©es.

Le projet sera organisé autour de 3 axes :

  1. Un travail d’analyse de la donnĂ©e pour dĂ©gager des signaux permettant de discriminer les fake news
  2. Le dĂ©veloppement d’algorithmes de traitement de textes (NLP/TAL) permettant de dĂ©tecter des contenus potentiellement faux (algo de similaritĂ© / de classification
)
  3. L’enrichissement d’une base de donnĂ©es de fake news FR notamment via la labellisation d’articles (sentiment, thĂšme
)

Pour les rejoindre c’est ici

11. COMPLOTISME NOUS VOILÀ ! — Le mĂ©ta projet bonus et unique pour Data For Good afin d’inscrire la lutte contre le complotisme dans le temps et maximiser notre impact

Le complotisme navigue entre une sectarisation toxique du dĂ©bat public et un dĂ©sir lĂ©gitime d’information de la population. Avec complotisme nous voilĂ  !, nous voulons pousser encore plus fort la data et l’IA pour aider Ă  lutter contre la dĂ©sinformation.

Pour la premiĂšre fois, nous lançons un mĂ©ta-projet, soit un projet long terme signĂ© Data For Good. Validalab, Open Fake Facts et Science Feedback sont trois projets avec un mĂȘme objectif : lutter contre la dĂ©sinformation et Complotisme nous voilĂ !, les encadrera pour pousser encore plus loin les recherches et les rĂ©sultats.

đŸ’Ș Comment rejoindre la communautĂ© de bĂ©nĂ©voles et s’impliquer sur un de ces projets : s’inscrire avec ce formulaire

đŸ“ș Pour retrouver toutes les informations du lancement, c’est ici ! lancement saison 9

--

--

Data for Good

Data For Good est une communauté de data scientists bénévoles mettant leurs compétences au profit de la résolution de problÚmes sociaux.