POUR UN "EDUCATION DATA HUB" AU SERVICE DE L’OUVERTURE DES DONNÉES ÉDUCATIVES
06/04/2021
Constat
Comme le souligne le rapport sur la politique publique de la donnée du député Éric Bothorel de décembre 2020, si la France fait partie des trois premiers pays des deux classements internationaux de référence en matière d’ouverture des données, l’essentiel des progrès réalisés dans ces classements est intervenu avant 2017 et la dynamique d’ouverture a depuis nettement ralenti. Alors que la crise sanitaire souligne à la fois le déficit et l’intérêt de l’ouverture des données en matière de santé, un autre domaine devrait faire l’objet d’une attention particulière dans la conduite de ce chantier : l’éducation.
Enjeu
L’ouverture des données et codes sources en matière d’éducation se heurte à plusieurs freins. D’une part, les données aujourd’hui disponibles sur la plateforme « data.education.gouv.fr » sont partielles puisqu’elles ne proviennent que du ministère de l’éducation nationale, alors même que les collectivités locales, des opérateurs du ministère ainsi que des acteurs privés sont aussi producteurs de données dans ce champ. D’autre part, l’ouverture des données dans le domaine éducatif pose un véritable enjeu « culturel » et de résistance au changement par la crainte d’un usage dévoyé des données mises à disposition du public.
Propositions
La création d’un Education Data Hub, à savoir une plateforme de données pour bâtir un service public performant, faire avancer la recherche et éclairer les décisions en matière d’éducation, permettrait de relancer la politique d’ouverture des données en matière éducative. Ce hub éducatif contribuerait à massifier les données et en favoriserait la réutilisation par le biais d’algorithmes permettant de les recouper de façon intelligente, de les tester et de proposer des modèles d’analyse prédictive. La réussite d’un tel projet est conditionnée à une mise en œuvre rigoureuse, s’agissant notamment de la qualité des données, de leur sécurité et du respect de la vie privée.
Comme le souligne le rapport sur la politique publique de la donnée du député Éric Bothorel 1 de décembre 2020, si la France fait partie des trois premiers pays des deux classements internationaux de référence en matière d’ouverture des données 2, l’essentiel des progrès réalisés dans ces classements est intervenu avant 2017 et la dynamique d’ouverture a depuis nettement ralenti, seule une minorité d’acteurs publics se conformant à la loi pour une République numérique du 7 octobre 2016. Le rapport identifie avec précision les différents facteurs stratégiques, techniques, organisationnels et humains expliquant ce ralentissement et formule des propositions pour une nouvelle dynamique de la politique publique de la donnée et des codes sources.
À l’occasion du cinquième comité interministériel de la transformation publique, le 5 février 2021, le Gouvernement a donné une première traduction à ces recommandations, avec l’ouverture annoncée de nouveaux jeux de données et codes sources, ainsi qu’avec la formalisation à venir d’une feuille de route interministérielle pour donner un nouveau souffle à cette politique publique. Dans ce contexte, alors que la crise sanitaire souligne à la fois le déficit et l’intérêt de l’ouverture des données en matière de santé, un autre domaine devrait faire l’objet d’une attention particulière dans la conduite de ce chantier : l’éducation.
L’ouverture des données engagée en matière d’éducation est encore inachevée
L’open data n’est pas étranger au domaine de l’éducation. Depuis 2016, la plateforme « data.education.gouv.fr » 3 permet d’ouvrir et de partager des données sur l’enseignement scolaire 4. La plateforme propose 56 jeux de données relatifs aux cursus et aux programmes, à l’orientation des élèves (vœux sur Parcoursup par exemple), à la gestion des établissements (données en équipements informatiques, temps scolaire, établissements de l’éducation prioritaire) et du ministère (budget, effectifs), en même temps que des données sur les résultats au brevet et au baccalauréat. Pour ce dernier examen, en plus du taux de succès brut de chaque établissement, des « indicateurs de valeur ajoutée » tenant compte des caractéristiques des élèves et des établissements sont proposés visant à évaluer plus finement la valeur ajoutée apportée par chaque établissement aux élèves.
Pour autant, l’ouverture des données et codes sources en matière d’éducation se heurte à plusieurs freins. D’abord, la plateforme « data.education.gouv.fr », qui ne concerne que les données et ne comprend pas de codes sources, n’est alimentée que par le ministère de l’éducation nationale, de la jeunesse et des sports, alors même que les collectivités locales, des opérateurs du ministère comme le centre national d’enseignement à distance ainsi que des acteurs privés sont aussi producteurs de données dans ce champ 5. De plus, la dispersion et l’actualisation des données publiées ne facilite pas leur lisibilité : la plateforme interministérielle « data.gouv.fr » propose ainsi 308 jeux de données publiés par le ministère (près de 70 % desquels n’ont pas été actualisés depuis 2016), et la tentative de répliquer la plateforme au niveau des régions académiques n’a pas eu le succès escompté 6.
Deux problématiques spécifiques restent alors à traiter. D’une part, les « traces numériques », c’est-à-dire les données générées par les élèves et les enseignants lors de l’utilisation de services numériques (livres électroniques, espaces numériques de travail, exercices en ligne), sont nombreuses mais seuls les éditeurs privés peuvent aujourd’hui y accéder ainsi que les chefs d’établissement, comme c’est le cas aujourd’hui avec le logiciel Pronote par exemple – et ce alors même que les infrastructures numériques utilisées peuvent avoir été financées par l’État et des collectivités locales. D’autre part, l’ouverture des données dans le domaine éducatif pose un véritable enjeu « culturel ».
Le rapport du député Éric Bothorel souligne ainsi que « certaines administrations vont jusqu’à évoquer le risque d’un usage néfaste des données mises à disposition du public. Par exemple, le ministère de l’éducation nationale souligne le risque d’utilisation des données de résultats scolaires à des fins de classements des établissements sur le seul critère de réussite au baccalauréat. […] La mission note toutefois que la presse reconstitue chaque année des classements sur les établissements scolaires, phénomène qui préexiste largement à l’open data, et ce, malgré l’absence de publication des données brutes par le ministère de l’éducation nationale ».
À ce titre, si l’annonce lors du cinquième comité interministériel de la transformation publique de l’ouverture des données relatives à la carte scolaire des collèges doit être saluée, il convient désormais de matérialiser le changement de méthode et d’échelle qu’appelle de ses vœux le rapport du député Éric Bothorel en centrant l’ouverture des données et codes sources dans l’éducation sur les utilisateurs et la diversité des réutilisations.
La création d’un Education Data Hub permettrait de relancer la politique d’ouverture des données en matière éducative
Par les inégalités d’accès à l’éducation qu’elle a révélées, la crise sanitaire a souligné la nécessité d’accélérer la transformation numérique en matière éducative. C’est dans ce cadre que les États généraux du numérique pour l’éducation de novembre 2020 ont formulé la proposition de créer un Education Data Hub, à savoir une plateforme de données pour bâtir un service public performant, faire avancer la recherche et éclairer les décisions en matière d’éducation 7.
Ce hub éducatif permettrait d’aller plus loin que les plateformes existantes en rassemblant les données des différentes parties prenantes publiques et privées. Les collectivités locales, les associations, les éditeurs privés ainsi que les startups seraient ainsi appelés à contribuer à la politique ambitieuse d’ouverture de données éducatives. L’Education Data Hub aurait aussi pour ambition d’enrichir les jeux de données mis à disposition, en ouvrant l’accès aux « traces numériques » et en encourageant l’utilisation de logiciels et de ressources éducatives libres.
Sur cette base, le hub devrait contribuer à massifier les données et en favoriser la réutilisation par le biais d’algorithmes permettant de les recouper de façon intelligente, de les tester et de proposer des modèles d’analyse prédictive. Les acteurs de la filière EdTech auraient ainsi accès à un jeu de données plus riche pour nourrir leurs offres et proposer des services personnalisés et adaptés aux besoins des élèves et des enseignants. En contrepartie, l’analyse des données disponibles permettrait d’évaluer les solutions numériques proposées, pour permettre aux décideurs de ne retenir que celles qui font leur preuve et qui sont les plus utilisées 8.
La réussite d’un tel projet est conditionnée à trois facteurs principaux, à savoir la qualité des données, leur sécurité et le respect de la vie privée. En premier lieu, la qualité des données fournies doit être suffisante pour permettre leur exploitation, en même temps que l’interopérabilité des systèmes doit être assurée pour garantir la réutilisation et la portabilité des données au profit de l’ensemble des parties prenantes dans la sphère éducative.
En second lieu, s’agissant de la sécurité des données, le hub éducatif pourrait s’inscrire dans le projet de cloud GaïaX, qui a pour objectif de fournir une infrastructure européenne de données sécurisée, évitant ainsi les inquiétudes relatives à un hébergement auprès d’une société américaine telles qu’elles étaient apparues pour le Health Data Hub. Enfin, la protection des données à caractère personnel, s’agissant qui plus est de données relatives à des mineurs, devra être garantie dans le cadre du règlement général européen sur la protection des données. Les enseignants, les chefs d’établissement et les élèves devront être formés aux enjeux de l’utilisation de leurs données et des délégués à la protection des données gagneraient à être systématiquement désignés 9. C’est dans cette perspective qu’un comité d’éthique pour les données d’éducation a été installé par le ministre de l’éducation nationale en octobre 2020 pour réfléchir aux enjeux éthiques associés aux données d’éducation 10.
En dépit des blocages et des résistances au changement, la création d’un Education Data Hub permettrait de relancer la dynamique d’ouverture des données en France. Initié et financé par le secteur public, ce hub éducatif permettrait de rallier l’ensemble des parties prenantes publiques et privées autour d’un projet d’avenir pour améliorer la qualité de l’offre éducative et construire une infrastructure numérique souveraine au profit des élèves et des enseignants. Car comme le soulignait Jules Michelet : « Quelle est la première partie de la politique ? L’éducation. La seconde ? L’éducation. Et la troisième ? L’éducation » 11.
- Mission Bothorel, décembre 2020, « Pour une politique publique de la donnée ».
- L’OURdata Index de l’OCDE (2ème place) et l’Open Data Maturity du Portail européen des données (3ème place).
- https://data.education.gouv.fr/pages/accueil/
- https://data.enseignementsup-recherche.gouv.fr/pages/home/
- Un seul jeu de données provient d’un opérateur sous tutelle du ministère, l’Office national d’information sur les enseignements et les professions.
- Deux plateformes ont été mises en place, pour la région académique de Normandie, qui compte six jeux de données, et d’Occitanie, qui est hors service.
- États généraux du numérique pour l’éducation, 2020, présentation synthétique des propositions, proposition n° 37.
- Marie-Christine Levet, Digital New Deal Foundation, 2019, « Préserver notre souveraineté éducative : soutenir l’EdTech française ».
- Inspection générale de l’éducation nationale et Inspection générale de l’administration de l’éducation nationale et de la recherche, 2018, « Données numériques à caractère personnel au sein de l’éducation nationale ».
- https://www.education.gouv.fr/installation-par-jean-michel-blanquer-du-comite-d-ethique-pour-les-donnees-d-education-11549
- Jules Michelet, 1846, « Le Peuple ».
ÉDITO
13 juillet 2023
LE NUMÉRIQUE AU SERVICE D’UN FUTUR DURABLE
« La “maison brûle”, ne laissons pas le thermomètre entre quelques mains… » Afin d’atteindre les Objectifs de Développement Durable, le think-tank Digital New Deal publie un nouveau rapport proposant que les données ESG, privatisées par 6 grandes compagnies américaines de notations, soient accessibles à tous via un commun numérique.
14 juin 2023
L’Open Source, chance unique de créer une IA de confiance européenne
L’avenir de la France se dessine aussi dans les lignes de code et les algorithmes. Face à la domination des géants américains et chinois en matière d’intelligence artificielle (IA), l’Europe, et la France en particulier, a une carte cruciale à jouer. Il est temps pour la France de prendre les devants et de se doter d’une IA de confiance pour renforcer sa souveraineté numérique et soutenir ses acteurs nationaux.
4 novembre 2022
Définir les normes, pas les subir.
Certains acteurs politiques et industriels critiquent la normalisation, allant pour les Britanniques jusqu’à justifier du Brexit du fait des contraintes normatives Européennes et du besoin de souveraineté. C’est oublier un peu rapidement que la normalisation est d’une part essentielle à la construction de la confiance et aux échanges économiques dans les pays modernes, et d’autre part que la normalisation est le résultat d’un consensus auquel chaque acteur peut contribuer. De fait, la normalisation n’est pas un objet éthéré qui tombe du ciel, mais le résultat d’un processus ouvert à toutes les organisations.
10 octobre 2022
La souveraineté numérique n’existe pas
La crise sanitaire que nous traversons aura eu le mérite de faire émerger des solutions, des talents, qui ont pu exprimer leur potentiel lors de ces circonstances exceptionnelles.
17 septembre 2022
POINT DE CLOUD SOUVERAIN SANS DATA DE CONFIANCE
La crise sanitaire que nous traversons aura eu le mérite de faire émerger des solutions, des talents, qui ont pu exprimer leur potentiel lors de ces circonstances exceptionnelles.
2 juillet 2022
Pour une IA des Lumières européenne
L’Intelligence Artificielle (IA) est au cœur des préoccupations et des fantasmes, sa simple définition constitue un défi en soi. Il est donc crucial que nous puissions y contribuer, afin de pouvoir offrir au monde une vision européenne, c’est-à-dire humaniste
7 mai 2022
RGPD, quatre ans après, enfin l’acte II
A mesure que se développent les outils numériques, l’ampleur de la collecte et du traitement des données personnelles ne cesse d’augmenter. Chez certains, cela a nourri des craintes d’intrusion dans la vie privée, par les États ou des acteurs privés, mais aussi de discrimination, de surveillance ou de manipulation. La réponse réglementaire européenne, le Règlement Général pour la Protection des Données (RGPD), visant à garantir tant la protection des données que leur libre circulation, a été globalement considérée comme salutaire dans le monde entier.
23 décembre 2021
SERVICE PUBLIC AUGMENTÉ, BÉNÉFICE COLLATÉRAL DU COVID
La crise sanitaire que nous traversons aura eu le mérite de faire émerger des solutions, des talents, qui ont pu exprimer leur potentiel lors de ces circonstances exceptionnelles. Comme en temps de guerre, des héros du quotidien issus de la société civile ont fait la fierté de nos concitoyens. Des infirmières que l’on applaudit, des caissières que l’on remercie, mais aussi… des geeks que l’on gratifie. En faisant chevalier de l’ordre national du Mérite le jeune Guillaume Rozier pour la création CovidTracker et Vitemadose, l’Etat prend acte de sa mue en institutionnalisant la participation des citoyens à la défense de l’intérêt général dont il n’a plus le monopole.
8 novembre 2021
« Cloud de confiance » : cuisine et dépendance
Les annonces gouvernementales en début d'année sur le « Cloud souverain » semblaient pourtant frappées du bon sens, et ont été d'ailleurs globalement bien accueillies. À un détail près peut-être, mais pas des moindres : la question des licences aux GAFAM. Beaucoup en effet considèrent que c'était ouvrir la porte en grand aux Big techs dont ils étaient supposés nous protéger. Les fervents défenseurs de notre indépendance technologique, économique et géopolitique, dont notre think-tank Digital New Deal fait partie, sont en droit de s'interroger.
30 juin 2021
Plateformes numériques : encore un effort pour être responsables !
Le président Trump chassé du réseau. La petite Mila pourchassée sur la toile. « La naissance du monde », célèbre toile de Courbet, interdite ! Chaque jour son lot de nouvelles étonnantes ou révoltantes qui montrent qu’il y a « quelque chose de pourri au royaume » des plateformes.
3 février 2021
Monopole de l’Apple Store : la grogne monte
Unique distributeur d’applications sur ses terminaux, Apple abuse de sa mainmise sur le marché mobile iOS. Les victimes ? Les éditeurs d’applications, contraints de se plier aux exigences de la plateforme, et les consommateurs, dont la liberté de choix semble en pâtir.
16 décembre 2020
« 1 JEUNE 1 PME » : L’EMPLOI DES JEUNES POUR ACCELERER LA TRANSITION NUMERIQUE DES TPE-PME FRANCAISES
L’instauration d’une dynamique nouvelle entre les filières du numérique de l’enseignement supérieur et les TPE-PME pourrait contribuer positivement à la transition numérique des entreprises, en même temps qu’à l’emploi des jeunes.
2 novembre 2020
UNE GOUVERNANCE POUR LA CIRCULATION DES DONNEES PERSONNELLES
L'article 20 du Règlement général sur la protection des données, qui consacre un droit à la portabilité des données, constitue une des clés pour mettre sur pied une architecture de circulation des données personnelles plus vertueuse que celle qu'ont mise en place les Big Tech.
27 octobre 2020
DATA : LA SEPARATION DES POUVOIRS POUR CONTRER LA MONARCHIE DES GAFAM
Notre dernière publication propose un modèle concret de partage des données personnelles, centré sur l’individu, offrant ainsi un modus operandi commun aux entreprises et collectivités afin qu’elles coopèrent et innovent.
12 octobre 2020
QUEL NOUVEAU SOUFFLE POUR L’ETAT PLATEFORME ?
Le besoin d’État s’accompagne d’une demande de transformation des moyens de l’action publique pour en assurer la réactivité, la résilience et la proximité avec les citoyens et les territoires.
5 mai 2020
NUMERIQUE EDUCATIF : ET APRES ?
La crise du Covid-19 a mis la résilience du système éducatif scolaire à rude épreuve, notamment pendant la période de confinement. En effet, l’impératif de continuité pédagogique du confinement a conduit à une expérience “grandeur nature” du numérique éducatif dans le milieu scolaire.
12 mars 2020
BIG TECH : L’HEURE EST A LA RESPONSABILITE
Alors qu’Internet est devenu l’espace central de la circulation de l’information, il devient crucial d’imposer aux géants du numérique, principaux acteurs d’échanges, un régime de responsabilité à la hauteur de l’influence qu’ils détiennent.
6 décembre 2019
DEFENDRE NOTRE EXCEPTION EDUCATIVE A L’ERE NUMERIQUE
L’impact systémique du numérique sur la société doit pousser l’Education nationale à sortir de son immobilité, à amorcer une mutabilité pérenne de l’institution scolaire.
20 septembre 2019
BIG TECH : L’HEURE EST A LA REGULATION PAR LA MULTITUDE
Face à la concentration inédite du pouvoir sur Internet dans les mains d’un petit nombre d’entreprises identifiées, quelle est la nature du contre-pouvoir à adopter ?
25 octobre 2018
SORTONS DE NOTRE PARALYSIE EN DEMYSTIFIANT LES GEANTS DU NET !
La dépendance à deux systèmes d’exploitation (OS), MS/DOS Windows et Unix/Linux constitue la racine commune des difficultés et effets secondaires négatifs de notre développement technologique actuel.
22 juin 2018
L’ADMINISTRATION, LA NOUVELLE AVENTURE ENTREPRENEURIALE ?
Aujourd’hui, l’innovation technologique profite majoritairement aux intérêts privés, et les innovations sociales – aussi prometteuses soient elles – peinent à atteindre une envergure à la hauteur des enjeux de société.