L’objectif est d’éviter la même naïveté que celle qui a marqué l’arrivée du Web2, il y a 25 ans, et qui nous a coûté si cher en termes de compétitivité et de souveraineté. Nous devons prévenir ce que nous appelons un “enfermement au carré” (GenAI = Web2²). Si nous n’agissons pas, nos entreprises risquent de se retrouver encore plus coincées par les BigTechs, prises d’un côté par leurs BigClouds (hyperscalers comme Azure, AWS ou GoogleCloud) et de l’autre par leurs BigAI (comme OpenAI ou Gemini).
« Face à cette révolution, les entreprises européennes doivent faire un choix : s’unir ou subir. Notre conviction c’est qu’en partageant les données de nos entreprises, nous pouvons co-construire une IA générative de confiance, performante et souveraine. »
Se montrer pragmatique face au gigantisme Nous devons être réalistes et concentrer nos efforts sur des objectifs atteignables. La course à l’accumulation de données pour les LLM est révolue (les Large Language Models sont déjà des produits standards selon Yann LeCun). Il ne sert à rien de chercher à scraper l’ensemble des données du web comme le font les géants. Non seulement cela soulève des questions éthiques et légales, mais cela nous fourvoie. L’Europe doit se concentrer sur une catégorie de données, celles qui ont le plus de valeur et les seules que les BigTechs n’ont pas encore : les données de nos entreprises.
Capitaliser sur les données privées et collaboratives Nous proposons donc de capitaliser sur ces données privées en nous appuyant sur la Data Strategy européenne. Stratégie consistant à encourager la mutualisation et le partage des données entre entreprises pour créer un marché commun de la donnée comparable aux marchés américain et chinois, et pouvoir, enfin, bénéficier de l’effet de réseau. Concrètement, cela passe par la participation aux Data Spaces, des écosystèmes de confiance offrant la bonne échelle et gouvernance pour créer des IA génératives adaptées à chaque filière. C’est la meilleure solution pour éviter la dépendance au “Powered by OpenAI”, ou la tentation contre-productive d’un modèle développé par une entreprise seule
Promouvoir les Data Spaces Des études américaines observent l’émergence d’un besoin de couches d’harmonisation des données nécessaires au développement de l’IA générative (“harmonized data layers”), et constatent que l’Europe a pris une longueur d’avance grâce à ses initiatives de Data Spaces issues du Data Governance Act (infrastructures de partage de données dotées d’une gouvernance de filière). Le rapport propose de s’appuyer sur ce second avantage compétitif, et de faire de ces écosystèmes de data de confiance, le socle d’une IA générative de confiance(performante, souveraine et éthique).
Faire le pari industriel des LAM (Large Action Models) En réponse au rapport Draghi qui encourage à prendre des paris technologiques audacieux, nous proposons de miser sur les Large Action Models (LAM). Plutôt que de se focaliser sur les modèles linguistiques (LLM), nous pensons que les Data Spaces devraient servir à créer des IA génératives dédiées à l’exécution autonome d’actions (agentification). Ces modèles innovants offrent à l’Europe un avantage stratégique grâce à l’accès aux données d’entreprises, un domaine où les Data Spaces sont particulièrement adaptés.
Suivre l’exemple concret du data space transport-tourisme EONA-X avec Gen4Travel EONA-X a lancé le consortium Gen4Travel pour développer un LAM dédié au secteur du voyage. Ce modèle permettra aux “Travel assistants conversationnels” des entreprises membres comme Accor ou ADP de devenir des agents intelligents autonomes pouvant automatiser des tâches complexes, telles que la réservation ou l’annulation de vols et d’hôtels en cas de problème (incluant la gestion des paiements). Prémunissant ainsi la filière du tourisme de la désintermédiation de trop par un “Booking ou Tripadvisor agentifié”.