Manifeste
De l’agent conversationnel au dispositif collectif
Au préalable de notre action, il y a une observation : de nouvelles pratiques informationnelles émergent chez les utilisateur·trices depuis le déploiement d’interfaces conversationnelles dans nos espaces numériques. Ceci, dans la mesure où les interactions en langage naturel avec la machine sont rendues possibles par les capacités des modèles de langage. Ce nouveau mode d’interaction transforme les habitudes de nombreuses personnes, dans leur manière d’accéder à la connaissance et de traiter celle-ci. Sans chercher à décrire exhaustivement les conséquences de ce nouveau rapport à la connaissance, nous pensons que l’approche connexioniste est devenue une partie intégrante du numérique. Et que celui-ci en tant que support cognitif est dorénavant grandement influencé par les réseaux de neurones artificiels et leurs applications de traitement automatique.
De ce constat, notre objectif est d’accompagner ces changements, de les orienter vers la coopération. Ainsi, nous cherchons à construire un dispositif qui favorise les activités réflexives et collectives. Pour cela, nous proposons un principe simple :
- Utiliser la génération automatique pour adresser des questions à une communauté.
Ceci, dans le contexte des bases de connaissance collaborative, wikis, afin de favoriser les contributions, la rédaction collective. En définitive, plutôt que de créer une machine imitant les capacités humaines, nous proposons de construire un outil favorisant le raisonnement humain.
Impacts
Au niveau social et environnemental, les impacts du déploiement de modèles de langage sont conséquents.
-
L’infrastructure exécutant les agents conversationnels nécessite une puissance énergétique considérable et la chaîne de valeur du matériel utilisé par les centres données favorise l’extractivisme minié. Par conséquence, cela amplifie la pollution environnementale et le réchauffement climatique.
-
Les technologies dites d’IA générative sont détenues, en majorité, par un monopole restreint d’acteurs privées, leur conférant une forte capacité d’influence cognitive sur la société.
Pour plus d’information sur les impacts, vous pouvez découvrir la cartographie du collectif Estampa : Cartographie IA générative
Une voie intermédiaire
Intégrant l’évolution des pratiques informationnelles et prenant en compte les impacts technologiques, nous cherchons à proposer une voie intermédiaire suivant un ensemble de principes techniques :
-
Un mode d’interactions collectif avec un modèle de langage : le modèle réalise des tâches de traitement automatique du langage à partir de connaissances communes pour répondre aux besoins d’une communauté.
-
Un système de requête, conçu et implémenté dans un processus libre et ouvert.
-
Un nombre de requêtes quotidiennes limitées à des tâches déterminées en amont.
-
L’utilisation de petits modèles de langage, exécutables sur CPU* et auto-hébergeables, via un moteur d’inférence open-source.
-
L’utilisation de modèles de langage, dont les sources de données et les méthodes d’apprentissage sont publics.
* Il s’agit de sélectionner des systèmes adaptés au matériel informatique accessible : L’exécution d’un petit modèle de langage nécessite un nombre d’opération (FLOPS) adapté à la plupart des processeurs (CPUs), alors que l’exécution d’un modèle de taille supérieure nécessite une infrastructure spécifique composée de GPUs, gourmande en énergie.
Manolia
Les principes énoncés forment l’amorce de Manolia, un outil à destination des contributeur·trices de bases de connaissances collaboratives, implémenté comme extension MediaWiki. Dans la mesure où les contributions dans un wiki émergent en partie de motivations sociales, notre objectif est de renforcer celles-ci. Ceci afin de produire à une amélioration de la qualité et la pertinence des connaissances communes.
Ainsi, nous nous concentrons sur deux fonctionnalités simples et complémentaires :
-
La génération d’une liste de questions adressées aux contributeur·trices, représentant les besoins d’information de la communauté.
-
Un système de suggestion des sources de connaissance à améliorer, pour chaque question générée.
En résumé, nous proposons d’utiliser les capacités d’un modèle de langage pour détecter, synthétiser et formaliser les besoins d’information d’une communauté, par la génération de questions. Ces dernières font appel au raisonnement humain sur la connaissance et appuient ainsi les contributions.
Au final, Manolia vise à améliorer le système de connaissance et d’accès à l’information de petite et moyenne communauté, en toute indépendance du monopole des principaux fournisseurs de technologies d’IA.
Sponsor
CC BY-SA 4.0