#4.10 Les prompts sont des données : il va falloir les cataloguer
Decideo - Data Science, Big Data, Intelligence Augmentée
Release Date: 04/21/2024
Decideo - Data Science, Big Data, Intelligence Augmentée
- On associe souvent l'éthique à la conscience humaine qui doit prendre des décisions. Or les IA n'ont pas de conscience, donc pourquoi doit-on parler d'éthique de l'IA ? - Vous avez choisi d'écrire votre livre en vous adressant à votre fils ? Pensez vous que les plus jeunes générations soient plus ou moins sensibles que nous à l'éthique ? - Comment circoncir l'éthique de l'IA ? En Chine le crédit social est acceptable, pas en Europe. En Iran, une IA générative développée par le pouvoir enseigne le Coran, aux Etats Unis les armes létales autonomes sont déjà une...
info_outlineDecideo - Data Science, Big Data, Intelligence Augmentée
Natalie Maroun (Photo Crédit Lakhdar Bouzouaid) est directrice associée du Cabinet Element, spécialisé en communication de crise. Elle vient de publier chez Dunod, un ouvrage dans la collection "Boites à outils" : La boite à outils de la communication de crise. Nous avons eu envie de parler ensemble des données au service de la communication de crise. Cette étape que tout le monde redoute, nécessite pour être franchie avec succès d'avoir accès sans délai, aux bonnes données. Comment s'y préparer ? Pages : 192 pages Format : 190 x 240 mm ...
info_outlineDecideo - Data Science, Big Data, Intelligence Augmentée
Aujourd'hui nous découvrons qu'à l'heure ou l'indépendance technologique doit être mieux préservée, il est possible de construire sa plateforme de données, avec des solutions 100% françaises. Nous en parlons avec Sandra Mathieu, co-fondatrice de Adobis Group. Adobis group, on ne connait pas encore bien votre entreprise, pourtant vous êtes un des seuls éditeurs de logiciels de "data platform" français. A une heure où on parle beaucoup de souveraineté, c'est un différenciateur ? - Alors cette plateforme, elle vient se frotter à de très nombreux acteurs, américains pour la...
info_outlineDecideo - Data Science, Big Data, Intelligence Augmentée
L'IA on en parle à coups de milliards, de data centers, et de LLMs... mais on parle peu des données : expliquez nous l'importance des données dans le processus d'intelligence artificielle - On parle parfois des données synthétiques qui permettraient de compenser l'absence de données réelles. Vous n'y croyez pas ? - Vous mentionnez les data space, et vous dites que des milliards ont été investi sur le sujet. De quoi s'agit-il et ou sont passés les milliards ? Parce que honnêtement, personne ne connait ! - Aux Etats-Unis, ils sont plutôt bons pour la collecte de données, mais ils...
info_outlineDecideo - Data Science, Big Data, Intelligence Augmentée
Un « nouveau » paradigme apparait, le SaaS ! Non, pas celui que vous croyez ! Vous vous dites, ça y est, on l’a perdu ! Il est resté en 1999 à la création de Salesforce ! Non, car si le SaaS est bien vivant depuis 25 ans, le nouveau SaaS pointerait le bout de son nez selon les oracles du marketing. Nous serions en train de passer du Software as a Service au Service as a Software. Que c’est beau le monde du marketing ! Allez, je vous explique. Le principe du Software as a Service a combiné depuis plus de deux décennies l’évolution...
info_outlineDecideo - Data Science, Big Data, Intelligence Augmentée
Dans cet épisode, nous recevons Jean-Georges Perrin. Ce nom ne peut vous être inconnu si vous vous intéressé au "shift-left" qui émerge dans le monde des données. Les utilisateurs prennent peu à peu le contrôle de leurs données, et cela a été théorisé en 2020 dans un livre développant le concept de Data Mesh. Au Data Mesh, il manquait une dimension, celle du "comment". Jean-Georges Perrin a été un des premiers à mettre en application ce concept, chez Paypal. Et parmi les premiers, avec Andrew Jones, à s'intéresser aux supports du Data Mesh, les Data Contracts. Au point qu'il...
info_outlineDecideo - Data Science, Big Data, Intelligence Augmentée
Dans cet épisode, nous recevons David Bougearel, fondateur de Cartographit, un nouvel outil de cartographie du système d'information, qui s'appuie sur les normes de cartographie de l'ANSSI. Les différentes couches cartographiées incluent donc les couches des données, des processus et des applications. Cela fait-il de Cartographit un outil potentiel de gouvernance des données ? Nous abordons ce sujet et différentes questions connexes. - La cartographie du Système d'Information (SI) offre une vue d'ensemble, un inventaire global du SI, incluant les données (objets d'information)....
info_outlineDecideo - Data Science, Big Data, Intelligence Augmentée
Vous en avez assez d’entendre parler de LLM, de prompt, de text token, ou de adversarial machine learning ? Ça tombe bien, le 6 septembre dernier, le Journal Officiel de la République Française a publié, pour la rentrée des classes, la liste relative au vocabulaire de l’intelligence artificielle. La commission d’enrichissement de la langue française a retenu quatorze termes ; elle les a traduits, et définit. Ainsi, vous pourrez parler de Grands Modèles de Langage, les GML ; d’instructions génératives pour les prompts, de jeton textuel pour les text...
info_outlineDecideo - Data Science, Big Data, Intelligence Augmentée
Le MIT a recensé 777 risques potentiels liés à l’IA dans une base de données partagée gratuitement Cet été, le MIT nous a fait un cadeau ! Le prestigieux organisme de recherche américain a publié un référentiel complet des risques liés à l’intelligence artificielle. L’objectif : vous aider à cartographier l’ensemble des risques qui pèsent sur votre entreprise afin de les mesurer, les quantifier et les mitiger par la suite. Si vous suivez mes contenus sur le thème de la gouvernance des données et de l’intelligence artificielle, vous avez déjà été...
info_outlineDecideo - Data Science, Big Data, Intelligence Augmentée
Vous avez 23 ans, vous mesurez 1 mètre 77, et vous pesez 72 kilos ? Vous avez, contrairement à moi, le profil idéal pour remporter le 100 mètres, épreuve reine de l’athlétisme aux jeux olympiques. Si en revanche vous avez plus de 27 ans… désolé, vous êtes déjà disqualifié par l’analyse statistique. Cependant, si vous êtes un peu en surpoids, jusqu’à 108 kilos, vous pouvez tenter le lancer de poids. Les grands triompheront au lancer de disque, quant aux plus petits qu’un mètre soixante… ils n’ont que peu de chance d’obtenir une médaille en athlétisme. Non,...
info_outlineLes prompts sont des données : va-t-il falloir les cataloguer ?
Selon une enquête de l’Associated Press, déjà 70 % des rédacteurs utilisent l’IA générative pour produire du contenu. Les données sont omniprésentes dans la démarche : dans l’alimentation des modèles, dans les prompts et dans les contenus produits.
Si j’écris demain un article à l’aide d’un traitement de texte, c’est moi qui en serai l’auteur et non Word. Mais si j’écris les prompts qui me permettent de demander à ChatGPT de produire cet article, ou le code d’un logiciel, ce serait donc ChatGPT qui deviendrait l’auteur ? Non, et heureusement, il a déjà été établi par jurisprudence dans plusieurs pays, qu’une IA ne pouvait pas obtenir de droits de propriété sur ses propres créations. L’IA n’a pas de personnalité juridique. C’est l’Humain qui a piloté l’IA qui est reconnu comme auteur de ses créations.
Mais demain, le journaliste, le scénariste, mais également le programmeur, le rédacteur de documentation, ne manipuleront plus directement les mots, mais les prompts qui serviront à les produire. Pourrait-on aller jusqu’à déposer et protéger un prompt, tout comme on protège un livre, un logiciel ou un scénario ? Peut-être est-ce une idée à creuser. Juristes spécialistes de la propriété intellectuelle, je vous lance la perche !
En tous cas, ces prompts, ce sont également des données. Et il faut les collecter, les stocker, et donc peut-être les protéger, afin de faire le lien entre le prompt et le contenu qu’il a produit.
En entreprise, la réplicabilité et l’explicabilité sont des sujets importants. Si je lance deux fois la même requête sur une même base de données, je dois obtenir le même résultat. Sinon, j’ai un problème. Êtes-vous certain que le même prompt lancé dans le même outil d’IA générative, produira le même contenu ?
Je ne crois pas, et c’est un vrai problème.
Si j’utilise l’IA générative pour transformer une question en langage naturel en requête SQL, la même question donnera-t-elle toujours la même réponse ? Si non, ça sent le crépage de chignon en réunion du lundi matin. Ça peut faire sourire, mais imaginez que votre tableau Excel donne des résultats différents en fonction de l’heure de la journée, de la météo ou de l’âge du capitaine.
Je vous parle beaucoup en ce moment de gouvernance de l’intelligence artificielle. Une des facettes de cette gouvernance, sera la gestion des prompts. Leur historisation, la traçabilité de leur cycle de vie, le lien entre le prompt et son résultat, etc. Des tas de métadonnées qu’il va falloir organiser.
Je ne sais pas encore comment nous l’appellerons, mais c’est un outil qu’il va falloir inventer. On y retrouvera :
- L’historisation des prompts utilisés, et de leurs métadonnées ;
- La traçabilité, le lineage, qui a mené du prompt au résultat. Quel modèle a été utilisé, quelle version, quelles données d’entrainement, etc..
Cet outil permettra également de vérifier les droits d’accès, la conformité des données utilisées, et produites. Et il assurera la piste d’audit nécessaire pour qu’en cas de besoin, le service conformité ou audit interne, voir une autorité extérieure, puissent remonter l’historique.
Vous voyez que le sujet de la gouvernance de l’IA, et des données qui vont avec, n’est pas une mince affaire. On est loin de votre ado tout fier d’avoir utilisé ChatGPT pour rédiger 10 lignes sur la révolution russe !
Si vous envisagez une utilisation sérieuse, et en production, de l’intelligence artificielle, vous devrez passer par les étapes que je viens de décrire. Et si vous cherchez une idée de business à créer dans le domaine du logiciel, regardez du côté d’une plate-forme de traçabilité des usages de l’IA en entreprise… il y a tout un marché !