#4.21 IBM se lance dans le data mesh avec Data Product Hub
Decideo - Data Science, Big Data, Intelligence Augmentée
Release Date: 06/26/2024
Decideo - Data Science, Big Data, Intelligence Augmentée
Un « nouveau » paradigme apparait, le SaaS ! Non, pas celui que vous croyez ! Vous vous dites, ça y est, on l’a perdu ! Il est resté en 1999 à la création de Salesforce ! Non, car si le SaaS est bien vivant depuis 25 ans, le nouveau SaaS pointerait le bout de son nez selon les oracles du marketing. Nous serions en train de passer du Software as a Service au Service as a Software. Que c’est beau le monde du marketing ! Allez, je vous explique. Le principe du Software as a Service a combiné depuis plus de deux décennies l’évolution...
info_outline #5.4 Jean-Georges Perrin, Pape du Data Mesh et des Data ContractsDecideo - Data Science, Big Data, Intelligence Augmentée
Dans cet épisode, nous recevons Jean-Georges Perrin. Ce nom ne peut vous être inconnu si vous vous intéressé au "shift-left" qui émerge dans le monde des données. Les utilisateurs prennent peu à peu le contrôle de leurs données, et cela a été théorisé en 2020 dans un livre développant le concept de Data Mesh. Au Data Mesh, il manquait une dimension, celle du "comment". Jean-Georges Perrin a été un des premiers à mettre en application ce concept, chez Paypal. Et parmi les premiers, avec Andrew Jones, à s'intéresser aux supports du Data Mesh, les Data Contracts. Au point qu'il...
info_outline #5.3 Cartographie des données et des systèmes avec David Bougearel de CartographitDecideo - Data Science, Big Data, Intelligence Augmentée
Dans cet épisode, nous recevons David Bougearel, fondateur de Cartographit, un nouvel outil de cartographie du système d'information, qui s'appuie sur les normes de cartographie de l'ANSSI. Les différentes couches cartographiées incluent donc les couches des données, des processus et des applications. Cela fait-il de Cartographit un outil potentiel de gouvernance des données ? Nous abordons ce sujet et différentes questions connexes. - La cartographie du Système d'Information (SI) offre une vue d'ensemble, un inventaire global du SI, incluant les données (objets d'information)....
info_outline #5.2 IA ? Et si nous parlions français !Decideo - Data Science, Big Data, Intelligence Augmentée
Vous en avez assez d’entendre parler de LLM, de prompt, de text token, ou de adversarial machine learning ? Ça tombe bien, le 6 septembre dernier, le Journal Officiel de la République Française a publié, pour la rentrée des classes, la liste relative au vocabulaire de l’intelligence artificielle. La commission d’enrichissement de la langue française a retenu quatorze termes ; elle les a traduits, et définit. Ainsi, vous pourrez parler de Grands Modèles de Langage, les GML ; d’instructions génératives pour les prompts, de jeton textuel pour les text...
info_outline #5.1 Le MIT classe 777 risques potentiels liés à l'IADecideo - Data Science, Big Data, Intelligence Augmentée
Le MIT a recensé 777 risques potentiels liés à l’IA dans une base de données partagée gratuitement Cet été, le MIT nous a fait un cadeau ! Le prestigieux organisme de recherche américain a publié un référentiel complet des risques liés à l’intelligence artificielle. L’objectif : vous aider à cartographier l’ensemble des risques qui pèsent sur votre entreprise afin de les mesurer, les quantifier et les mitiger par la suite. Si vous suivez mes contenus sur le thème de la gouvernance des données et de l’intelligence artificielle, vous avez déjà été...
info_outline #4.24 Gagner aux JO, est-ce une question de data ?Decideo - Data Science, Big Data, Intelligence Augmentée
Vous avez 23 ans, vous mesurez 1 mètre 77, et vous pesez 72 kilos ? Vous avez, contrairement à moi, le profil idéal pour remporter le 100 mètres, épreuve reine de l’athlétisme aux jeux olympiques. Si en revanche vous avez plus de 27 ans… désolé, vous êtes déjà disqualifié par l’analyse statistique. Cependant, si vous êtes un peu en surpoids, jusqu’à 108 kilos, vous pouvez tenter le lancer de poids. Les grands triompheront au lancer de disque, quant aux plus petits qu’un mètre soixante… ils n’ont que peu de chance d’obtenir une médaille en athlétisme. Non,...
info_outline #4.23 Gouvernance des données orientée métier, quelques prérequisDecideo - Data Science, Big Data, Intelligence Augmentée
Gouvernance des données : quelques prérequis organisationnels Ayant l’opportunité d’accompagner de nombreuses entreprises dans la mise en place d’une gouvernance des données orientée métier, je voudrais partager avec vous aujourd’hui quelques prérequis organisationnels. Eloignés des habituels conseils sur les outils à déployer, je constate que les premiers pas à réaliser, et pas les plus faciles, sont liés aux personnes et à l’organisation. Trois questions ! Qui ? Cela peut paraitre évident, mais dans la réalité, la nomination claire et affirmée de la...
info_outline #4.22 La donnée sous tous les angles, avec Philippe Charpentier, CTO de NetAppDecideo - Data Science, Big Data, Intelligence Augmentée
Avec Philippe Charpentier, le CTO de NetApp France, nous abordons le "contenant" des données. Contenant et contenu sont mutuellement indispensables, et ils répondent tous deux à des contraintes différentes : - Les data sont enfin reconnues comme des actifs informationnelles de l'entreprise, il faut donc les protéger. Quels sont les enjeux actuels liés à la sécurité et à la confidentialité de ces données collectées par toutes les entreprises ? - Peut-on et doit-on tout conserver ? L'IA semble nous dire que oui, les lois sont un peu moins d'accord. Comment arbitrer ? - Un des...
info_outline #4.21 IBM se lance dans le data mesh avec Data Product HubDecideo - Data Science, Big Data, Intelligence Augmentée
IBM se lance à son tour dans le data mesh et les data products. L’entreprise l’a annoncé cette semaine, à l’occasion d’un séminaire de présentation de son offre appelée IBM Data Product Hub. Cette tendance, le « shift left », consiste à transférer peu à peu la responsabilité des data aux utilisateurs métiers, et l’autonomie qui va avec. Que vous appliquiez à la lettre les principes du data mesh ou si vous créez simplement des data products pour remplacer vos entrepôts de données centralisés, vous allez passer par la recherche et l’installation d’une...
info_outline #4.20 Cinq ans de prison, si vous tentez de prévoir les décisions d'un jugeDecideo - Data Science, Big Data, Intelligence Augmentée
5 ans de prison, si vous tentez de prévoir la décision d’un juge … mais comme toujours, les lignes jaunes sont contournables, pour peu que l’on prenne le temps de comprendre la loi. Je vous parle ici d’une disposition liée à l’utilisation de l’intelligence artificielle dans le cadre de procédures judiciaires, tentant de prédire quel sera le comportement de tel ou tel juge dans une affaire, et pour les parties prenantes d’adapter leur stratégie. Aux Etats-Unis, vous l’avez certainement vu dans de nombreuses séries criminelles, la technologie est utilisée pour analyser...
info_outlineIBM se lance à son tour dans le data mesh et les data products. L’entreprise l’a annoncé cette semaine, à l’occasion d’un séminaire de présentation de son offre appelée IBM Data Product Hub.
Cette tendance, le « shift left », consiste à transférer peu à peu la responsabilité des data aux utilisateurs métiers, et l’autonomie qui va avec.
Que vous appliquiez à la lettre les principes du data mesh ou si vous créez simplement des data products pour remplacer vos entrepôts de données centralisés, vous allez passer par la recherche et l’installation d’une plateforme de jeux de données. Amazon, SAP, Microsoft mais également des éditeurs spécialisés comme Zeena, Meta-Analysis ou Orkestra Data se sont lancés dans la course. Nous en avons déjà parlé ici.
Signe que le sujet du data mesh devient incontournable, IBM se lance à son tour.
Difficile de remettre en question ses habitudes de centralisation ! IBM annonce Data Product Hub, une plateforme, centralisée, pour stocker les data products.
Les sources de données sont des entrepôts de données ou des lakehouses – 57 connecteurs sont annoncés. Les jeux de données peuvent ensuite être analysés avec Tableau, Watsonx de IBM ou encore en Python via la librairie Pandas. Le plan de développement prévoit l’incorporation d’IA générative dans les prochaines versions, fin 2024 et début 2025.
Les consommateurs de données peuvent envoyer des requêtes, demandant à accéder aux données qui les intéressent. Les producteurs de données peuvent personnaliser les formats de génération des jeux de données, pour s’adapter aux besoins de leurs consommateurs.
La gouvernance de l’ensemble est bien sur facilitée. Si vous utilisez le catalogue de données IBM Knowledge Catalog, le Data Product Hub pourra s’y connecter. Une intégration avec Informatica est prévue fin 2024. Les jeux de données peuvent être générés et stockés, ou pourront être virtualisés à partir de fin 2024. La génération et la mise à jour des data products sera automatisée dans la version de début 2025.
Point très important, des data contracts et des niveaux de service peuvent être implémentés afin de gouverner les échanges de données. Un tableau de bord de suivi est même prévu. Ces contrats « lisibles par la machine » permettront dans la version de début 2025, de mettre en place un suivi automatisé de la gouvernance.
Le Data Product Hub de IBM sera disponible en version on-premise, à l’achat ou à la location, ainsi qu’en version SaaS hébergée dans le cloud IBM, ou dans d’autres grands clouds. Une version d’essai de 60 jours sera proposée par l’éditeur. La version perpétuelle sera proposée à partir de 250 000 $, ou en location à partir de 100 000 $ par an. Le Data Product Hub est un nouveau composant ajouté à la Data Fabric de IBM.
Préparant le futur, et la monétisation des données, IBM inclut une fonction de place de marché – on appelle également cela un Data Space. Mais dès maintenant, les consommateurs de données peuvent l’utiliser pour rechercher un jeu de données répondant à leurs besoins. Avec toutes les difficultés que l’on constate lors des tentatives de création de catalogues de données métier, on peut espérer que les catalogues de jeux de données seront adoptés, par les producteurs et les consommateurs, et seront alors correctement catalogués !