loader from loading.io

#4.8 SAP Datasphere et le data mesh

Decideo - Data Science, Big Data, Intelligence Augmentée

Release Date: 04/08/2024

#5.9 L'éthique de l'IA expliquée à mon fils, avec Enrico Panaï show art #5.9 L'éthique de l'IA expliquée à mon fils, avec Enrico Panaï

Decideo - Data Science, Big Data, Intelligence Augmentée

- On associe souvent l'éthique à la conscience humaine qui doit prendre des décisions. Or les IA n'ont pas de conscience, donc pourquoi doit-on parler d'éthique de l'IA ? - Vous avez choisi d'écrire votre livre en vous adressant à votre fils ? Pensez vous que les plus jeunes générations soient plus ou moins sensibles que nous à l'éthique ? - Comment circoncir l'éthique de l'IA ? En Chine le crédit social est acceptable, pas en Europe. En Iran, une IA générative développée par le pouvoir enseigne le Coran, aux Etats Unis les armes létales autonomes sont déjà une...

info_outline
#5.8 Natalie Maroun nous parle de données et de communication de crise show art #5.8 Natalie Maroun nous parle de données et de communication de crise

Decideo - Data Science, Big Data, Intelligence Augmentée

Natalie Maroun (Photo Crédit Lakhdar Bouzouaid) est directrice associée du Cabinet Element, spécialisé en communication de crise. Elle vient de publier chez Dunod, un ouvrage dans la collection "Boites à outils" : La boite à outils de la communication de crise. Nous avons eu envie de parler ensemble des données au service de la communication de crise. Cette étape que tout le monde redoute, nécessite pour être franchie avec succès d'avoir accès sans délai, aux bonnes données. Comment s'y préparer ? Pages : 192 pages Format : 190 x 240 mm ...

info_outline
#5.7 Data Chain, une plateforme de données française, avec Sandra Mathieu de Adobis Group show art #5.7 Data Chain, une plateforme de données française, avec Sandra Mathieu de Adobis Group

Decideo - Data Science, Big Data, Intelligence Augmentée

Aujourd'hui nous découvrons qu'à l'heure ou l'indépendance technologique doit être mieux préservée, il est possible de construire sa plateforme de données, avec des solutions 100% françaises. Nous en parlons avec Sandra Mathieu, co-fondatrice de Adobis Group. Adobis group, on ne connait pas encore bien votre entreprise, pourtant vous êtes un des seuls éditeurs de logiciels de "data platform" français. A une heure où on parle beaucoup de souveraineté, c'est un différenciateur ? - Alors cette plateforme, elle vient se frotter à de très nombreux acteurs, américains pour la...

info_outline
#5.6 De l'IA oui, mais pas sans Data Spaces, avec Matthias de Bièvre, VISIONS show art #5.6 De l'IA oui, mais pas sans Data Spaces, avec Matthias de Bièvre, VISIONS

Decideo - Data Science, Big Data, Intelligence Augmentée

L'IA on en parle à coups de milliards, de data centers, et de LLMs... mais on parle peu des données : expliquez nous l'importance des données dans le processus d'intelligence artificielle - On parle parfois des données synthétiques qui permettraient de compenser l'absence de données réelles. Vous n'y croyez pas ? - Vous mentionnez les data space, et vous dites que des milliards ont été investi sur le sujet. De quoi s'agit-il et ou sont passés les milliards ? Parce que honnêtement, personne ne connait ! - Aux Etats-Unis, ils sont plutôt bons pour la collecte de données, mais ils...

info_outline
#5.5 Le nouveau SaaS, vous connaissez ? show art #5.5 Le nouveau SaaS, vous connaissez ?

Decideo - Data Science, Big Data, Intelligence Augmentée

Un « nouveau » paradigme apparait, le SaaS ! Non, pas celui que vous croyez ! Vous vous dites, ça y est, on l’a perdu ! Il est resté en 1999 à la création de Salesforce ! Non, car si le SaaS est bien vivant depuis 25 ans, le nouveau SaaS pointerait le bout de son nez selon les oracles du marketing. Nous serions en train de passer du Software as a Service au Service as a Software. Que c’est beau le monde du marketing ! Allez, je vous explique. Le principe du Software as a Service a combiné depuis plus de deux décennies l’évolution...

info_outline
#5.4 Jean-Georges Perrin, Pape du Data Mesh et des Data Contracts show art #5.4 Jean-Georges Perrin, Pape du Data Mesh et des Data Contracts

Decideo - Data Science, Big Data, Intelligence Augmentée

Dans cet épisode, nous recevons Jean-Georges Perrin. Ce nom ne peut vous être inconnu si vous vous intéressé au "shift-left" qui émerge dans le monde des données. Les utilisateurs prennent peu à peu le contrôle de leurs données, et cela a été théorisé en 2020 dans un livre développant le concept de Data Mesh. Au Data Mesh, il manquait une dimension, celle du "comment". Jean-Georges Perrin a été un des premiers à mettre en application ce concept, chez Paypal. Et parmi les premiers, avec Andrew Jones, à s'intéresser aux supports du Data Mesh, les Data Contracts. Au point qu'il...

info_outline
#5.3 Cartographie des données et des systèmes avec David Bougearel de Cartographit show art #5.3 Cartographie des données et des systèmes avec David Bougearel de Cartographit

Decideo - Data Science, Big Data, Intelligence Augmentée

Dans cet épisode, nous recevons David Bougearel, fondateur de Cartographit, un nouvel outil de cartographie du système d'information, qui s'appuie sur les normes de cartographie de l'ANSSI. Les différentes couches cartographiées incluent donc les couches des données, des processus et des applications. Cela fait-il de Cartographit un outil potentiel de gouvernance des données ? Nous abordons ce sujet et différentes questions connexes. - La cartographie du Système d'Information (SI) offre une vue d'ensemble, un inventaire global du SI, incluant les données (objets d'information)....

info_outline
#5.2 IA ? Et si nous parlions français ! show art #5.2 IA ? Et si nous parlions français !

Decideo - Data Science, Big Data, Intelligence Augmentée

Vous en avez assez d’entendre parler de LLM, de prompt, de text token, ou de adversarial machine learning ? Ça tombe bien, le 6 septembre dernier, le Journal Officiel de la République Française a publié, pour la rentrée des classes, la liste relative au vocabulaire de l’intelligence artificielle. La commission d’enrichissement de la langue française a retenu quatorze termes ; elle les a traduits, et définit.   Ainsi, vous pourrez parler de Grands Modèles de Langage, les GML ; d’instructions génératives pour les prompts, de jeton textuel pour les text...

info_outline
#5.1 Le MIT classe 777 risques potentiels liés à l'IA show art #5.1 Le MIT classe 777 risques potentiels liés à l'IA

Decideo - Data Science, Big Data, Intelligence Augmentée

Le MIT a recensé 777 risques potentiels liés à l’IA dans une base de données partagée gratuitement Cet été, le MIT nous a fait un cadeau ! Le prestigieux organisme de recherche américain a publié un référentiel complet des risques liés à l’intelligence artificielle. L’objectif : vous aider à cartographier l’ensemble des risques qui pèsent sur votre entreprise afin de les mesurer, les quantifier et les mitiger par la suite. Si vous suivez mes contenus sur le thème de la gouvernance des données et de l’intelligence artificielle, vous avez déjà été...

info_outline
#4.24 Gagner aux JO, est-ce une question de data ? show art #4.24 Gagner aux JO, est-ce une question de data ?

Decideo - Data Science, Big Data, Intelligence Augmentée

Vous avez 23 ans, vous mesurez 1 mètre 77, et vous pesez 72 kilos ? Vous avez, contrairement à moi, le profil idéal pour remporter le 100 mètres, épreuve reine de l’athlétisme aux jeux olympiques. Si en revanche vous avez plus de 27 ans… désolé, vous êtes déjà disqualifié par l’analyse statistique. Cependant, si vous êtes un peu en surpoids, jusqu’à 108 kilos, vous pouvez tenter le lancer de poids. Les grands triompheront au lancer de disque, quant aux plus petits qu’un mètre soixante… ils n’ont que peu de chance d’obtenir une médaille en athlétisme. Non,...

info_outline
 
More Episodes

SAP et le data mesh

Depuis que le concept de data mesh a émergé en 2019, la réponse des grands éditeurs de solutions centralisées était attendue. SAP n’étant clairement pas un ardent défenseur de la décentralisation, il était légitime pour ses clients de se demander comment l’editeur allait aborder le sujet.

Lancé en 2019, formalisé en 2022 dans le livre éponyme, le concept de data mesh a convaincu un certain nombre d’entreprises comme Suez, Le bon coin, Paypal, Eurotunnel, etc. Certains ne le nomment pas, et en choisissent les principes qu’ils souhaitent appliquer. Mais tous font un pas vers la décentralisation de la responsabilité des données vers les domaines métiers, et la migration de data warehouses centralisés vers des data products, décentralisés fonctionnellement et centralisés techniquement.

Centraliser les données ou les jeux de données ?

La réponse de SAP est apparue récemment, elle s’appelle SAP Datasphere. Soit pour ne pas avoir à payer de royalties, soit pour ne pas avouer qu’il n’est pas l’inventeur du concept, SAP n’utilise quasiment pas l’expression data mesh dans sa communication. Mais l’objectif est clairement de répondre à cette évolution. Voyons ensemble comment.

Il y a quelques années, SAP migrant vers le cloud, proposait comme solution centrale à un système décisionnel son offre SAP Data Warehouse Cloud. Evoluant sur les plans technologiques et marketing, SAP Data Warehouse Cloud est devenu SAP Datasphere. Et il y a tout juste un an, SAP a présenté SAP business data fabric, basée sur SAP Datasphere comme coeur de la conception des systèmes décisionnels pour ses clients. “i[Data Fabric est une architecture technique, qui permet de rassembler des données hétérogènes en provenance de plusieurs sources]i”, explique Wolfgang Epting, expert produit chez SAP. On est donc bien dans une architecture de centralisation des données. Mais en réalité, SAP défend que SAP Datasphere peut être utilisé pour centraliser, de manière technique uniquement, des données ou des jeux de données (data products) qui peuvent provenir de sources externes.

Ainsi, en définissant et construisant les data products dans les domaines métier, comme le préconise le data mesh, mais en les stockant dans la SAP business data fabric, cette dernière devient une plateforme selfservice de jeux de données. Les quatre principes du data mesh sont bien respectés : les domaines, les jeux de données, la plateforme en libre-service, et la gouvernance fédéralisée.

Il faudra cependant resister à la tentation de stocker les données unitaires dans SAP business data fabric et d’y fabriquer les jeux de données, auquel cas il n’y aurait plus de décentralisation et l’on retrouverait le trio data warehouse - data lake - data mart. Le data mesh est avant tout un changement de paradigme, une organisation différente, décentralisant la responsabilité des données dans les métiers, et modifiant la répartition des rôles entre l’informatique et les métiers. Les luttes de pouvoir pourraient se réveiller à l’occasion de cette mise en place…

Cataloguer, la première pierre de l’édifice

Qu’il s’agisse de gouvernance ou de data mesh, le catalogue des données est au centre du dispositif. SAP ou pas, sans catalogue de données, toute la gouvernance et la décentralisation des responsabilités vers les métiers, seront incomplètes et surtout bien compliquées à appliquer.

SAP s’est beaucoup appuyé sur ses partenaires pour la création du catalogue des données. Collibra semble le partenaire éditeur privilégié. D’ailleurs, en terme de couverture fonctionnelle, comme de coût et de délai de mise en place, il n’est pas rare d’entender Collibra qualifié de “SAP des catalogues de données”.

Jusqu’à ce que SAP annonce sa propre solution, SAP Datasphere Catalog. Il permet “ i[de découvrir, gérer et controler, toutes les données afin de garantir une gouvernance transverse de l’ensemble de leur cycle de vie]i”, explique Wolfgang Epting. Il s’appuie sur un graphe de connaissance, qui met en relation les données, les métadonnées, et les processus métier. Dès la version 1.0 de SAP Datasphere, publiée en janvier 2024, il est possible de rechercher en une fois des données et des jeux de données dans le catalogue.

Dans la feuille de route publiée par SAP, la connexion entre les data products et le catalogue de données, est prévue pour le dernier trimestre 2024. Les data products pourront alors s’enrichir des métadonnées du catalogue. Le catalogue de données pourrait alors devenir un catalogue de data products. L’extraction automatique des métadonnées pour alimenter Datasphere est prévue pour le premier trimestre 2025. Une question intéressante se pose alors en ce qui concerne l’avenir de la coopétition avec Collibra, et de l’impact de SAP Datasphere Catalog sur les clients actuellement équipés de SAP et de Collibra… Devront ils cumuler les deux solutions ou SAP leur conseillera-t-il amicalement de se concentrer sur sa propre solution ?

Vers le partage et la monétisation des données

Autre évolution intéressante, la place de marché de jeux de données que pourrait devenir SAP Datasphere. Les différentes fonctionnalités liées à la publication de données et de jeux de données sont prévues dans le courant de 2024. Seule l’ouverture vers une place de marché publique est inscrite dans la vision mais non encore planifiée.

Franchement, si le ramage de SAP business data fabric, et ses composants Datasphere et Catalog, se rapportent à leur plumage, cette évolution de l’offre de SAP est en ligne avec celle des bonnes pratiques, et c’est une bonne nouvelle. Reste à voir le prix, les ressources de mise en œuvre, et la complexité.