Plan de Formation Extraire des insights à partir de données visuelles sur Azure AI-3008 : Modules Détaillés
Module 1: Développer une application IA générative compatible avec la vision
- Utiliser un modèle doté de capacités de vision dans le portail Microsoft Foundry
- Développer une application de conversation basée sur la vision
- Exercice – Développer une application de conversation compatible avec la vision
Module 2: Générer des images à l’aide de l’IA
- Qu’est-ce que les modèles de génération d’images ?
- Explorer les modèles de génération d’images dans le portail Microsoft Foundry
- Créer une application cliente qui utilise un modèle de génération d’image
- Exercice – Générer des images avec l’IA
Module 3: Générer des vidéos avec Microsoft Foundry
- Déployer un modèle de génération de vidéo
- Générer une vidéo à partir d’une commande
- Générer une vidéo en Python
- Exercice – Générer une vidéo avec Sora 2 dans Microsoft Foundry
Module 4: Analyser des images avec Content Understanding
- Qu’est-ce que Content Understanding ?
- Analyser des images avec Content Understanding
- Exercice – Analyser des images avec Content Understanding
Module 5: Créer une solution d’analyse modale avec Azure Content Understanding
- Qu’est-ce qu’Azure Content Understanding ?
- Créer un analyseur d’analyse de contenu
- Utiliser l’API Content Understanding
- Exercice – Extraire des informations à partir du contenu multimodal
Module 6: Créer une application cliente Azure Content Understanding
- Préparer l’utilisation de l’API AI Content Understanding
- Créez un analyseur de compréhension de contenu
- Analyser le contenu
- Exercice – Développer une application cliente Content Understanding
Module 7: Extraire des données avec Azure Document Intelligence
- Qu’est-ce qu’Azure Document Intelligence ?
- Utiliser Document Intelligence Studio
- Utiliser des modèles prédéfinis
- Entraîner et utiliser des modèles personnalisés
- Exercice – Analyser des documents avec Document Intelligence
Module 8: Créer une solution d’exploration de connaissances avec Azure AI Search
- Qu’est-ce que Recherche Azure AI ?
- Extraire des données avec un indexeur
- Enrichir les données extraites avec des compétences IA
- Rechercher un index
- Conserver les informations extraites dans une base de connaissances
- Exercice – Créer une solution d’exploration de connaissances
La littérature et les diapositives de présentation en classe sont en langue française. L’environnement de laboratoire technique incluant les étapes de configuration est disponible en anglais.
Connaissances pré-requises recommandées
- Compréhension de base du développement logiciel (logique applicative, API, formats JSON)
- Familiarité avec les environnements cloud (notions de ressources, sécurité, accès)
- Connaissance pratique des données et des documents (PDF, images, fichiers Office) et des notions d’extraction/structuration
- Bases en IA/ML et en modèles de langage (concepts généraux : prompts, contexte, limites)
- Compréhension des concepts d’IA multimodale (texte + image/document) — un atout
- Notions d’automatisation et d’orchestration (workflows, déclencheurs, étapes, outils)
- Connaissance basique des outils de versionnage (ex. Git) et des cycles de développement logiciel
- Compréhension des principes de déploiement et d’exploitation (tests, supervision, amélioration continue)
- Expérience en collaboration d’équipe (revues, partage de code, documentation)
Formation IA multimodale & agents
La formation AI-3008 est conçue pour aider les professionnels IT et développeurs à acquérir les bases essentielles pour concevoir des applications IA capables d’analyser des images et des documents. Le cours met l’accent sur l’utilisation de modèles multimodaux et d’outils basés sur des agents afin de combiner entrées visuelles/documentaires et modèles de langage, pour produire des résultats exploitables en contexte d’entreprise.
Grâce à des notions clés et des exercices pratiques, les participants découvriront des patrons concrets pour réaliser l’extraction structurée, l’analyse et l’orchestration de workflows décisionnels. L’objectif : créer des solutions plus fiables, capables d’ancrer les réponses dans les données visuelles et documentaires, et de transformer des contenus non structurés en informations actionnables.
Pourquoi suivre cette formation ?
L’IA multimodale et les agents transforment la façon dont les organisations exploitent leurs images et leurs documents (contrats, factures, formulaires, rapports, dossiers techniques) en permettant de comprendre, extraire et raisonner à partir de contenus non structurés. Cette formation vous initie aux principes essentiels pour combiner entrées visuelles/documentaires et modèles de langage, afin de créer des applications capables de produire des analyses fiables et des réponses directement ancrées dans les données.
En maîtrisant ces fondements, vous pourrez accélérer l’automatisation de processus, améliorer la qualité des décisions et concevoir des workflows plus efficaces (extraction structurée, validation, routage, synthèse et actions), tout en renforçant la valeur opérationnelle de vos contenus visuels et documentaires.
Compétences développées pendant la formation
Compréhension des bases de l’IA multimodale
Comprenez comment des modèles peuvent traiter et relier plusieurs modalités (texte + image + document) pour produire des réponses plus riches et contextualisées.Analyse d’images et de documents pour l’extraction d’informations
Apprenez à identifier et extraire des éléments clés (champs, tableaux, sections, entités) afin de transformer des contenus non structurés en données structurées.Combinaison des entrées visuelles/documentaires avec des modèles de langage
Découvrez comment intégrer des images et des documents dans des scénarios de raisonnement et de génération (résumés, classification, comparaison, interprétation).Mise en place de workflows décisionnels basés sur des agents
Explorez des approches d’orchestration “agentic” pour enchaîner des étapes (analyse, validation, action), déclencher des outils et automatiser des décisions.Ancrage des réponses dans les données (grounding)
Apprenez des patrons pratiques pour baser les réponses du modèle sur les preuves issues des documents/images, afin d’améliorer la fiabilité et la traçabilité.Conception de solutions applicables en contexte d’entreprise
Appliquez des modèles de conception réutilisables pour créer des applications IA exploitables : extraction structurée, analyse, routage, synthèse et automatisation.
Une formation pratique dirigée par des experts
Cette formation est animée par des instructeurs certifiés Microsoft/Azure qui combinent apports théoriques et exercices pratiques. Les participants travailleront sur des scénarios concrets pour apprendre à concevoir des applications IA capables d’exploiter des images et des documents à l’aide de modèles multimodaux et d’outils orchestrés par des agents.
L’approche est orientée “terrain” : vous verrez comment structurer l’extraction d’informations, enchaîner des étapes d’analyse et de décision, et produire des réponses ancrées dans les données visuelles et documentaires, afin d’obtenir des résultats plus fiables et directement actionnables.
À qui s’adresse cette formation ?
- Développeurs souhaitant créer des applications IA capables d’analyser des images et des documents (extraction, classification, synthèse, validation).
- Professionnels IT et équipes produit cherchant à automatiser des processus documentaires grâce à l’IA (workflows décisionnels, routage, contrôle qualité).
- Ingénieurs IA / data / ML voulant intégrer des capacités multimodales et des approches agentiques dans des solutions applicatives.
- Architectes et concepteurs de solutions qui doivent transformer des contenus non structurés (PDF, scans, formulaires, rapports) en informations actionnables à l’échelle de l’entreprise.
Favorisez l’innovation avec l’IA multimodale et les agents
La formation AI-3008 vous apporte les concepts et approches pratiques pour concevoir des applications intelligentes capables de voir, interpréter et raisonner sur des images et des documents. Inscrivez-vous dès aujourd’hui pour exploiter des modèles multimodaux et des workflows basés sur des agents, accélérer l’extraction d’informations, automatiser des décisions et transformer vos contenus visuels et documentaires en valeur opérationnelle.
Questions fréquemment posées – Formation AI-3008 (FAQ)
AI-3008 porte sur la conception d’applications IA capables d’exploiter des images et des documents à l’aide de modèles multimodaux et d’outils orchestrés par des agents. L’objectif est de permettre l’extraction structurée, l’analyse et des workflows décisionnels basés sur des contenus non structurés.
Oui. La formation combine concepts clés et exercices pour appliquer des patrons concrets : extraction d’informations, enchaînement d’étapes d’analyse, orchestration d’outils et production de réponses ancrées dans les données visuelles/documentaires.
Non. Une base en développement logiciel et une familiarité avec les données/documents sont recommandées. Le cours vise surtout les personnes qui conçoivent ou développent des applications et veulent intégrer des capacités IA multimodales.
Par exemple : traitement de factures et formulaires, analyse de documents de conformité, extraction de champs et tableaux, classification, synthèse de rapports, validation et routage automatisés, assistance aux équipes support/ops à partir de documents et captures.
Un agent est une approche d’orchestration où l’application peut planifier des étapes, appeler des outils (extraction, recherche, validation), et exécuter un workflow pour atteindre un objectif (ex. analyser un document, vérifier des critères, produire une décision et générer une sortie structurée).
Oui. Vous verrez comment baser les réponses sur les informations réellement présentes dans les images/documents, afin d’améliorer la fiabilité, réduire les hallucinations et produire des résultats plus traçables.