Formation IA multimodale & agents

Plan de Formation Extraire des insights à partir de données visuelles sur Azure AI-3008 : Modules Détaillés

Module 1: Développer une application IA générative compatible avec la vision

Utiliser un modèle doté de capacités de vision dans le portail Microsoft Foundry
Développer une application de conversation basée sur la vision
Exercice – Développer une application de conversation compatible avec la vision

Module 2: Générer des images à l’aide de l’IA

Qu’est-ce que les modèles de génération d’images ?
Explorer les modèles de génération d’images dans le portail Microsoft Foundry
Créer une application cliente qui utilise un modèle de génération d’image
Exercice – Générer des images avec l’IA

Module 3: Générer des vidéos avec Microsoft Foundry

Déployer un modèle de génération de vidéo
Générer une vidéo à partir d’une commande
Générer une vidéo en Python
Exercice – Générer une vidéo avec Sora 2 dans Microsoft Foundry

Module 4: Analyser des images avec Content Understanding

Qu’est-ce que Content Understanding ?
Analyser des images avec Content Understanding
Exercice – Analyser des images avec Content Understanding

Module 5: Créer une solution d’analyse modale avec Azure Content Understanding

Qu’est-ce qu’Azure Content Understanding ?
Créer un analyseur d’analyse de contenu
Utiliser l’API Content Understanding
Exercice – Extraire des informations à partir du contenu multimodal

Module 6: Créer une application cliente Azure Content Understanding

Préparer l’utilisation de l’API AI Content Understanding
Créez un analyseur de compréhension de contenu
Analyser le contenu
Exercice – Développer une application cliente Content Understanding

Module 7: Extraire des données avec Azure Document Intelligence

Qu’est-ce qu’Azure Document Intelligence ?
Utiliser Document Intelligence Studio
Utiliser des modèles prédéfinis
Entraîner et utiliser des modèles personnalisés
Exercice – Analyser des documents avec Document Intelligence

Module 8: Créer une solution d’exploration de connaissances avec Azure AI Search

Qu’est-ce que Recherche Azure AI ?
Extraire des données avec un indexeur
Enrichir les données extraites avec des compétences IA
Rechercher un index
Conserver les informations extraites dans une base de connaissances
Exercice – Créer une solution d’exploration de connaissances

La littérature et les diapositives de présentation en classe sont en langue française. L’environnement de laboratoire technique incluant les étapes de configuration est disponible en anglais.

Connaissances pré-requises recommandées

Compréhension de base du développement logiciel (logique applicative, API, formats JSON)
Familiarité avec les environnements cloud (notions de ressources, sécurité, accès)
Connaissance pratique des données et des documents (PDF, images, fichiers Office) et des notions d’extraction/structuration
Bases en IA/ML et en modèles de langage (concepts généraux : prompts, contexte, limites)
Compréhension des concepts d’IA multimodale (texte + image/document) — un atout
Notions d’automatisation et d’orchestration (workflows, déclencheurs, étapes, outils)
Connaissance basique des outils de versionnage (ex. Git) et des cycles de développement logiciel
Compréhension des principes de déploiement et d’exploitation (tests, supervision, amélioration continue)
Expérience en collaboration d’équipe (revues, partage de code, documentation)

La formation AI-3008 est conçue pour aider les professionnels IT et développeurs à acquérir les bases essentielles pour concevoir des applications IA capables d’analyser des images et des documents. Le cours met l’accent sur l’utilisation de modèles multimodaux et d’outils basés sur des agents afin de combiner entrées visuelles/documentaires et modèles de langage, pour produire des résultats exploitables en contexte d’entreprise.

Grâce à des notions clés et des exercices pratiques, les participants découvriront des patrons concrets pour réaliser l’extraction structurée, l’analyse et l’orchestration de workflows décisionnels. L’objectif : créer des solutions plus fiables, capables d’ancrer les réponses dans les données visuelles et documentaires, et de transformer des contenus non structurés en informations actionnables.

Pourquoi suivre cette formation ?

L’IA multimodale et les agents transforment la façon dont les organisations exploitent leurs images et leurs documents (contrats, factures, formulaires, rapports, dossiers techniques) en permettant de comprendre, extraire et raisonner à partir de contenus non structurés. Cette formation vous initie aux principes essentiels pour combiner entrées visuelles/documentaires et modèles de langage, afin de créer des applications capables de produire des analyses fiables et des réponses directement ancrées dans les données.

En maîtrisant ces fondements, vous pourrez accélérer l’automatisation de processus, améliorer la qualité des décisions et concevoir des workflows plus efficaces (extraction structurée, validation, routage, synthèse et actions), tout en renforçant la valeur opérationnelle de vos contenus visuels et documentaires.

Compétences développées pendant la formation

Compréhension des bases de l’IA multimodale
Comprenez comment des modèles peuvent traiter et relier plusieurs modalités (texte + image + document) pour produire des réponses plus riches et contextualisées.
Analyse d’images et de documents pour l’extraction d’informations
Apprenez à identifier et extraire des éléments clés (champs, tableaux, sections, entités) afin de transformer des contenus non structurés en données structurées.
Combinaison des entrées visuelles/documentaires avec des modèles de langage
Découvrez comment intégrer des images et des documents dans des scénarios de raisonnement et de génération (résumés, classification, comparaison, interprétation).
Mise en place de workflows décisionnels basés sur des agents
Explorez des approches d’orchestration “agentic” pour enchaîner des étapes (analyse, validation, action), déclencher des outils et automatiser des décisions.
Ancrage des réponses dans les données (grounding)
Apprenez des patrons pratiques pour baser les réponses du modèle sur les preuves issues des documents/images, afin d’améliorer la fiabilité et la traçabilité.
Conception de solutions applicables en contexte d’entreprise
Appliquez des modèles de conception réutilisables pour créer des applications IA exploitables : extraction structurée, analyse, routage, synthèse et automatisation.

Une formation pratique dirigée par des experts

Cette formation est animée par des instructeurs certifiés Microsoft/Azure qui combinent apports théoriques et exercices pratiques. Les participants travailleront sur des scénarios concrets pour apprendre à concevoir des applications IA capables d’exploiter des images et des documents à l’aide de modèles multimodaux et d’outils orchestrés par des agents.

L’approche est orientée “terrain” : vous verrez comment structurer l’extraction d’informations, enchaîner des étapes d’analyse et de décision, et produire des réponses ancrées dans les données visuelles et documentaires, afin d’obtenir des résultats plus fiables et directement actionnables.

À qui s’adresse cette formation ?

Développeurs souhaitant créer des applications IA capables d’analyser des images et des documents (extraction, classification, synthèse, validation).
Professionnels IT et équipes produit cherchant à automatiser des processus documentaires grâce à l’IA (workflows décisionnels, routage, contrôle qualité).
Ingénieurs IA / data / ML voulant intégrer des capacités multimodales et des approches agentiques dans des solutions applicatives.
Architectes et concepteurs de solutions qui doivent transformer des contenus non structurés (PDF, scans, formulaires, rapports) en informations actionnables à l’échelle de l’entreprise.

Favorisez l’innovation avec l’IA multimodale et les agents

La formation AI-3008 vous apporte les concepts et approches pratiques pour concevoir des applications intelligentes capables de voir, interpréter et raisonner sur des images et des documents. Inscrivez-vous dès aujourd’hui pour exploiter des modèles multimodaux et des workflows basés sur des agents, accélérer l’extraction d’informations, automatiser des décisions et transformer vos contenus visuels et documentaires en valeur opérationnelle.

Questions fréquemment posées – Formation AI-3008 (FAQ)

AI-3008, c’est une formation sur quoi exactement ?

AI-3008 porte sur la conception d’applications IA capables d’exploiter des images et des documents à l’aide de modèles multimodaux et d’outils orchestrés par des agents. L’objectif est de permettre l’extraction structurée, l’analyse et des workflows décisionnels basés sur des contenus non structurés.

La formation est-elle orientée “pratique” ?

Oui. La formation combine concepts clés et exercices pour appliquer des patrons concrets : extraction d’informations, enchaînement d’étapes d’analyse, orchestration d’outils et production de réponses ancrées dans les données visuelles/documentaires.

Dois-je être data scientist pour suivre AI-3008 ?

Non. Une base en développement logiciel et une familiarité avec les données/documents sont recommandées. Le cours vise surtout les personnes qui conçoivent ou développent des applications et veulent intégrer des capacités IA multimodales.

Quels types de cas d’usage sont couverts ?

Par exemple : traitement de factures et formulaires, analyse de documents de conformité, extraction de champs et tableaux, classification, synthèse de rapports, validation et routage automatisés, assistance aux équipes support/ops à partir de documents et captures.

Qu’entend-on par “agents” dans AI-3008 ?

Un agent est une approche d’orchestration où l’application peut planifier des étapes, appeler des outils (extraction, recherche, validation), et exécuter un workflow pour atteindre un objectif (ex. analyser un document, vérifier des critères, produire une décision et générer une sortie structurée).

La formation couvre-t-elle l’ancrage des réponses (grounding) ?

Oui. Vous verrez comment baser les réponses sur les informations réellement présentes dans les images/documents, afin d’améliorer la fiabilité, réduire les hallucinations et produire des résultats plus traçables.

Extraire des insights à partir de données visuelles sur Azure (AI-3008)

Formations connexes

Exclusivités

Classe privée

Comment obtenir une proposition?