Ce cours est destiné aux étudiants des parcours Systèmes Logiciels et Image et Multimédia, niveau M1. Il s'appuie sur les notions déjà vues en apprentissage en 1e année.

La première partie du cours est consacrée au réseaux de neurones profonds pour la vision et s'attache à décrire l'application de détection d'objet.

La seconde partie du cours est dédiée au traitement du langage naturel, en particulier à l'architecture du Transformer et aux grands modèles de langage (LLM).

Vision par ordinateur

Cours : Architectures convolutives avancées

Cours : Détection d'objet

TP : Implémentation simplifiée de YOLO

Traitement du Langage Naturel

Cours : Attention, Transformers et LLM

TP : Transformers pour la classification de texte

TP : Transformers pour la génération de texte

TP : Retrieval Augmented Generation

Apprentissage Profond

Vision par ordinateur

Traitement du Langage Naturel