Ce cours est destiné aux étudiants des parcours Systèmes Logiciels et Image et Multimédia, niveau M1. Il s'appuie sur les notions déjà vues en apprentissage en 1e année.
La première partie du cours est consacrée au réseaux de neurones profonds pour la vision et s'attache à décrire l'application de détection d'objet.
La seconde partie du cours est dédiée au traitement du langage naturel, en particulier à l'architecture du Transformer et aux grands modèles de langage (LLM).
Vision par ordinateur
Cours : Architectures convolutives avancées
Cours : Détection d'objet
TP : Implémentation simplifiée de YOLO
Traitement du Langage Naturel
Cours : Attention, Transformers et LLM
TP : Transformers pour la classification de texte