Définition complète
Les CNN utilisent des couches de convolution pour extraire des features locales (bords, textures, formes) à différentes échelles. Architecture de référence en computer vision depuis AlexNet (2012). Modèles célèbres : VGG, ResNet, EfficientNet, YOLO. Progressivement remplacés par les Vision Transformers (ViT) dans la recherche récente.
Termes liés
Deep Learning (apprentissage profond)
Sous-ensemble du ML basé sur des réseaux de neurones à plusieurs couches.
Computer Vision
Branche de l'IA dédiée à l'analyse et compréhension d'images et vidéos par des machines.
Transformer
Architecture de réseau de neurones basée sur le mécanisme d'attention, fondation des LLMs modernes.
Autres termes Deep Learning
Envie d'aller plus loin que la définition ?
AI2 forme à l'IA et à la data avec des programmes certifiés RNCP.