Full definition

Introduit en 2017 par Google dans l'article « Attention Is All You Need », le Transformer a remplacé les RNN/LSTM pour la plupart des tâches NLP. Son mécanisme d'attention permet de capter les dépendances à longue distance dans les séquences. Architecture en couches d'encodeurs/décodeurs (BERT) ou décodeurs seuls (GPT). Base de tous les LLMs actuels, des modèles de vision (ViT) et des modèles multimodaux.

Related terms

LLM (Large Language Model)

Grand modèle de langage entraîné sur de vastes corpus textuels pour comprendre et générer du texte naturel.

Mécanisme d'attention

Technique permettant à un modèle de se concentrer sur les parties pertinentes d'une séquence.

BERT

Modèle Transformer bidirectionnel de Google pour la compréhension du langage.

Other Deep Learning terms

Deep Learning (apprentissage profond) — Sous-ensemble du ML basé sur des réseaux de neurones à plusi...Computer Vision — Branche de l'IA dédiée à l'analyse et compréhension d'images...Réseau de neurones — Architecture computationnelle inspirée du cerveau, brique de...CNN (Convolutional Neural Network) — Réseau de neurones spécialisé dans le traitement d'images et...Mécanisme d'attention — Technique permettant à un modèle de se concentrer sur les pa...

Want to go beyond the definition?

AI2 trains in AI and data with RNCP-certified programs.

📘 Brochure ← Back to glossary

Transformer

Full definition

Related terms

Other Deep Learning terms

Want to go beyond the definition?

Keyboard Shortcuts

Transformer

Full definition

Related terms

Other Deep Learning terms

Want to go beyond the definition?