1. Qu'est-ce que la data science ?
La data science est la discipline qui combine statistiques, informatique et expertise métier pour extraire de la valeur des données. Elle s'appuie sur machine learning, analyse statistique, visualisation, et ingénierie de données. Son objectif : transformer des données brutes en décisions business.
Le terme a émergé dans les années 2000 (Jeff Hammerbacher, William Cleveland) et explosé à partir de 2012 avec la démocratisation du ML puis de 2023 avec l'IA générative. En 2026, c'est l'un des domaines les plus recherchés du marché de l'emploi français.
2. Les 3 piliers de la data science
Données
SQL, Spark, data pipelines, lakes, warehouses. L'ingénierie data = 30-50% du temps d'un Data Scientist.
Modèles
Machine learning, deep learning, statistiques. Python + scikit-learn + PyTorch en 2026.
Business
Comprendre les enjeux, prioriser, restituer. Le Data Scientist qui réussit parle aux métiers.
3. Les sous-domaines de la data science
- Machine Learning : algorithmes qui apprennent des données (supervisé, non supervisé, renforcement).
- Deep Learning : réseaux de neurones profonds pour vision, langage, audio.
- NLP (Natural Language Processing) : traitement automatique du langage. Domaine explosif depuis les LLMs.
- Computer Vision : analyse d'images et de vidéos.
- MLOps : déploiement et industrialisation des modèles ML.
- Big Data : traitement de volumes massifs. Stack Spark, Hadoop, Snowflake, Databricks.
- Data Engineering : pipelines, qualité, infrastructure data.
- Business Intelligence (BI) : reporting, dashboards, KPIs. Tableau, Power BI, Looker.
4. Le workflow d'un projet data science
- 1. Définition du problème — avec les métiers, clarifier les KPIs à impacter et les données disponibles.
- 2. Collecte et exploration — ingestion des données, vérification qualité, premières visualisations.
- 3. Nettoyage et préparation — valeurs manquantes, outliers, encoding, feature engineering. 30-50% du temps.
- 4. Modélisation — entraînement de plusieurs modèles, validation croisée, tuning hyperparamètres.
- 5. Évaluation rigoureuse — métriques métier (pas juste accuracy), tests A/B, biais.
- 6. Déploiement en production — API, batch, streaming. Collaboration avec ML Engineers et MLOps.
- 7. Monitoring continu — drift de données, dégradation performance, réentraînement.
5. Stack technique 2026
Langages
- • Python (référence absolue)
- • SQL (indispensable)
- • R (secondaire)
- • Scala (big data)
Libs ML/DL
- • scikit-learn
- • PyTorch (leader 2026)
- • TensorFlow / Keras
- • XGBoost, LightGBM
Données
- • Pandas, NumPy, Polars
- • Spark, Dask
- • dbt, Airflow
- • Snowflake, Databricks, BigQuery
NLP/LLM
- • Hugging Face Transformers
- • LangChain, LlamaIndex
- • spaCy
- • sentence-transformers
Visualisation
- • matplotlib, seaborn
- • Plotly, Altair
- • Tableau, Power BI
- • Streamlit (démos)
MLOps
- • MLflow, Weights & Biases
- • Kubernetes, Docker
- • Kubeflow, Seldon
- • Prometheus, Grafana
6. Métiers de la data science en 2026
Panorama des rôles data avec salaires médians 2026 :
- Data Scientist : 42-120 K€ · modélisation, exploration, projets ML.
- Data Analyst : 35-85 K€ · analyses, dashboards, storytelling.
- Data Engineer : 42-130 K€ · pipelines, infrastructure data.
- Machine Learning Engineer : 45-140 K€ · industrialisation de modèles.
- MLOps Engineer : 48-145 K€ · DevOps pour modèles ML.
- Business Analyst IA : 40-100 K€ · cas d'usage et ROI data.
Voir le baromètre salaires complet 2026 ou la liste de tous les métiers.
7. Se former à la data science
Voies principales :
- Bachelor IA (RNCP 6, 3 ans) — post-bac, parcours complet.
- Mastère IA (RNCP 7, 2 ans) — meilleur ROI en 2026, 80% en alternance.
- Bootcamp Data Science — reconversion rapide 3-6 mois.
- Master universitaire en math-info ou stats.
Voir le guide alternance complet, le guide RNCP ou le guide devenir Data Scientist.
8. L'impact de l'IA générative sur la data science
Les LLMs ont bouleversé la data science depuis 2023. Impacts principaux :
- +20-40% productivité sur code, documentation, exploration.
- Nouveaux cas d'usage : RAG, agents, automatisation de tâches cognitives.
- Déplacement des compétences : moins de feature engineering manuel, plus d'orchestration et prompt engineering.
- Augmentation du volume de projets faisables (démocratisation).
- Nouveaux métiers : Prompt Engineer, AI Product Manager, MLOps LLM.
FAQ — 9 questions
Quelle différence entre data science et intelligence artificielle ?
La data science est le domaine qui extrait de la valeur des données (statistiques, ML, visualisation). L'IA est plus large et inclut tout système qui imite la cognition humaine. Data science ⊂ IA mais pas 100% : les stats descriptives et la BI font partie de la data science sans être strictement de l'IA.
Faut-il être fort en maths pour faire de la data science ?
Oui pour les rôles avancés (Data Scientist, ML Engineer, Research Scientist) : algèbre linéaire, probabilités, statistiques inférentielles, optimisation. Non nécessairement pour les rôles Data Analyst / Business Analyst IA où SQL + pensée business suffisent.
Quels sont les outils à maîtriser en data science en 2026 ?
Langages : Python (référence absolue), SQL (indispensable), R (secondaire). Libs Python : Pandas, NumPy, scikit-learn, matplotlib, seaborn, PyTorch/TensorFlow. Plateformes : Jupyter, VS Code. Cloud : AWS / GCP / Azure. BI : Tableau, Power BI, Looker. Versioning : Git. Conteneurisation : Docker.
Combien de temps pour apprendre la data science ?
Bases opérationnelles : 6-12 mois (bootcamp + projets). Niveau senior : 3-5 ans d'expérience professionnelle. Expertise research : 5+ ans incluant doctorat. Formation recommandée : Mastère IA RNCP 7 en alternance.
Est-ce que la data science est encore porteuse en 2026 ?
Oui massivement. +35% d'offres Data Scientist en 2026. L'IA générative augmente la productivité du data scientist mais ne le remplace pas : il reste indispensable pour concevoir des expériences, interpréter les résultats, et diriger les projets.
Quelle différence entre big data et data science ?
Big data = gros volumes de données (TB à PB). Data science = extraction de valeur. Un Data Engineer travaille sur le big data (infrastructure, ingestion, stockage). Un Data Scientist travaille sur la data science (modélisation, analyse). Les deux collaborent.
Quelles études pour devenir data scientist ?
3 voies : (1) Bachelor IA + Mastère IA (RNCP 7, 5 ans, idéal post-bac), (2) Licence/Master universitaire info/maths (3-5 ans), (3) École d'ingé + spécialisation data (5 ans). Reconversion rapide : bootcamp 3-6 mois.
Salaire en data science en France en 2026 ?
Très variable selon rôle : Data Analyst 35-85 K€, Data Scientist 42-120 K€, ML Engineer 45-140 K€, Data Engineer 42-130 K€, Principal Data Scientist 100-200 K€. Médiane tous rôles : 62 K€.
Data science en télétravail est-ce possible ?
Oui. 90% des postes offrent 2-3j TT/semaine. Full remote : 25% des offres en 2026. Certaines entreprises (finance, défense, santé) imposent plus de présentiel pour raison de sensibilité des données.
Prêt à te former à la data science ?
Bachelor, Mastère, Bootcamps. Certifié Qualiopi, finançable CPF / OPCO / alternance 0 €.
Pour aller plus loin : Guide IA complet · Devenir Data Scientist · Baromètre salaires · Glossaire IA