Introduction
Intégrer l'API OpenAI dans une application Python est devenu standard en 2026. Voici comment démarrer du zéro, gérer les erreurs et passer en production.
Prérequis
- Python 3.10+
- Compte OpenAI avec clé API ($5 offerts au démarrage)
- Bases Python (pip, fonctions, classes)
Étapes (7)
1. Installer le SDK OpenAI
`pip install openai python-dotenv`. Créez un fichier .env avec OPENAI_API_KEY=sk-... (ne jamais committer dans Git). Utilisez python-dotenv pour charger la clé.
2. Premier appel API
```python from openai import OpenAI client = OpenAI() response = client.chat.completions.create( model='gpt-5', messages=[{'role':'user','content':'Explique LLM en 3 phrases'}] ) print(response.choices[0].message.content) ``` Coût : ~0.001 $ pour ce test.
3. Gérer le contexte (memory)
Accumulez les messages dans une liste pour conversation multi-tours. Limite contexte GPT-5 : 200K tokens. Stratégie : garder les 10 derniers messages + résumé des anciens.
4. Activer le streaming
Ajoutez `stream=True`. Itérez sur les chunks pour affichage en temps réel. UX beaucoup plus fluide qu'attendre toute la réponse.
5. Implémenter du RAG
Chargez vos documents → embeddings (`text-embedding-3-large`) → base vectorielle (Chroma, Pinecone) → retrieval → contexte dans prompt. Réduit les hallucinations de 80%.
6. Gérer les erreurs
Try/except sur : RateLimitError (attendre avec backoff exponentiel), APIError (retry 3x max), InvalidRequestError (tokens trop longs — chunk le prompt).
7. Monitorer les coûts
Dashboard OpenAI Usage. Tracker tokens_input + tokens_output par requête. Alertes budget. Typique app perso : 10-50 $/mois. App SaaS 1000 users : 500-2000 $/mois.
Astuces de pro
- •Utilisez gpt-5-mini pour tâches simples (10x moins cher que gpt-5)
- •Cachez les réponses identiques (Redis) pour diviser les coûts par 5-10
- •Limitez tokens de sortie (`max_tokens=500`) pour éviter les dérapages coûteux
FAQ
GPT-5 vs Claude API : lequel choisir ?
GPT-5 : meilleure polyvalence, écosystème riche, moins cher. Claude Opus 4 : raisonnement plus rigoureux, long contexte (500K), meilleur pour juridique/finance. Testez les deux.
Comment passer en prod sans exploser les coûts ?
(1) Cache Redis des réponses, (2) rate limiting par user, (3) fallback gpt-5-mini, (4) alertes budget quotidiennes, (5) analytics par endpoint.
Pour aller plus loin
Envie d'aller plus loin ?
AI2 forme à l'IA et à la data avec des programmes certifiés RNCP.
Autres guides HowTo
Comment analyser des données avec Python et l'IA en 2026
Méthode pratique en 8 étapes pour analyser un dataset avec Python, Pandas et ChatGPT Code Interpreter. Pour débutants.
Comment automatiser ses tâches répétitives avec l'IA en 2026
8 workflows IA concrets pour automatiser vos tâches de bureau en 2026. Make, Zapier, n8n + ChatGPT. Gain : 10h/semaine.
Comment trouver une entreprise d'alternance en IA en 2026
Méthode éprouvée en 6 étapes pour décrocher une alternance data/IA rapidement. Taux de succès 96% chez AI2.