- L'hebdo de MAIjin
- Posts
- NL#151 - OpenAI frappe fort (6 nouveautés cette semaine)
NL#151 - OpenAI frappe fort (6 nouveautés cette semaine)
...voice mode avancé, connecteurs, record mode, codex et o3 pro
Bonjour,
J’espère que vous allez bien pour cette 151ème newsletter,
De mon côté, tout va bien. J’ai animé vendredi un atelier en live pour des directeurs industriels. J’ai pu présenter 6 innovations que l’IA générative permet dans les usines, d’après mon étude des capacités des modèles. Je vous partagerai ça la semaine prochaine.
En attendant, j’ai hâte de vous partager les nouvelles de cette semaine (il y en a beaucoup).
Au menu :
OpenAI frappe fort cette semaine : voice mode avancé, connecteurs, record mode, codex et o3 pro
Comment modifier n’importe quelle image avec cet outil allemand ?
Mon outil pour générer des prompts facilement avec Gemini
Le comparatif des meilleurs chatbot en juin 2025 par Peter Yang
Mon application visuelle pour créer un prompt parfait pour Veo3
Et bien plus encore
Bonne lecture,
Jean-Baptiste
Je m’appelle Jean-Baptiste Berthoux, je suis le co-fondateur de MAIjin. Depuis Janvier 2023, j’ai accompagné 1760 professionnels et 103 organisations à gagner du temps avec l’IA générative. Je me désigne comme un expert des usages de l’IA générative dans le milieu professionnel. Chaque semaine, depuis 151 éditions, j'envoie ma newsletter qui démystifie le monde de l’IA en pleine ébullition. - Merci aux 10 nouveaux abonnées/abonnés qui ont rejoint cette newsletter - Nous sommes maintenant 3715 - N’hésite donc pas à partager le lien d’inscription à tes proches De plus, si ce n’est pas fait déjà fait, tu peux aussi : - Me suivre sur Linkedin où je partage mes idées chaque jour (16 667 abonnés) - Me contacter pour une formation ou un audit pour ton entreprise |
Jean-Baptiste Berthoux |
OpenAI frappe fort cette semaine : codex, voice mode avancé, connecteurs, record mode
Codex a accès à internet
Tout d’abord, OpenAI a donné la possibilité à Codex, son assistant de code, d'aller sur internet. Cela le rend plus utile encore.
Tu veux tester ?
Ouvre ChatGPT > Fenêtre de gauche > Codex.
Ensuite, tu connectes avec ton compte github (créez en un si besoin) et tu peux l’utiliser pour créer et éditer du code.
Le voice mode est fluide et drôle
Mieux encore, le 04 juin, OpenAI a mis à jour son mode de voix avancé pour les utilisateurs payants. Tu y accèdes sur l’application smartphone ou sur l’application de PC en appuyant sur les écouteurs. La conversation est plus fluide, les émotions plus palpables et la traduction quasi parfaite.
Pourquoi l’utiliser ?
Entraînement à un entretien d’embauche
Amélioration de son anglais
Tuteur socratique
Demander des informations en marchant
Raconter des histoires
Et bien plus.
Vous avez d’autres idées ? Dites le moi en commentaire de cette newsletter.
OpenAI se connecte à vos outils métiers
La firme de la Sillicon Valley a développé les connecteurs.
Cela permet à ChatGPT d'accéder à des informations provenant d’applications connectées.
Il y a deux types de connecteurs :
1 - les connecteurs accessibles avec ChatGPT search : récupération de l’information en instantanée
2 - les connecteurs accessibles avec ChatGPT Deep Research : récupération de l’information et action mises en place entre 3 et 10 minutes.
Par exemple, vous pouvez connecter ChatGPT à Google Agenda et ajouter un nouvel événement. Ou créé un brouillon d’email à ChatGPT.
Mais ce n’est pas intéressant.
C’est intéressant quand vous lui demandez :
1 - De récupérer tous vos leads non signés via Hubspot
2 - identifier la typologie des personnes non signés et rédiger un brouillon d’email de prospection dans gmail
3 - bloquer un créneau dans google agenda pour travailler sur ce projet
4 - parcourir le drive pour créer un fichier excel avec les leads et les emails de prospection
Enfin, tous les connecteurs ne sont pas disponibles.
Mais vous pouvez créer vos propres connecteurs avec un serveur MCP (les fameux) pour donner accès à ChatGPT à vos outils maisons.
Évidemment, la question des données et de leur sécurité est centrale pour intégrer ce type de système dans votre IT.
En résumé : ChatGPT se connecte à vos applications métiers et réalise des tâches en autonomie. Le chatbot devient encore plus “agentique”.
Enregistrez vos réunions avec ChatGPT depuis votre ordinateur
Nouvelle icône (rond enregistreur) en bas à droite dans votre application ChatGPT sur Mac et PC.

OpenAI sort o3 pro
Il est disponible via l’API ou les usagers pro qui paient 200$ par mois.
C’est une amélioration du modèle o3 actuel qui permet de résoudre des problèmes de raisonnement auparavant impossibles. La plupart des utilisateurs ne verront pas la différence.
Que ça soit pour o3 ou o3 pro, voici le template de prompt proposés par Ben Hylak de Latent Space :

Traduction du template de Ben Hylak
J’ai créé pour vous un “constructeur de prompts o3” avec Claude : https://claude.ai/public/artifacts/9f42a3aa-ce0b-46dd-baf4-e9b187e92c33
Et pour terminer :
Sam Altman a rédigé son dernier billet de blog à la main
Et je vous l’ai traduit en français.
Je vous conseille de le lire, car il est toujours intéressant de comprendre la vision de ceux qui modèlent le futur de l’IA.
Nous pourrons aussi comparer leurs prédictions avec la réalité.
Black Forrest Lab, l’entreprise allemand sort Flux.1 Kontext.
Vous pouvez modifier n’importe quels éléments d’une photo de base avec ce modèle.
Par exemple :

Et les modifications via ces prompts :

Je le présente ici car c’est un outil performant européen.
Et vous pouvez le tester gratuitement sur ce site : https://kontext-chat.replicate.dev/ ou ici en créant un compte : https://playground.bfl.ai/image/edit.
A vos modifs 🙂
Mon outil pour générer des prompts facilement avec Gemini
Dans ce post Linkedin, je montrais la nouvelle fonctionnalité utile de Gemini pour créer des mini-applications.
Et pour vous, j’ai créé un constructeur de prompts en fonction de qui vous êtes et ce que vous faites.
Dites-moi ce que vous en pensez,
Notez que Gemini 2.5 pro est désormais le meilleur modèle sur LMarena, loin devant ses prétendants d’Open AI et d’Anthropic. Gemini est d’ailleurs un peu meilleur en code que les modèles d’Anthropic et aussi bien moins cher. Je préfère tout de même utiliser Claude.
D’ailleurs, comment faire la différence entre ces modèles en juin 2025.
Le comparatif des meilleurs chatbot en juin 2025 par Peter Yang

Peter Yang vient de publier une analyse comparative excellente entre ChatGPT o3, Claude 4 et Gemini 2.5. Tu ne vas pas perdre ton temps en la lisant...
Point essentiel : il n'y a PAS de "meilleur" modèle d'IA en 2025.
Le fondateur de "creator economy" a testé ces 3 modèles sur 6 cas d'usage concrets. Ses découvertes vont t'aider à choisir le bon outil selon tes besoins :
1 ) Pour le code : Claude 4 écrase la concurrence. Peter lui a demandé de créer un Tetris complet. Résultat ? Un jeu magnifique avec scores et contrôles parfaits. Il a même réussi à créer un niveau 1 de Super Mario fonctionnel.
Le hic ? Claude coûte 20x plus cher que Gemini.
2 ) Pour l'écriture : Claude reproduit le mieux le style personnel. Quand Peter lui donne ses exemples d'écriture, Claude capture parfaitement son ton conversationnel. ChatGPT coupe trop, Gemini devient verbeux.
3 ) Pour l'assistance quotidienne : ChatGPT domine grâce à sa mémoire. Il se souvient des projets en cours et propose spontanément des suggestions pertinentes. Une fonctionnalité que les autres n'ont toujours pas en 2025.
4 ) Pour la recherche approfondie : ChatGPT trouve le juste équilibre. Claude produit 427 sources mais reste générique. Gemini pond 48 pages illisibles. ChatGPT livre 25 sources avec des recommandations précises et actionnables.
5 ) Pour les images : ChatGPT reste imbattable selon Peter. Il suit mieux les instructions et génère le meilleur rendu de texte dans les visuels.
6 ) Pour la vidéo : Gemini écrase tout avec Veo 3. Il transforme un simple prompt en vidéo de 8 secondes avec son et voix.
Le résultat final de Peter que je partage :
Assistance personnelle → ChatGPT
Code et écriture pro → Claude
Vidéo et budget serré → Gemini
En résumé : arrête de chercher LE modèle parfait. Choisis celui qui résout TON problème spécifique.
Mon application visuelle pour créer un prompt parfait pour Veo3
Vous avez envie de tester un outil de génération de vidéo mais vous ne savez pas comment vous y prendre ?
J’ai créé pour vous un artefact visuel pour vous guider.
Et pour terminer : ElevenLabs sort V3
ElevenLabs sort ElevenV3, son meilleur modèle de génération de voix (text to audio).
Cette pré-version de recherche apporte un contrôle et un réalisme sans précédent à la génération vocale :
plus de 70 langues
dialogues multi-locuteurs
balises audio comme [excited], [whispers] et [sighs]
Eleven v3 (alpha) demande plus de prompt engineering que les modèles précédents, mais les rendus sont tops.
Si tu bosses sur des vidéos, des livres audio ou des outils médias, regarde ça de proche.
C’est tout pour aujourd’hui,
JB
As-tu aimé cette newsletter ? |
Comment modifier n’importe quelle image avec cet outil allemand ?