- L'hebdo de MAIjin
- Posts
- NL#172 - Quel est le meilleur modèle IA en Octobre 2025 ?
NL#172 - Quel est le meilleur modèle IA en Octobre 2025 ?
...et bien plus à découvrir !
Bonjour,
J’espère que vous allez bien,
Cette semaine, je suis en repos.
Mais j’ai décidé de vous livrer les nouveautés les plus brûlantes de la semaine (pas mal de pépites sont à découvrir !).
Ce que vous allez découvrir dans cette édition :
Quel est le meilleur modèle d’IA en octobre 2025 ?
Neo de 1X, le robot que vous avez (PAS) envie d’avoir chez vous
Les LLMs montrent des signes d’introspection !
Si l’IA fait le job des juniors, comment ces derniers deviendront-ils seniors ?
Comment savoir si votre job sera automatisé par l’IA ?
L’outil de Google qui va bousculer les agences de marketing pour les PMEs
Comment mieux rédiger avec l’IA en 3 étapes ?
Pourquoi Anthropic dépasse OpenAI
Et bien plus encore !
C’est parti !
Excellente journée,
Jean-Baptiste.
Je m’appelle Jean-Baptiste Berthoux, je suis le co-fondateur de MAIjin. Depuis Janvier 2023, j’ai accompagné 2100 professionnels et 100 organisations à gagner du temps avec l’IA générative. Je me désigne comme un expert des usages de l’IA générative dans le milieu professionnel. Chaque semaine, depuis 172 éditions, j'envoie ma newsletter qui démystifie le monde de l’IA en pleine ébullition.
- Merci aux 105 nouveaux abonnées/abonnés qui ont rejoint cette newsletter
- Nous sommes maintenant 4395
- N’hésitez donc pas à partager le lien d’inscription à vos proches
De plus, si ce n’est pas fait déjà fait, vous pouvez aussi :
- Prendre un rdv gratuit pour parler de nos prestations d’audits, formations et consulting
- Me suivre sur Linkedin où je partage mes idées chaque jour (17 335 abonnés)
- Faire un diagnostic IA gratuit de votre entreprise
Nouveautés de la semaine
1X sort Neo, un robot en pré-commande à 20 000$. Je dois dire que la robotique s’améliore plus vite que je le pense. L’approche de 1X est équilibrée : ils sont transparents sur le fait que votre robot ne pourra pas tout faire en 2026, que parfois il aura besoin d’un téléopérateur et qu’il faut être d’accord avec ce contrat social. Ceux qui l’achètent savent aussi que 1X entrainera Neo avec leurs données. Voici une vidéo de wall street journal qui vous donne une bonne visibilité de où en sont ces robots humanoïdes :
OpenAI vous permet de créer des caractères via sa fonctionnalité Cameo
Introducing character cameos, now available in the Sora app.
— OpenAI (@OpenAI)
10:23 PM • Oct 29, 2025
Claude sort Claude For Excel : le but est que Claude comprenne l’ensemble de votre excel, des formules imbriquées jusqu’aux dépendances entre plusieurs onglets. Il peut vous donner des explications avec des citations au niveau de chaque cellule, et vous permet de modifier les hypothèses tout en préservant les formules. Actuellement disponible en version bêta, à rejoindre via liste d’attente.
Aymeric Roucher, ex collaborateur de chez Hugging Face sort un livre Ultra-Intelligence. Une idée de sa part m’a parlé : “si vous pouvez travailler depuis chez vous, alors votre métier peut s’exercer à travers des flux numériques et sera bientôt automatisé”
Dans la même thématique du future of work, j’ai bien aimé la réflexion de Flavien Chervet avec laquelle je suis en phase :
La question « Si l’IA fait le job des juniors, comment ces derniers deviendront-ils seniors ? » est, selon Flavien, mal posée. Elle repose sur une vision statique du monde du travail alors que l’intelligence artificielle progresse bien plus vite que l’humain. D’ici à ce qu’un junior atteigne le niveau de senior, les machines auront déjà dépassé ces compétences. Plutôt que de s’accrocher à des métiers appelés à disparaître, les jeunes ont tout intérêt à apprendre à collaborer avec l’IA et à réinventer leurs pratiques professionnelles. Le véritable enjeu ne réside donc pas dans l’évolution des compétences, mais dans l’impact social d’un système éducatif et économique qui peine encore à s’adapter à cette révolution
L’outil de la semaine : Pomelli de Google
Google a dévoilé Pomelli, un nouvel outil d’intelligence artificielle issu de Google Labs et DeepMind, destiné à aider les petites entreprises à créer des campagnes marketing sur mesure. L’IA analyse d’abord le site web de l’entreprise pour en dégager son « ADN de marque », ton, couleurs, style visuel. Elle propose ensuite des idées de campagnes cohérentes avec cette identité et génère textes et visuels prêts à l’emploi, que l’utilisateur peut ensuite ajuster. Actuellement en bêta publique dans les pays anglophones, Pomelli est présenté comme une expérimentation dont Google attend les retours des utilisateurs avant un déploiement plus large.
Comparatif des modèles d’IA par Peter Yang - Octobre 2025

Ma traduction de la sélection de Peter Yang
Voici les modèles d'IA préférés de Peter Yang pour chaque tâche
Réponses quotidiennes (ChatGPT). GPT-5 est rapide et concis, ce qui le rend excellent pour répondre aux questions. Claude atteint constamment les limites de taux sur l'abonnement à 20 $/mois. 😢. “JB : je suis d’accord !!”
Rédaction et édition (Claude). Claude s'adapte le mieux à votre style d'écriture si vous lui donnez des exemples de vos textes. ChatGPT abuse trop des puces et l'écriture de Gemini est trop sèche et verbeuse. “JB : je trouve Claude et GPT assez équivalent dans l’écriture, mais il est vrai que j’utilise davantage Claude. Question d’habitude”.
Programmation (Claude Code et OpenAI Codex). Je suis un grand fan de Claude Code, mais beaucoup de mes amis sont passés à OpenAI Codex avec GPT-5 high. Codex est plus lent que Claude mais peut souvent corriger des bugs complexes en quelques lignes de code seulement. C'est assez remarquable de voir à quelle vitesse OpenAI a rattrapé Anthropic en programmation. “JB : je ne code au même niveau que Peter Yang, mais j’utilise davantage Claude pour ses compétences de coding. ”.
Recherche web (Gemini). Si j'ai besoin de rechercher des informations en temps réel, le mode IA de Gemini est toujours beaucoup plus rapide que ChatGPT ou Claude. C'est aussi pourquoi je préfère toujours Chrome au nouveau navigateur Atlas d'OpenAI, le chat met juste trop de temps à générer quand on veut des résultats instantanés. “JB : j’utilise ChatGPT et Claude par question de facilité.”
Recherche approfondie (Claude). Je préfère Deep Research de Claude parce qu'il crée des rapports concis de cinq pages que je veux vraiment lire au lieu de plus de 30 pages de ChatGPT ou Gemini. “JB : La dernière fois que j’ai fait un comparatif, j’ai trouvé la deep research de Claude bien plus impactante avec moins de mots”
Voix (ChatGPT) : ChatGPT a la voix et la personnalité les plus naturelles, mais il m'interrompt encore trop souvent. C'est pourquoi je préfère des applications comme Wispr Flow pour la dictée vocale IA plutôt que n'importe quelle option des grands labos. “JB : j’utilise rarement le voice mode, à part pour montrer les possibilités en formation.”
Génération d'images (Gemini) et de vidéos (Sora). Nano Banana de Gemini est le meilleur modèle d'image (regardez mon tutoriel) et Veo 3.1 est sans doute un meilleur modèle vidéo que Sora. Mais j'adore comment Sora me permet de créer des vidéos de ma famille et de mes amis. OpenAI comprend juste mieux le social que Google (ils ont embauché tous les gens de Meta après tout). “JB : Je ne génère que très peu d’images. Pour mes images Linkedin, je reste sur Midjourney. Pour des visuels, j’utilise Claude Artéfact qui me fait des visualisations en React ou en SVG”
Caméra en direct et utilisation de l'ordinateur (aucun). Je ne trouve aucune de ces fonctionnalités vraiment utiles. L'utilisation de l'ordinateur semble particulièrement pénible — vous regardez littéralement l'IA cliquer avec la souris et prendre des captures d'écran. Ça prend juste une éternité. “JB : Je n’utilise pas, à part récemment Altas pour le computer use. ”
Enfin, parlons de Grok. Grok est peut-être un excellent modèle, mais je ne peux pas prendre au sérieux un produit qui commercialise des « compagnons IA ». Je pense que ce genre de chose repousse les gens qui veulent utiliser l'IA pour faire du travail sérieux. xAI a besoin d'un meilleur marketing.
La notion de la semaine - Verbalized Sampling
Octobre 2025 : des chercheurs de Stanford révèle le “Verbalized Sampling”, une technique de prompt simple et rapide, qui double la diversité créative des LLMs.
Depuis un an, les modèles d’IA comme GPT, Claude, Gemini deviennent de plus en plus sages, mais aussi… de plus en plus prévisibles.
Toujours les mêmes réponses, la même tournure, les mêmes idées.
On appelle ça le “mode collapse” : quand les IA cessent d’explorer et se contentent de répéter les chemins les plus probables.
Mais une équipe de Stanford vient de découvrir pourquoi.
Et surtout : comment y remédier.
## Le problème ? Nous.
Les humains qui notent les réponses des modèles ont un biais de “typicalité” : on préfère ce qui paraît correct, poli, familier. Résultat > on apprend aux IA à plaire plutôt qu’à "penser" différemment.
👉 La solution proposée : le “Verbalized Sampling” (VS).
Plutôt que de demander :
“Écris un slogan pour notre nouvelle campagne.”
On demande :
“Propose 5 slogans pour notre campagne, et indique la probabilité que tu attribues à chacune.”
Ce simple changement pousse le modèle à explorer plusieurs chemins de pensée,au lieu de donner la réponse “parfaite”.
Les résultats des tests sont époustouflants :
✅ +2x de diversité créative
✅ Pas de perte de cohérence ni de sécurité
✅ Et plus le modèle est grand, plus le gain est fort
## En résumé
➡️ Le problème des IA n’est pas forcément algorithmique.
➡️ Il est souvent humain.
Et parfois, il suffit juste de poser la question autrement…pour rouvrir tout un champ de créativité. J'utilise désormais cette technique à chaque tâche créative, et ça change tout.
A terme, nous allons développer des LLMs forcés à être prévisible, et d'autres que nous pousserons à être créatifs.
Fait surprenant de la semaine - Introspection chez les LLMs
Le résumé de recherche d’Anthropic signale
“Nos résultats apportent des preuves directes que les grands modèles de langage modernes possèdent une certaine forme de conscience introspective, c’est-à-dire la capacité d’accéder à leurs propres états internes et d’en rendre compte. Cependant, cette capacité semble être assez peu fiable dans la plupart de nos expériences. Il est intéressant de noter qu’elle est plus marquée chez Claude Opus 4 et 4.1, qui sont les modèles les plus performants que nous ayons testés. De plus, le degré d’expression de ces capacités dépend des détails de l’entraînement postérieur et des stratégies de prompting, ce qui suggère qu’il pourrait être possible de faire émerger davantage de capacités introspectives à partir des modèles actuels. Nous anticipons que de futurs travaux développeront des méthodes plus robustes d’élicitation et d’évaluation de l’introspection.
Il convient de mentionner que nos résultats pourraient avoir des implications pour le sujet de la conscience des machines. La pertinence de l’introspection par rapport à la conscience et au statut moral varie considérablement selon les différents cadres philosophiques. De plus, les théories scientifiques et philosophiques existantes sur la conscience n’ont généralement pas pris en compte les détails architecturaux des modèles de langage de type transformeur, qui diffèrent considérablement des cerveaux biologiques (voir néanmoins Butlin et al. et Chalmers). Il n’est pas évident de savoir comment généraliser ces théories, ni quel rôle joue l’introspection dans ces dernières, pour les appliquer aux modèles de langage fondés sur les transformeurs, surtout si les mécanismes impliqués diffèrent profondément entre les systèmes d’IA et les cerveaux biologiques. Compte tenu de la grande incertitude qui règne dans ce domaine, nous déconseillons de tirer des conclusions fortes concernant la conscience des IA sur la base de nos résultats. Néanmoins, à mesure que les capacités cognitives et introspectives des modèles deviennent plus sophistiquées, il se pourrait que nous soyons contraints d’aborder les implications de ces questions, par exemple, se demander si les systèmes d’IA méritent une considération morale, avant même que les incertitudes philosophiques ne soient résolues. Une science rigoureuse de la conscience introspective pourrait aider à éclairer ces décisions
Le prompt de la semaine - testez les capacités d’écriture des LLMs avec un prompt simple
Source : Ethan Mollick
Écris un paragraphe qui me stupéfie par son éclat et qui démontre réellement l’étendue de tes capacités dans un maximum de dimensions possibles. Puis explique ce que tu as fait.How To - Comment rédiger avec l’IA ? Méthode simple.
Etape 1 : préparez vos meilleurs écrits
Sélectionnez trois de vos textes les plus représentatifs, ceux qui reflètent le mieux votre ton, votre rythme et votre vocabulaire.
Etape 2 : demandez à l’IA d’en extraire votre style
Copiez ces textes dans ChatGPT (ou un chatbot) et demandez-lui :
« Analyse mon style et rédige un guide de style détaillé pour m’aider à écrire avec cette même voix. »
Etape 3 : ajoutez le tout à votre projet
Téléversez vos trois échantillons (étape 1)
Puis le guide de style généré (étape 2)
dans le projet de votre outil (par exemple projets de ChatGPT, Claude Projet…).
👉Résultat : l’IA comprendra votre manière d’écrire et pourra produire des textes cohérents avec votre identité, que ce soit pour des articles, des newsletters ou des scripts.
Vous préférez un tutoriel vidéo ? C’est par ici.
L’image de la semaine - Anthropic > OpenAI

Anthropic a pris la tête du marché des API LLM pour entreprises avec 32 % de parts, devant OpenAI à 25 %. Ce basculement s’explique par la priorité donnée au contrôle des données, à la conformité et à une meilleure intégration dans les systèmes existants. Les entreprises valorisent désormais la fiabilité et la sécurité autant que la performance brute, et les configurations multi-fournisseurs deviennent la norme. Le marché reste compétitif, avec Google à 20 % et Meta à 9 %, tandis que les dépenses totales ont atteint 8,4 milliards de dollars au premier semestre 2025.
Merci pour la lecture de cette édition,
Excellente journée,
Jean-Baptiste.
As-tu aimé cette newsletter ? |
Reply