novembre 2025

25 novembre 2025 • Theo - t3․gg • 30m 16s

Theo évalue Claude Opus 4.5 d’Anthropic, saluant sa fiabilité en code, son usage des outils, son efficacité en jetons et ses progrès en UI tout en critiquant les prix, les benchmarks et l’irrégularité des concurrents.

24 novembre 2025 • Le SamourAI | IA et Stratégie • 14m 23s

Une analyse en français soutient que l’IA accélère sur tous les fronts — agents de codage, raisonnement scientifique (GPT‑5 Pro), compréhension vidéo sémantique (Meta SAM3), génération d’IU haute fidélité (Google Nano Banana Pro), création de mondes 3D (Marble de Fei‑Fei Li) et bascule géopolitique de l’infrastructure (OpenAI–Foxconn, GB300 saoudiens) — et appelle les professionnels à passer du statut d’opérateurs à celui d’architectes de systèmes.

24 novembre 2025 • All About AI • 18m 29s

Présentation de sept usages créatifs et centrés sur le visuel de Nano Banana Pro : expliquer du code en infographies, résoudre un problème de physique manuscrit, générer automatiquement des menus, résumer des PDF sur un tableau blanc, visualiser des erreurs de code, transformer des plans en vues 3D et créer des lots de diapositives.

23 novembre 2025 • Ray Fernando • 18m 51s

Un guide pratique montrant comment les serveurs MCP ref.tools et exa.ai réduisent drastiquement l’usage du contexte dans les flux de travail de codage IA, avec une configuration pas à pas dans Claude Code, Cursor, Codex et DroidFactory, une démo de refactorisation Tailwind v4 et des conseils de prompt.

23 novembre 2025 • Alex Ziskind • 12m 59s

Comment utiliser VS Code Insiders pour ajouter et configurer des modèles personnalisés compatibles OpenAI—y compris des LLM locaux et distants via les paramètres—pour le chat, l’édition et les workflows d’agent, avec des démos depuis LM Studio et une grande instance distante Kimi K2.

Des tests pratiques du nouveau Nano Banana Pro (Gemini 3 Pro Image) de Google montrent de solides capacités de génération et d’édition d’images — affiches, maquettes, raisonnement spatial et retouches réalistes — avec des améliorations notables par rapport à la version précédente.

Démo en direct où Debbie utilise Goose avec Gemini 3 pour repenser son site Nuxt, en itérant sur les héros, les grilles, l’accessibilité et l’UX tout en corrigeant des bugs et en automatisant des tâches comme la gestion d’images.

19 novembre 2025 • All About AI • 33m 42s

Premières impressions pratiques de Gemini 3 Pro à travers sept tests — sandbox terminal, pilotage de drone, clonage d’UI, terminal Web type Linux, conception de build Path of Exile 2, raisonnement d’images « trouve la balle », ainsi qu’un jeu façon Mario et des quiz alimentés par vidéo — concluant que c’est le LLM le plus solide à ce jour.

Analyse stratégique montrant que les progrès de Gemini 3 aux benchmarks, combinés à la distribution intégrée de Google (et un partenariat Apple probable), déplacent le pouvoir de l’IA de la qualité du modèle vers le workflow et l’accès par défaut, avec des implications concrètes pour les carrières.

19 novembre 2025 • Theo - t3․gg • 30m 56s

Un examen détaillé et des tests pratiques de Gemini 3 Pro de Google mettant en avant ses succès aux benchmarks, ses capacités multimodales, sa grande vitesse, ses excellentes performances en UI/génération de code, ainsi que ses défauts comme un coût plus élevé, une forte consommation de tokens et des hallucinations occasionnelles.

19 novembre 2025 • Ray Fernando • 2h 46m 27s

Test en direct de Gemini 3 de Google dans Cursor, Droid de Factory AI et l’IDE Antigravity de Google en créant des apps réelles (suivi de volcan, Canoe Club, ajustements d’AnimeLeak), mettant en avant la qualité de design, les workflows d’agents et les limites de débit.

17 novembre 2025 • Jack Herrington • 17m 7s

Un guide étape par étape montrant comment déployer une application TanStack Start sur Railway, ajouter un point de terminaison MCP et l’intégrer à ChatGPT pour afficher des widgets interactifs, aboutissant à un widget React qui renvoie vers les pages produit.

17 novembre 2025 • Debbie O'Brien • 20m 4s

Explique la différence entre Playwright MCP et Playwright Test MCP : le premier sert à l’automatisation générale du navigateur, tandis que le second alimente les workflows de test avec les agents Planner, Generator et Healer et des outils centrés sur TS/JS, ainsi que l’installation et l’utilisation de chacun.

16 novembre 2025 • Le SamourAI Dansant • 19m 40s

La vidéo explique comment GPT-5.1 passe de la simple reconnaissance des instructions à leur obéissance fiable, permettant une automatisation précise, un raisonnement adaptatif et une meilleure gestion de l’incertitude, tout en sacrifiant certaines catégories de sécurité pour une expérience plus chaleureuse et humaine, et expose les implications pour les métiers ainsi que des actions concrètes pour s’adapter.

15 novembre 2025 • Maximilian Schwarzmüller • 24m 20s

La vidéo analyse une étude de l’Université de Chicago sur les agents d’IA pour le code, concluant qu’ils augmentent la production (p. ex., plus de fusions) sans dégrader la qualité à court terme, tout en soulignant que les développeurs expérimentés acceptent davantage grâce à des requêtes précises et planifiées, et en avertissant des risques de dépendance excessive et de maintenabilité à long terme.

14 novembre 2025 • Theo - t3․gg • 28m 36s

Theo critique l’approche de MCP basée sur une profusion d’outils et met en avant la nouvelle orientation d’Anthropic vers des agents exécutant du code, bien plus efficace, sûre et scalable pour utiliser des outils externes avec des LLMs.

Une table ronde débat de la nouvelle troncature de Codex à 256 lignes pour les appels d’outils et de son impact sur les agents de code, compare Claude, Kimi K2 Thinking, Minimax M2, GLM 4.6 et d’autres, et explore les tarifs, la sécurité et les stratégies de flux de travail qui façonnent les outils d’IA actuels.

13 novembre 2025 • Matthew Berman • 8m 52s

Aperçu des nouveautés de GPT‑5.1 : chat plus rapide, précis et chaleureux, raisonnement adaptatif qui calibre le temps de réflexion, meilleur suivi des instructions, gains d’extensibilité et de latence en entreprise, et améliorations en développement front‑end, ainsi que le déploiement et les changements d’API comme la mise en cache des invites.

9 novembre 2025 • Theo - t3․gg • 14m 44s

Theo analyse des fuites et des indices de performance suggérant que le supposé GPT‑5.1 d’OpenAI pourrait être le modèle furtif « Polaris Alpha », en comparant benchmarks, générations d’UI, TPS/latence et modes de déploiement pour conclure à une sortie imminente.

7 novembre 2025 • Matthew Berman • 14m 31s

Présentation du modèle Kimi K2 Thinking en open weights de Moonshot, de ses résultats aux benchmarks, de ses capacités d’agent avec outils et de démos illustrant un raisonnement long, la navigation web et l’exécution de projets complexes.

7 novembre 2025 • The Plain Bagel • 22m 22s

La vidéo analyse si l’essor actuel de l’IA est une bulle, en présentant les dépenses massives, les financements circulaires, les contraintes de demande et d’infrastructure, et les différences avec l’ère dot‑com.

7 novembre 2025 • Arseny Shatokhin • 8m 5s

L’article d’Anthropic soutient que générer et exécuter du code pour appeler les outils à la demande est supérieur au chargement complet des définitions MCP, réduisant les jetons, la latence et l’exposition, tout en permettant la divulgation progressive, des garde-fous de confidentialité et des compétences persistantes—au prix de compromis en fiabilité et d’un surcoût de sandbox.

7 novembre 2025 • Zed Industries • 47m 37s

Addy Osmani présente le « problème des 70 % » en IA pour le code : l’IA accélère l’échafaudage mais peine sur le dernier kilomètre (qualité, confiance, tests, revues, contraintes réelles), et propose des flux de travail pragmatiques, les tests comme boucle de retour et des conseils pour les équipes et les juniors.

Première découverte du modèle Kimi K2 Thinking de Moonshot AI avec une vue technique (quantification int4, MoE, 1T de paramètres) et des tests pratiques : OS de navigateur, sécurité en jeu de rôle, FPS low‑poly en Python, jeu de course 3D web, sites de réparation PC (pression commerciale vs standard), écriture créative et une expérience « Espace Quantique » en terminal.

Un guide pas à pas pour créer un agent chatbot no‑code dans n8n avec Gemini, connectant Strava, YouTube, la météo, les issues GitHub, des flux RSS, Google Calendar et Gmail, avec mémoire de conversation et résumés e‑mail automatisés.

4 novembre 2025 • Grafikart.fr • 19m 4s

Un guide pas à pas pour créer un nœud déclencheur n8n personnalisé connecté à Twitch—de la mise en place avec le starter kit, aux métadonnées du nœud, à la logique du trigger avec TMI.js, jusqu’au lien local pour le développement et les tests dans un workflow.

3 novembre 2025 • Grafikart.fr • 23m 16s

Une démonstration pratique en français de la mise en place et de l’utilisation de n8n pour créer un workflow déclenché par un chat qui classe les emails avec un classificateur IA et génère des réponses personnalisées, avec des astuces sur les data tables, webhooks et intégrations.

3 novembre 2025 • Theo - t3․gg

Theo passe en revue les témoignages de régression de qualité de GPT‑5/Codex, en détaillant l’enquête interne d’OpenAI (variance matérielle, compaction, délais, bug d’échantillonnage contraint, vérifications de l’API responses) et les correctifs, en expliquant que la perception vient aussi de tâches plus dures et de la complexité des configurations.

3 novembre 2025 • Ray Fernando

Un livestream technique avec Luke Alvoeiro (Factory AI) expliquant comment l’agent scaffolding de Droid, les résumés ancrés et la compression du contexte permettent des sessions de codage de plusieurs millions de tokens sans perte de contexte, avec également des échanges sur le mode “spec”, la parallélisation et les impacts pratiques sur le cycle de vie logiciel.

2 novembre 2025 • Ray Fernando

Dans un live de 3 h, Ray ré-architecture AnimeLeak en un système multi‑thèmes avec Droid de Factory AI et Sonnet 4.5, montrant le « spec mode », les stacked diffs, les migrations sous Convex et pourquoi la gestion du long contexte par Droid et le respect des agents.md ont surpassé Cursor 2.0 pour de longues sessions de code continues.