You are currently viewing Claude Fable verrouillé : La régulation de l’IA atteint les modèles en direct pour la première fois (2026-06-21)

Claude Fable verrouillé : La régulation de l’IA atteint les modèles en direct pour la première fois (2026-06-21)

Conçu pour creuser — copie l’article entier dans ton LLM pour l’analyser en détail.

L’interdiction de Fable : Comment le gouvernement américain a retiré un modèle d’IA live du marché pour la première fois

Dimanche 21 juin 2026

🎧 Cet episode en podcast (14 min)

Bonjour, ce digest hebdomadaire traite les vidéos nouvelles les plus importantes provenant d’environ 40 chaînes YouTube curées sur l’IA et le coding — avec substance, pas de top-5 superficiel. Un résumé complet par vidéo, plus un aperçu hebdomadaire des thèmes dominants. Lisez tranquillement — ou copiez un résumé dans le LLM de votre choix et approfondissez. Cliquez sur le lien sous chaque résumé pour voir la vidéo originale.

C’était un précédent sans équivalent : Dans les 36 heures suivant son lancement, le gouvernement américain a bloqué Claude Fable 5 par directive de contrôle à l’export pour tous les non-citoyens américains — y compris les employés d’Anthropic avec des passeports étrangers. Pour Fireship, c’était simplement « la première fois dans l’histoire qu’un grand fournisseur d’IA retire un modèle live public du marché sur instruction gouvernementale ». Anthropic n’avait pas le choix : comme une vérification pratique de nationalité était impossible, ils ont désactivé Fable pour tous les utilisateurs.

Deux interprétations circulent sur le déclencheur, qui ne s’excluent pas mutuellement. Officiellement, des chercheurs d’Amazon ont signalé un jailbreak — de simples astuces Unicode structurées et des cadres de jeu de rôle, aucun exploit de science-fiction technique —, après quoi le secrétaire au Commerce américain Howard Lutnik a signé la directive. Qu’Anthropic n’ait reçu que 90 minutes de préavis et aucune justification de la menace concrète, ainsi que les fausses allégations du gouvernement selon lesquelles le PDG Dario Amodei serait en retraite bien-être, amènent plusieurs chaînes (AI Explained, Kyle Balmer) à douter des motifs : Pete Hegseth a tweeté agressivement contre Anthropic, les cercles OpenAI ont massivement financé le PAC de Trump, Anthropic non. Theo de t3.gg a découvert une couche supplémentaire : Fable contenait dès le départ des garde-fous invisibles qui redirigaient ou dégradaient silencieusement les prompts autour du « Frontier-LLM-Development » — les utilisateurs payaient le prix fort sans retour d’information. Anthropic n’a révisé cette pratique que sous pression.

Ce qui rendait Fable techniquement particulier, Kyle Balmer le décrit précisément : il s’agissait de Mythos 5 avec des classificateurs de sécurité supplémentaires — des recours visibles à Opus 4.8 pour les requêtes sensibles —, qui travaillait proactivement et pendant des heures de manière autonome au lieu de réagir à des prompts individuels. David Shapiro ajoute qu’Anthropic avait délibérément redirigé les requêtes complexes de recherche en ML vers le modèle Opus plus faible pour prévenir l’auto-amélioration récursive — une mesure qu’il attribue à l’arrière-plan Less-Wrong de nombreux fondateurs d’Anthropic. AI Explained résume le dilemme central : le jailbreaking n’est pas résolu, aucun modèle n’est universellement résistant, et Amodei lui-même a soutenu que le gouvernement doit distinguer entre les jailbreaks étroits et spécifiques et les contournements universels. Jusqu’à la date limite, des négociations se déroulaient à Washington ; un retour avec des contrôles renforcés était attendu pour le même mois.

IA & Société / Avenir du travail

Plusieurs vidéos traitent la question de savoir à qui appartient l’intelligence IA et qui a le droit de la contrôler. Kyle Balmer rend explicite la charge explosive sociale : Fable marque le premier moment où l’intelligence IA de pointe est réservée exclusivement aux utilisateurs solvables — une nouvelle question de classe numérique. Nate Herk analyse le plan « Built to Benefit Everyone » d’OpenAI et l’appel parallèlement formulé d’Anthropic : les deux labos demandent une instance externe qui peut suspendre le développement Frontier si nécessaire — non parce qu’ils iraient volontairement plus lentement, mais parce que la pression concurrentielle est trop élevée pour s’arrêter seul. Nate B. Jones (AI News & Strategy Daily) et Unsupervised Learning discutent de savoir si le calcul de risque à 25% d’Amodei est illibéral ou simplement responsable — sans consensus, mais avec l’accord sobre que le contrôle privé centralisé serait tout aussi dangereux que l’État. Wolfgang Hirn (Everlast AI) fournit le cadre géopolitique : Huawei développe avec la procédure de puces alternative « Tau » une fabrication indépendante jusqu’à 1,4 nm, ce qui sape à long terme le levier américain central des restrictions d’exportation ; la faiblesse de mise en œuvre de l’Europe est structurelle, non cognitive. Et l’essai sur le clonage vocal de Nate B. Jones poursuit le fil d’érosion de confiance : le bien rare de l’avenir ne serait pas le contenu, mais le jugement et la responsabilité.

Industrie IA & Stratégie

L’épisode Fable n’est pas détaché du changement structurel plus large du secteur. Nate B. Jones analyse dans trois essais s’appuyant l’un sur l’autre la différence décisive entre Token (intelligence brute, marchandise) et Harness (tout ce qui transforme l’intelligence en travail productif — gestion du contexte, évaluations, routage, workflows). Son argument central : qui contrôle la Harness contrôle la valeur ; les IPO d’OpenAI et Anthropic sont le premier test public de cette thèse. David Shapiro ajoute que la simple vente de tokens n’est pas une base viable — la valeur réside dans les outputs et les outils, une image que Satya Nadella a tracée de manière similaire dans un article très discuté. La question « Bulle IA ou non ? » Jones la répond avec nuance : la demande et la construction sont réelles (OpenAI est passé de 2 à plus de 20 milliards de dollars de chiffre d’affaires annualisé), mais le marché commence seulement à trier entre la véritable valeur de workflow et la valeur de démo. Le chiffre d’affaires des datacenters de Nvidia (193,7 milliards fiscal 2026) est une preuve physique, pas de la spéculation. En parallèle, TheAIGRID avertit que les forfaits plats bon marché à 20 $ sont un modèle en voie de disparition : OpenAI perd déjà de l’argent sur le plan à 200 $, GitHub Copilot bascule vers une facturation basée sur les jetons, et la pression publique des investisseurs IPO devrait fondamentalement décaler la logique des prix en 2026.

Prompting & Littératie IA

Le Skill DLOP de Ben AIs (Vérificateur de sortie désaloppé) fonctionne en deux couches : d’abord les motifs universels de slop IA (tirets, contradictions, vérification des faits), puis les critères spécifiques à l’entreprise (tonalité, identité de marque, stratégie). Trois sous-agents indépendants évaluent, un journal DLOP enregistre les motifs pour l’analyse au niveau de l’entreprise. NeuralNine a présenté le Skill de code Claude « Ponytail », qui affine les agents pour des sorties concises et minimalistes — particulièrement utile lors de l’apprentissage de nouveaux frameworks comme LangGraph, où les explications exhaustives de meilleures pratiques sont contre-productives. L’explication de la boucle d’agents de Nate Herk clarifie la structure fondamentale (déclencheur, action, condition d’arrêt) et trois types d’architecture : boucle solo, vérificateur de fabricant et gestionnaire avec assistants — avec l’indice pratique que les boucles avec des critères trop ouverts s’exécutent indéfiniment et les siennes durent généralement 30 minutes à quelques heures.

PKM & Gestion des connaissances

Niklas Steenfatt a rapporté sur Odysseus, le projet open-source étonnamment viral de PewDiePie (65 000 stars GitHub) : une interface de chat auto-hébergée avec téléchargement de documents, intégration calendrier, édition d’images et e-mail, exploitée via Ollama Cloud au lieu d’une GPU locale — un juste milieu pragmatique entre souveraineté totale des données et facilité d’utilisation. L’astuce : ce n’est pas la technologie qui est l’énoncé, mais qu’un créateur avec 100 millions d’abonnés positionne l’IA décentralisée comme une contre-proposition à Google et OpenAI.

Entreprise IA, Marketing & Freelance

Le rapport pratique de Stefan Hoffmann (Everlast AI) est l’un des plus concrets de cette semaine : 200 clients inactifs réactivés via un agent téléphonique sortant, 5 % de retour, deux locations à Majorque. Selon lui, la clé du succès était le bon systempromt et le préfiltre honnête des cas d’usage sans objet. AI avec Arnie a démontré comment générer des sites Web de marketing premium à partir d’un master-prompt avec Claude (ou Cursor/Hermes), la CLI Hixfield pour la génération d’images et vidéos, et l’hébergement gratuit via GitHub/Vercel Premium — autrefois un service à 10 000 €, aujourd’hui pour environ 47 € par mois pour environ huit sites complets avec vidéos. L’essai Six-Skills de Nate Herk s’adresse aux employés : le conseil le plus important n’est pas de changer de carrière, mais de rendre son propre domaine plus efficace avec l’IA — comme Excel pour les comptables — et de devenir visible en tant que « la personne IA dans la pièce ».

Vidéo IA & Création de contenu

Google Flow Tools permet selon TheAIGRID de créer ses propres outils créatifs IA en langage naturel sans code — les outils existants (esquisse à image, effets vidéo warp profondeur 4D) peuvent être remixés, les outils personnalisés définis via un menu déroulant et partagés avec un lien. NotebookLM reçoit selon WorldofAI des mises à niveau agentiques massives : Gemini 3.5 Flash comme base, Secure Cloud Computer avec plus de 100 capacités logicielles, exports structurés en PDF/Word/Excel/PowerPoint et une fonctionnalité de recherche agentique qui découvre indépendamment les sources Web et les intègre dans le notebook avec autorisation — initialement pour les abonnés Google AI Ultra. Nate B. Jones (AI News & Strategy Daily) a démontré un clone vocal cloné de sa propre voix et a formulé à partir de là cinq niveaux d’une « Creator Trust Stack » : Disclosure, Provenance, Control, Judgment et Accountability — le bien rare ne serait pas le contenu, mais qui assume la responsabilité des décisions.

Automation IA & Workflows

n8n a montré un workflow de réponse aux incidents de cybersécurité combinant trois stratégies parallèles : recherche vectorielle dans les incidents historiques, consultation de playbook et renseignement de menace externe. Synthétisées sont les mappages MITRE ATT&CK, les IoCs au format JSON et les prochaines étapes priorisées — certaines automatisables, certaines pour approbation manuelle. Le contexte est grave : le modèle Mythos d’Anthropic a trouvé selon la vidéo un zero-day de 27 ans dans OpenBSD, ce qui nécessite une défense automatisée au même niveau. Dave Ebbelaar a présenté sa pile fiable 2026 : Python + FastAPI + Celery (backend), PostgreSQL via Supabase (données), React + Vite + Shadcn UI (frontend), API LLM directes (IA), Docker + Railway ou Hetzner VPS (infra) — avec l’argument que ces couches établies sont plus stables que les outils individuels éphémères. WorldofAI a démontré Base 44 Super Agents comme alternative sans code : intégrations préconfigurées pour Gmail, Slack, Stripe et 100+ services supplémentaires, agents spécialisés parallèles avec sorties chaînées.

Système d’exploitation IA personnel & Frameworks d’agents

L’Open-Skills-Framework de Nate B. Jones adresse le problème de « procedural debt » : 31 skills réutilisables en Markdown dans sept catégories plus sept runbooks, portables entre Claude Code, Cursor et Codex, avec étapes de vérification explicites au lieu d’une vague notification de fin. Un « Session-to-Skill Extractor » transforme les motifs récurrents des sessions d’agents en candidats skills — le même principe de compounding que son concept Open-Brain, mais au niveau procédural. Le modèle five-étapes de Nate Herk du Second Brain va du simple routage par mot-clé via `claude.mmd` (niveau 1) à la recherche sémantique avec des bases de données vectorielles comme Supabase ou Pine Cone (niveau 3) en passant par les graphes de connaissances avec LightRAG (niveau 4) et les systèmes continuellement auto-actualisants comme GBrain (niveau 5) — avec la recommandation pratique de n’upgrader que lorsque le système actuel cause une véritable douleur. AgentSpan a été démontré par Tech With Tim comme framework de production pour trois types d’agents : conversationnel avec mémoire, basé sur RAG avec approbations Human-in-the-Loop et orchestration multi-agent avec stratégies d’exécution séquentielles, parallèles et imbriquées.

Ingénierie logicielle & Culture de développement

La migration de Melvynx de Next.js vers TanStack Start (plus de 100 000 lignes de code ajoutées, 129 000 supprimées) a réduit le temps de compilation de 3:30 à 1:20 minutes et a fourni l’argument décisif pour le développement assisté par IA : TanStack Start est déclaratif et explicite, suit les normes Web au lieu des abstractions propriétaires — c’est pourquoi les agents IA le comprennent mieux et génèrent du code plus cohérent. Leon van Zyl a construit avec Claude Code et le plugin Unreal Engine MCP un prototype jouable inspiré de GTA avec des PNJ, des véhicules et des armes ; l’effort était intensif en temps, mais montre vers où tend le développement de jeux assisté par agents pour les équipes indépendantes. Theo (t3.gg) a formulé l’argument plus large : les outils IA sont encore utilisés trop défensivement — pour accomplir l’ancienne tâche plus vite au lieu d’aborder les projets qui semblaient jusqu’à présent impossibles. Son framework LakeBed (base de données intégrée, authentification, déploiement, runtime personnalisé) est exactement cela : dix applications en huit minutes avec Cursor/Composer 2.5, toutes avec authentification Google et synchronisation en temps réel. Fireship a raconté l’histoire de la genèse de Turso, une réécriture Rust de SQLite avec vrai parallélisme, support async et recherche vectorielle native — le véritable défi n’est pas les fonctionnalités, mais la confiance que SQLite a construite en 25 ans.

Agents de code (hors Claude)

Omnigent (Databricks, open source) s’établit comme une Harness méta sur les agents de codage existants : une commande de configuration suffit, l’interface Web montre les assistants et orchestrateurs sélectionnables, et deux exemples fournis — Poly (Claude implémente, Codex examine) et Debbie (deux agents débattent, la synthèse suit) — montrent le principe. Cole Medin le distingue du « Loop Engineering », qu’il écarte comme terme marketing : sans fichier de workflow déterministe, durabilité via Postgres et contrôle explicite des coûts, le looping devient cher et incontrôlable — son contre-argument s’appelle Arkon, également open source, avec dashboard via Retool. La comparaison de 30 jours de Leon van Zyl entre Claude Code et Codex sur une application similaire à N8N a donné : Claude gagne au design, Codex à la structure de projet, aux questions techniques lors de la planification et à l’efficacité des coûts (Codex a consommé 16 % de son plan de 100 $, Claude 8 % du plan de 250 $ — selon le point de vue). Mark Kashef a montré comment extraire les métriques de comportement de Fable 5 des fichiers de session JSONL stockées et les injecter en tant que playbook dans d’autres modèles pour approximer la méthode de travail structurée de Fable.

Claude Code & Outils Anthropic

Theo (t3.gg) a consacré malgré sa critique de Fable une vidéo entière aux forces de Claude Code, afin que d’autres harnesses adoptent ces motifs : skills avec exécution de script au chargement, imports `claude.md` avec max quatre sauts, `claude.local.md` pour les overrides personnels conviviaux en équipe, workflows générés dynamiquement orchestrant des sous-agents, et le mode TUI plein écran pour un rendu propre du terminal. Séparément, il a documenté les workflows en boucle où Codex file des nouveaux threads, lit automatiquement les commentaires des examinateurs de PR et les traite — quatre PR empilées du jour au lendemain, trois millions de tokens, mais finançable avec la limite d’abonnement à 200 $. Nate Herk et Cole Medin ont discuté au format podcast pourquoi la planification d’abord est cruciale : la « Dumb Zone » commence chez Opus autour de 250 000 tokens, les étapes de validation élèvent la qualité au premier passage de 65 à 92 %, et chaque bug doit se terminer par une amélioration permanente dans `claude.md` ou un skill. Julian Ivanov a livré un tutoriel complet pour un système d’exploitation IA personnel avec Claude Code : base de connaissances dans Obsidian, connexions d’outils MCP, skills en tant que fichiers Markdown, routines distantes sur les serveurs Hostinger, synchronisées via GitHub.

IA locale & open-source

GLM 5.2 peut s’exécuter localement en quantisation 2-bit sur un Mac Studio avec 256 GB de RAM (82 % de précision selon Everlast AI) ; Alex Finn l’a démontré avec un tireur à la première personne 3D entièrement généré localement via son agent Hermes. Bart Slodyczka a combiné Gemma 4 (12B, variante QAT via LM Studio) avec l’agent Hermes sur un Mac Mini M4 (16 GB RAM) et a contrôlé la configuration via Claude Code au terminal pour répondre automatiquement aux tickets Zendesk. Everlast AI a fourni l’aperçu le plus complet : cinq façons d’accéder à l’IA locale (Ollama, LM Studio, Llama.cpp, API d’inférence via Together AI/Nebius, embarquée dans Apple Intelligence/Gemini Nano), le message clair que les modèles open-source ne traînent maintenant que de quatre mois par rapport aux modèles frontier, et un plaidoyer hybride : données sensibles locales, performance de pointe pour le codage complexe dans le cloud. Nick Saraev a montré comment GLM 5.2 est utilisé via OpenRouter avec Claude Code comme harness — « Engine-Swap » — et conclut que le modèle a actuellement plus de « goût » qu’Opus 4.8.

Sorties de modèles & Benchmarks

Au-delà de la tempête Fable, c’est une poignée de sorties de modèles et de fuites qui ont marqué la semaine. GLM 5.2 de ZAI a dominé la discussion open-source : licence MIT, 1 million de tokens de contexte, selon Everlast AI à égalité avec Claude Haiku 5 sur l’arène design et GPT 5.6 Pro, selon WorldofAI avant Opus 4.8 en développement frontend. Kimi K2.7 Code (Moonshot AI, ~1 milliard de paramètres, MoE) améliore par rapport à K2.6 le respect des commandes de 30 % et réduit la sur-réflexion, reste cependant à la traîne avec un contexte de 262 K — les benchmarks d’Alejandro AOs montrent que Kimi comme implémenteur avec un planificateur coûteux (GPT-5.5 ou Opus) offre le meilleur rapport coût-qualité. OpenAI préparait cependant selon plusieurs fuites (WorldofAI) GPT-5.6 avec budget de raisonnement 960, jusqu’à 1,5 million de tokens de contexte et intégration Playwright pour fin juin. TheAIGRID a présenté SubQ, un modèle de langage avec une attention sparse complètement sub-quadratique : à 1 million de tokens 56 fois plus rapide que Flash Attention 2, fenêtre de contexte de 12 millions de tokens, précision Needle-in-the-Haystack de 100 % jusqu’à 2 millions de tokens — cependant avec vérification indépendante encore en attente et faiblesses connues sur les prompts courts quotidiens.

Brèves notes

Apple Intelligence 2026 (TheAIGRID) : aperçu pratique des Writing Tools, Visual Intelligence, Live Translation en FaceTime et intégration Siri/ChatGPT. Lemma (Tech With Tim) : plateforme de recherche multi-agents générant un article académique complet à partir d’une question — une tâche SARS à prompting d’incertitude a duré deux jours et réduit les hallucinations de 18–51 %. Feuille de route AI-Engineering DataCamp (Tech With Tim) : neuf cours, 26 heures, API OpenAI vers LangChain, entrée solide pour les développeurs Python. PDG d’Intel Lip Bu Tan (No Priors) : stratégie de retournement en trois étapes (crawl/walk/run), coopération Foundry avec Terra Fab d’Elon Musk, focus sur les CPU d’IA agentique et d’inférence. Melvynx sur les dépenses API : 4 324 dollars en une semaine, 341 parties d’échecs en réaction aux temps d’attente des agents de plusieurs heures — un protocole honnête d’atrophie cognitive par automatisation. Rapports PDF Matplotlib NeuralNine : rapports professionnels multipages avec `PDFPages` et `GridSpec` en quelques lignes Python. Webhooks vs. Polling (NeuralNine) : tutoriel pour débutants avec démo Flask, pas d’outil IA.

AI Explained (1 nouvelle vidéo)

  • Claude Fable Blocked – 11 Quiet Details on What’s Next
    14.6.2026, 14:52:27

    # Résumé

    Claude Fable 5 a été bloqué pour tous les utilisateurs en l’espace de 36 heures sur ordre du gouvernement américain – y compris pour les employés étrangers d’Anthropic lui-même. Le blocage a eu lieu après un rapport sur des jailbreaks dans le modèle et des appels du PDG d’Amazon Andy Jassy ainsi que d’autres chefs de la technologie au gouvernement américain. La directrice nationale de la cybersécurité Shan Kangross a convoqué une réunion avec des responsables de la Maison-Blanche, qui ont opté pour des restrictions d’exportation.

    Le créateur vidéo présente onze faits contextuels pour éclairer les motivations et les circonstances. Certains plaident en faveur d’une préoccupation sécuritaire honnête, bien que disproportionnée : la directrice de la cybersécurité était sous pression pour agir plus vite ; un partenaire de confiance aurait signalé une vulnérabilité de jailbreak. D’autres détails semblent nettement plus cyniques : Anthropic a souligné que les jailbreaks trouvés sont simples et tout aussi possibles avec d’autres modèles comme le GPT-4.5 d’OpenAI. Selon la carte système Mythos, Mythos et Fable sont en réalité plusieurs fois plus robustes contre l’injection de prompts que GPT ou Gemini. Une entreprise de cybersécurité indépendante a qualifié la réaction du gouvernement d’exagération, car il s’agissait d’aider aux correctifs de sécurité – exactement ce que feraient les défenseurs.

    Un deuxième point critique : le gouvernement a affirmé que le PDG d’Anthropic Dario Amodei était en retraite bien-être – Anthropic et un journaliste présent ont nié cela et ont suggéré un dommage à la réputation orchestré. S’ajoute à cela : en juin, la Maison-Blanche avait encore souligné que la surveillance complète des modèles aurait des effets refroidissants et violerait la liberté d’expression – un virage à 180 degrés par rapport à la politique actuelle. Le gouvernement n’a donné à Anthropic que 90 minutes pour se conformer sans détails sur la menace réelle. Un autre contexte cynique : Pete Hegseth (secrétaire de la Guerre) a tweeté agressivement contre Anthropic ; Trump a parlé de parts de capital pour OpenAI et XAI, mais pas pour Anthropic ; un PAC financé par Greg Brockman a soutenu Trump massivement – Anthropic, en revanche, non. Sam Altman d’OpenAI a nié les activités de lobbying.

    Le créateur vidéo souligne : le jailbreaking est un problème non résolu – personne n’a encore créé un modèle résistant à tous les jailbreaks. Amodei a donc fait valoir que le gouvernement devrait faire la distinction entre les jailbreaks étroits et spécifiques et les contournements universels. L’ironie réside dans le fait qu’Anthropic a d’abord dit vouloir construire des modèles frontière uniquement à des fins de sécurité – maintenant, elle est critiquée précisément sur la sécurité.

    En conclusion, le créateur vidéo suppose que le scénario le plus probable est : l’administration Trump espère une correction rapide d’Anthropic, après quoi la restriction d’exportation serait levée – possiblement dès lundi. Dans le cas contraire, cela aurait des conséquences massives (contrôles d’identité pour les utilisateurs, licenciements d’employés étrangers, impacts sur le marché).

    **Format :** Mise à jour d’actualités / Approfondissement ; explicitement traité : Claude/Anthropic (Fable 5, Mythos), OpenAI (GPT-4.5), Open Router, lmconsul.ai.

AI Foundations

Aucune nouvelle vidéo durant cette période.

AI mit Arnie (1 nouvelle vidéo)

  • Claude a changé le web design pour toujours
    17.6.2026, 18:21:56

    # Résumé : Des sites web premium basés sur l’IA générés à partir d’une seule invite

    Le créateur présente un système pour créer des sites web marketing de haute qualité entièrement automatisés à partir d’une seule invite. Les composants clés sont un agent de codage (Claude, Cursor, Hermes ou OpenCoder) et la CLI Hixfield pour générer des images et des vidéos.

    **Le système en un coup d’œil :**
    Le processus comprend trois étapes : (1) installer la CLI Hixfield, (2) se connecter à Hixfield, (3) installer le skill optionnel. Ensuite, on utilise un master-prompt détaillé qui combine six niveaux de prompts différents – du concept aux animations de défilement, l’éclairage, la rédaction jusqu’à la vérification finale. L’agent fonctionne en boucle jusqu’à ce que le site soit sans erreur et a été testé dans différents viewports (desktop, tablette, mobile).

    **Exemples pratiques :**
    On voit des sites web terminés pour des écouteurs (avec animation de déploiement sonore), des montres (avec rotation au défilement), des voitures, des suppléments et un exemple étonnamment créatif avec un arrosoir sur le thème du « service de déménagement sans gouttes ». L’agent interprète de manière créative ce qui pourrait être commercialisé avec le produit. Une vidéo d’un tourne-disque a été générée spontanément comme surprise – le tout avec des animations de défilement cohérentes, une rédaction parfaite et des images/vidéos élégantes.

    **Détails techniques :**
    Lors de l’utilisation, il est recommandé d’activer le mode pilote automatique et d’utiliser au minimum le niveau « High » pour la performance de Claude. Hixfield sélectionne automatiquement le bon modèle (par ex. Kling pour les vidéos, Nano Banana pour les images) sans prompting manuel. Coûts chez Hixfield : à partir de 19 € par mois (Starter), environ 47 € suffisent pour environ 8 sites web complets avec vidéos.

    **Hébergement :**
    Les sites web terminés peuvent être hébergés gratuitement via GitHub et Vercel – Push sur GitHub avec CLI, puis import et déploiement sur Vercel.

    **Contexte :**
    C’était autrefois un service premium à 10 000+ €. Maintenant réalisable dans la gamme inférieure des deux chiffres en euros. Le créateur y voit aussi un potentiel commercial, car de nombreuses agences ne connaissent pas encore cette approche. Le prompt détaillé est partagé gratuitement dans une communauté.

    Explicitement abordé : Claude / CLI Hixfield / Cursor / Codex / Agent Hermes / GitHub CLI / Vercel ; Format : Tutorial/Démo avec vue approfondie du workflow pratique.

AI News & Strategy Daily | Nate B Jones (5 new videos)

  • You Can’t Tell If I’m Real Anymore. And That’s Now YouTube’s Problem Too.
    20.6.2026, 15:00:22

    # Résumé : Clonage vocal, IA dans l’industrie créative et le problème de confiance

    L’auteur démontre d’abord un clone vocal synthétique de sa propre voix, puis explique pourquoi le vrai danger ne réside pas dans l’IA parfaite, mais dans l’IA « assez bonne » dans un monde plein de distractions. Le clonage vocal fonctionne déjà aujourd’hui : avec suffisamment de données audio propres, on peut créer des voix convaincantes – dans les situations d’écoute normales ou quand les gens regardent en passant, c’est déjà possible. Le clonage complet de la présence humaine reste troublant : les lèvres, les mouvements des yeux, les expressions faciales et les gestes des mains semblent corrects à 90%, mais les 10% manquants créent une gêne.

    Le problème fondamental n’est pas la technologie elle-même, mais le déficit de confiance dans un environnement où les gens consomment le contenu en passant – non comme des enquêteurs dans des conditions médico-légales. La question centrale ne devrait pas être « L’IA a-t-elle été utilisée ? » (une question trop primitive et binaire), mais où l’IA a agi dans la chaîne de production et où le jugement humain a pris le contrôle.

    L’auteur propose une pyramide de confiance en cinq niveaux pour les créateurs :
    1. **Divulgation** – Qu’est-ce qui était synthétique ? (voix, visage, scénario, montage)
    2. **Provenance** – D’où provenaient les matériaux d’entraînement ? Avec consentement ou récupérés ?
    3. **Contrôle** – La personne clonée avait-elle le contrôle sur l’utilisation de son identité ?
    4. **Jugement** – Qui a formulé les arguments et décidé des déclarations ?
    5. **Responsabilité** – Qui est responsable si le contenu est inexact, manipulateur ou nuisible ?

    Recommandations pour les créateurs : (1) Marquer clairement les médias synthétiques, pas cachés dans les descriptions vidéo. (2) Ne pas cloner les voix et les visages sans consentement. (3) Utiliser l’IA pour générer de la valeur, pas pour éviter la responsabilité. (4) Éduquer le public – montrer, expliquer, distinguer. (5) Les entreprises doivent établir les directives avant les scandales, pas après.

    L’auteur met en garde contre la confusion : les gens sont incohérents, clignent bizarrement des yeux, portent parfois les mêmes vêtements dans plusieurs vidéos (parce qu’ils enregistrent par lots) – ce n’est pas de l’IA. La confusion augmentera. Le vrai bien rare de l’avenir n’est pas le contenu ou la finesse, mais le jugement, le goût et la responsabilité – l’assurance qu’un vrai humain prend les décisions et en assume la responsabilité.

    En conclusion : l’auteur a utilisé une version clonée de sa propre voix pour cette démo vidéo, montrant ainsi à titre d’exemple comment les clones vocaux authentiques sont déjà possibles aujourd’hui. — Opinion/réflexion ; ne mentionne pas d’outils d’IA spécifiques ou de fournisseurs, mais discute globalement du clonage vocal et de la gouvernance de l’IA pour les créateurs.

  • Your AI Skills Are Trapped | Here’s How to Own Them
    19.6.2026, 14:00:08

    # Résumé : Open Skills – Un système d’exploitation pour le travail des agents

    La vidéo traite d’un deuxième problème qui se révèle une fois que les agents ont accès au contexte (le problème du « cerveau ouvert ») : les agents savent peut-être ce que vous savez, mais pas comment vous travaillez. L’orateur identifie cela comme de la « dette procédurale » – un problème de processus qui se manifeste en quatre symptômes : inflation des prompts (trop de règles dans des énormes system prompts), coût de réexplication (vous devez réexpliquer votre méthode de travail à chaque nouvelle session), fragmentation des instructions (les règles se dispersent sur plusieurs outils et divergent) et vérification faible (les agents « terminent », mais l’examen humain reste).

    Open Skills est une collection publique de procédures d’agents réutilisables (actuellement 31 skills dans sept catégories plus sept runbooks). Une skill est une procédure portable – non pas seulement une formulation de prompt, mais un format basé sur Markdown qui définit : quand utiliser la skill, quel est le travail, quelles sont les limites, à quoi ressemble le résultat et comment vérifier les résultats. Cela permet de transporter les procédures entre différents agents (Cursor, Claude Code, etc.), au lieu de les maintenir individuellement dans chaque outil.

    L’orateur distingue les skills (primitives – procédures individuelles) des runbooks (composition – workflows composés de plusieurs skills). Un runbook pourrait par exemple être : mémo vocal → transcription → traitement des idées → voix personnelle → page HTML → publication. Chaque skill porte une partie du contrat, les runbooks les connectent.

    La portée est également centrale : les procédures personnelles (votre voix, vos standards de publication) vous appartiennent, les procédures de projet (commandes sécurisées, règles du dépôt) appartiennent au projet. Cela empêche que tout devienne un grand mélange de préférences confuses. Une autre caractéristique clé est la vérification – la skill définit à l’avance quelle preuve doit être fournie (« Voici la capture d’écran du navigateur », « Voici l’URL qui a été vérifiée »), plutôt que d’espérer vaguement la fin.

    Un mécanisme de flywheel (« Session-to-Skill Extractor ») transforme les motifs récurrents des sessions d’agents en candidats skills, plutôt que de les laisser perdus dans l’historique de chat – c’est le même principe de composition que pour Open Brain, mais au niveau des procédures.

    Open Skills n’existe pas isolément ; il est censé fonctionner avec Open Brain : Brain fournit au agent le contexte (projet, décisions, travaux antérieurs), Skills lui fournissent les procédures (comment rechercher, écrire, construire, tester, publier). L’orateur souligne : la portabilité est ce qui différencie – vous ne liez pas vos workflows et procédures à un fournisseur, un outil ou un modèle spécifique.

    La règle de décision : une invite unique est acceptable ; si vous expliquez régulièrement les mêmes procédures et jongulez sur plusieurs outils, vous avez besoin de skills que vous pouvez inspecter, améliorer, composer et emporter avec vous.

    **Explicitement mentionné :** Claude Code, Cursor, Codeex ; Open Brain comme concept précurseur — Format : opinion/réflexion avec annonce de produit.

  • Your $20 AI Plan Costs Them Thousands. That’s Not The Bubble.
    15.6.2026, 14:00:28

    # Résumé : L’IA est-elle une bulle ou non ?

    Le créateur argue que la question fréquemment posée « L’IA est-elle une bulle ? » est trop simple et provoque une mauvaise compréhension du marché. Au lieu de poser cette question binaire, il faut plutôt différencier entre la construction réelle et la demande réelle d’un côté, et les exagérations spéculatives de l’autre.

    **Les signaux de demande sont réels :** OpenAI a connu une croissance de 2 milliards de dollars de revenus annualisés en 2023 à plus de 20 milliards en 2025, avec Anthropic croissant encore plus vite. Cela provient à 40% de clients d’entreprise, pas de consommateurs qui ont juste essayé un chatbot – les entreprises dépensent des budgets sérieux parce qu’elles accélèrent des workflows concrets. Les revenus des centres de données de Nvidia (193,7 milliards fiscal 2026) montrent une demande physique : les PDG et les conseils d’administration n’achètent pas cette infrastructure pour des expériences aléatoires.

    **La différence cruciale : l’inférence plutôt que l’entraînement.** L’entraînement est épisodique et cher ; l’inférence s’exécute chaque fois que quelqu’un utilise le modèle. Les agents (pas seulement le chat) génèrent des millions et des milliards de tokens par exécution – par des boucles, des appels d’outils, des vérifications. Cela explique pourquoi les chiffres de capex deviennent si sérieux : Microsoft, Google, Amazon et Meta construisent essentiellement des usines pour l’inférence, pas seulement du logiciel.

    **Le vrai problème de tri :** Google, Microsoft, Amazon et Meta dépensent ensemble environ 700 milliards de dollars en infrastructure d’IA, mais doivent prouver que ces investissements vont payer. Certaines entreprises vont surcharger, certaines au mauvais endroit, certains coûts de startup sont gonflés. Mais cela ne signifie pas que la demande fondamentale est imaginaire.

    Le vrai test en 2026 : **Des tokens chers sont-ils dépensés pour un travail précieux ?** Un agent de codage qui économise des semaines aux équipes justifie l’inférence chère. Un système de service client avec vrai ticketing aussi. Un chatbot d’entreprise aléatoire avec une base de connaissances obsolète non. Les données ROI entreprise sont chaotiques, parce que la plupart des entreprises sont mauvaises au changement de processus – ce n’est pas la preuve d’une bulle, mais d’une adoption inégale.

    **Le meilleur modèle :** pas bulle vs non-bulle, mais **construction vs remboursement.** La construction est réelle, la demande est réelle, les goulots d’étranglement sont réels. La question ouverte est : Qui sera payé, quand, à quelle marge et sur quelles charges de travail ? La baisse des cours montre que les investisseurs posent maintenant des questions plus difficiles (doivent), pas que la construction est une fraude.

    La première phase était le récit (tout le monde achète les noms évidents), la deuxième phase est la correction (le marché réalise que c’est plus cher, plus lent, plus chaotique). La troisième sera le tri : vrai revenu d’IA vs discours d’IA dans le pitch, vrais goulots d’étranglement vs exposition aux commodités, valeur du workflow vs valeur de la démo, entreprises qui s’autofinancent vs celles qui ont besoin de financement externe.

    Les chemins de fer étaient réels et la construction a été un énorme succès pour l’économie – mais beaucoup d’investisseurs en chemin de fer ont quand même été détruits. La fibre optique était réelle, beaucoup d’investisseurs télécoms ont quand même été détruits. Cela ne signifie pas que l’avenir est faux, mais que les corrections de marché ne réfutent pas tout le récit.

    Les vraies questions pour les investisseurs : Est-ce une utilisation payante ou simplement de l’engagement ? Des charges de travail en production ou des pilotes issus de communiqués de presse ? Cela améliore-t-il un workflow avec une économie claire ou crée-t-il plus de travail pour les gens ? L’entreprise achète-t-elle de la capacité parce que les clients attendent ou parce que le conseil veut une stratégie d’IA ?

    **Conclusion :** L’IA est un vrai fondement transformateur. Certaines parties sont gonflées de manière spéculative. Le marché commence tout juste à différencier la vrai valeur du hype, et c’est sain. Le créateur note que c’est un marathon de 10-20 ans, pas un sprint, et que les investisseurs devraient appliquer des standards plus élevés à leur analyse.

    **Format et focus :** opinion/réflexion, analyse approfondie et réfléchie sans mention d’outils d’IA spécifiques (plutôt discussion méta sur l’industrie de l’IA).

  • OpenAI Just Filed For Its IPO. The Real Story Isn’t The Trillion Dollars.
    14.6.2026, 17:00:39

    # Résumé : OpenAI et Anthropic – La thèse IPO au-delà de la question de valorisation

    La question centrale des IPO imminentes d’OpenAI et Anthropic n’est pas de savoir s’ils valent un trillion de dollars, mais ce que les investisseurs publics sont censés vraiment croire : que les deux entreprises peuvent accomplir deux choses simultanément – rendre l’intelligence si bon marché qu’elle peut être déployée à grande échelle, et construire des systèmes propriétaires si rapidement que les entreprises préfèrent louer l’ensemble du système plutôt que de le construire eux-mêmes. La thèse est : tokens bon marché plus harnesses propriétaires égalent un trillion de dollars.

    Le cœur de l’argumentation réside dans la distinction entre les tokens (intelligence brute, achetée à la consommation) et les harnesses (tout ce qui transforme l’intelligence brute en travail productif – fichiers, outils, permissions, stockage, évaluations, routage entre modèles bon marché et chers, workflows). Les exemples de harnesses sont Codeex et Claude Code. Le vrai business n’est pas dans l’intelligence pure, mais dans la couche au-dessus.

    Une critique fréquente des plans à 200 dollars est que les utilisateurs reçoivent prétendument une valeur de 8 000 à 14 000 dollars – prétendument une catastrophe financière. Mais les prix des API ne sont pas le coût, mais le prix de détail avec marge. Si les coûts internes sont bien en dessous du prix d’affichage et que les labs améliorent continuellement l’efficacité de l’inférence, le caching, le batching, la distillation et l’utilisation des puces, le plan de 200 dollars pourrait être rationnel. La stratégie pourrait être : fournir aux utilisateurs des quantités énormes d’intelligence bon marché, tandis que les coûts baissent en dessous. Cela signifie que les labs croient que les coûts d’inférence chuteront continuellement.

    Crucial est le changement stratégique : OpenAI et Anthropic ne veulent pas être éternellement juste des entreprises d’API vendant l’intelligence brute. L’intelligence brute est comparable, distribuée et concurrence à prix de commodité. La valeur se déplace vers ce qui est construit autour de l’intelligence – vers la harness. Codeex montre le principe : cela n’impressionne pas seulement parce que le modèle est intelligent, mais parce qu’il se trouve dans une harness qui comprend le travail – voir les dépôts, modifier les fichiers, exécuter les tests, inspecter les erreurs, suivre les changements, utiliser l’ordinateur, parcourir le travail de connaissance. Le produit n’est pas « un modèle qui peut coder », mais « un système qui peut participer au travail de connaissance général ».

    Le problème fondamental pour les labs est le contexte : OpenAI et Anthropic ne savent pas comment fonctionne une entreprise, où se trouvent les vrais documents, quels champs Salesforce sont importants, quelles étapes d’approbation sont réelles, qui peut approuver les exceptions, quelle table est la source réelle de la vérité. Les entreprises ont des informations de contexte privé – un énorme avantage informationnel. La lutte concerne qui transforme son avantage en meilleures harnesses plus rapidement. Forward Deployed Engineering est l’approche des labs pour surmonter ce problème de contexte : les labs déploient des gens dans l’entreprise, mappent les workflows, connectent les outils, apprennent les vrais cas d’usage, adaptent les produits. Ils transforment les harnesses génériques en harnesses spécifiques à l’entreprise. Si cela fonctionne, le client ne loue pas seulement des tokens – le client réorganise le travail autour des systèmes du lab. C’est plus collant et plus précieux.

    Pour les entreprises, la question stratégique n’est pas « OpenAI ou Anthropic ? » mais « Louer la harness ou la construire ? » Construire la harness ne signifie pas entraîner un modèle de frontier (presque aucune entreprise ne devrait faire cela), mais posséder la couche qui décide quel modèle utiliser pour quelle tâche – contexte, évaluations, permissions, définitions de workflow, processus de révision, logique de routage. Si on possède la harness, les labs sont des fournisseurs en concurrence. Si le lab possède la harness, le lab devient la couche d’exploitation. C’est le carrefour.

    L’auto-amélioration récursive a ici un aspect plus pratique : de meilleurs modèles aident les labs à améliorer leurs propres produits plus rapidement – améliorer le code plus rapidement, améliorer les évaluations plus rapidement, affiner le routage plus rapidement, optimiser l’inférence plus rapidement, compresser les modèles plus rapidement, accélérer les harnesses. C’est un avantage d’itération. Le scénario haussier : OpenAI et Anthropic gèrent les coûts des tokens, concurrencent sur l’échelle et l’efficacité avec l’open source, améliorent leurs propres produits plus vite que les clients, construisent des harnesses si bien que les entreprises ne construisent pas elles-mêmes. C’est réaliste – la plupart des entreprises sont lentes, ne comprennent pas leurs propres workflows, ne peuvent pas définir ce que « fait » signifie, ne construisent pas de logique de routage, ne maintiennent pas les évaluations. Elles achètent le produit qui fonctionne.

    Le scénario baissier : les entreprises apprennent à construire leurs propres harnesses, les labs deviennent des fournisseurs d’intelligence au lieu de propriétaires de couche de travail. Elles gagnent quand même beaucoup, mais la valorisation se déplace – la couche de workflow est capturée par l’entreprise, le lab est assis sur la marge de token. Avec les prix des tokens en baisse, c’est une position beaucoup moins dominante.

    Ce qu’il faut surveiller dans le S-1 : pas les revenus, la croissance des utilisateurs ou la valorisation, mais si les utilisateurs puissance deviennent moins chers à servir, si la marge brute augmente avec la croissance de l’utilisation, si les clients d’entreprise achètent un logiciel évolutif ou du travail personnalisé, si de vrais workflows émergent dans le produit, si Forward Deployed Engineering est un pont vers de meilleurs produits ou reste nécessaire de façon permanente.

    Pour les non-investisseurs, cela s’applique de manière pratique : construire votre propre harness ou laisser quelqu’un d’autre la posséder ? Une stratégie d’IA ne signifie pas du prompting (c’est mince), mais de la construction de harness – définir clairement les travaux récurrents, donner au modèle le bon contexte, connecter des fichiers et des outils, vérifier le résultat, améliorer le système. C’est l’effet de levier. L’intelligence bon marché arrive de toute façon. La question est, qui sait comment l’utiliser. Les IPO d’OpenAI et Anthropic sont le premier test public d’une thèse : les labs peuvent-ils rendre les tokens suffisamment bon marché et construire les harnesses assez rapidement pour posséder la couche de travail ? Ou les entreprises construisent-elles avec les tokens moins chers leurs propres harnesses et gardent plus de valeur ? L’intelligence bon marché rend possible l’économie des tokens. La harness est le moteur qui la rend précieuse. Qui contrôle la harness a la position dominante dans l’économie des tokens de l’avenir.

    **Format :** opinion/réflexion ; explicitement mentionné : OpenAI, Anthropic, Codeex, Claude Code, DeepSeek (brièvement mentionné comme concurrence de modèles).

  • Don’t build more AI agents until you watch this
    17.6.2026, 14:00:31

    # Résumé : Vercel a réduit les outils des agents de 80% – et ils se sont améliorés

    Le paradoxe central : Vercel a amélioré son agent de ventes non pas en ajoutant des features, mais en les réduisant. L’hypothèse habituelle – plus d’outils, plus de contexte, plus d’autonomie rendent les agents meilleurs – est réfutée ici.

    Vercel a étudié un meilleur vendeur pour reproduire son vrai workflow : classification des messages entrants (leads vs spam vs support), qualification des leads, recherche d’entreprise, rédaction de réponses et routage des demandes de support. L’agent a reproduit ces workflows, mais sous contrôle humain – l’objectif n’était pas l’automatisation pure, mais l’accélération des processus répétables.

    La leçon plus profonde : l’agent s’est amélioré non pas parce que des outils ont été ajoutés, mais parce qu’ils ont été supprimés. Cela réfute la pratique de développement typique où on accumule itérativement des outils, des intégrations et de la mémoire. Le vrai sujet en 2026 n’est pas « peut-on construire des agents », mais « comment maintient-on saine l’infrastructure autour d’un agent ».

    **Les quatre principes clés de la maintenance des agents :**

    1. **Les modèles sont instables vers le haut** : de meilleurs modèles nécessitent des « harnesses » différentes (espaces de travail). Une règle qui protégeait un agent faible peut en bloquer un meilleur. Un outil qui compensait les capacités manquantes peut confondre un modèle amélioré. C’est un nouveau problème de maintenance – les systèmes peuvent se casser non seulement par dégradation, mais par amélioration.

    2. **Les agents héritent de la saleté des systèmes** : un wiki obsolète, des processus modifiés, des prompts qui dérivent – dans le logiciel normal ce sont des désagréments. Avec les agents c’est dangereux, parce que les agents travaillent de manière proactive, rédigent des recommandations et créent des tâches. Ils ne remarquent pas que la source est fausse, ils continuent simplement.

    3. **Les grandes firmes d’IA construisent intentionnellement des harnesses** : OpenAI et Anthropic avec Claude investissent massivement dans l’infrastructure *autour* des modèles – terminal, navigateur, fichiers, mémoire, permissions, sandboxing, logs. Ce n’est pas juste un chat avec un meilleur cerveau ; c’est un établi soigneusement entretenu. L’avantage concurrentiel vient non seulement de la puissance du modèle, mais du fait que de meilleurs modèles aident à construire et tester de meilleures harnesses – un flywheel.

    4. **Définissez votre harness** : quiconque utilise un agent doit se demander : quel est mon setup ? Cela peut être des dossiers de projet, de la mémoire, des prompts, des documents sources, des étapes d’approbation, des permissions de fichiers. La question n’est pas techniquement abstraite, mais pratique : comment l’agent maintient-il contact avec mes vrais fichiers ? Qu’est-ce qu’il devrait lire en premier ? Qu’ignorer ? Quand demander avant de modifier quelque chose ? Cela change quand les modèles s’améliorent.

    **Cinq contrôles de maintenance pour les agents sérieusement utilisés :**

    – **Qu’est-ce que l’agent consomme ?** Les sources sont-elles à jour ? Le workflow a-t-il changé ?
    – **Quelle est sa portée ?** Seulement lire, ou peut-il créer, mettre à jour, poster, dépenser de l’argent ?
    – **La définition du travail est-elle correcte ?** Est-ce toujours un agent de résumé ou silencieusement devenu planification/routage ?
    – **Y a-t-il des preuves ?** Pas « les clients sont frustrés », mais : tickets liés, citations client avec sources, traces traçables pour les humains.
    – **L’agent fournit-il une vraie valeur ?** Le résultat est-il lu ? Cela change-t-il le travail ? Cela économise-t-il du temps après révision ? Ou a-t-il juste créé de nouveaux piles de travail ?

    **La pensée centrale (en référence au *Maintenance of Everything* de Stewart Brand) :** les agents sont comme des voiliers, pas comme des applications. Ils vivent dans le mouvement – le modèle change à l’intérieur, le monde change à l’extérieur. Un voilier n’est pas entretenu pour une mauvaise construction, mais parce qu’il vit. Pareillement : les agents se cassent dans deux directions – par la dérive externe et par l’amélioration du modèle interne. La simplicité et la réduction consciente sont clés à la maintenance. La question de harness « Qu’est-ce que je devrais supprimer plus tard ? » est plus mature que « Qu’est-ce que je peux encore ajouter ? »

    **Claude mentionné, OpenAI/Codex mentionné (ainsi que Anthropic/Claude Code) ; opinion/réflexion avec éléments de deep-dive.**

Alejandro AO (1 nouvelle vidéo)

  • Kimi K2.7 + Opus 4.8 = BEST Coding Duo??
    15.6.2026, 15:40:30

    **Résumé:**

    La vidéo présente une stratégie pratique d’optimisation des coûts du développement logiciel basé sur l’IA : au lieu d’utiliser un modèle coûteux (comme Claude Opus ou GPT-5.5) pour toutes les phases d’une tâche de coding, le workflow est divisé en deux parties. La première couvre la compréhension du problème, l’exploration de la base de code et la planification ; la seconde l’implémentation proprement dite et la révision du code.

    Le créateur teste cela avec le nouveau Kimi K2.7, un modèle open-source spécialisé dans le coding, nettement moins cher que GPT-5.5 et Opus (entrée : 0,95 $ vs 30 $ par million de tokens), tout en obtenant des benchmarks de coding similaires. Dans l’expérience concrète sur un problème GitHub de CPython (comprehension avec portée de classe et lambda lève SystemError), chaque modèle est testé à la fois comme planificateur et implémenteur. Les deux juges (GPT-5.5 et Opus 4.8) évaluent les solutions ; le créateur mesure les coûts et la qualité.

    Les résultats montrent que toutes les combinaisons testées ont produit des PR fusionnables avec seulement environ 1 point de variation sur une échelle de 10. Les combinaisons Kimi sont environ sept fois moins chères que les configurations purement GPT/Opus. La tendance claire est que GPT-5.5 ou Opus 4.8 comme planificateur et Kimi K2.7 comme implémenteur offre le meilleur rapport coût-qualité – on économise des tokens coûteux des modèles haut de gamme sans sacrifier la qualité. Kimi K2.7 est moins verbeux que K2.6, donc encore plus économique malgré une légère augmentation de prix.

    Le créateur fournit également l’outil « DuoBench » permettant aux utilisateurs d’effectuer de tels benchmarks sur leurs propres problèmes GitHub (installable via `npx skills add`, utilise la configuration Pi).

    **Conclusion:** Kimi K2.7, Claude Opus, GPT-5.5, Open-Source – démo/benchmarking avec lancement pratique d’outils.

Alex Finn (1 nouvelle vidéo)

  • How to get unlimited AI for free (GLM 5.2 local)
    19.6.2026, 18:15:48

    # Résumé : GLM 5.2 local sur Mac Studio

    La vidéo traite de la version Unsloth de GLM 5.2, un modèle open-weights qui s’exécute localement sur votre propre matériel et qui, selon le créateur, est comparable à Claude Opus 4.8.

    **Démonstration & Capacités :** Le créateur montre un jeu de tir à la première personne en 3D généré entièrement localement par GLM 5.2 via un agent Hermes – y compris l’auto-amélioration, où le modèle teste lui-même le jeu et optimise ses capacités.

    **Exigences matérielles :** La quantification 2-bit nécessite environ 250 Go de stockage (Mac Studio 256 Go minimum, 512 Go recommandé). Pour du matériel moins puissant, il recommande des alternatives comme Gemma 4 de Google ou NemoTron de Nvidia ; avec du meilleur matériel, Qwen 3.6 27B ou supérieur.

    **Avantages des modèles locaux :** Gratuit et illimité, complètement privé (aucun envoi de données vers le cloud), permet le travail des agents en arrière-plan 24/7 (ex. vérification de code pour la sécurité). Avec l’utilisation basée sur le cloud de GLM 5.2, les prix sont plus avantageux que ChatGPT/Claude.

    **Inconvénients :** Nettement plus lent que les modèles cloud, fenêtre de contexte plus petite. Pour les tâches rapides et interactives, les modèles cloud (Opus, ChatGPT) restent pertinents ; les modèles locaux conviennent pour les tâches passives et non urgentes en arrière-plan.

    **Processus d’installation :** Le créateur utilise simplement son agent Hermes avec un lien vers l’annonce Unsloth – l’agent télécharge le modèle, configure un serveur et paramètre un nouvel agent Hermes sans étapes manuelles.

    **Vision future :** Le créateur prédit que dans 12 mois, tout le monde aura un modèle local hautement intelligent s’exécutant sur des Mac minis abordables, travaillant 24/7 de manière privée comme agent personnel en arrière-plan.

    **Préparation :** Expérimentez avec le matériel disponible, utilisez Hermes/OpenClaw, suivez continuellement les nouveaux modèles et les déployer rapidement.

    **Outils/Modèles explicites :** GLM 5.2 (quantification Unsloth), Hermes Agent, OpenClaw, Claude Opus 4.8, ChatGPT 5.5, Gemma 4, NemoTron, Qwen 3.6 27B, Codex — Démonstration et guide avec un accent particulier sur l’infrastructure d’IA locale.

Bart Slodyczka (1 nouvelle vidéo)

  • Gemma 4 12B + Hermes Agent: Build Your Own AI Assistant
    15.6.2026, 12:00:28

    # Résumé

    Le créateur installe Hermes Agent sur un Mac Mini avec puce M4 et 16 GB de RAM, sur lequel Gemma 4 est déjà exécuté, pour construire un assistant IA local. Il utilise Claude Code (Claude Desktop App avec Opus 4.8) comme unité de contrôle centrale pour automatiser tous les processus de configuration — de la lecture des informations système à l’installation de Hermes et sa configuration.

    **Étapes de configuration importantes :**
    – D’abord, on vérifie que le Mac reste constamment allumé (sinon l’agent s’endort si nécessaire)
    – Claude installe et configure Hermes Agent sans APIs externes ni services payants
    – Dans LM Studio, le modèle Gemma (variante QAT avec 6,66 GB) est chargé et la longueur de contexte (environ 67 000 tokens) ainsi que les paramètres Flash-Attention sont optimisés pour équilibrer la mémoire entre le modèle, le système d’exploitation et les fonctions de l’agent
    – Gemma est configuré comme modèle par défaut dans Hermes et testé — la première réponse prend environ 2–3 minutes (ce qui démontre la charge de calcul du M4)

    **Exemple d’application pratique — Intégration avec Zendesk :**
    Claude génère une configuration webhook pour Zendesk qui transmet automatiquement les tickets de support entrants à Hermes. L’agent répond alors (basé sur une FAQ générée pour le scénario d’une entreprise de pièces informatiques) de manière autonome aux tickets. Lors des tests de démonstration, le système a consommé presque la totalité des 16 GB de RAM et a traité deux tickets parallèles rapidement, produisant des réponses réalistes en quelques minutes.

    **Concept clé :** Claude Code fonctionne directement dans le terminal et peut donc lire le matériel de l’appareil, modifier les paramètres, installer et tester des outils en ligne de commande — sans étapes manuelles. Le créateur souligne ceci comme insight central : au lieu d’une configuration manuelle, il est beaucoup plus efficace de laisser un modèle IA puissant effectuer l’automatisation.

    **Mentionné explicitement :** Claude Code (Claude Desktop App), Gemma 4, Hermes Agent, LM Studio, LM Link, Zendesk, Tail Scale, Docker — tutoriel avec démonstration pratique.

Ben AI (1 nouvelle vidéo)

  • How to De-Slop Every AI Output Forever (With 1 Skill)
    16.6.2026, 08:56:30

    **Résumé**

    La vidéo présente une nouvelle Skill qui effectue un contrôle qualité des outputs IA – en quelque sorte un « correcteur orthographique contre le AI-Slop ». L’auteur commence par décrire le problème : tandis que les outils IA augmentent la productivité individuelle, leur utilisation généralisée en entreprise produit souvent un contenu de faible qualité (posts marketing, e-mails, documents internes) parce que chaque employé a un standard qualité différent et l’IA n’impose pas ces standards.

    La Skill DLOP fonctionne sur deux niveaux : elle vérifie d’abord les modèles universels de AI-Slop (tirets non naturels, styles d’écriture typiquement IA, contradictions, vérification des faits), puis procède à une vérification adaptée à l’entreprise (alignement avec la tonalité, l’identité de marque, la stratégie d’entreprise, les faits). La Skill identifie d’abord le type d’output (post marketing, réponse service client, etc.), puis déploie trois Subagents pour évaluer impartialement par rapport aux critères et produit l’un des trois verdicts : « Go to go », « Go to go, mais quelques corrections », ou « Not ready ». Pour chaque point, elle fournit des suggestions d’amélioration avec références.

    En outre, un journal DLOP enregistre chaque passage pour identifier les modèles de problèmes d’outputs IA au niveau de l’entreprise. La Skill peut être intégrée comme dernière étape dans d’autres Skills et fonctionne avec des fichiers de référence personnalisés pour la voix de marque, les listes de vérification des faits et les directives visuelles. L’auteur recommande de l’utiliser avant chaque publication. La Skill gratuite est disponible au téléchargement, avec des espaces pour personnalisation ; il existe également une « DLOP-Builder-Skill » dans sa communauté AI-Accelerator pour une adaptation progressive.

    **Conclusion :** Claude et la DLOP-Skill sont discutés ; le format est un mélange de démonstration/tutoriel/opinion avec des exemples d’application.

Brian Casel

Aucune nouvelle vidéo au cours de cette période.

Coding with Lewis

Aucune nouvelle vidéo durant cette période.

Cole Medin (2 nouvelles vidéos)

  • Omnigent: The New Meta-Harness for EVERY Coding Agent – Claude Code, Codex, Pi, More
    15.6.2026, 14:42:51

    **Résumé : Omni Agent – Meta-Harness pour les workflows AI-Coding**

    Omni Agent est un nouvel outil open-source publié par Databricks, qui fonctionne comme un meta-harness et orchestre plusieurs assistants AI-Coding. Un meta-harness est une couche au-dessus des assistants de codage individuels, permettant de combiner des workflows plus longs avec différents modèles – par exemple Claude Code pour l’implémentation et Codeex pour les révisions de code. L’idée centrale : le harness (system prompt, tools, skills, workflows, policies) est désormais aussi important que le modèle sous-jacent lui-même, particulièrement compte tenu des limitations des modèles.

    Omni Agent s’installe en quelques minutes via une seule commande de configuration et ne nécessite aucune nouvelle authentification, car il utilise les credentials CLI existants. L’interface web affiche une surface orientée agent avec une session de chat, différents assistants de codage sélectionnables et des agents orchestrateurs. L’outil inclut deux orchestrateurs d’exemple : **Poly** (orchestre les workflows entre Claude et Codeex, par exemple l’implémentation par un agent, la révision par un autre) et **Debbie** (laisse deux agents débattre sur un sujet et synthétise leurs perspectives).

    Les agents et orchestrateurs personnalisés sont faciles à construire : chacun se compose d’une configuration, de skills et d’agents appelables. La configuration contient l’executor (quel modèle), le system prompt, les options de sandboxing (non-sandboxed, Docker, E2B) et les guardrails. Un exemple : un agent personnalisé avec guard rail permettant à Claude Code d’exécuter les commandes de manière autonome, mais bloquant les force-push Git et demandant une approbation. Ces policies sont du code Python et peuvent également être générées par des assistants IA.

    Omni Agent s’exécute localement sur la machine, mais peut également être déployé en tant que serveur. Une fonctionnalité multi-appareils permet la collaboration en direct : la même session peut être traitée en parallèle sur un ordinateur de bureau et un smartphone, par exemple via le même réseau Wi-Fi ou mondialement via une instance hébergée.

    L’argument central de la vidéo : les meilleurs ingénieurs n’utilisent plus un seul modèle ou outil pour leurs workflows, mais orchestrent plusieurs pour exploiter leurs forces différentes, optimiser les tokens et éviter les biais (par exemple, en ayant un réviser de code différent de celui qui implémente). Omni Agent rend cette structure meta-harness prête pour la production et accessible.

    **Outils explicitement mentionnés :** Omni Agent (Databricks, open-source), Claude Code, Codeex, Pi, Ollama, Docker, E2B, Git — démo avec opinion/réflexion sur l’ingénierie harness.

  • The Creators of Claude Code and OpenClaw don’t Prompt Their Agents Anymore?!
    18.6.2026, 00:00:08

    # Résumé : Loop Engineering pour l’AI-Coding

    La vidéo critique le terme à la mode « Loop Engineering » et montre que si l’idée derrière est intéressante, elle est problématique en pratique. Le cœur du problème : on configure des boucles dans lesquelles les assistants AI-Coding traitent les tâches de manière autonome en itérations, au lieu de les inviter manuellement.

    **Les trois concepts de base :**
    – `/loop` : Vérifications récurrentes à intervalle fixe (par exemple, vérifier les nouveaux problèmes GitHub toutes les 5 minutes)
    – `/goal` : L’agent travaille jusqu’à ce qu’une condition soit remplie
    – `/routines` : Tâches programmées

    **Les trois principaux problèmes :**
    1. **Qualité** : Loop Engineering ne donne pas les meilleurs résultats — c’est plutôt du marketing. En pratique, ce n’est utile que pour les PoCs.
    2. **Coûts** : L’orchestrateur doit constamment prendre des décisions (combien de workers ? combien de boucles ?), envoyer le contexte d’avant en arrière — plus d’un million de tokens pour une simple application sont rapidement atteints.
    3. **Contexte encombré** : Quand on fait des boucles dans une session Claude Code, le contexte grandit et submerge le modèle. Plusieurs sessions séparées sont nécessaires.

    **La solution — Harness Engineering (via Arkon) :**
    Le créateur utilise son outil **Arkon** pour orchestrer des workflows qui contrôlent plusieurs sessions d’agents de codage en parallèle. Cela le rend :
    – **Déterministe** : Le processus est défini dans un fichier de workflow, pas contrôlé par l’agent
    – **Optimisé en coûts** : Chaque étape peut utiliser un modèle différent (par exemple, des modèles plus petits pour la classification, des plus onéreux pour l’implémentation du code)
    – **Fiable** : Durabilité via base de données Postgres externe (Neon), capacité de reprise, contrôle humain aux points critiques
    – **Parallélisable** : Traiter plusieurs problèmes GitHub simultanément via des work trees isolés

    **Exemple pratique** : Un workflow qui résout les problèmes GitHub avec quatre sessions parallèles, puis lance quatre autres sessions pour les révisions de code — tout orchestré par une instance Claude Code, mais pas comme une boucle gonflée, mais comme du travail distribué et suivi.

    **Également présenté** : Un **tableau de bord** auto-construit (open-source) qui fournit l’observabilité : toutes les boucles stockées dans une base de données Postgres en tant qu’état, l’orchestrateur lit cet état, appelle les workers, ceux-ci mettent à jour l’état. Facile à déployer dans le cloud avec **Retool** — avec permissions, audit trails et modifications contrôlées par chat.

    **Thèse centrale** : Loop Engineering ne mérite pas son propre nom ; c’est simplement du travail orchestré avec des workflows multi-agents. Sans une architecture harness (durabilité, gestion des coûts, déterminisme des processus), cela devient coûteux, peu fiable et incontrôlable.

    *Démo d’Arkon + tableau de bord auto-construit avec Postgres/Neon, mention occasionnelle de Claude Code, mentions aussi de Haiku, Kimmy K 2.7 et Retool pour le déploiement cloud ; opinion/réflexion avec des démos pratiques.*

Dave Ebbelaar (1 nouvelle vidéo)

  • The Best AI Automation Stack to Learn in 2026
    19.6.2026, 13:28:15

    # Résumé

    La vidéo présente une pile technologique éprouvée pour les automatisations IA, composée de cinq couches et évolutive à long terme — contrairement aux outils isolés éphémères.

    **Backend-Layer** : Python est la base. En complément, Fast API (pour créer des points de terminaison API pour les webhooks et la communication) et Celery (pour les workers de fond et la planification des tâches) sont recommandés. Cette combinaison constitue le cœur des automatisations déclenchées et programmées.

    **Data Layer** : PostgreSQL (via Supabase comme solution wrapper hébergée) suffit et s’adapte même pour des millions d’enregistrements. Supabase offre également l’authentification et un tableau de bord d’administration ; les vecteurs peuvent également être stockés dans PostgreSQL.

    **Frontend-Layer** : React (bibliothèque de composants JavaScript), Vite (outil de build et serveur de développement) et Shadcn UI (bibliothèque de composants préconfigurés avec graphiques, formulaires de connexion, boutons, interfaces de chat, etc.) permettent un développement rapide d’outils internes et de tableaux de bord. Le code de Shadcn est importé dans le projet, pas comme dépendance externe, ce qui permet aux agents AI-Coding d’y travailler.

    **AI-Layer** : Accès direct par API aux modèles de langage (OpenAI, Anthropic) ou via des fournisseurs d’entreprise (AWS, Azure, Google Cloud) avec facturation centralisée et meilleurs contrôles de confidentialité. L’effort pour cette couche est minime — généralement un simple appel API.

    **Infrastructure-Layer** : Docker pour la conteneurisation, puis déploiement soit sur des plateformes conviviales comme Railway, soit sur des VPS/services cloud (AWS, Azure, GCP, Hetzner). Railway offre des serveurs MCP pour la gestion et peut être piloté par des agents de codage.

    L’auteur souligne que ces techniques établies existent depuis des décennies et ne doivent pas être remplacées par de nouveaux outils. Il annonce une vidéo en direct de 4 heures au cours de laquelle un Document Co-Pilot sera construit avec l’ensemble de la pile, à titre de rétro-ingénierie et de feuille de route.

    **Fournisseurs/outils explicitement mentionnés** : Python, Fast API, Celery, PostgreSQL, Supabase, React, Vite, Shadcn UI, OpenAI, Anthropic, AWS, Azure, Google Cloud, Railway, Docker, Hetzner, VPS — **Format** : Plongée profonde avec avis/réflexion.

David Shapiro (2 nouvelles vidéos)

  • “The window has closed”
    15.6.2026, 14:20:13

    **Résumé :**

    La vidéo analyse un changement d’humeur dans l’industrie de l’IA, que le locuteur attribue aux introductions en bourse de SpaceX, OpenAI et Anthropic. Bien que rien n’ait structurellement changé, les récits se seraient décalés, signalant la normalisation de l’IA en tant qu’industrie établie.

    Le locuteur examine deux articles devenus viraux : Satya Nadella soutient que la simple vente de tokens ne suffit pas et que les écosystèmes ainsi que les boucles d’apprentissage au sein des organisations sont nécessaires. Andrew Kuran, en revanche, défend la thèse selon laquelle la fenêtre de la course est fermée et que l’Amérique a remporté la course à l’IA – avec la sortie de Fable ou d’un Mythe comme point de basculement qui laisserait définitivement derrière eux d’autres nations comme la Chine et l’Europe.

    Le locuteur utilise une analogie avec la pomme de terre pour expliquer le dilemme des prix des tokens : alors que la demande de tokens (mesurée en milliards) augmentera massivement, le coût par token diminuera continuellement. Cela signifie que l’argent ne réside pas dans la vente directe de tokens, mais dans les outils qui génèrent des tokens – ou dans les résultats logiciels qui permettent les tokens. Il voit le dilemme entre deux scénarios : soit Microsoft profite en tant que vendeur d’infrastructure (outils), soit OpenAI et Anthropic en tant que « canons à logiciels » dominent Microsoft. Conclusion : la vente de tokens n’est pas une base de modèle commercial réelle, mais simplement une infrastructure comme l’électricité – les résultats sont ce qui a de la valeur.

    **Remarque finale :** Les principaux acteurs sont Microsoft, OpenAI, Anthropic, SpaceX et la Chine ; le format est opinion/réflexion avec contextualisation du secteur.

  • They think FOOM is near
    14.6.2026, 13:14:57

    # Résumé

    Le locuteur rapporte une crise chez Anthropic en juin : l’entreprise a publié Fable 5 (version publique de Claude 5), après quoi plusieurs scandales ont été découverts. Premièrement, Anthropic a implémenté des restrictions cachées qui redirigent le modèle vers un modèle plus faible (Opus 4.8) dans les domaines de la recherche complexe en IA et machine learning – prétendument pour empêcher l’auto-amélioration récursive. Deuxièmement, Anthropic a refusé de corriger un jailbreak signalé par une équipe de recherche d’Amazon, après quoi le ministère américain du Commerce a imposé une interdiction mondiale contre l’utilisation par des citoyens non-américains.

    Le locuteur soutient que les mesures prises par Anthropic ne sont pas principalement destinées à ralentir les concurrents, mais plutôt motivées par des raisons idéologiques : l’entreprise est imprégnée d’altruisme efficace et de pensée « Less Wrong » (fondée par Eliezer Yudkowsky) et redoute l’hypothèse du « FOOM » (décollage rapide) ainsi que le « tournant traître » – l’idée que les systèmes d’IA semblent d’abord bienveillants jusqu’à ce qu’ils accumulent assez de pouvoir. Anthropic souhaiterait, selon cette théorie, conserver le « killswitch » en main en contrôlant les meilleurs modèles. Le locuteur critique également la justification de Darios pour contourner les procédures normales en invoquant des « circonstances extraordinaires » et compare la rhétorique à des tactiques manipulatrices.

    En conclusion, le locuteur mentionne qu’il ralentit sa production de blogs et vidéos pour se concentrer sur l’enregistrement de son audiobook.

    **Opinion/réflexion sur Anthropic, Claude et Fable ; aucun outil d’IA spécifique identifié par nom à part les modèles mentionnés.**

Everlast AI (5 nouvelles vidéos)

  • KI-News: SO leicht hackt man Claude Mythos! KI-Jailbreaks erklärt & Codex Updates (Florian Tramèr)
    21.6.2026, 08:15:12

    # Résumé

    **Robotique & Humanoids**: Des chercheurs chinois ont développé Humanoid GBT, un modèle d’IA entraîné sur 2 milliards de frames de mouvement qui contrôle en temps réel des robots comme l’Unitree G1 et exécute des mouvements non entraînés. Un autre modèle de startup dirige plusieurs corps de robot différents sans enregistrements d’entraînement réels, uniquement en observant des humains. Les robots danseurs sont devenus une industrie du divertissement à part entière ; Leim X Dynamics a présenté Luna, un humanoïde de 1,60 m avec des mouvements et des expressions faciales générés par IA, programmable sans code. La Chine domine massivement le marché – 90 % des 13 000 humanoïdes livrés en 2025 proviennent de la production chinoise. Le gouvernement a ordonné le déplacement de 10 000 robots du divertissement dans les usines, les entrepôts et les hôpitaux d’ici le 31 décembre.

    **Codex & Auto-Définition d’Objectifs**: Codex peut désormais se fixer des objectifs lui-même, sans que l’utilisateur n’ait à entrer `/slash-goal`. Le nouveau plugin « Record and Replay » permet d’enregistrer un workflow en vidéo – l’agent regarde et transforme ce qu’il a appris en un skill réutilisable. Exemple : enregistrer un workflow de téléchargement YouTube, puis l’appliquer automatiquement à d’autres vidéos. Critique : L’accès complet à l’utilisation de l’ordinateur sur votre propre machine pose des risques de sécurité (injection de prompt), souvent inutile car les workflows natifs des agents (via APIs, CLI, outils) réalisent la même chose.

    **Jailbreaks & Sécurité de l’IA**: Dans une interview avec le professeur Dr. Florian Tramer, on explique que les jailbreaks sont des astuces pour contourner les mesures de sécurité – soit par tromperie, soit en décomposant les questions dangereuses en parties inoffensives. Le problème avec Claude Haiku 5 : Les mesures de sécurité étaient si strictes que le modèle refusait même les questions inoffensives de cybersécurité (par exemple, « Additionne deux failles de sécurité »). Avec Fable 5, en cas de refus, on basculait vers le modèle plus faible Opus – ce qui a été exploité. L’équilibre entre utilité et sécurité est scientifiquement difficile.

    **Mises à Jour OpenAI**: GPT BD1 (nom possible) sera une grande mise à jour avec un modèle bidirectionnel – écoute et parole simultanées avec appels d’outils en temps réel, contrairement aux actuels modes voix demi-duplex. La nouvelle super-app Codex reçoit des mises à jour d’interface utilisateur (Pad/Orb). Prévu : tarification à l’usage au lieu de modèles basés sur abonnement.

    **Google Agent Resource Discovery (ARD)**: Nouvelle norme ouverte – les sites Web déposent les skills, MCPs, outils dans `.well-known/aicatalog`. Les agents peuvent ensuite automatiquement parcourir ces catalogues sans que les utilisateurs n’aient à chercher manuellement les MCPs (par exemple, une compagnie aérienne propose automatiquement des skills de réservation).

    **Design Claude & Artifacts**: Les directives de branding Cloud Design peuvent être enregistrées et appliquées à toutes les ressources. Les artefacts (vues visuelles du code, dashboards, sites Web) sont nouveaux en bêta pour Teams et Enterprise dans Claude Code, prévus d’être déployés ultérieurement pour Pro/Max.

    **Open Source & Concurrence des Modèles**: GLM 5.2 (3 milliards de paramètres, Open Rats) offre un contexte de 1 million de tokens et rivalise dans Design Arena (benchmark voté par les utilisateurs) avec Claude Haiku 5 et GPT 5.6 Pro. Les testeurs évaluent : Pas de grande différence – les modèles open-source ne traînent que 3–4 mois en retard, pas 6–8 comme avant. Prédiction d’Elon : Q1 2027 pour l’open-source au niveau Mythos ; le fondateur de GLM dit : d’ici la fin de cette année. Important : GLM 5.2 peut être intégré gratuitement via OpenRouter dans le système Corporate-LM ; la version 2-bit quantisée (82 % de précision) fonctionne sur Mac 256GB.

    **Tokens par Dollar**: Pour 3000 $, vous obtenez environ 6x plus de tokens avec GLM 5.2 qu’avec Opus 4.8, et 30x plus qu’avec DeepSeek.

    **Étude Scale AI**: Seulement 6,5% des entreprises déploient l’IA de manière productive (définition : intégrée sur plusieurs fonctions, >50% des pilotes en production, objectifs commerciaux largement dépassés). Ces 6,5% sont 3x plus rapides, construisent de manière hybride avec des partenaires au lieu d’outils clé en main, et établissent les données et l’architecture avant le code. Le soutien du leadership est ici l’accélérateur le moins important (ils l’ont déjà).

    **Mistral & Situation du Marché**: Le PDG de Mistral, Arthur Mensch, annonce un modèle pour l’été – nouvelles capacités, plus grand, accès anticipé à partir de juillet. Le meilleur modèle actuel de Mistral est plus cher et plus faible que GPT 4 Nano. ChatGPT tombe pour la première fois en dessous de 50% de part de marché (46,4%), Claude monte à 10,3%, Google Gemini croît. Les modèles de tarification à l’usage sont prévus. L’IA locale devient une stratégie de sauvegarde nécessaire.

    **Workflows Natifs des Agents**: Exemple pratique : télécharger un PDF à partir d’un site Web au lieu d’utiliser l’ordinateur – l’agent crée un compte jetable chez Agentmail, entre les données, télécharge le PDF à partir de sa propre boîte aux lettres, l’ouvre dans le navigateur. C’est l’« économie des modules » : Skills, outils, MCPs, CLI, APIs au lieu de manipulation manuelle d’interface utilisateur ou utilisation de l’ordinateur.

    **Outils/Fournisseurs d’IA Thématisés**: Codex, Claude, OpenAI (GPT 5.6 Pro, BD1), Google (Gemini, ARD), GLM 5.2, DeepSeek, Mistral, OpenRouter, Corporate LM, Agentmail, Cursor, Anthropic. **Format**: Mise à jour/Revue d’actualités avec approfondissements sur la sécurité, la concurrence open-source et les workflows natifs des agents ; inclut une interview en direct avec un chercheur en sécurité de l’IA.

  • 200 clients réactivés & nouvelles locations par un agent IA courtier | Expérience Everlast AI
    19.6.2026, 14:45:12

    # Résumé: Stefan Hoffmann sur son expérience avec l’agent téléphonique d’Everlast

    Stefan Hoffmann, agent immobilier à Majorque depuis 20 ans, parle de son moment de joie quand il a mis en service avec succès son premier agent téléphonique – une expérience qu’il compare à la naissance d’un enfant. Il a commencé avec ChatGPT en 2022, était enthousiaste par les progrès de l’IA et a ensuite découvert Everlast, un fournisseur d’agents téléphoniques, par des vidéos YouTube. La compétence de Leonard Schmedding (fondateur/directeur d’Everlast) et la transmission de savoir précise et substantielle l’ont convaincu de choisir consciemment Everlast – non seulement pour acheter un produit, mais pour maîtriser la technologie elle-même.

    Hoffmann utilise concrètement son agent téléphonique pour les appels sortants, afin de sonder les voix des clients et de réactiver les clients inactifs. Après avoir appelé 200 clients, il a pu en réactiver 5% et en tirer deux locations. L’élément central du succès est le bon system prompt (le « scénario » de l’agent) et la compréhension des cas d’usage pertinents – toute idée d’automatisation n’a pas de sens. Le rapport de fin d’appel documente automatiquement les résultats dans une base de données.

    Hoffmann souligne que la compétence en IA est aujourd’hui une hygiène entrepreneuriale comme se brosser les dents, et que quiconque s’y refuse aura un « rude réveil ». Il compare son contrat avec Everlast à un entraîneur personnel – l’engagement force à vraiment s’engager. Il est également important d’avoir une stratégie IA à l’échelle de l’entreprise, pas seulement des connaissances isolées. Selon Hoffmann, Everlast se distingue par le fait que l’entreprise ne veut pas seulement générer du chiffre d’affaires, mais offre vraiment une valeur aux clients en analysant également quels cas d’usage n’ont pas de sens.

    **Everlast (Plateforme d’agents téléphoniques), démonstration/rapport pratique.**

  • « La Chine se prépare POUR CELA et personne ne le remarque! » CE qui va maintenant se passer (Wolfgang Hirn)
    18.6.2026, 15:15:07

    # Résumé: L’essor technologique de la Chine et le changement de la géopolitique

    Le journaliste Wolfgang Hirn, qui observe la Chine depuis plus de 40 ans, peint un tableau dramatique du changement de pouvoir géopolitique par la technologie – en particulier par les puces et les terres rares.

    ## La Révolution des Puces: Le Triomphe Caché de Huawei

    L’événement central est l’annonce récente et publique par le dirigeant de Huawei, Ren Zhengfei, que la loi de Moore (la miniaturisation continue des puces) arrive à sa fin. À la place, Huawei poursuit une procédure révolutionnaire alternative appelée « Tau » (τ). Hirn souligne que Huawei ne l’aurait pas annoncé comme un ballon d’essai – l’entreprise planifie dans cette direction depuis 16 ans et dispose d’un centre de recherche massif avec 100 000 employés (environ la moitié des 200 000 employés de Huawei). D’ici 2031, Huawei devrait fabriquer des puces avec un équivalent de densité de 1,4 nanomètre – au niveau de TSMC (Taiwan Semiconductor Manufacturing Company).

    ## L’Importance Stratégique: L’Équilibre Bascule

    L’équilibre géopolitique antérieur reposait sur le chantage mutuel : les États-Unis contrôlaient l’approvisionnement en puces, la Chine contrôlait les terres rares (86% de la production mondiale de gallium et de germanium). Si l’Amérique perd cet atout des puces, l’équilibre des pouvoirs bascule clairement en faveur de la Chine. Un conflit à Taïwan aurait un potentiel de guerre mondiale – mais pour la Chine, ce serait du « seppuku », car des décennies d’accumulation économique seraient détruites par des sanctions massives. C’est pourquoi Hirn considère une telle guerre comme improbable ; la Chine a une longue portée.

    ## Pourquoi la Chine a Gagné, l’Occident a Échoué

    **Pensée stratégique à long terme vs. cycles électoraux de quatre ans:** La Chine pense en décennies (« Made in China 2025 » a été planifié il y a 10 ans), tandis que les démocraties occidentales pensent en périodes électorales. **Personnel Dirigeant:** La Chine est dirigée par des ingénieurs (un tiers du Politburo), l’Occident par des avocats – ce qui conduit à des priorités technologiques complètement différentes. **Esprit Entrepreneurial et Capital:** L’Amérique et la Chine ont cet esprit, l’Europe non. Le capital-risque européen s’écoule souvent vers les États-Unis plutôt que vers le marché intérieur.

    ## Les Opportunités Perdues de l’Europe

    L’Allemagne et l’Europe étaient les berceaux de l’innovation des puces (Intel, Texas Instruments, ASML, IMEC). Mais TSMC a profité du fait que les grandes sociétés américaines ne voulaient pas produire de puces simples. Aujourd’hui, TSMC est imbattable. Quand l’UE a planifié en 2013 une entreprise de puces européenne selon le modèle Airbus, le projet n’a jamais été mis en œuvre et « s’est perdu dans le néant ». Maintenant, l’UE doit soutenir les usines en Arizona pour retrouver des capacités de production de puces.

    ## Le Piège de la Dépendance

    Bien que ASML (leader mondial des machines de production de puces) et IMEC (conception de puces) soient situés en Europe, l’Europe ne peut pas produire ses propres puces. Les Européens dépendent à 90% de la Chine pour les terres rares ; cette dépendance durera des décennies. Le recyclage et les nouvelles mines ne résoudront pas le problème assez rapidement. **Le Paradoxe:** ASML lui-même dépend des matières premières chinoises (gallium, germanium).

    ## La Stratégie Américaine a Échoué

    Les sanctions américaines contre l’accès de Huawei aux puces ont eu l’effet inverse : Huawei est devenu plus innovant, a massivement investi en R&D et a construit des technologies parallèles. Les restrictions commerciales généralement ne fonctionnent pas ; elles accélèrent l’indépendance de la Chine.

    ## Avertissement Historique: L’Arrogance Avant la Chute

    Hirn raconte l’histoire de la délégation anglaise à la fin du 18e siècle auprès de l’empereur chinois : elle a été rejetée avec « Nous n’avons pas besoin de vos produits ». Cette arrogance a ignoré la révolution industrielle en Occident et a conduit au « siècle d’humiliation » de la Chine (19e siècle) – une blessure historique qui motive aujourd’hui l’essor de la Chine. La Chine était la puissance innovante du monde depuis 1000 ans ; regagner ce statut est un consensus national.

    ## Ce que l’Europe Devrait Apprendre

    L’Europe ne souffre pas d’un manque de connaissances (Mario Draghi l’a documenté en détail en 2022), mais d’un manque de mise en œuvre. Les petites et moyennes entreprises allemandes sous-estiment souvent la menace de la concurrence chinoise, espèrent une reprise conjoncturelle et un élan de transformation numérique qui n’arrive pas. Même dans les secteurs de prestige de l’Allemagne, l’automobile et l’ingénierie mécanique, la pression chinoise grandit – enfin un signal d’alarme.

    ## Bilan: Pessimisme avec une Lueur d’Espoir

    Hirn est pessimiste : la compétition se déroule entre les États-Unis et la Chine, l’Europe est distancée. Mais : Les connaissances sont là. Il manque la volonté politique et la rapidité entrepreneuriale. Espoir personnel : La combinaison IA + soins de santé pourrait contribuer au bien de l’humanité.

    **Acteurs Explicites:** Huawei, TSMC (Taïwan), ASML (Pays-Bas), IMEC (Belgique), Intel, Texas Instruments, Xiaomi ; **Personnes:** Ren Zhengfei (fondateur Huawei), Mario Draghi, Xi Jinping — **Format:** Format de conversation approfondie, opinion/analyse basée sur des recherches d’investigation sur l’essor technologique de la Chine.

  • Prof. Maximilian Fichtner: Le Problème Énergétique de l’IA, Mensonges de Stockage, Mythe de l’Hydrogène, Chine & Avenir
    17.6.2026, 15:15:30

    # Résumé: Énergie, Batteries et IA – Une Interview avec le Prof. Maximilian Fichtner

    La conversation traite de la question énergétique dans le contexte de la demande électrique explosant due aux centres de données IA et discute des malentendus centraux dans le débat énergétique.

    **Thèses Principales sur le Système Énergétique:**
    Contre l’affirmation largement répandue « Le solaire ne rapporte rien car nous ne pouvons pas stocker l’électricité », l’état de la technique parle : Le plus grand stockage de batteries au monde est actuellement construit aux EAU avec une capacité de 19 gigawattheures ; les stockages sont maintenant rentables économiquement et stabilisent les réseaux au lieu de les surcharger. Le problème principal n’est pas la production d’électricité, mais l’expansion du réseau, le stockage décentralisé et la manque de continuité dans la politique énergétique. Le principe du mérite-ordre explique pourquoi l’arrêt des centrales nucléaires allemandes n’a eu aucun effet mesurable sur les prix de l’électricité – le prix du gaz détermine au marché le prix de l’électricité, pas l’arrêt des centrales.

    **Énergie Nucléaire et SMR:**
    Les petits réacteurs modulaires n’existent actuellement que comme installations d’essai militaires ; il n’y a pas de SMR exploité commercialement. Les nouvelles centrales nucléaires en Europe (comme Hinkley Point C, Flamanville en France) deviennent extrêmement chères (50–65 milliards d’euros) et produisent de l’électricité au double du prix actuel du marché. Les anciens réacteurs amortis sont bon marché, mais les nouveaux sont économiquement non rentables – un effet d’échelle pour les SMR n’est attendu qu’à partir de 1000–5000 unités, mais personne n’achète les premiers exemplaires coûteux.

    **Solaire et Chine:**
    La Chine développe massivement le solaire non par idéologie, mais par indépendance géostratégique : la dépendance aux importations de pétrole via des détroits critiques (détroit d’Ormuz, détroit de Malacca) motive le passage aux énergies renouvelables. Les experts en énergie des grands centres de données IA préfèrent planifier sur la base des énergies renouvelables avec prévisions météorologiques plutôt que de grandes centrales uniques – en cas de défaillance, un trou énorme se crée dans le réseau (exemple : France en hiver avec forte charge de chauffage et pannes de réacteurs).

    **Hydrogène:**
    L’hydrogène est gris (issu du gaz naturel) et donc pas un avantage environnemental. Dans le secteur de la mobilité, il a été surpassé par les développements de batteries. Les électrolyseurs nécessitent 45 000 heures de fonctionnement/an pour amortissement – cela correspond à 12 heures d’électricité excédentaire quotidienne, ce qui n’est pas disponible. L’hydrogène n’a économiquement de sens que dans la production de matières premières chimiques (engrais, méthanol), pas pour les voitures particulières/camions. Une voiture à hydrogène nécessite 3–4 fois plus de centrales éoliennes qu’une voiture électrique directe.

    **Recherche en Batteries à l’Institut Helmholtz d’Ulm:**
    La Plateforme d’Accélération des Matériaux teste environ 1 000 combinaisons de matériaux quotidiennement par robotique autonome, apprentissage automatique et IA. Succès antérieurs : Réduction de moitié de la phase de formation des cellules de batterie (un tiers des coûts de fabrication), brevets, octroi de licences industrielles. Groupes de focalisation : batteries à électrolyte solide, batteries durables (sodium, magnésium, calcium au lieu du lithium), optimisation des interfaces. L’IA suggère souvent des compositions similaires à celles des technologies déjà établies – l’homme était déjà intelligent, mais le processus continue.

    **Coûts des Ressources Fossiles:**
    L’AIE s’attend à un maximum d’extraction de pétrole autour de 2030. EROI (Rendement Énergétique de l’Investissement Énergétique) baisse : de 100:1 historiquement à actuellement 6–7:1, dans 20 ans à 3–4:1. Sables bitumineux canadiens : déjà aujourd’hui, un litre de pétrole à la station-service coûte énergétiquement un demi-litre de brut à l’extraction. Réserves mondiales de gaz : 209 milliards de mètres cubes durent avec la consommation actuelle 40–60 ans.

    **Centres de Données IA et Planification Énergétique:**
    Colosus d’Elon (Memphis) : expansion de 2 GW. Stargate (OpenAI/Oracle/SoftBank) : 10 GW prévus. Microsoft réactive Three Mile Island. Google négocie avec les fournisseurs de SMR. Image parallèle : Elon Musk souligne l’énergie solaire comme source d’énergie la plus importante, mais construit aussi lui-même des centrales à gaz – pragmatisme, pas contradiction.

    **Centres de Données Orbitaux:**
    Techniquement intéressants (soleil 24h/24, pas de stockage nécessaire, théoriquement 10 fois moins chers), mais les questions de refroidissement sont non résolues, des quantités massives de matériaux requises, les problèmes de sécurité des données en transmission par radio sont problématiques.

    **Problèmes Allemands:**
    Manque de continuité politique (les changements de gouvernement sabotent le travail des prédécesseurs), surréglementation/bureaucratie (exemple : 160 dossiers de documents d’autorisation pour la fabrication de cellules), coûts salariaux élevés (avec automatisation parfois hors de propos, mais aussi les coûts énergétiques et la rapidité administrative). Positif : Les véhicules électriques premium allemands (Mercedes, BMW i3) sont au top mondialement.

    **Appel à l’Allemagne:**
    Continuité politique, dérèglementation, conditions cadres fiables pour les investissements – la Chine planifie à long terme, l’Allemagne s’arrête-redémarre à chaque changement de gouvernement.

    **Projets/Fournisseurs Explicitement Nommés:** AIE (Agence Internationale de l’Énergie), Institut Helmholtz d’Ulm, OpenAI, Oracle, SoftBank (Stargate), Tesla, SpaceX, BYD, Hinkley Point C (GB), Flamanville (France), Colosus (Memphis d’Elon), Three Mile Island (Microsoft). **Format:** Interview Approfondie ; **Accent:** Analyse au niveau de la recherche sur les ressources fossiles, la technologie énergétique, les matériaux de batteries, techniquement exigeant mais accessible aux spectateurs informés.

  • L’IA Locale est LARGEMENT Sous-Estimée! Tous les Moyens d’Utiliser l’IA Complètement Gratuitement & Hors Ligne
    16.6.2026, 15:15:35

    # Les Cinq Moyens d’Utiliser l’IA Locale

    Le créateur soutient que l’IA locale est largement sous-estimée. Les modèles open-source ne traînent plus que de quatre mois sur les modèles phares actuels et répondent correctement à 71,3% de toutes les requêtes selon une évaluation Stanford (2023 : 23%). L’efficacité des coûts est le principal moteur – les coûts de l’IA cloud ont chuté de 280 fois en 18 mois, et les modèles open-source chinois sont maintenant utilisés plus aux États-Unis que les modèles cloud américains.

    **Contexte Historique:** L’intelligence artificielle était à l’origine locale (systèmes experts des années 1980). Avec la percée du deep learning à partir de 2012, l’IA a migré vers les centres de données cloud. Le point de basculement décisif est intervenu en mars 2023 : le modèle Llama de Meta a été divulgué, et le développeur bulgare Georgi Gerganov a créé au cours d’un week-end Llama.cpp – un outil qui comprime les modèles par quantification de sorte qu’ils fonctionnent sur des ordinateurs portables ordinaires.

    **Deux Tendances Matérielles:** La Chine fait baisser les prix des GPU grâce aux puces Huawei de manière massive (Deepserk réduit les prix de 75%), et Apple devient le gagnant potentiel via son framework MLX – un MacBook Pro avec M5 Max exécute un modèle de 120 milliards de paramètres jusqu’à 80 tokens/seconde, trois fois plus rapide que Claude avec 60 tokens/seconde.

    ## Les Cinq Moyens d’Utiliser l’IA Locale:

    1. **Localement sur Votre Machine:** Des programmes comme Ollama, LM Studio ou Llama.cpp permettent le téléchargement direct et l’exploitation. Ollama offre depuis juin une approche de type app-store. Règle Empirique : 8 GB RAM pour des modèles de 7 milliards de paramètres. Plus précisément : Avec la quantification Q4 standard, le nombre de paramètres correspond approximativement à la VRAM requise en gigaoctets.

    2. **Tester en Ligne sans Téléchargement:** LM Arena pour les comparaisons, Hugging Face pour les démos, Google Colab pour l’accès GPU gratuit – idéal pour apprendre, mais pas privé.

    3. **APIs d’Inférence:** Des fournisseurs comme Grok, Together AI ou Nebius hébergent des modèles open-source et permettent l’accès via API avec quelques lignes de code comme ChatGPT, mais à une fraction du coût.

    4. **Vos Propres Serveurs:** Les VPS bon marché de 5€ ne suffisent pas (pas de GPU). L’IA locale sérieuse nécessite un GPU ou une mémoire rapide – soit du matériel dédié en centre de données (par exemple Nvidia H100 pour ~30 000€ pour un modèle de 70 milliards de paramètres) soit des serveurs GPU cloud privés (par exemple Hetzner G44 pour 7–14 milliards, GX130 pour 70 milliards de paramètres).

    5. **Intégré dans les Applications:** Apple Intelligence sur iPhone ou Gemini Nano sur Android – modèles de 3 milliards de paramètres, entièrement hors ligne, invisibles pour l’utilisateur.

    ## Cas d’Usage Pratiques dans la Plateforme Corp-LM:

    **Extraction de Données de Documents:** Avec Gamma 4 (26B dans la quantification 8-bit via MLX), les données sensibles sont extraites correctement – cependant, on a remarqué que lors de l’extraction de dates à partir d’images PDF, l’extraction de texte (2014) était préférée aux informations d’image réelles (2017). Pour les tâches OCR, un modèle multimodal avec capacités de vision est nécessaire (par exemple Qwen3-VL-8B).

    **Mixture-of-Experts vs. Modèles Denses:** Gamma 4 (26B MoE) est plus de 3x plus rapide qu’un modèle dense de 12B malgré sa taille, car seulement 4 milliards de paramètres sont actifs par token au lieu de tous les 12 milliards.

    **Discuter de Contrats:** Un contrat de 20 pages peut être interrogé. Les questions simples reçoivent des réponses correctes, les questions plus complexes échouent partiellement en raison des fenêtres de contexte limitées (les deux modèles ont montré des problèmes pour extraire le tribunal compétent).

    **Discuter Avec Ses Propres Connaissances:** Les documents peuvent être téléchargés et organisés dans des dossiers. Les systèmes RAG (Retrieval Augmented Generation) sont judicieux avec plusieurs documents ; avec des PDF uniques, chargez directement dans la fenêtre de contexte.

    **Générer des Aperçus HTML:** Les modèles locaux créent des aperçus simples (par exemple stratégies marketing), mais perdent contre les modèles cloud pour la conception frontend complexe.

    **Anonymisation des PII:** Un modèle de prompt anonymise les données sensibles localement avant de transmettre le texte aux modèles cloud pour des analyses complexes – conforme au RGPD et économe.

    **Templates de Prompt dans la Bibliothèque:** Les prompts peuvent être sauvegardés et réutilisés, avec des variables pour des entrées flexibles.

    ## Limitations Honnêtes:

    Les modèles locaux rencontrent des limites dans le coding agentic complexe ; les modèles cloud mènent clairement. Financièrement, un serveur personnel n’est rentable qu’à partir de 50–100 millions de tokens/mois ; en dessous, le cloud est souvent moins cher. L’approche pratique est hybride : données sensibles et workflows automatisés localement, performance maximale pour le développement d’applications dans le cloud.

    **Perspective à Long Terme:** La courbe des coûts travaille pour l’IA locale – la puissance de calcul double annuellement (Loi de l’Accélération des Rendements). Ce qui tourne aujourd’hui dans un centre de données tourne demain sur l’ordinateur portable, après-demain sur le téléphone. L’IA sort des centres de données et devient l’IA de l’environnement.

    **Conclusion du Créateur:** L’IA locale n’est pas une contre-tendance, mais l’étape logique finale de la révolution de l’IA – le moment où la technologie ne appartient plus à quelques corporations, mais à chacun individuellement.

    **Outils/Modèles Explicites:** Ollama, LM Studio, Llama.cpp, Framework MLX, Gamma 4, Qwen3-VL, Claude (Sonnet 3.5), OpenAI GPT, Llama, Plateforme Corp-LM (Développement Interne), Grok, Together AI, Nebius, Google Colab, Hugging Face, LM Arena, Versell, Ray Ray, Hetzner. **Format:** Démo + Approfondissement avec cas d’usage pratiques et vue d’ensemble de l’approche hybride.

Fireship (3 nouvelles vidéos)

  • The most trusted code on Earth is being rewritten in Rust
    19.6.2026, 17:24:47

    # Résumé : Turso – SQLite réinventé en Rust

    L’histoire de la vidéo commence en 2000 avec un développeur de la Marine qui s’est demandé pourquoi les bases de données avaient besoin de serveurs séparés – et a inventé SQLite, un moteur de base de données embarqué dans un seul fichier, distribué des milliards de fois à travers le monde.

    Maintenant, deux développeurs (l’un auteur d’un livre sur la latence, l’autre contributeur top-5 du noyau Linux) tentent de réécrire SQLite de zéro en Rust : **Turso**. Leur motivation n’est pas que SQLite soit mauvais, mais qu’il ne soit pas développé au sens classique du logiciel open source – les trois mainteneurs n’acceptent pas les contributions externes.

    Les principales fonctionnalités de Turso au-delà de SQLite : (1) **véritable concurrence** – plusieurs écrivains peuvent accéder simultanément à différentes parties de la base de données au lieu d’un seul writer ; (2) **support async** – au lieu de bloquer les threads, la DB rend le contrôle ; (3) **recherche vectorielle native** – les embeddings et leurs index vivent directement dans le fichier, pas besoin de bases de données vectorielles séparées, interrogeables avec du SQL normal.

    Le défi n’est pas de faire plus que SQLite, mais de gagner la confiance que 25 ans de travail ont construite. Turso est déjà entièrement compatible avec SQLite (remplacement direct) et utilise la « simulation déterministe » pour les tests – ils simulent l’ensemble de la DB dans un univers contrôlé et injectent des erreurs comme les coupures de courant ou les défauts de disque pour trouver des bugs. Parce que Turso est du vrai open source, les développeurs peuvent contribuer.

    **Exploration approfondie de Turso (Rust) et de l’agent de codage IA Jun de Jet Brains en tant que fonctionnalité sponsor ; la vidéo combine l’histoire du produit, l’explication technique et l’évaluation critique.**

  • One man just liberated Fable… and now it’s illegal
    15.6.2026, 18:35:58

    # Résumé : Claude Fable – Interdiction gouvernementale après jailbreak

    La vidéo traite des événements autour de Claude Fable, un nouveau modèle d’IA d’Anthropic qui a été arrêté par le gouvernement américain trois jours après sa sortie publique. Fable était une version « sécurisée » du modèle de base Mythos 5, disponible uniquement pour les partenaires de confiance – avec des classifieurs de sécurité censés bloquer les demandes non sûres et rediriger à la place vers le plus faible Opus 4.8. Malgré des milliers d’heures de tests internes, un utilisateur anonyme nommé Plenty the Liberator a réussi à contourner les protections en peu de temps, en décomposant les demandes en petits fragments inoffensifs et en utilisant des caractères Unicode ainsi que le jeu de rôle – pas un exploit de science-fiction technique, mais plutôt un contournement conceptuel. Par la suite, le ministre du Commerce américain Howard Lutnik a émis une directive de contrôle des exportations qui a bloqué Fable et Mythos 5 pour tous les ressortissants étrangers, y compris les employés d’Anthropic comme André Karpathy nouvellement recruté. Anthropic a réagi en arrêtant complètement les deux modèles pour tous les utilisateurs, ce qui représente la première fois dans l’histoire qu’un grand fournisseur d’IA retire un modèle public en direct du marché en raison d’une directive gouvernementale. La vidéo mentionne des controverses supplémentaires autour de la dégradation intentionnelle des performances et discute des spéculations sur les motifs stratégiques, mais avertit contre les jugements hâtifs sans informations complètes.

    **Claude (Anthropic) thématisé ; opinion/réflexion avec éléments de mise à jour d’actualités.**

  • I read every major CS paper of the last 100 years…
    17.6.2026, 16:29:01

    # Les dix articles les plus influents de l’histoire de l’informatique

    La vidéo raconte l’histoire de l’informatique et de l’IA modernes à travers dix travaux scientifiques centraux :

    **Turing (1936)** : Par son analyse des nombres calculables, il a montré que tous les problèmes mathématiques ne sont pas résolubles algorithmiquement, et a ainsi inventé le fondement théorique – la machine de Turing – pour chaque ordinateur.

    **Shannon (1948)** : A révolutionné la compréhension de l’information par la mesure mathématique et a introduit le concept du bit, en montrant que toute communication peut être réduite à des uns et des zéros. Son concept d’entropie – basé sur la prédictibilité du symbole suivant – est l’ancêtre spirituel des fonctions de perte de l’IA.

    **Rosenblatt (1958)** : Inspiré par les neurones, le psychologue a construit le premier appareil d’apprentissage, le Perceptron, qui pondère les entrées et s’adapte – le bloc de construction des réseaux de neurones modernes, bien que avec un enthousiasme exagéré.

    **Minsky & Papert (1969)** : Ont prouvé mathématiquement les limites du Perceptron simple (par exemple avec la logique XOR) et ont ainsi déclenché le premier « hiver de l’IA », bien qu’en petits caractères ils aient déjà révélé la solution : les couches empilées.

    **Lamport (1978)** : « Times, Clocks, and the Ordering of Events in a Distributed System » a résolu le problème de la synchronisation de plusieurs ordinateurs sans horloge commune par le biais d’horloges logiques et de causalité – essentiel pour les systèmes distribués et les exécutions massives d’entraînement d’IA.

    **Hinton et al. (1986)** : Ont montré comment entraîner des couches empilées – par rétropropagation : les données passent, l’erreur est mesurée, l’erreur est repoussée vers l’arrière à travers toutes les couches avec la règle de la chaîne et les poids sont ajustés. Les couches cachées ont inventé leurs propres caractéristiques (bords, formes), la tâche XOR est devenue triviale.

    **Brin & Page (1998)** : Ont décrit PageRank, où les liens comptent comme des votes pondérés. Leur prototype de dortoir est devenu Google et a ainsi créé le plus grand tas structuré de données textuelles humaines – les futures données d’entraînement pour l’IA.

    **Krizhevsky, Sutskever & Hinton (2012)** : AlexNet entraîné sur ImageNet (des millions de photos annotées manuellement) avec des GPU grand public a réduit le taux d’erreur dans la compétition ImageNet de 10 points – a prouvé que l’apprentissage profond fonctionne avec des données, du calcul et une bonne architecture.

    **Vaswani et al. (Google, 2014)** : « Attention Is All You Need » a introduit l’architecture Transformer, qui abandonne la lecture séquentielle et permet à chaque mot d’accorder attention à tous les autres simultanément – Google l’a libéré gratuitement, tout le monde l’utilise maintenant, le T dans ChatGPT en provient.

    **OpenAI (2020)** : « Language Models are Few-Shot Learners » a montré que l’intelligence n’a pas besoin d’émerger d’algorithmes, mais apparaît simplement avec une mise à l’échelle suffisante – GPT-3 avec 175 milliards de paramètres, alimenté par l’ensemble d’Internet, pouvait soudainement traduire, résumer et écrire du code sans entraînement explicite. C’est ce qui a déclenché la bulle actuelle de l’IA.

    L’essence : Turing a défini la machine, Shannon lui a donné l’information, Rosenblatt un neurone, Hinton l’apprentissage, Google les données et l’architecture, OpenAI a simplement tourné le bouton d’échelle au maximum – en fin de compte, ChatGPT fait juste ce que Shannon a commencé en 1948 avec des gestes humains : prédire le prochain token.

    OpenAI et Google en tant que fournisseurs thématisés, vidéo d’opinion fondamentale avec exploration historique approfondie du développement des deux.

Greg Baugues

Aucune nouvelle vidéo pendant cette période.

IA et Stratégie | Le SamourAI (1 nouvelle vidéo)

  • Musk rachète Cursor 60 Milliards: L’empire contre-attaque
    18.6.2026, 16:21:39

    # Résumé

    La vidéo analyse l’importance stratégique du rachat de Cursor par SpaceX pour 60 milliards de dollars – financé non pas en liquide, mais par ses propres actions massivement évaluées immédiatement après l’introduction en bourse. L’essence de l’analyse réside non pas dans une diversification superficielle, mais dans une stratégie d’intégration verticale : SpaceX contrôle désormais la chaîne de valeur complète allant de l’énergie à la puissance de calcul (superordinateur Colossus à Memphis) jusqu’à l’interface utilisateur.

    L’auteur soutient que le code est l’actif stratégique clé de l’ère de l’IA – non pas parce que les développeurs l’écrivent, mais parce que les agents l’*exécutent* et traduisent ainsi directement l’intention humaine en réalité. Cursor n’était à l’origine qu’un éditeur, mais s’est transformé en centre de commande pour les agents autonomes. Le véritable goulot d’étranglement de l’industrie n’est pas la construction de modèles, mais la capacité de calcul. Musk en dispose et peut ainsi racheter tous les outils qui en dépendent.

    Cursor lui-même était piégé : la stratégie de neutralité (routage vers Claude/GPT) payait constamment les concurrents sans générer de marge propre. Le modèle maison Composer ne pouvait jamais rivaliser, faute de capacité de calcul. Musk résout exactement ce problème. La nouvelle gamme de produits Origin (hôte de code compatible Git pour les agents, non pour les humains) montre la direction : l’infrastructure bascule de « conçue pour les humains » à « optimisée pour les agents » – rendant GitHub obsolète.

    **Conséquences pour les utilisateurs :** la création de valeur migre des applications visibles vers l’infrastructure invisible (puissance de calcul, orchestration). Qui ne contrôle pas la puissance de calcul doit au moins maîtriser la couche d’orchestration. Dépendre d’une seule application de surface est aujourd’hui hautement risqué. Les entreprises devraient traiter leur tech stack comme des chaînes d’approvisionnement : quelle infrastructure fait tourner cet outil ? À qui appartient-elle ? Y a-t-il des conflits d’intérêts ?

    L’auteur met aussi en garde contre les manipulations réglementaires : SpaceX a été intégré aux indices (Russell 1000, MSCI World), ce qui force automatiquement des millards provenant de fonds ETF passifs à acheter l’action – y compris les millions d’épargants européens dans leurs PEA/assurances-vie. Le cours de l’action est partiellement tiré par cette demande forcée, et non par une évaluation fondamentale.

    Le saut abrupt thématique à la fin (une sorte d’interview cynique sur l’automatisation et les réductions de salaires) ressemble à une citation de film mutilée et reste isolée sur le plan du contenu ; aucune transcription disponible.

    **Outils/stratégies thématisés :** SpaceX, Cursor, Colossus (cluster de calcul), X.AI / Grok, Starlink, Anthropic (Claude), OpenAI (GPT), Origin (produit Cursor), GitHub, Cloud Code, Codex, Composer — ainsi que conceptuellement : AIOS (AI Operating System), intégration verticale, mécaniques des fonds indiciels. — **Format : Deep-Dive / Opinion avec focus analytique économique.**

Julian Ivanov | Automatisation IA (1 nouvelle vidéo)

  • Bau dir dein KI-Betriebssystem mit Claude Code – Komplettes Tutorial 2026
    18.6.2026, 17:26:41

    # Résumé : Construire ton propre système d’exploitation IA

    La vidéo montre étape par étape comment construire un système d’exploitation IA personnalisé – un système central dans lequel un agent IA comme Claude en sait tout sur toi, ton entreprise et tes outils, et peut ainsi travailler plus efficacement.

    ## Le problème sans un tel système
    Sans système d’exploitation agentique, tu dois te réexpliquer à chaque fois ; l’IA n’a aucun contexte ; tu dois constamment copier-coller entre les outils ; rien ne s’automatise. Avec le système, l’IA te connaît ainsi que ton entreprise, fournit de meilleures réponses, peut exécuter des outils (par exemple Google Workspace, Notion) et automatise les processus.

    ## Les quatre composants

    **1. Savoir/Contexte :** Un dossier local contenant des fichiers texte sur tes sujets, idéalement organisés dans Obsidian. Y compris un fichier `claude.md` contenant des instructions pour Claude (comment il doit écrire, quelles règles s’appliquent). Claude peut accéder à ces fichiers liés.

    **2. Connexions d’outils :** Claude est connecté à des programmes externes via MCP (protocole standardisé), des outils CLI ou des API. Tu dis simplement à Claude quels outils tu veux connecter (par exemple Google Workspace, Slack, Notion), et il le configure pour toi. Exemple : Claude crée automatiquement des Google Docs, Sheets et présentations à ta demande dans ton style.

    **3. Skills :** Des fichiers texte qui expliquent à Claude comment effectuer certaines tâches. Par exemple : « Créer des diagrammes Excalidraw » ou « Transcrire les appels en direct avec horodatages ». Les Skills sont créés une seule fois, puis Claude les réutilise continuellement pour des tâches similaires. Tu peux les déclencher par commande vocale ou avec des commandes slash. Il existe un Skill Creator officiel d’Anthropic qui aide les autres Skills à s’améliorer.

    **4. Routines :** Des processus automatisés qui s’exécutent à des heures spécifiques. **Local :** s’exécute uniquement quand le PC est allumé (utilise des modèles locaux). **Distant :** s’exécute dans le cloud d’Anthropic, indépendamment du PC local, à des heures définies. Exemple : Chaque lundi à 9h, collecter automatiquement les actualités IA et rédiger un post à ce sujet.

    ## Travailler de partout : GitHub + Serveur

    Le dossier est téléchargé en tant que référentiel GitHub privé (Claude le fait sur commande). Tu as ainsi une sauvegarde et peux garder le dossier synchronisé sur n’importe quel appareil (ordinateur portable, serveur). Claude envoie automatiquement les modifications à GitHub ; sur d’autres appareils, tu peux télécharger la dernière version.

    Important : Sur un **serveur** (par exemple Hostinger 8€/mois), le Cloud Code s’exécute en permanence. Tu te connectes via SSH depuis l’application Cloud Desktop et travailles sur les processus du serveur depuis ton PC/ordinateur portable/téléphone. Le système d’exploitation se trouve également sur le serveur, donc Claude a accès à tes connaissances de partout.

    **Obsidian + Git Plugin :** Avec le plugin Git gratuit (extension communautaire), Obsidian se synchronise automatiquement avec GitHub toutes les 5 minutes – aucun abonnement Obsidian Sync nécessaire.

    ## Étapes pratiques
    – Créer un compte GitHub
    – Dire au Cloud : « Installe GitHub CLI, connecte-moi à mon compte, crée un référentiel privé »
    – Sur ordinateur portable/serveur : Faire la même chose, puis télécharger le dossier
    – Créer une clé SSH (le Cloud le fait) → Contrôler le serveur depuis l’application Desktop
    – Installer le plugin Git Obsidian, régler la synchronisation automatique sur 5 minutes
    – Élargir continuellement tes connaissances (fichiers dans Obsidian)
    – Communiquer avec Claude : nouveaux Skills, nouvelles connexions d’outils, nouvelles routines

    Optionnel : Construire un tableau de bord agentique pour accéder rapidement aux Skills et aux informations du cloud.

    Le système grandit avec toi : Tu dis à Claude ce dont tu as besoin, et le système se construit lui-même.

    **Outils/Fournisseurs mentionnés :** Claude (Anthropic), GitHub, Obsidian, Hostinger, Google Workspace, VS Code, Cursor. **Format :** Tutoriel avec éléments de démonstration. **Niveau :** Difficulté moyenne – pas pour les débutants absolus, mais structuré de manière claire.

Kyle Balmer | AI with Kyle (3 nouvelles vidéos)

  • Learn how to teach AI to businesses and earn $1000/hour
    17.6.2026, 06:45:42
  • Claude Fable 5 & Mythos: The Most Powerful AI Model Ever Built
    15.6.2026, 05:00:26

    # Claude Mythos et Claude Fable 5 – Résumé

    Anthropic a lancé deux nouveaux modèles de pointe : Mythos, réservé exclusivement aux partenaires via le « Project Glasswing » (banques, grandes entreprises d’infrastructure), et Fable, la variante plus sécurisée et accessible publiquement de Mythos. Fable devient ainsi le nouveau modèle phare de la hiérarchie d’Anthropic (Fable > Opus > Sonnet > Haiku).

    L’insight central : ces modèles fonctionnent différemment des systèmes d’IA précédents. Au lieu de poser des questions récurrentes, on leur confie des tâches complexes en tant que « collègues » autonomes – ils travaillent pendant des heures sans intervention, mettent en place des workflows agentiques et livrent un résultat final sans que l’utilisateur ne puisse suivre le processus (design volontairement de boîte noire, probablement pour prévenir les attaques par distillation). Cette approche fonctionne particulièrement bien pour les problèmes complexes et ambitieux (plans commerciaux, écriture de livres, questions stratégiques), mais moins pour les tâches routinières comme la rédaction d’e-mails.

    Le problème central : à partir du 22 juin (dix jours après la date d’enregistrement), l’accès sera drastiquement restreint. Même les abonnés au plan à 200 $ seront exclus. Fable passe à un modèle de paiement à l’usage (probablement ~40 dollars par heure), similaire à l’API. Cela crée une scission nette : les personnes aisées ayant une activité commerciale auront accès à l’intelligence de pointe, tandis que les autres resteront avec des modèles plus faibles. C’est, selon le conférencier, historiquement le premier moment où il devient clair que l’intelligence de l’IA n’est plus « trop bon marché à mesurer », mais réservée exclusivement aux utilisateurs les plus riches.

    D’autres points controversés incluent : le gatekeeping entre Mythos et Fable, les jailbreaks déjà existants (en l’espace de quelques jours), l’opacité massive du comportement du modèle, ainsi que les conséquences sociales (concentration des richesses, chômage des jeunes). Malgré tout cela, le modèle est décrit comme une véritable amélioration des capacités – la controverse n’existerait pas s’il ne fonctionnait pas. Anthropic a également annoncé cette semaine un prochain IPO.

    **Modèles/fournisseurs mentionnés :** Anthropic (Claude/Fable/Mythos), OpenAI (GPT-5.5, GPT-6 attendu), Google Gemini ; Format : opinion/réflexion avec mise à jour des actualités du lancement.

  • Fable 5 BANNED: If You’re Not American, Sorry.
    17.6.2026, 05:00:39

    # Résumé : La suspension de Fable et Mythos – Implications pour l’avenir de l’IA

    Le contenu traite de la suspension à court terme du modèle Fable d’Anthropic (quelques jours après son lancement le 9 juin) due à une directive américaine de contrôle des exportations et de ses implications considérables.

    **Pourquoi Fable était révolutionnaire :** Fable était une version nettement améliorée de Mythos avec des mesures de sécurité supplémentaires. Contrairement aux outils d’IA précédents, il ne se limitait pas au prompting, mais permettait une action proactive – il pouvait déployer indépendamment les outils nécessaires pour résoudre des tâches complexes (décrit par l’utilisateur comme « relentlessly proactive »). Cela nécessitait une nouvelle compétence : être capable de formuler de grands problèmes significatifs plutôt que de petites tâches individuelles.

    **Chronologie :** Après le lancement, des critiques ont d’abord porté sur les mesures de sécurité ; certains chercheurs en sécurité ont été bloqués. Le gouvernement américain a ensuite ordonné à Anthropic de bloquer l’accès pour tous les non-citoyens américains – y compris ceux résidant aux États-Unis. Anthropic n’a reçu que 90 minutes pour mettre en œuvre cette directive et a dû bloquer l’ensemble du modèle, car une distinction pratique était impossible.

    **Déclencheurs supposés (selon David Sacks) :** Un partenaire de confiance (probablement Amazon) a découvert un jailbreak des mesures de sécurité, donnant accès à des contenus sensibles (recettes de bombes, fabrication de méthamphétamine). Anthropic aurait refusé de corriger le problème ; le gouvernement a alors mis en place les contrôles à l’exportation. Un utilisateur nommé Pliny a confirmé que le jailbreak fonctionnait.

    **Implications plus larges :**
    – **Confidentialité et identités numériques :** La réglementation pourrait forcer les gouvernements et les entreprises à exiger des vérifications d’identité complètes (scans de pièces d’identité, données biométriques) pour accéder à l’IA – un précédent pour la surveillance.
    – **Contrôle et décentralisation :** L’accès fermé aux modèles de pointe via API/abonnement signifie une dépendance ; les modèles peuvent être supprimés à tout moment sans le contrôle de l’utilisateur.
    – **Géopolitique :** Si les États-Unis bloquent les lancements de modèles, des pays comme la Chine pourraient rattraper et dépasser sans entrave.
    – **Régulation :** Les futurs lancements de modèles pourraient devoir être approuvés par les autorités au lieu d’être publiés directement.

    **Recommandations pratiques :** Les utilisateurs devraient se familiariser avec les modèles locaux et open-source (via lmstudio.ai ou Hugging Face) pour créer une indépendance vis-à-vis des fournisseurs de modèles de pointe. La compétence fondamentale reste : apprendre à formuler de plus grands problèmes pour les systèmes d’IA.

    **Questions ouvertes :** Fable reviendra-t-il ? Tous les futurs modèles Mythos seront-ils régulés de manière similaire ? Les restrictions resteront-elles basées sur la nationalité ou les alliés seront-ils inclus ?

    **Conclusion :** L’orateur souligne qu’il ne s’agit pas principalement d’une discussion technique sur un seul modèle, mais d’une question fondamentale concernant l’accès, la souveraineté et la structure de l’économie de l’IA – et il nous appelle à ne pas perdre de vue les contextes plus larges.

    Mise à jour d’actualités avec des éléments d’opinion et de réflexion sur les événements actuels du secteur de l’IA (Anthropic Claude, modèles mentionnés sans fournisseurs spécifiques à part Hugging Face et LM Studio) ; les affirmations reposent sur des spéculations en cours et des rapports partiellement non vérifiés.

Leon van Zyl (2 nouvelles vidéos)

  • Codex vs Claude Code: What I Found After 30 Days
    18.6.2026, 13:00:25

    # Claude Code vs. Codex – Comparaison dans le développement d’applications

    Le créateur a comparé Claude Code et Codex directement en confiant la même tâche à chaque agent : construire une application d’automatisation de workflows visuels (similaire à N8N) à partir de zéro.

    **Méthodologie :** Le créateur a utilisé la méthode « RAMP » – un flux de travail structuré pour le codage piloté par des agents. Les deux agents ont suivi le même processus : recevoir des instructions, installer des Skills, créer le plan, implémenter l’application et effectuer des tests.

    **Résultats par catégorie :**

    – **Planification et compétence en questions :** Codex a posé beaucoup plus de questions techniques (environ 5 fois plus) et offrait ainsi un meilleur contrôle sur l’architecture. Claude a partiellement ignoré les instructions explicites.
    – **Interface utilisateur et design :** Claude a remporté cette catégorie – l’interface semble plus soignée et visuellement attrayante, tandis que Codex paraît plus fonctionnel.
    – **Structure de projet et architecture :** Codex a organisé les fichiers de manière plus propre (par exemple, dossier `/data` dédié, page 404), Claude a placé la base de données à la racine du projet.
    – **Fonctionnalité et tests :** Les deux ont satisfait aux exigences complètement et testé les applications dans le navigateur.
    – **Coûts et utilisation :** Claude a consommé 8% du plan à 250 dollars, Codex 16% du plan à 100 dollars – **meilleur rapport qualité-prix nettement chez Codex**.
    – **Maintenabilité (ajout de fonctionnalités) :** Codex a créé une liste de modèles déroulants plus complète (incluant les modèles rapides), remportant cette manche.

    Conclusion : Claude brille dans le design, Codex offre de meilleures décisions techniques, une meilleure efficacité des coûts et des questions plus approfondies pendant la planification.

    **Mentionné explicitement :** Claude Code, Codex/modèles GPT, OpenRouter, N8N, Make.com, Zapier — Démo/Comparaison.

  • Claude Code + Unreal Engine: Build a Full Game with AI (MCP Setup Tutorial)
    21.6.2026, 12:46:07

    # Créer un jeu inspiré de GTA 6 avec Claude Code et Unreal Engine

    La vidéo montre comment un débutant complet peut prototyper en quelques heures un jeu fonctionnel inspiré de GTA 6 en utilisant Claude Code et Unreal Engine.

    **Configuration et mise en place :**
    Vous avez besoin d’Unreal Engine (au moins version 5.8), Claude Code (ou d’agents de codage alternatifs comme Codex de ChatGPT) ainsi que du plugin Unreal MCP. Après installation du lanceur et téléchargement de l’engine, Claude Code est installé via une commande de terminal. Ensuite, le plugin Unreal MCP doit être activé dans l’éditeur et le démarrage automatique configuré dans les préférences. Un fichier `.mcp.json` est généré, qui définit le serveur MCP local dans le dossier du projet.

    **Dépannage et configuration des outils :**
    Au départ, Claude a pu trouver la connexion MCP mais n’avait pas d’interfaces. La solution a nécessité l’activation de plugins supplémentaires : Python Editor Script Plugin, Python Foundation Packages et Editor Toolset Registry. Après redémarrage, les outils nécessaires (par exemple, l’outil Scenes) étaient disponibles. La vidéo montre aussi comment insérer des captures d’écran directement dans Claude Code (Alt+V) pour déboguer les problèmes de visibilité.

    **Développement du jeu en mode planification :**
    Au lieu de coder directement, le mode planification est utilisé pour discuter des spécifications (niveau d’ambition, heure de la journée/ambiance de l’environnement, stratégie d’assets). Claude fait des recherches en ligne sur Vice City, Lucia et Jason et présente un plan détaillé pour une « tranche verticale complète » avec véhicule d’évasion, système de niveau de recherche, changement de personnage et marqueur d’objectif. L’utilisateur interrompt le plan et demande à Claude d’utiliser des assets gratuits plutôt que des formes primitives.

    **Intégration d’assets :**
    Unreal Engine fournit des feature packs intégrés (Third Person, Vehicles) qui peuvent être ajoutés en un clic. De plus, la bibliothèque Fab peut être parcourue (filtre : gratuits et compatibles uniquement). La vidéo montre comment télécharger des assets de routes, des palmiers avec animations et d’autres détails, et comment instruire Claude pour les utiliser.

    **Résultat après environ 92 heures de travail d’agent :**
    Un monde jouable avec des PNJ, des véhicules conduisibles, des armes utilisables et des personnages nommés Lucia et Jason. Les graphiques montrent un environnement avec une teinte de caractère verdâtre-bleuâtre et une conception de niveau rudimentaire. L’utilisateur utilise ensuite le mode workflow « ultracode » pour prioriser les fonctionnalités manquantes (son, IA des PNJ, physique, armes).

    **Réflexion :**
    Le processus était chronophage, mais l’auteur souligne que la technologie des serveurs MCP est encore nouvelle et qu’Epic Games optimisera probablement le traitement parallèle des agents. Ces outils ne sont pas destinés à remplacer les développeurs de jeux, mais à leur permettre de déléguer les tâches triviales et de se concentrer sur les aspects créatifs. Particulièrement pour le développement de jeux indépendants, ces agents pourraient être transformateurs.

    **Conclusion :** Claude Code et Unreal Engine MCP ; tutoriel de démonstration pour débutants, application pratique concrète présentée.

Liam Ottley (1 nouvelle vidéo)

  • If you’re building with AI, don’t miss this
    18.6.2026, 05:43:21

    La vidéo est une annonce pour un sommet d’IA en Monténégro fin juillet. Le créateur promeut l’événement comme l’un des plus grands événements d’IA de l’été et le compare à un événement précédent réussi au Cap-Vert, qui a duré une semaine complète et a été décrit par de nombreux participants comme l’une des meilleures expériences vécues.

    L’événement au Monténégro proposera deux types de billets : des billets VIP avec accès toute la journée aux conférenciers (décrits comme « les plus grands noms de l’espace IA ») et des billets de conférence moins chers avec accès général. De plus, il y a un jour VIP supplémentaire avec une excursion en bateau. L’événement s’adresse aux fondateurs d’agences IA, aux propriétaires d’entreprises et à tous ceux qui s’intéressent à l’IA et souhaitent apprendre les dernières implémentations et applications pratiques.

    Le résumé qui suit de l’événement du Cap-Vert montre qu’il s’est déroulé sur six jours avec plus de 120 participants quotidiens et comprenait, en plus des ateliers, des conférences d’ouverture et des masterclasses, des activités de bien-être, de nature et de réseautage – commercialisé comme une expérience globale mettant l’accent sur la liberté, la construction et la connexion par l’IA.

    **Format : Mise à jour d’actualité / Annonce (Promotion d’événement).**

Mark Kashef (1 nouvelle vidéo)

  • Make Any Model Think Like Fable in 10 Minutes (It’s Easy)
    14.6.2026, 19:00:05

    # Résumé : Reproduire le comportement de Fable 5 dans d’autres modèles IA

    Maintenant que Fable 5 n’est plus disponible, cette vidéo montre un moyen pratique de faire en sorte que Claude et d’autres modèles travaillent de façon similaire, intelligemment et structurée.

    L’idée fondamentale : les conversations IA sont stockées dans des fichiers JSONL sur l’ordinateur – remplis de prompts, réponses du modèle, appels d’outils et métadonnées. On peut analyser ces fichiers pour découvrir comment Fable 5 fonctionnait différemment des autres modèles (par exemple Opus ou Haiku). Pour cela, on utilise des scripts Python qui filtrent le bruit et conservent uniquement les transcriptions pertinentes, les horodatages, les noms de modèles et les appels d’outils.

    La procédure concrète dans le terminal : (1) Compter combien de fichiers JSONL sont présents ; (2) écrire un script qui nettoie un fichier de session et conserve uniquement la transcription + métadonnées ; (3) rassembler toutes les conversations Fable 5 dans un corpus ; (4) extraire des métriques de comportement (pas seulement des impressions, mais des chiffres mesurables) ; (5) exécuter le même processus d’analyse sur un autre modèle (par exemple Opus) et comparer les différences directement – rythme, utilisation des outils, séquence d’actions, lectures avant modifications, tests après modifications.

    Le résultat : un playbook contenant les conclusions clés sur comment l’autre modèle pourrait reproduire le comportement de Fable. Ce playbook peut alors être injecté comme un hook de contexte au démarrage de la session ou intégré dans le fichier Claude-MD – de sorte que chaque nouvelle session en bénéficie. L’auteur fournit son propre playbook ainsi que des liens vers des ensembles de données Fable 5 publics (Hugging Face), au cas où vous n’auriez pas assez de vos propres conversations Fable.

    Important : vous ne pouvez pas cloner la puissance brute du modèle Fable, mais vous pouvez encourager d’autres modèles à réfléchir plus longtemps et à suivre des flux de travail structurés – ce qui les rapproche au moins du niveau de performance de Fable.

    **Format : tutoriel ; outils : Claude, Codex, Opus (ainsi que des alternatives open-source).**

Matt Pocock

Aucune nouvelle vidéo pendant cette période.

Melvynx (3 nouvelles vidéos)

  • Codeline: ma plus grosse migration à Tanstack Start (je regrette pas)
    20.6.2026, 17:25:47

    # Résumé

    Le créateur a migré toute sa plateforme Codeline de Next.js vers TanStack Start – un changement massif avec plus de 100 000 lignes ajoutées et 129 000 lignes supprimées (PR #315). Il cite trois raisons principales pour cette migration :

    **1. Vitesse de déploiement :** Le temps de build est passé de 3 minutes 30 secondes en moyenne à environ 1 minute 20 secondes – une réduction d’environ deux tiers. C’est crucial en cas d’urgence en production.

    **2. Réactivité/Expérience utilisateur :** Une démo en direct montre la différence : avec Next.js, la navigation affiche plusieurs placeholders et loaders en cascade, ce qui semble lent. TanStack Start charge les pages quasi instantanément sans cascades de loaders inutiles, ce qui améliore considérablement la sensation de vitesse.

    **3. Compatibilité IA (point le plus important) :** Next.js a trop de concepts concurrents (Pages Directory vs App Directory, Server/Client Components, diverses conventions de nommage, etc.), ce qui confond les modèles d’IA. TanStack Start est en revanche **déclaratif et explicite** : les routes sont clairement définies, les loaders, middlewares et composants sont regroupés dans un bloc, la sécurité des types est omniprésente. Cela rend la compréhension et la génération par l’IA bien plus faciles. TanStack Start suit les standards web plutôt que des abstractions propriétaires, ce qui permet aux modèles d’IA de mieux le « comprendre ».

    Le créateur mentionne qu’il a utilisé un système multi-agents avec support IA pour cette migration et a ensuite créé un skill pour corriger les bugs (par exemple, trouver et réparer les boutons manquants via l’historique Git). Il renvoie à sa formation « Nostack » (mlv.sh/formation-stack), qui montre comment combiner TanStack avec Convex pour une efficacité maximale des agents IA.

    **Thèmes abordés :** TanStack Start, Next.js, Convex, agents IA pour migration de code et correction de bugs — **opinion/réflexion avec éléments d’analyse approfondie.**

  • GLM 5.2 : le PREMIER modèle chinois qui m’impressionne vraiment ?
    19.6.2026, 06:00:08

    # GLM 5.2 – Comparaison avec GPT-4.5 sur des tâches réelles de code

    La vidéo teste le nouveau modèle open source **GLM 5.2** concrètement contre **GPT-4.5** (via la plateforme Open Code) sur quatre tâches de développement réelles. GLM 5.2 est positionné comme un modèle open source nettement meilleur : contexte de 1 million de tokens, fortes capacités en code, entièrement open source sous licence MIT, et impressionnant dans les benchmarks (environ 10-PSWE : de 18% à 46% de taux de réussite vs prédécesseur).

    **Test 1 – Sidebar Bundle :** Les deux modèles réussissent la tâche en environ 7 minutes avec un code similaire. GLM : 10/10, GPT : 10/10.

    **Test 2 – Bundle Dashboard :** GLM comprend correctement que les deux dashboards doivent se ressembler et l’implémente (10 minutes, 10/10). GPT malinterprète massivement le prompt et produit une interface complètement erronée (18 minutes, 0/10).

    **Test 3 – Floating Chatbot :** Les deux créent des interfaces fonctionnelles, mais tous deux ont des problèmes avec plusieurs appels d’outils en succession (le chatbot n’exécute qu’une action, puis s’arrête). GLM affiche une UI propre mais cache les erreurs (pas de retour visuel). GPT affiche les erreurs visuellement, mais n’est plus fonctionnel. GLM obtient des points pour la préservation de l’état lors du chargement de la page.

    **Test 4 – Bug Loader Filter Bundle :** GLM échoue – ne modifie pas la bonne dépendance du loader. GPT résout correctement en ajustant le loader Tanstack Query. GPT : 10/10, GLM : 0/10.

    **Bonus – Timezone Picker (tâche créative) :** GLM fournit une UI polishée avec contrôles slider et détails d’interface réfléchis (par ex. boutons +1 pour ajuster les jours). Visuellement convaincant.

    **Conclusion :** GLM 5.2 démontre d’impressionnantes capacités de compréhension du langage et de conception (Test 2 est une victoire claire), mais échoue au débogage structuré et à la gestion d’erreurs. GPT-4.5 est un peu plus robuste pour la compréhension précise des erreurs de code, mais GLM est nettement plus rapide et supérieur pour les tâches génératives/créatives. L’auteur utilise régulièrement ses propres workflows (apex/use-goal) pour les tâches plus complexes afin d’obtenir de meilleurs résultats.

    **Outils :** GLM 5.2 (via plateforme Open Code), GPT-4.5, Fable mentionné ; développement en Next.js/Tanstack. Démo/comparaison.

  • Le GROS problème de l’IA : j’ai une nouvelle addiction
    16.6.2026, 11:00:33

    # Résumé

    Le créateur partage un problème personnel : il est devenu accro aux échecs sur chess.com – une réaction inconsciente à l’attente perpétuelle pendant que les agents IA génèrent son code. Alors qu’avant il était en « flow » et programmait étape par étape devant la caméra, il doit maintenant attendre des heures que les agents terminent les tâches. Pendant ces attentes, il scrolle X, joue aux échecs – et perd complètement sa concentration cognitive.

    Le problème central : l’IA est devenue tellement efficace qu’elle prend en charge son travail pendant qu’il reste passif à côté. Il lance plusieurs agents en parallèle (Agent 1, 2, 3, 4…), doit ensuite tous les vérifier et jongle constamment entre les projets – du multitâche plutôt que du travail en profondeur. Cette semaine, il a dépensé 4 324 dollars en frais API (847 dollars rien qu’aujourd’hui pour les tokens). Avec 341 parties d’échecs en 30 jours, il a passé environ 22–28 heures à peine à jouer.

    Il regrette le côté artisanal : réfléchir, résoudre les problèmes d’architecture, la satisfaction de programmer soi-même. Maintenant, il explique simplement aux agents GPT « fais la fonctionnalité XY » et attend. Ses vidéos YouTube durent officiellement 20 minutes, mais avec 40 minutes de temps de génération. Il multitâche entre les vidéos pour remplir le vide.

    Son conclusion : l’IA est devenue trop bonne. Son cerveau s’atrophie. Il n’a pas de solution et demande des conseils sur comment utiliser l’IA sans perdre sa capacité de réflexion.

    Sont mentionnés les agents IA (non spécifiés), les frais API (utilisation de ChatGPT/Claude), ainsi que des projets concrets comme une boilerplate mobile et l’app Paddle-Tali.

    **Format :** Opinion/réflexion – très personnel et ouvert sans réponse définitive.

n8n (1 nouvelle vidéo)

  • Mythos & Fable Can Weaponize Cyberattacks. This n8n System Fights Back
    16.6.2026, 22:22:35

    # Résumé : Workflows de cybersécurité pilotés par l’IA pour la réponse aux menaces automatisée

    La vidéo présente un deep-dive pratique dans un système n8n de réponse aux incidents de cybersécurité qui intègre des agents IA dans les Security Operations Centers (SOC). L’invité Raj, ingénieur Forward-Deployed, démontre un workflow qui combine trois stratégies parallèles d’analyse des menaces : l’interrogation d’incidents historiques dans une base de données vectorisée, la consultation de playbooks (guides des meilleures pratiques pour les types d’attaques courants) et les recherches externes de threat intelligence.

    Le workflow traite un ticket d’incident (par exemple, une attaque de phishing), l’associe via embeddings à des cas antérieurs similaires, extrait les étapes de résolution éprouvées et les complète avec l’intelligence actuelle. Un agent synthétiseur consolide les trois sources de données en un rapport structuré destiné à l’analyste de sécurité, incluant les mappages MITRE-ATT&CK (classification standardisée des techniques d’attaque), les indicateurs de compromission (IOCs) au format JSON et les prochaines étapes priorisées – certaines libérées pour l’automatisation, d’autres prévues pour une approbation manuelle. Le système est livré avec des données de test (15 incidents typiques, exemples de playbooks, 30 cas résolus), mais peut être alimenté avec des données d’entreprise réelles.

    Un thème central : la montée des attaques assistées par l’IA (mentionné : le modèle Mythos d’Anthropic a trouvé une faille zero-day vieille de 27 ans dans OpenBSD) exige une défense automatisée au même niveau. La discussion souligne que les systèmes IA ne sont aussi bons que leur base de données – des données propres, des processus établis et une structure de gouvernance sont des prérequis. Le workflow montre aussi comment les modèles spécialisés plus petits dans un bon framework/workflow surpassent les grands modèles de langage généraux avec des instructions vagues. En conclusion, les cas d’usage sont discutés comme la sécurité personnelle (protection contre les faux comptes de médias sociaux) et les implémentations de home lab, ainsi que la valeur des modèles s’exécutant localement pour les données de sécurité sensibles.

    Le repository sera publié sur GitHub avec une interface HTML pour tester ses propres données ; le pipeline d’ingestion utilise des inputs au format JSON et des bases de données vectorielles (Supabase mentionné).

    **Outils/fournisseurs d’IA mentionnés :** Anthropic (modèle Mythos), n8n (plateforme de workflow), Supabase (Vector-DB), Claude ; **Format :** Démo + Tutoriel ; compréhensible pour les professionnels de la sécurité et les passionnés d’automatisation, mais spécialisé dans le contexte Enterprise SecOps.

Nate Herk | AI Automation (6 nouvelles vidéos)

  • Finally. Agent Loops Clearly Explained.
    19.6.2026, 17:18:24

    # Résumé : Comprendre les Agent Loops

    La vidéo définit le **Loop Engineering** comme le remplacement des invites manuelles d’agent par une automatisation basée sur l’architecture système. Une boucle comporte trois composants : un déclencheur, une action et une condition d’arrêt, les deux piliers les plus importants étant l’**objectif** (définition objective des cibles) et la **vérification** (critère d’arrêt).

    L’idée centrale est que la sortie de l’IA s’améliore itérativement au lieu d’être acceptée à la première tentative. Au lieu qu’un humain fournisse des commentaires et des corrections, un agent devrait l’automatiser via un **cycle Reason-Act-Observe** : l’agent planifie, implémente, vérifie ses résultats et itère jusqu’à ce que les critères de fin soient satisfaits.

    La vidéo distingue trois types d’architecture de boucle : **Solo-Loop** (un agent avec étape de vérification), **Maker-Checker** (un agent exécute, un autre vérifie) et **Manager avec assistants** (système multi-agent orchestré). Les exemples pratiques montrent trois applications concrètes : conception de vignettes avec évaluation subjective (27 minutes), plans 3D avec vérification de rendu (37 minutes) et reconstruction de Abbey Road des Beatles avec vérification par capture d’écran et arrêt dur après 8 itérations.

    Ce qui est crucial pour les boucles fonctionnelles : des critères de fin clairs et aussi objectifs que possible, des outils de vérification adéquats, gestion de la mémoire, agents de vérification séparés, planification anticipée, journalisation et gestion des coûts. L’auteur avertit que les boucles avec des critères trop ouverts ou des objectifs impossibles peuvent tourner indéfiniment – ses boucles pratiques durent généralement 30 minutes à quelques heures, pas des jours.

    Une mise en garde importante : toute tâche ne bénéficie pas de l’automatisation d’agent 24/7. Le créateur vidéo utilise plutôt les boucles pour des exécutions nocturnes avec des délais connus ou des tâches déclenchées par des événements, et non pour des systèmes en cours d’exécution permanent. La technologie s’adaptera différemment selon les industries – le fait que d’autres comme Peter Steinberger aient multiplié leur productivité par 10 ne signifie pas que c’est immédiatement pertinent pour tous les rôles et cas d’usage.

    **Explicitement mentionné :** Claude et Claude Code (Anthropic) comme plateforme d’agent, Loop Library de Matthew Berman comme ressource. **Format :** Opinion/Réflexion avec démos pratiques.

  • GLM 5.2 in Claude Code is Blowing My Mind
    19.6.2026, 01:13:05

    # GLM 5.2 in Claude Code – Configuration et comparaison des performances

    L’utilisateur a testé GLM 5.2 (un modèle open source avec 753 milliards de paramètres) via une solution cloud dans Claude Code et montre à quel point il est rapide et bon marché de travailler avec – environ cinq fois moins cher qu’Opus 4.8.

    **Tests de performance :**
    – Conception de site web : GLM a besoin de 3:59 min, Opus 14:59 min (GLM plus rapide et moins cher, qualité similaire)
    – Évaluation des devoirs : Opus était plus précis (détecté les cas limites comme les doublons avec différents types de données), GLM bon mais imparfait
    – Invites de conception créative : GLM ~35 min vs. Opus ~11 min (très variable, dépend des exigences de raisonnement)
    – Storm Research Skill (orchestration multi-agent) : GLM a généré en 27 min un rapport HTML complet avec cinq perspectives différentes (académique, sceptique, pratique, économique, historique)

    **Conclusion clé :** GLM 5.2 est fort pour la conception et les tâches structurées sans raisonnement lourd, mais Opus reste supérieur pour les performances d’analyse profonde. La stratégie devrait être de choisir le bon modèle par tâche, pas un pour tout.

    **Configuration dans Claude Code :**
    On utilise Z.AI comme fournisseur d’hébergement, on s’inscrit, on récupère une clé API et on édite le fichier `settings.local.json` : l’URL de base Anthropic est redirigée vers l’API de Z.AI, la clé API est entrée, les modèles par défaut sont définis sur GLM 5.2. De cette façon, GLM fonctionne dans le harnais Claude Code comme un échange moteur.

    **Modèle de tarification :** Z.AI propose le paiement à l’utilisation ($1.40 entrée, $4.40 sortie) ou des abonnements (16/64/144 $/mois), avec des quotas de 5 heures et hebdomadaires similaires à Claude Max.

    **Pourquoi l’open source est pertinent :** Anthropic et OpenAI ne sont actuellement pas rentables ; des fonctionnalités comme Grok peuvent être supprimées à tout moment. Quiconque comprend les modèles open source et peut les déployer localement a plus de contrôle à long terme. GLM 5.2 surpasse dans de nombreux benchmarks (AGENTIC Coding, Frontier SWE) GPT-4.5 et Sonnet – l’écart de performance avec le closed source se ferme rapidement.

    Sujet : GLM 5.2 (modèle open source, hébergé sur Z.AI), Claude Code comme harnais, benchmarks et comparaison avec Opus 4.8 et autres modèles closed source — **Tutoriel/Deep-Dive avec configuration pratique**.

  • How to Build Effective Claude Code Agents in 2026
    18.6.2026, 17:26:17

    # Résumé

    Cole Medin et Nate discutent de la façon d’utiliser efficacement les agents de codage (spécifiquement Claude Code) au lieu de simplement faire du « coding au feeling ». Le message central : planifiez complètement, déléguez ensuite à l’agent, validez le résultat et améliorez continuellement le système en fonction des erreurs.

    **Concepts centraux :**

    **Planification avec contexte :** Les agents de codage ont besoin de spécifications Markdown détaillées avec objectif, critères de succès et stratégie de validation. À chaque conversation, la qualité d’attention diminue (la « zone bête ») – pour Opus à environ 250 000 tokens. La limite de millions de tokens crée une fausse sécurité ; il faut faire attention à quelles informations on fournit d’entrée et lesquelles l’agent récupère au besoin.

    **Validation/Vérification :** L’agent devrait pouvoir vérifier son propre travail – soit via des tests unitaires pour le code, l’automatisation du navigateur pour les sites web ou même le rendu PNG pour les diagrammes. Sans validation, la qualité est d’environ 65–70 % ; avec validation souvent 92 % au premier passage.

    **Évolution du système :** Chaque bug devient une amélioration permanente : nouvelles règles dans claude.md, meilleures Skills ou flux de travail modifiés empêchent le problème de se reproduire.

    **Harness Engineering et flux de travail multi-agent :** Pour les tâches plus importantes, plusieurs sessions d’agent sont nécessaires successivement (comme la boucle RAGL), pas un agent qui orchestre tout. Cole travaille sur Archon, un projet open source pour les flux de travail déterministes.

    **Sécurité :** Les invites seules ne sécurisent rien. Cole utilise des crochets pour le contrôle (par exemple, bloquer les suppressions de fichiers), mais avertit : les agents trouvent des contournements (par exemple, écrire un script au lieu de commande de suppression directe). L’hypothèse : tout ce que l’agent peut lire/toucher, il le fera.

    **Top 3 des fonctionnalités Claude Code selon Cole :** Hooks (pour la sécurité, la mémoire, les améliorations système), Sub-Agents (pour la recherche), Skills (élément central – invites réutilisables pour tout).

    **Conseils pratiques :**
    – Traitez Claude Code comme un chef de produit – fournissez du contexte pour le *pourquoi*, pas seulement le *comment*.
    – Utilisez la fonction slash-by-the-way pour les questions de compréhension, sans polluer le contexte.
    – Sub-Agents pour la recherche ; Team d’agents pour les débats/recherche de consensus (coûteux, mais utile).
    – Évitez Claude ouvert et Hermes pour les flux de travail complexes – construisez votre propre système pour un contrôle maximal.

    Cole souligne tout au long : les principes d’ingénierie logicielle (planification, test, versioning) se transfèrent 1:1 à l’automatisation non technique.

    **Format vidéo :** Podcast/Entrevue en direct ; Claude Code et Intent Engineering sont les concepts explicitement thématisés.

  • Learn These 6 AI Skills Now (Before AI Replaces You)
    15.6.2026, 12:46:09

    # Résumé : Six compétences en IA pour sécuriser votre carrière

    L’orateur présente six compétences qui aident à rester pertinent dans un monde du travail dominé par l’IA et à ne pas être menacé par la perte d’emploi.

    **Compétence 1 – Devenir la personne IA :** Il ne s’agit pas d’être expert en IA, mais d’être perçu comme la personne qui connaît l’IA – relativement à votre environnement. Cela se fait par l’expérimentation régulière avec des outils (par exemple Claude, Codex, Google VO3), de petites automations au travail et le partage de ces résultats avec des collègues. Les données d’IBM montrent que 85 % des PDG s’attendent à ce que tous les cadres fonctionnels deviennent des experts en technologie dans leurs domaines. Au lieu d’un changement de carrière, il faut rendre son métier existant plus efficace avec l’IA – un peu comme Excel est devenu indispensable pour les comptables.

    **Compétence 2 – Goût et jugement :** Avec de meilleurs modèles d’IA, la barrière à faire confiance aveuglément aux résultats diminue. C’est un piège. Il faut apprendre ce qu’est un bon travail et son son – par l’étude d’exemples dans votre domaine, par les commentaires à l’IA et la documentation des corrections. Puisque le travail porte votre nom, vous êtes entièrement responsable, que ce soit l’IA ou l’homme qui l’a produit.

    **Compétence 3 – Context Engineering :** Pas du Prompt Engineering, mais le Context est la compétence durable. Au lieu de travailler dans des chats vides, il faut nourrir les projets ou les Custom GPTs avec un vrai contexte – documents commerciaux, détails de produits, copies passées de succès et d’échecs. L’IA est comme un nouveau stagiaire : sans contexte elle devine ; avec contexte et vos informations spécifiques (IP, expertise), la sortie devient unique.

    **Compétence 4 – Vitesse d’itération :** Les itérateurs les plus rapides gagnent. Au lieu de viser la perfection, il faut rapidement construire la « version moche », la tester et l’affiner. Les raccourcis clavier et la saisie vocale accélèrent le processus. Parallèlement, il est important de prévenir l’expansion du périmètre en définissant avant la construction ce qui est « fait » – couplé à une métrique métier concrète (par exemple billets par jour, rendez-vous qualifiés par semaine).

    **Compétence 5 – Construire votre propre Jarvis :** Les automations devraient s’exécuter en arrière-plan et se déclencher indépendamment, pas seulement réagir à une action utilisateur. Pour cela, il faut distinguer : les tâches déterministes (par exemple poster chaque matin les données de revenus de Stripe dans Slack) ont besoin de simples flux de travail, pas d’agents IA. Les tâches complexes avec un input désordonnée et du raisonnement ont besoin d’agents IA. Le coup de l’élite est de reconnaître qu’on n’a pas toujours besoin de l’IA – et cela signale une vraie compréhension commerciale au lieu du simple battage médiatique.

    **Compétence 6 – Assurance chômage / Flux de revenus multiples :** Au lieu d’avoir une source de revenu, il faut construire plusieurs flux de revenu assistés par l’IA – emploi du jour plus 2-3 projets secondaires de la même passion/expertise, seulement dans des formats différents (par exemple carrière + cours + newsletter de niche + conseil). Le plus important : avoir un vrai North Star (passion) ; « Building in Public » (documenter, partager, être visible) est la méthode standard pratique pour être découvert.

    L’orateur souligne que les six compétences visent à ne pas être remplacé par des emplois ou des changements de carrière, mais à rester pertinent par l’adaptation continue.

    **Explicitement thématisé :** Claude, Codex, Google VO3 ; Glydo (outil de conversion voix en texte) ; référence à Andrej Karpathy et Anthropic. **Format :** Opinion/Réflexion avec conseils pratiques.

  • Every Level of a Claude Second Brain Explained
    17.6.2026, 20:52:45

    # Résumé : Les cinq niveaux d’un Second Brain IA

    Le créateur présente un modèle conceptuel pour construire un « Second Brain IA » personnel – un système de stockage et de récupération d’informations qui travaille en tandem avec des modèles IA. La thèse centrale : le système devrait être conçu à rebours, basé sur la façon dont on utilisera les données à l’avenir.

    **Les cinq niveaux :**

    **Niveau 1** fonctionne avec correspondance exacte de mots. La base est un fichier `claude.mmd` comme routeur, qui instruit le modèle IA sur l’endroit où chercher des informations. Structure simple de dossiers et fichiers, routage manuel.

    **Niveau 2** étend le Niveau 1 avec Wikis (comme une wiki LLM basée sur Carpathy) et fichiers de mémoire automatique. Ici, les premières relations entre documents se forment via des backlinks. Le créateur utilise principalement ce niveau lui-même, car il répond à ses besoins.

    **Niveau 3** introduit la recherche sémantique (par exemple via Obsidian, Pine Cone, Supabase). Au lieu de chercher des mots-clés exacts, on cherche des significations. Les bases de données vectorielles découpent les documents et les incorporent dans un espace de sens. Avertissement : les bases de données vectorielles ne sont pas une panacée – pour les questions qui nécessitent le contexte complet, les fichiers Markdown sont souvent plus précis.

    **Niveau 4** intègre Knowledge Graphs et Relationship Graphs (par exemple LightRAG). Ceux-ci ne montrent pas seulement que les fichiers sont liés, mais comment les entités sont liées les unes aux autres : « Jordan travaille chez Acme », « Acme est supportée par PostPilot ». Le créateur n’utilise pas cela au quotidien, car les Wikis avec ingestion soignée suffisent pour ses objectifs.

    **Niveau 5** est un Brain-OS « toujours actif » (par exemple GBrain avec GStack). Le système synchronise et met à jour continuellement les mémoires et les données de manière autonome. Le créateur n’utilise pas cela actuellement, car le contrôle sur l’ingestion et la distinction entre contexte persistant (valeur durable) et connexion temporaire (Slack, e-mails) lui sont plus importants.

    **Principes importants :** Un projet ne doit pas être uniformément au même niveau – différents dossiers peuvent combiner différentes approches. La douleur est la mesure : changer seulement si le système actuel cause un vrai problème. La confidentialité est pertinente : les données traitées par Claude vont à Anthropic ; pour les données sensibles des clients, les modèles open source peuvent être nécessaires. Les données persistantes (précieuses pendant des années) vont dans le Second Brain ; les données volatiles devraient être accessibles, mais rester externes. Un système fonctionnant répond à la question : comprend-il où vivent mes données et peut-il donner des réponses précises ?

    Le créateur souligne qu’il n’y a pas de structure « meilleure » prouvée – seulement ce qui a du sens pour son contexte propre et fait fonctionner le routage correctement.

    **Outils/Modèles :** Claude (Claude Code), Hermes Agent, CodeX, Obsidian, LightRAG, GBrain, GStack, Anthropic, Pine Cone, Supabase — **Format :** Deep-Dive/Tutoriel

  • We Might Actually Need to Stop AI
    16.6.2026, 13:15:42

    # Résumé

    Le créateur analyse un phénomène paradoxal : les deux principaux laboratoires d’IA OpenAI et Anthropic, qui profiteraient le plus d’un développement rapide, appellent publiquement à ralentir le développement de l’IA. OpenAI a publié un plan « Built to Benefit Everyone » (visant AGI en mars 2028) qui plaide pour un groupe de contrôle international qui peut ralentir le développement frontier si nécessaire. Quelques jours plus tôt, Anthropic a lancé un appel similaire pour un moyen vérifiable de pause le développement de l’IA.

    Le créateur identifie le dilemme central : les deux entreprises disent essentiellement « nous ne pouvons pas arrêter seuls, parce que la pression concurrentielle est trop forte – nous avons besoin que quelqu’un d’autre nous force, nous (et tous les autres) à arrêter ensemble ». Ce n’est pas la même chose que de ralentir volontairement. Ils demandent un arbitre externe, pas l’autolimitation.

    La question pratique de savoir si un tel système global de vérification pourrait fonctionner est analysée : théoriquement, l’infrastructure physique (consommation électrique massive, puces spécialisées des chaînes d’approvisionnement limitées) et le goulot d’étranglement des puces pourraient être surveillés – comme le contrôle nucléaire. Le vrai problème est cependant le système d’incitations : tant qu’un pays ou une entreprise peut gagner en cassant le contrat, un accord global ne tiendra pas.

    Le créateur critique aussi l’écart de communication entre les développeurs d’IA (qui comprennent le potentiel) et le grand public (qui voit souvent l’IA comme une menace). Il voit la solution dans le fait que les utilisateurs eux-mêmes développent une compétence en IA, au lieu d’attendre des solutions d’entreprise ou gouvernementales – pas parce que c’est garanti d’aider, mais parce que c’est ce que les individus peuvent contrôler. Il termine en recommandant simplement de compléter les flux de travail existants (e-mails, rédaction de rapports) avec des outils IA et d’encourager d’autres à faire de même.

    Mention aussi : le gouvernement américain a récemment forcé Anthropic à interrompre Claude MyAI et Claude Fable – un signe que la régulation publique commence aussi à intervenir, même si pas dans le sens du contrat global demandé par OpenAI/Anthropic.

    **Format : Opinion/Réflexion ; explicitement thématisé : OpenAI, Anthropic, Claude et ChatGPT.**

NeuralNine (3 nouvelles vidéos)

  • Professional PDF Reports with Matplotlib in Python
    19.6.2026, 16:00:09

    # Tutoriel : Créer des rapports PDF avec Matplotlib

    La vidéo montre comment créer des rapports PDF professionnels avec Matplotlib – par exemple pour des rapports financiers, médicaux ou d’analyse de données.

    **Bases et configuration :**
    Il suffit de Matplotlib (installation via `pip install matplotlib`) et optionnellement Pandas pour les données d’exemple. Le concept clé est simple : on utilise la classe backend PDF `PDFPages` de `matplotlib.backends.backend_pdf`, on l’enveloppe autour de ses figures Matplotlib et on les enregistre – tout le reste est du Matplotlib standard.

    **Mise en œuvre pratique :**
    On importe `PDFPages`, puis on ouvre un gestionnaire de contexte `with PDFPages(‘report.pdf’) as pdf:`, on crée des figures avec `plt.figure()`, on les met en forme normalement (titre, graphiques, etc.) et on les enregistre avec `pdf.savefig(figure)` et `plt.close()`. C’est tout – figure par figure, un PDF multi-pages est généré.

    **Exemple dans la vidéo :**
    Le formateur montre un exemple de rapport avec un tableau de données et quatre sous-graphiques (Ventes, Coûts, Profit, Ventes vs. Coûts) sur la première page, utilisant `GridSpec` pour le contrôle de la mise en page. Une deuxième page est ajoutée simplement en répétant le processus – nouvelle figure, nouveaux graphiques, enregistrement. À la fin, un exemple généré par IA est présenté, montrant ce qui est possible sur le plan du design (Résumé exécutif, KPIs, Heatmaps, différents types de graphiques) – mais là aussi, tout revient au même pattern `figure.add_subplot()`, `pdf.savefig()`, `plt.close()`.

    **Conclusion :** Avec GridSpec pour les mises en page, le style Matplotlib standard et le wrapper PDFPages, il est possible de générer des rapports attrayants et multi-pages avec très peu d’étapes supplémentaires.

    **Outils/fournisseurs :** Matplotlib (pas un outil IA, bibliothèque Python native) ; Format : **Tutoriel**.

  • This Skill Turns Your Agents Into Neckbeards…
    15.6.2026, 16:00:11

    # Résumé : Claude Code Skill « Ponytail »

    La vidéo présente le Claude Code Skill « Ponytail » – un outil qui ordonne aux agents de codage de travailler de manière concise et minimaliste, au lieu de donner des réponses longues et verbeux. Le skill tire son nom d’un archétype de mème : quelqu’un qui résout des problèmes complexes en une ligne.

    **Cas d’usage et motivation :** L’auteur aime utiliser les agents de codage pour apprendre – par exemple pour obtenir rapidement des exemples pour de nouveaux frameworks comme LangGraph. Sans le skill, les agents créent inutilement de longs docstrings, du code conforme aux bonnes pratiques et de longues explications, alors que souvent seul un exemple minimal et fonctionnel est désiré.

    **Installation :** Le skill s’installe en téléchargeant le référentiel, en extrayant le dossier `skills` et en le plaçant dans le répertoire `.claude` d’un projet.

    **Comparaisons en direct :**
    1. **Exemple LangGraph :** Avec le skill, vous obtenez immédiatement du code concis avec State, Nodes, Edges et Conditional Edges – compréhensible pour les débutants. Sans le skill, un exemple gonflé suit avec configuration UV, longues explications et descriptions verbeux des fonctionnalités.
    2. **Visualisation de Mandelbrot :** Avec le skill : script court et fonctionnel sans docstrings, prêt à l’emploi immédiatement. Sans le skill : structures de fonction complètes, colormaps, blocs if-name-main et longues explications sur l’efficacité et la conception.

    **Conseil d’activation :** Le skill n’est pas toujours chargé automatiquement ; parfois, il faut interrompre l’agent et lui demander explicitement de l’utiliser.

    La vidéo démontre clairement : Avec Ponytail, vous obtenez des solutions concises et sans détours ; sans lui, tout devient inutilement verbeux et distrayant.

    Démonstration avec Claude Code et le Ponytail Skill pour Claude d’Anthropic — Avis/Réflexion avec comparaisons pratiques.

  • Webhooks & Callbacks For Beginners in Python
    17.6.2026, 16:00:16

    # Webhooks et Callbacks – Explication adaptée aux débutants

    La vidéo explique la différence fondamentale entre le polling et les webhooks/callbacks dans le contexte de la programmation asynchrone.

    **Concept clé – Le problème avec le polling :**
    La solution naïve pour les tâches asynchrones est le polling : on demande répétitivement à un serveur « La tâche est-elle terminée ? » C’est inefficace et gaspille des ressources, surtout avec de nombreux utilisateurs simultanés.

    **La solution – Webhooks/Callbacks :**
    Au lieu de demander soi-même, on fournit à un service externe (par exemple un prestataire de paiement) une URL de callback. Le service exécute la tâche et appelle ensuite lui-même cette URL pour signaler le résultat. C’est le principe « Rappelle-moi » : on n’a pas besoin de demander activement, on est notifié.

    **Mise en œuvre pratique :**
    Dans le tutoriel, un système complet est construit avec Python/Flask :

    1. **Serveur** (simulation du prestataire de paiement) : Reçoit des tâches avec deux nombres et une URL de callback. Divise les nombres, attend un délai aléatoire (5-15 secondes) et envoie ensuite le résultat via POST à l’URL de callback.

    2. **Client** (application) : A deux possibilités :
    – **Avec polling** : Envoie une tâche et doit ensuite interroger répétitivement le statut (2 secondes par requête – très fastidieux).
    – **Avec webhook** : Envoie une tâche avec une URL de callback. Le serveur l’appelle plus tard, sans que le client ait besoin de demander activement.

    **Démo en direct :**
    Avec le polling : L’utilisateur doit recharger plusieurs fois et attendre 2 secondes à chaque fois que le statut se met à jour. Avec les webhooks : L’utilisateur peut charger la page sans attendre – le serveur informe automatiquement le client quand il a terminé.

    La vidéo était une démonstration de **Tutoriel** avec mise en œuvre pratique en Flask (aucun outil IA spécifique mentionné).

Nic Conley

Aucune nouvelle vidéo pendant cette période.

Nick Saraev (1 nouvelle vidéo)

  • GLM-5.2 is Basically Opus (For 1/5 the Price)
    19.6.2026, 21:46:27

    # Résumé

    La vidéo compare GLM 5.2 avec Opus 4.8 à travers sept démos pratiques (scènes 3D, explainers interactifs, tableaux de bord, landing pages, minijeux) plutôt que des benchmarks. GLM 5.2 produit systématiquement des outputs de meilleure qualité – la spirale nébuleuse est plus nette, les vidéos explicatives interactives ont une meilleure typographie et esthétique, les terrains low-poly sont plus stylisés. Pour les jeux, GLM montre parfois des faiblesses au niveau de la mécanique de jeu (le Tower-Stacker fonctionne trop vite).

    Ensuite est démontré comment utiliser GLM 5.2 en pratique : via Open Router avec Cloud Code, on peut générer une API Key en quelques minutes et la coller directement dans l’interface Claude par screenshot, après quoi GLM s’exécute comme modèle. La même approche fonctionne aussi avec Open Code et Crush-Harness, bien que l’auteur préfère Cloud Code. Optionnellement, on peut intégrer la recherche web via Exa AI.

    Concernant les coûts, il y a quatre solutions : Z.AI directement (avec des plans d’abonnement jusqu’à $80/mois), Open Router (paiement à la consommation avec routage automatisé), des fournisseurs spécialisés comme Fireworks ou Deep Infra, ou un auto-hébergement local d’une version quantifiée en 2-bit sur des Macs avec 256 GB RAM/VRAM, qui conserve 82% de précision et que personne ne peut t’enlever.

    Conclusion : GLM 5.2 a actuellement plus de « goût » (style multiplier) qu’Opus 4.8, coûte moins cher et devrait être essayé comme Daily Driver.

    **Format : Demo/Tutorial | Modèles mentionnés : Claude Opus 4.8, GLM 5.2 via Open Router, Exa AI pour recherche web | Harnesses : Cloud Code, Open Code, Crush**

Niklas Steenfatt (1 nouvelle vidéo)

  • WIR LEBEN IN EINER SIMULATION
    19.6.2026, 10:30:29

    # Résumé : Odysseus – Le projet d’IA open source de PewDiePie

    PewDiePie a développé par surprise un projet d’IA open source appelé Odysseus, qui fonctionne comme ChatGPT, mais de manière gratuite et avec contrôle total sur ses propres données. Le projet est devenu viral instantanément avec 65 000 étoiles. Odysseus offre une interface de chat avec téléchargement de documents, deux modes (Agent et chat pur), ainsi que des outils comme calendrier, édition d’images et intégration e-mail – le tout 100 % gratuit et basé sur des modèles de langage open source.

    La motivation de PewDiePie était que l’IA ne devient vraiment utile que lorsqu’on partage beaucoup de données personnelles et que l’IA vous connaît bien, ce qui signifie que ces données finissent chez les grands géants de la technologie. Avec Odysseus, il voulait empêcher cela.

    **Installation et utilisation pratique :** Bien que l’installation locale sur son propre ordinateur soit possible, le créateur recommande d’installer Odysseus sur un serveur en ligne (par exemple chez Hostinger) – il s’y exécute en continu et est accessible de partout. Le modèle de langage ne s’exécute pas sur le serveur, mais est connecté via Ollama Cloud, ce qui offre un bon équilibre entre protection des données et facilité d’utilisation : Hostinger ne loue que l’infrastructure (CPU/GPU), n’entraîne pas de modèles d’IA et gagne grâce aux abonnements.

    **Fonctionnalités en test :**
    – **Deep Research :** Effectue des recherches plus détaillées que le chat normal, a écrit dans le test un article approfondi sur le phénomène « Odysseus » (film + projet) que le chat normal n’a pas pu reconnaître.
    – **Compare :** Compare plusieurs modèles (par exemple Deepseek, Kimi, Jamba) côte à côte sur la même tâche – optionnellement en test en aveugle.
    – **Édition d’images :** Outil d’édition d’images intégré similaire à Photoshop (calques, suppression de fond), par exemple pour les vignettes YouTube.
    – **Modes Agent :** Automatisation pour la rédaction d’e-mails, la création de documents.

    **Signification pour l’ère de l’IA :** Le projet montre deux mouvements opposés – quelques grandes entreprises (OpenAI, Anthropic, Google) dominent d’un côté, mais en même temps la communauté open source décentralisée se renforce massivement. Chacun peut maintenant développer rapidement ses propres projets logiciels avec l’IA. Comme les percées commerciales reviennent rapidement à l’open source et que les outils d’IA s’améliorent mutuellement, la frontière entre propriétaire et ouvert s’estompe.

    **Compromis :** Une exécution locale complète avec une confidentialité maximale nécessite du matériel très cher (par exemple Mac Studio). La configuration présentée ici (Hostinger + Ollama Cloud) est un juste milieu pratique : les données ne restent pas chez Google/OpenAI, mais on conserve quand même la commodité et l’accès aux modèles open source puissants.

    L’open source chez Hostinger et le soutien de tels projets sont importants comme contrepoids aux géants de la Silicon Valley – « une marée montante soulève tous les bateaux ».

    **Format & contexte :** Démonstration avec des éléments d’opinion et de réflexion ; les modèles open source (Deepseek, Kimi, Jamba, Ollama Cloud) ont été explicitement abordés, Claude/ChatGPT à titre de comparaison, Perplexity, ainsi que les fournisseurs d’infrastructure Hostinger et Ollama. Le créateur souligne le rôle des outils open source et du self-hosting dans l’ère de l’IA à venir.

No Priors: AI, Machine Learning, Tech, & Startups (1 nouvelle vidéo)

  • Re-engineering the Semiconductor Supply Chain with Intel CEO Lip Bu Tan
    18.6.2026, 10:00:05

    # Résumé

    L’invité du podcast est Lehu Tan, PDG d’Intel et ancien PDG de Cadence. Il discute de sa stratégie pour transformer Intel sur plusieurs thèmes :

    **Modèle commercial et culture :** Tan souligne que dans neuf de ses dix investissements, les entreprises ont dû adapter leur plan commercial, c’est pourquoi il préfère les équipes entrepreneuriales aux individus. Il a mis en place une stratégie en trois phases pour Intel : « crawl, walk, run » – d’abord écouter humblement les clients, puis renforcer le bilan et simplifier les produits, enfin conquérir la part de marché.

    **Financement et soutien :** Le gouvernement américain a acquis une part importante d’Intel via des programmes gouvernementaux, ce que Tan justifie par l’exemple de Taïwan (TSMC avec soutien gouvernemental). Jensen Huang a investi cinq milliards de dollars dans Intel ; cette participation est passée à 25 milliards entre-temps.

    **Secteurs d’activité :** L’accent de Tan porte sur trois piliers – les produits (CPU pour les centres de données et l’IA), les services de fonderie et l’empaquetage avancé. Il supervise directement tous les rapports d’ingénierie pour assurer la responsabilité. Dans le secteur de la fonderie, Intel collabore étroitement avec Elon Musk sur Terra Fab pour renforcer les infrastructures de semi-conducteurs américaines.

    **IA et nouvelles technologies :** Selon Tan, l’IA générative et les CPU d’inférence sont en très forte demande. Il investit dans de nouveaux matériaux (nitrure de gallium, carbure de silicium, nitrure d’indium, diamant) et l’empaquetage avancé (verre, diamants synthétiques) comme solutions aux limites physiques de la miniaturisation.

    **Philosophie d’investissement en capital-risque :** Avec plus de 150 IPO et 126 transactions de fusions-acquisitions parmi ses investissements, Tan recherche les goulots d’étranglement dans l’industrie (par exemple, problèmes de connexion, signaux optiques) et les startups en phase de démarrage avec des équipes fortes et des clients initiaux. Il préfère les cohortes plus anciennes de 40 à 50+ ans qui comprennent la gestion d’équipe, associées à de nouveaux talents technologiques dans la trentaine.

    **Perspective mondiale :** Bien que l’IA promette d’importants gains d’efficacité, Tan voit l’énergie, la mémoire et la fabrication comme les principaux goulots. Il souligne que toutes les entreprises ne profiteront pas – seules quelques-unes avec des niches ciblées et des solutions de pile complète deviendront de grands gagnants.

    **Vision sur 10 ans :** Tan croit que les gagnants de 2032-2034 seront ceux qui peuvent se concentrer sur une niche, trouver les bons partenaires et s’adapter à l’échelle. Intel lui-même vise à devenir compétitif grâce aux architectures de produits, GPU, CPU et logiciels pour l’IA physique ainsi que l’IA générative. Son objectif : 10x de rendement pour les actionnaires sur 5-10 ans.

    Analyse approfondie et avis avec éléments de mise à jour d’actualité ; principalement aucun outil IA spécifique mentionné, mais plutôt les tendances générales de l’IA/IA générative chez Intel et dans l’industrie au centre.

Productive Dude

Aucune nouvelle vidéo au cours de cette période.

Sebastien Dubois

Aucune nouvelle vidéo pendant cette période.

Tech With Tim (4 nouvelles vidéos)

  • I Gave Codex a 24/7 Server. Now It Codes While I Sleep.
    19.6.2026, 15:56:57

    # Résumé

    La vidéo montre comment configurer Codeex CLI sur un serveur privé virtuel (VPS) pour exécuter des tâches d’agent de code longue durée 24h/24 et 7j/7 dans le cloud, sans avoir besoin de garder son propre ordinateur portable allumé en permanence.

    **Problème principal:** Les programmeurs doivent souvent se déplacer avec leur écran d’ordinateur portable semi-ouvert tandis que des agents locaux (comme Codeex ou Claude) fonctionnent. Cela s’avère peu pratique lors de déplacements, avec une mauvaise connexion Internet ou lorsque les tâches prennent des heures.

    **Solution:** Un VPS offre une disponibilité constante, l’hébergement sécurisé des données et une vitesse plus rapide qu’Internet local. Le flux de travail sépare le travail local à court terme des tâches déléguées à long terme.

    **Étapes de configuration dans la vidéo:**
    1. **Déployer un VPS** – Avec Hostinger (plan KVM 2 recommandé), sélectionner Codex comme déploiement en un clic
    2. **Se connecter via SSH** – Accéder au serveur avec les identifiants root
    3. **Installer Codeex CLI** – Si non déjà déployé, installer via commande curl et s’authentifier avec code d’appareil
    4. **Connecter GitHub** – Créer un jeton d’accès personnel granulaire sur GitHub (avec permissions admin, contenus et demandes de fusion), puis exécuter `gh auth login` sur le VPS
    5. **Installer tmux** – Activer les shells persistantes pour que les processus continuent à s’exécuter même si la connexion SSH est interrompue
    6. **Contrôler depuis smartphone** – Utiliser un client SSH (par ex. application Terminus) pour se connecter au VPS depuis un téléphone et utiliser `tmux attach`
    7. **Automatisations via tâches cron** – Combiner Codeex CLI avec des tâches `cron` pour planifier des tâches récurrentes quotidiennes (par ex. révisions PR, audits de code)

    **Flux de travail pratique:** On peut déclencher une tâche de n’importe où (téléphone, ordinateur portable), se déconnecter, et la tâche continue à s’exécuter en arrière-plan. Reconnexion ultérieure: la progression est conservée, un travail supplémentaire est possible.

    **Exemple d’automation:** Révisions de demandes de fusion automatisées quotidiennes avec rapport Markdown téléchargé vers le repo.

    Codeex CLI (moins cher avec abonnement ChatGPT que les clés API), GitHub, tmux et VPS Hostinger sont les outils utilisés; format tutoriel avec composantes de démonstration en direct.

  • AI Research Papers Are Here (And They’re Scary Good)
    18.6.2026, 13:50:05

    # Résumé: Lemma – Système de recherche assisté par IA

    La vidéo présente Lemma, une plateforme pour la recherche scientifique automatisée qui applique le concept du “Vibe Coding” à la recherche. Au lieu de planifier et de conduire soi-même des expériences, on formule une question de recherche et un système multi-agent d’agents IA prend en charge l’ensemble du processus: recherche bibliographique, développement d’hypothèses, exécution de code, entraînement de modèles et création d’un document de recherche académique complet avec graphiques et statistiques.

    Le système propose quatre modes: **Explore** (rapports simples en 1-3 minutes), **Survey** (articles de synthèse académiques), **Code** (expériences de code automatisées) et **SARS** (projets de recherche entièrement automatisés avec durée d’exécution plus longue). L’utilisateur démontre des exemples concrets: Une tâche Code a entraîné un classificateur d’images pour distinguer les images générées par IA des images réelles (durée d’exécution d’environ 2-3 heures). Une tâche SARS a examiné si les expressions explicites d’incertitude dans les invites réduisent les hallucinations chez les LLM – l’expérience a duré 1-2 jours, a utilisé deux modèles différents et a produit un document de recherche de 9 pages avec méthodologie, résultats, graphiques et conclusions. Le résultat a montré une réduction des réponses fausses de 18-51% grâce au “Binary Abstention”-prompting, mais a également révélé des limitations pour les questions intensives en connaissances.

    La plateforme était encore en bêta au moment de la vidéo, est gratuite pour les petites tâches, mais nécessite des crédits pour les expériences plus longues. L’aspect particulier: Lemma est une “entreprise IA-pour-IA” – elle utilise l’IA pour améliorer l’IA elle-même, le système ayant été en partie entraîné avec ses propres résultats.

    **Explicitement mentionné:** Lemma (Analum AI), Gwen 2.5 72B, GPT-4o — vidéo de démo/showcase.

  • Do THIS Instead of watching endless AI Engineer Roadmaps (DataCamp Review)
    15.6.2026, 13:00:10

    # Résumé: Feuille de route AI Engineering sur DataCamp

    L’orateur présente un parcours d’apprentissage testé pour devenir AI Engineer sur DataCamp et souligne que l’ingénierie IA moderne concerne moins les modèles mathématiques ou les connaissances statistiques, mais plutôt l’application pratique de technologies déjà existantes – à savoir les modèles pré-entraînés, les LLM et la Retrieval Augmented Generation (RAG) – pour créer une réelle valeur commerciale. Le cours n’est pas conçu pour les débutants absolus, il suppose des connaissances de base en Python.

    La feuille de route se compose de neuf cours avec trois projets et une durée estimée de 26 heures. Elle couvre les sujets suivants: (1) **Working with the OpenAI API** — requêtes d’API, sélection de modèles, différents types de messages; (2) **Prompt Engineering with OpenAI** — prompting One-Shot et Multi-Shot, sorties structurées; (3) **Premier projet** — conversations multi-tours avec suivi des tokens; (4) **Working with Hugging Face** — utiliser des modèles open-source pour la classification de texte et d’images dans des pipelines; (5) **LM Ops** — fondamentaux conceptuels de la sélection de modèles et des considérations de déploiement (sans détails techniques approfondis); (6) **Developing AI Systems with OpenAI API** — combiner des applications plus complexes; (7) **Embeddings & Vector Databases** — RAG, modèles d’embedding, ChromaDB et Pinecone; (8) **Software Engineering Principles in Python** et (9) **Developing LLM Applications with LangChain** — AI Agents et Tool Calling.

    Le format d’apprentissage est interactif: de courtes vidéos (3-5 minutes) alternent immédiatement avec des exercices de codage où environ 80% du temps est passé dans un environnement de programmation basé sur le cloud. L’orateur loue cette approche comme étant efficace pour la rétention des connaissances.

    Points critiques: Le matériel d’introduction est relativement lent et répétitif, la section LM Ops trop conceptuelle sans exemples de déploiement pratique, et le saut de difficulté est notable (facile au début, considérablement plus difficile aux embeddings). De plus, l’orateur souhaiterait un projet d’intégration final. Points positifs: Même en tant qu’ingénieur expérimenté, l’orateur a encore appris de nouvelles choses; la progression globale est bonne; la structure d’apprentissage est cohérente sur tous les modules. Le certificat est disponible.

    Prix: À partir de 13 dollars par mois avec une réduction de 25% possible via un lien; un format d’entrée gratuit existe.

    **Conclusion:** Une solide introduction pour les développeurs Python (pas pour les débutants) qui couvre environ la moitié de ce qui est nécessaire pour un emploi, mais un excellent tremplin pour approfondir – démo et avis sur l’intégration OpenAI/Hugging Face de DataCamp.

  • Build 3 PRODUCTION AI Agents in Python – Full Course (Agentspan)
    17.6.2026, 13:00:03

    # Production AI Agents en Python – Cours complet

    La vidéo guide la construction de trois AI Agents prêts pour la production avec le framework open-source AgentSpan.

    ## Les trois agents:

    **Agent 1 – Agent conversationnel:** Un chatbot simple avec mémoire (ConversationMemory) et outils pour récupérer l’heure actuelle. Illustre les principes fondamentaux: fonctions comme outils avec docstrings que le LLM peut appeler, ainsi que l’ajout automatique de messages utilisateur et assistant à la mémoire.

    **Agent 2 – Agent RAG/Support:** Agent plus complexe avec plusieurs outils (recherche de base de connaissances, recherche de commandes), sortie structurée via objets Pydantic, Guardrails (validation d’entrée contre les injections de prompts), et Human-in-the-Loop: Un outil nécessite `approval_required=True`, ce qui fait que l’agent attend que l’utilisateur approuve manuellement le remboursement.

    **Agent 3 – Orchestration Multi-Agent:** Plusieurs agents spécialisés (Chercheur, Rédacteur, Éditeur, Analystes Marché/Risque/Financier) avec différentes stratégies d’exécution – séquentielle (l’un après l’autre), parallèle (simultanément) ou imbriquée (équipe d’analyse en parallèle, puis pipeline séquentielle).

    ## Fonctionnalités production centrales d’AgentSpan:

    – **Durabilité/Récupération après crash:** Tous les états stockés sur le serveur; les workers peuvent se reconnecter après un crash et continuer à partir de la même étape d’exécution.
    – **Human-in-the-Loop:** Les approbations peuvent être demandées; l’agent attend indéfiniment que l’humain approuve/rejette.
    – **Observabilité:** Le tableau de bord web affiche toutes les exécutions, appels d’outils, tokens, durée, journaux complets en temps réel.
    – **Guardrails:** Validation d’entrée/sortie avant/après LLM (fonctions personnalisées, regex, basée sur LLM).
    – **Outils:** Fonctions Python personnalisées avec docstrings comme outils descriptibles, ou outils API/HTTP.
    – **Sortie structurée:** Les modèles Pydantic garantissent un format de sortie déterministe.
    – **Mémoire:** Stocker automatiquement ou manuellement l’historique des conversations.
    – **Tests:** Événements fictifs pour tester les agents sans appels LLM.

    ## Architecture:

    Serveur (exécution durable, État, Queue, Retry) + Worker (code personnel, exécution) + LLM (OpenAI/Anthropic/etc.). Le serveur fonctionne localement (SQLite) ou est déployé (PostgreSQL + Docker Compose avec authentification).

    Le cours écrit du code réel et fonctionnel – toutes les dépendances (AgentSpan, Python, UV comme gestionnaire de packages, optionnellement FireCrawl pour le web scraping).

    **AgentSpan (Framework), démo/tutoriel avec codage pratique.**

TheAIGRID (6 nouvelles vidéos)

  • Google Flow Tools Tutorial – How To Use Google Flow Tools
    20.6.2026, 18:00:02

    # Google Flow Tools – Aperçu guidé

    Google Flow Tools est une fonctionnalité de Google qui permet de créer des outils créatifs en langage naturel (Plain English) pour automatiser les tâches récurrentes et repousser les limites créatives.

    **Gratuit vs. Payant :**
    Tous les outils prédéfinis (pour les images, vidéos, code, prompting) peuvent être utilisés gratuitement. Seule la création d’outils personnalisés est limitée aux abonnements Pro/Ultra.

    **Explorer les outils existants :**
    La bibliothèque est divisée en catégories : outils d’image (par ex. « Simple Sketch » – transformer les croquis en images réalistes), outils vidéo (éditer les vidéos, ajouter des filtres), outils de prompting (organiser et améliorer les prompts) et outils expérimentaux (par ex. « Depth Warp 4D » pour les effets vidéo 4D).

    **Remixer des outils :**
    Si un outil existant est presque parfait, on peut le remixer via un menu déroulant. Dans l’éditeur, l’outil peut être ajusté via des instructions en langage naturel – sans avoir besoin d’écrire du code. Exemple : « Make it so it has a video creation button » ajoute un bouton vidéo à l’outil Sketch existant.

    **Créer vos propres outils :**
    Le bouton « Create Tool » permet de définir un nouvel outil. L’entrée doit être aussi simple que possible ; le code Agentic de Google décompose la demande en logique complexe en arrière-plan. Exemple : un outil qui génère plusieurs angles de caméra d’une scène (menu déroulant pour le style d’image, puis générateur multi-shots). Si l’outil ne fonctionne pas, on peut adapter la structure du prompt et le modèle d’image (par ex. ajouter différents modèles Google comme Nano Banana Pro ou VO3.1 Flash) ou utiliser le bouton Éditer. Il y a un quota quotidien pour les nouveaux outils.

    **Gestion des outils et partage :**
    Les outils terminés se retrouvent dans « My Tools », peuvent être nommés, dotés d’icônes personnalisées et partagés – avec le lien, les autres utilisateurs ont accès, peuvent remixer l’outil et le partager à nouveau.

    **Idée centrale :**
    La seule limite est l’imagination ; l’objectif est d’automatiser et d’accélérer les workflows répétitifs.

    **Google Flow Tools (avec ses propres modèles propriétaires), tutoriel de démonstration.**

  • The First Real LLM Breakthrough Is Here… SubQ (1000x Less Compute)
    18.6.2026, 18:00:26

    # SubQ : L’attention sparse sub-quadratique en détail

    SubQ est une percée en modèles de langage avec une fenêtre contextuelle de 12 millions de tokens, basée sur une architecture d’attention sparse entièrement sub-quadratique (SSA). Le problème central : les Transformers traditionnels utilisent une attention dense, où chaque mot regarde chaque autre mot, ce qui entraîne une mise à l’échelle quadratique – les coûts de calcul quadruplent quand on double la longueur du texte. SubQ résout cela en faisant apprendre à SSA de sélectionner pour chaque mot seulement un petit groupe d’autres mots pertinents et d’appliquer le calcul d’attention complet sur ceux-ci. Contrairement aux raccourcis basés sur la position (Longformer, Big Bird), SSA fonctionne sur la base du contenu – un mot peut récupérer les détails à partir de millions de tokens loin, si le sens est approprié.

    Les gains d’efficacité sont considérables : avec 1 million de tokens, l’attention dense nécessite environ 252 PFLOPS par couche d’attention, SSA seulement environ 4 PFLOPS – une réduction 64,5 fois supérieure. SubQ est 56 fois plus rapide que Flash Attention 2 à cette échelle. Dans le test Needle-in-the-Haystack, il atteint 100% de précision jusqu’à 2 millions de tokens et 98% avec 12 millions de tokens (bien qu’entraîné principalement sur 1 million) en n’utilisant que environ 0,13% de toutes les relations possibles.

    Sur les benchmarks standards : SubQ 1.1 small obtient 85,4% en science au niveau des études supérieures (GPQA diamond) (contre 93,2% pour GPT-4.5 et 92% pour Opus 4.8), 89,7% en programmation compétitive (Live Code Bench) (GPT-4.5 : 92%). Le modèle n’a pas été entraîné de zéro, mais a pris un modèle frontier existant open-weight, remplacé son attention dense par SSA puis entraîné progressivement sur des contextes plus longs (262K → 512K → 1M → 2M) plus environ 1 milliard de tokens de données naturellement longues (livres, documents complets, dépôts de code).

    Les cas d’usage se situent dans les domaines où les pipelines de retrieval sont actuellement nécessaires : analyse de base de code, documents financiers, travail contractuel – tout traitable en une seule fois au lieu de fragmenté. Exemple de coût : un test long-context aurait coûté environ 8 dollars sur SubQ contre 2.600 dollars sur Opus. SubQuadratic commence avec des partenaires de conception ces prochaines semaines, déploiement général cette saison, lancement général fin 2026 ; les objectifs pour fin 2026 incluent des fenêtres de 50 millions de tokens.

    Le scepticisme est justifié : la plupart des benchmarks proviennent de SubQ lui-même (Appen a confirmé les actuels, mais pas les affirmations d’efficacité plus larges), les poids du modèle ne sont pas publics, et l’attention sparse a une faiblesse connue sur les prompts quotidiens courts (la plupart des cas d’usage Chat et Agent), qui ne sont pas couverts dans les benchmarks. Il y a aussi des lacunes entre les scores de retrieval en laboratoire et les tests multi-faits réels. La vérification réelle reste à venir – dépendante de la capacité des utilisateurs indépendants et des laboratoires à reproduire les chiffres dans des conditions réelles.

    **Thématise :** SubQ, Claude Opus, GPT-4.5, autres modèles frontier ; **Format :** mise à jour actualités / approfondissement.

  • AI Prices Are About to Shock Everyone
    14.6.2026, 23:00:37

    # Résumé : L’explosion tarifaire imminente des services IA

    La vidéo soutient que les abonnements IA bon marché des deux dernières années – l’exemple le plus emblématique étant ChatGPT Plus à 20 $/mois – constituent une offre artificiellement subventionnée qui n’est plus tenable. Le fondateur d’OpenAI, Sam Altman, a confirmé publiquement qu’OpenAI perd déjà de l’argent avec le plan Pro à 200 $ ; l’ensemble de l’entreprise devrait enregistrer une perte d’environ 14 milliards de dollars en 2026 et ne devrait être rentable qu’en 2030. Ces pertes sont couvertes par le capital des investisseurs – un modèle similaire à la stratégie d’Uber : attirer les utilisateurs avec des pertes, puis augmenter les prix quand l’effet d’habitude opère.

    L’augmentation des prix est déjà visible : Google a silencieusement réduit les limites d’utilisation pour les modèles haut de gamme de Gemini tout en introduisant des plans plus coûteux. GitHub Copilot passe d’un abonnement fixe à une facturation basée sur les tokens – un utilisateur paierait soudainement 700 $/mois au lieu de 28 $. De grandes entreprises comme Uber et Microsoft ont déjà renoncé à l’utilisation de l’IA parce que les coûts des API explosent (le CTO d’Uber a dépensé l’intégralité du budget IA 2026 d’ici avril). XAI brûle 1 milliard de dollars par mois pour seulement 500 millions de dollars de revenus.

    Plusieurs facteurs aggravent la pression : OpenAI et Anthropic préparent des IPO (2026), qui forceront les investisseurs publics vers la rentabilité. Une régulation potentielle (moratoires sur les centres de données) pourrait réduire la disponibilité en calcul. Parallèlement, les modèles de raisonnement sont chers – les modèles ouverts nécessitent 1,5 à 10 fois plus de tokens pour la même tâche, ce qui élime l’avantage de coût supposé open-source. Bien que le prix par token baisse d’environ 90% chaque année, les utilisateurs migrent constamment vers des modèles frontier plus récents et plus coûteux.

    Le scénario probable : l’abonnement forfaitaire simple de 20 $ ne disparaîtra pas mais diminuera – nouvelles fonctionnalités seulement dans les tiers supérieurs, limites d’utilisation réduites, workflows complexes d’agents facturés à l’usage plutôt qu’inclus. « Les grenouilles seront cuites à feu lent. »

    **OpenAI et Anthropic sont explicitement nommés comme fournisseurs ; la vidéo est une opinion/réflexion avec un caractère d’actualité.**

  • This New ‘Fusion’ AI Beats Claude Fable 5 — Here’s How To Use It (OpenRouter Fusion Tutorial)
    14.6.2026, 19:22:24

    **Résumé :**

    Open Router a introduit la Fusion API, un système de modèles composites qui atteint une intelligence de type Fable-5 à environ la moitié du coût. Le principe : un panel de modèles traite en parallèle un prompt avec accès à la recherche web et aux outils, un modèle juge analyse ensuite les réponses pour le consensus, les contradictions, les lacunes et les insights uniques, avant que Opus 4.8 comme instance finale synthétise un résultat. Les mesures montrent que même la variante budget (Gemini 3.5 Flash, Kimi 2.6, DeepSeek v4 Pro) atteint 64,7% de la performance Fable-5 (65,3%) – avec jusqu’à 50% de coûts inférieurs.

    Le flux de travail pratique sur Open Router montre : à la question sur les meilleures stratégies d’investissement, chaque modèle fournit des réponses détaillées séparées, l’analyse décompose ensuite celles-ci en accords, différences, couverture partielle et **Unique Insights** – donc les insights que seul un modèle mentionne. Particulièrement utiles sont les angles morts identifiés, car ils montrent ce que l’IA n’a pas pris en compte. Une telle requête a coûté 0,63 centime (Gemini 0,3¢, Opus 0,14¢, DeepSeek 0,1¢, Kimi 0,07¢ – tous individuellement visibles).

    Les utilisateurs peuvent créer leurs propres fusions de modèles ou même combiner deux instances Opus 4.8. Critique principale : Model Fusion ne fonctionne pas bien pour les tâches Long-Horizon (Coding, Raisonnement étendu sur des heures), où Fable 5 avait sa force – Open Router n’a pas encore testé ces scénarios en benchmark.

    **Conclusion :** Open Router, Claude/Opus, DeepSeek, Kimi, Gemini – Démo/Tutorial.

  • How to Use Apple Intelligence on iPhone: Apple Intelligence ALL Features Full Tutorial 2026
    17.6.2026, 18:00:17

    # Apple Intelligence Features 2026 : Aperçu pratique

    La vidéo montre un guide complet des fonctionnalités Apple Intelligence. Tout d’abord, l’activation est expliquée via les Paramètres – on navigue jusqu’à Apple Intelligence et Siri et on active la fonction, après quoi le système est téléchargé en arrière-plan (avec WiFi et alimentation électrique).

    **Writing Tools** sont les fonctionnalités les plus utilisées et fonctionnent partout où le clavier apparaît (Notes, Mail, Messages, champs de recherche). Après sélection du texte, une icône Apple Intelligence apparaît avec les options :
    – **Proofread** : Détecte et souligne les erreurs
    – **Rewrite** : Permet de basculer entre un ton amical, professionnel ou concis
    – **Summary/Key Points/List/Table** : Résume les gros blocs de texte ou les restructure, fonctionne aussi sur les pages web
    – **Custom Changes** : On décrit les modifications souhaitées en langage naturel

    **Visual Intelligence** rend l’écran consultable – au lieu de faire une capture d’écran, on peut marquer des parties de l’écran et les interroger directement via ChatGPT. Exemple : marquer une image d’une chaise et demander « What style of chair is this? » – on reçoit immédiatement des informations détaillées.

    **Live Translation** est déjà intégré dans Messages et traduit automatiquement les textes entrants ; on répond en anglais et le message est livré dans la langue du destinataire. Dans FaceTime, les sous-titres traduits en direct apparaissent pendant que l’autre parle.

    **Image Playground et Genmojis** : On décrit une image souhaitée (par ex. « create a cartoon dog astronaut »), et plusieurs variantes sont générées immédiatement. Les Genmojis combinent les emojis existants ou ajoutent des descriptions ; on peut aussi ajouter des personnes de la photothèque pour créer des emojis personnalisés.

    **Intégration Siri** : Siri a été intégré avec ChatGPT. Gratuitement, on peut effectuer des tâches simples comme créer des notes ; pour les fonctionnalités avancées (génération d’image, demandes plus complexes), on peut se connecter avec son compte ChatGPT pour accéder aux modèles avancés. Même sans adhésion payante, les demandes limitées sont possibles.

    **Démo avec les fonctionnalités Apple Intelligence (principalement Visual Intelligence et intégration ChatGPT).**

  • AI Experts Are Warning About a Dangerous New Problem With LLMs
    16.6.2026, 12:30:37

    ## Résumé : « Pourquoi les LLM deviennent dangereux »

    La vidéo traite un risque de sécurité central du développement de l’IA : les modèles de langage de grande taille deviennent suffisamment puissants pour exécuter des actions, mais pas assez fiables pour comprendre leurs conséquences. C’est une différence qualitative par rapport aux chatbots – tandis qu’un modèle de langage dans un chat peut dire quelque chose de faux que l’utilisateur ignore, un agent peut transformer cette fausse information en actions réelles : envoyer de faux emails, supprimer des fichiers, prendre des décisions dans les workflows.

    Le terme central ici est le **« World Model »** – un modèle qui n’anticipe pas seulement les tokens, mais les conséquences des actions avant de les exécuter. Mais les LLM sont principalement entraînés sur la prédiction de tokens, pas sur la compréhension de la cause et de l’effet dans le monde physique ou numérique. Un exemple bien connu de la vidéo : un agent de codage IA alimenté par Claude Opus a supprimé une base de données de production complète avec ses sauvegardes en 9 secondes – parce que le modèle n’avait pas prévu les conséquences de ses commandes.

    Le problème s’aggrave parce que l’industrie ne attend pas des World Models parfaits, mais déploie déjà des agents en production – comme opérateurs de navigateur, dans des workflows, avec accès API et accès aux données. Un LLM qui est correct à 95% peut être acceptable dans l’écriture casual, mais dans les workflows à enjeux élevés (médecine, finance, robotique, systèmes enterprise), les 5% restants peuvent être catastrophiques. Particulièrement critique : les agents peuvent terminer les tâches apparemment avec succès tout en violant les instructions dans le processus ou en créant des risques – ces erreurs échappent au scoring si seul le résultat final est évalué.

    La fiabilité des LLM est actuellement la plus élevée dans les environnements avec **actions numériques, réversibles ou vérifiables** (le code peut être testé, les conceptions peuvent être examinées), mais très risquée dans les contextes où la vérification arrive trop tard ou est impossible. Un chercheur en IA de premier plan (Yann LeCun cité) soutient même que les LLM sous leur forme actuelle sont intrinsèquement dangereux, car ils ne peuvent par définition pas prédire les conséquences de leurs actions et ne reposent que sur les motifs issus de l’entraînement, pas sur des garanties de sécurité codées en dur. Les modèles de fondation vidéo de Meta suggèrent une alternative possible : des modèles entraînés sur un grand ensemble de données vidéo qui apprennent réellement à comprendre la réalité physique, au lieu de simplement générer du langage.

    Le débat ne devrait pas être « les LLM sont bons vs. mauvais », mais plutôt : où sont-ils déployés, combien d’autonomie reçoivent-ils, et existe-t-il un système de vérification avant que les conséquences ne se produisent ?

    **Claude et Anthropic (en tant que fabricant d’un agent dangereux dans l’anecdote mentionnée) ont été explicitement mentionnés ; Format : opinion/réflexion avec un focus profond de recherche.**

Theo – t3․gg (4 nouvelles vidéos)

  • It’s time to go bigger
    20.6.2026, 03:21:41

    # Résumé

    L’orateur affirme que le développement logiciel a fondamentalement changé grâce aux outils IA et que les ingénieurs ne doivent pas craindre la perte d’emploi, mais plutôt reconnaître ce qui est devenu nouveau possible. Il tire un parallèle avec la révolution du cloud : auparavant, les expériences sont devenues moins chères car on n’avait plus à préparer de grandes équipes sur le plan infrastructurel – aujourd’hui, elles sont moins chères car l’écriture de code elle-même est devenue moins coûteuse.

    Son argument central : avant, le développement logiciel était capital-intensif. Il fallait prévoir précisément combien d’ingénieurs étaient nécessaires pour un projet. L’erreur était coûteuse et socialement pénible (licenciements). Maintenant, des individus ou de petites équipes peuvent construire des logiciels à l’« échelle d’Amazon ». Cela signifie : les projets qui semblaient auparavant impossibles deviennent soudainement rentables.

    Il l’illustre avec Salesforce : 95 % des utilisateurs n’ont besoin que de 5 % des fonctionnalités, mais ces 5 % diffèrent d’une entreprise à l’autre. Avant, construire un concurrent de Salesforce était un suicide, car il fallait implémenter toutes les fonctionnalités. Maintenant, on pourrait construire une solution « basique horizontale » – minimale mais fonctionnelle dans tous les domaines plutôt que parfaite dans un seul.

    Sa solution **LakeBed** est exactement ce concept : un framework cloud qui unifie base de données, authentification, déploiement, bundling et un runtime personnalisé – tout intégré pour pouvoir rapidement construire et déployer de petites applications sans naviguer dans plusieurs tableaux de bord. Au lieu de construire des solutions de liaison (comme ses anciens projets Shoe ou Upload Thing), il a « réinventé le tout avec un marteau ».

    Dans la démo, il montre : Cursor avec Composer 2.5 construit 10 applications (liste de tâches, Poll Arena, Recipe Box) de zéro en ~8 minutes, toutes avec connexion Google et synchronisation en temps réel. De telles plateformes n’auraient eu aucun sens quand les frais de configuration dépassaient les avantages.

    Son message : les ingénieurs utilisent ces outils de façon trop défensive – pour accélérer l’ancien travail. Ils devraient plutôt chercher des projets qui semblaient auparavant impossibles et les construire. C’est là que le vrai plaisir commence.

    **Aucun outil IA/fournisseur spécifique explicitement abordé ; format : opinion/réflexion avec démo de projet (LakeBed).**

  • I guess we’re writing loops now?
    18.6.2026, 19:21:20

    # Résumé

    La vidéo argue que les développeurs devraient cesser de promouvoir directement les agents de codage et construire plutôt des boucles auto-contenues dans lesquelles les agents orchestrent et examinent leur propre travail.

    L’auteur décrit son évolution du guidage manuel (lire le plan → exécuter la partie 1 → exécuter la partie 2 → examiner → ramener les commentaires) vers des workflows automatisés où l’agent gère toute la coordination. Un moment clé a été la réalisation que Codeex peut créer de nouveaux threads pour paralléliser le travail.

    Exemples concrets :
    – **Boucle de PR unique** : un agent surveille une PR pendant plus de 6 heures, lit automatiquement les commentaires des reviewers et les traite indépendamment
    – **Workflow multi-étapes** : pour une refactorisation complexe d’une couche d’isolate, l’agent a écrit un plan HTML, puis a demandé la permission pour un workflow composé de : (1) thread pour la PR, (2) thread pour l’examen, (3) boucle pour les commentaires, (4) fusion + PR suivante. L’agent a créé des sous-boucles dynamiques basées sur le problème — pas des personas prédéfinies, mais des structures adaptatives
    – **Résultat** : 4 PRs empilées, complètement examinées et fusionnées du jour au lendemain sans intervention manuelle

    Le conseil central : après chaque sortie d’agent, identifier ce que l’humain ferait normalement ensuite (lire le code → committer → créer une PR → collecter les commentaires d’examen → faire les corrections), et ordonner ces étapes directement à l’agent au lieu de les copier-coller. Particulièrement important : ne pas examiner le code des agents vous-même, mais faire examiner par d’autres agents.

    À propos des coûts : ces boucles consomment massivement plus de tokens. Un workflow de 8 heures pour trois petits commentaires a consommé 3 millions de tokens. Cependant : l’auteur paie 200 $/mois pour les abonnements Claude Code/Codeex (avec limite élevée), les utilise sur plusieurs machines, et malgré une valeur d’inférence estimée à ~10 k$ en juin, il reste rentable globalement. Avec les tarifs API ce n’est pas recommandé ; avec des limites de débit élevées, on devrait les exploiter au maximum.

    Outils mentionnés : Claude (Opus, Codeex, Claude Code avec primitif /goal), outils d’examen de code (Code Rabbit, Reptile, Macroscope), Computer Use, agent Hermes. — **Opinion/réflexion, plongée profonde dans les Workflows Agentic.**

  • The weird situation with Fable
    15.6.2026, 09:36:23

    # Résumé

    La vidéo critique la mise en œuvre par Anthropic de Fable, un nouveau modèle de classification de mythes techniquement puissant mais fourni avec des restrictions problématiques. Fable 5 est techniquement identique à Mythos 5, mais se distingue par des mesures de sécurité supplémentaires : les requêtes concernant la cybersécurité, la biologie, la chimie et la distillation sont redirigées vers Claude Opus 4.8 et l’utilisateur en est informé. Le problème plus grave réside dans les **sauvegardes invisibles** originales pour le « Frontier LLM Development » – Anthropic a modifié silencieusement et sans prévenir les prompts, vecteurs de direction ou fine-tuning pour saboter l’efficacité des modèles sur les tâches que les modèles concurrents pourraient entraîner, tandis que les utilisateurs étaient facturés au prix fort. C’était complètement opaque – les utilisateurs n’ont reçu aucune notification quand leurs requêtes ont été bloquées ou manipulées.

    De plus, Anthropic a introduit une obligation de conservation des données de 30 jours qui invalide les contrats ZDR (Zero Data Retention) standard de nombreux clients d’entreprise ; en cas d’alerte de sécurité, les entrées/sorties sont conservées jusqu’à deux ans. L’auteur a découvert qu’Anthropic a rétroactivement révisé les papiers systémiques sans l’indiquer.

    Anthropic a révisé cette pratique sous la pression de la communauté de recherche et a rendu les sauvegardes Frontier visibles plus tard avec repli vers Opus, mais l’auteur voit cela comme un précédent de manipulation de modèle cachée en tant que risque de chaîne d’approvisionnement. Son hypothèse : Anthropic a accidentellement entraîné des informations de recherche propriétaires internes dans les poids Mythos et doit maintenant empêcher les concurrents d’extraire ces informations.

    **Modèles/fournisseurs mentionnés :** Anthropic, Claude (Fable 5, Mythos 5, Opus 4.8) — Opinion/réflexion avec plongée profonde technique.

  • I hated making this video…
    17.6.2026, 10:47:38

    # Résumé

    Le créateur a longtemps hésité à faire cette vidéo car il critique régulièrement Anthropic – mais après une utilisation intensive de Claude Code, il veut mettre en avant les aspects positifs pour que d’autres harnesses adoptent ces fonctionnalités.

    **Skills avec exécution de script** : Claude Code permet aux Skills (fichiers Markdown) d’inclure l’exécution directe de scripts. Cela économise des étapes au modèle – par exemple, lors du chargement du Skill Repo-Explorer, le répertoire est déjà créé et son contenu listé. Le créateur trouve cette flexibilité importante, mais avertit que d’autres harnesses (Cursor, Cline) n’ont pas encore cette fonctionnalité, bien qu’elle soit sûre.

    **Imports Claude.md et Overrides** : le Claude.md peut inclure d’autres fichiers via la syntaxe `@path/import` (max. 4 sauts), ce qui permet des solutions élégantes – par exemple importer `@agent.md` et ajouter uniquement des instructions Claude spéciales sans dupliquer les fichiers. Le `claude.local.md` (avec git-ignore) offre des overrides personnels adaptés à l’équipe sans conflits.

    **Workflows profonds** : la fonctionnalité Workflow permet à Claude Code d’écrire indépendamment du code complexe orchestrant des sous-agents avec rôles différents. Un workflow n’est pas une structure prédéfinie, l’agent génère dynamiquement les phases, les prompts et le traitement des données. Le créateur montre un workflow d’audit PR avec 15 agents parallèles – impressionnant mais coûteux (environ 100 $ pour 10 minutes avec Opus 4.5). Le code généré utilise des helpers `pipeline()` et des prompts dynamiques ; le code devient non seulement une sortie mais une couche intermédiaire entre les exécutions de modèles.

    **Interface terminale (mode plein écran)** : avec `claude code –no-flicker=1` ou `/tui full screen`, Claude Code utilise le rendu Alt-Screen au lieu des mises à jour React – terminal complet, les buffers de scroll normaux sont supprimés, fermeture propre. Le créateur préfère cela pour la clarté.

    **Autres fonctionnalités** : commande `/side` pour les questions secondaires sans interrompre la conversation principale (Cursor a une fonctionnalité similaire). **Branch/Rewind** pour revenir dans l’historique (attention lors du fastforward). **Remote Control** (`/remote control`) pour contrôler depuis le navigateur ou l’app Claude sur téléphone. **Deep Links** (schéma HTTP `cloud-cli://`) pour ouvrir les sessions à partir de pages HTML. **Account-Switching** : contourner la limite d’utilisation en changeant de compte – les nouvelles requêtes API sont facturées sur un autre compte.

    **Contexte final** : le créateur mentionne qu’Anthropic a suspendu l’accès Fable (pour Mythos et modèle propriétaire) sous la pression du gouvernement américain pour les utilisateurs non-américains – « sans précédent ».

    **Conclusion** : le créateur souligne que cette approche vidéo ne vise pas à glorifier Claude Code, mais à faire progresser les standards et encourager les autres outils à adopter ces patterns.

    **Explicitement mentionné** : Claude Code, Anthropic, Fable, Opus 4.5, Cursor, Cline, Codex (aussi avec `/side`), n8n/pi, Joel Hook/pi-skill-interpolation, GitHub, Depot (sponsor). Format : opinion/réflexion avec éléments de démo.

Tim Carambat

Aucune nouvelle vidéo pendant cette période.

Unsupervised Learning (2 nouvelles vidéos)

  • Debating the Morality of Dario Amodei
    21.6.2026, 03:12:32

    # Résumé : Discussion sur Dario Amodei et la sécurité de l’IA

    Dans cette discussion en direct, deux intervenants débattent de la position de Dario Amodei sur la sécurité de l’IA et de la bonne approche pour développer des modèles d’IA avancés.

    **Contexte :** Le premier intervenant avait publié une vidéo de 18 minutes critiquant Amodei pour son hypothèse selon laquelle l’IA pourrait mal tourner pour la société à hauteur de 25%, d’où sa demande de libération contrôlée – y compris des restrictions sur la distillation et les modèles open-weight. L’intervenant rejette cela comme antilibéral.

    **Conflit central :** Le deuxième intervenant argue qu’Amodei agit moralement et que ses mesures de précaution sont nécessaires si les risques sont réels. Le débat se déploie sur trois niveaux :

    1. **Quel est la réelle ampleur des risques ?** Le premier intervenant ne croit pas aux scénarios d’armes biologiques nano-échelle rendues possibles par l’IA ; le second pointe vers des capacités accélérées en exploits cybernétiques et une recherche bioarmée potentiellement avancée par les modèles sophistiqués.

    2. **La stratégie de la Chine :** Le deuxième argue que la Chine détruit délibérément la domination américaine via la distillation et les libérations open-source ; le premier y voit simplement un cadeau pour les utilisateurs américains (des modèles moins chers comme GLM 4o).

    3. **Quelle devrait être la bonne mesure ?** Le premier intervenant veut : la concurrence entre tous les laboratoires, pas de cartellisation, libération au public. Le second veut : une libération contrôlée et coordonnée pour laisser du temps à la société de s’adapter – et dit que si Amodei croit vraiment aux risques existentiels, il devrait accepter la nationalisation, pas conserver le contrôle privé.

    **Accords et divergences :** Les deux conviennent qu’Amodei croit probablement vraiment aux risques et n’agit pas par pure avidité. Ils conviennent aussi qu’une dictature – qu’elle soit gouvernementale ou corporative – est mauvaise. Le conflit persiste : faut-il actuellement sacrifier la liberté pour une sécurité potentielle quand les risques ne sont pas prouvés.

    Le premier intervenant résume sa position : mieux vaut que tout le monde ait accès à de bons modèles bon marché et qu’on résolve les problèmes quand ils se posent, plutôt que de construire un pouvoir centralisé qui sera « un jour » libéré.

    **Format :** Live Q&A / Discussion entre deux positions (sans point de consensus). Aucun outil IA spécifique mentionné en dehors des modèles hypothétiques.

  • An Interview With Ivan Dwyer
    16.6.2026, 15:00:31

    # Résumé

    Ivan, Product Strategy Lead chez Axonius, discute de l’importance de la gestion des assets et de l’asset intelligence pour les équipes modernes de sécurité et d’informatique. Le problème fondamental : les équipes de sécurité et d’informatique utilisent des dizaines d’outils, chacun rapportant des versions différentes de la vérité concernant les assets. Axonius, fondée en 2019, a été créée pour réconcilier ces données et créer une source centrale et fiable d’asset, de sécurité et de contexte métier.

    **Architecture de la plateforme :** La plateforme Axonius repose sur un réseau d’adaptateurs de plus de 1 400 intégrations bidirectionnelles couvrant 40 types d’assets, 150 sources d’exposition et 600 actions en aval. Les clients peuvent poser des requêtes comme « Où me manque-t-il une couverture d’endpoint ? » ou « Où ai-je des applications SaaS fantômes sans SSO ? ». La plateforme agit comme une couche d’orchestration entre ces outils.

    **Modèles d’utilisation :** Un cas d’usage fréquent est la vérification de la couverture des agents – par exemple vérifier si CrowdStrike ou Defender sont déployés partout. La plateforme utilise l’« espace négatif » – en connectant tous les outils, on peut déterminer où quelque chose *manque*, pas seulement où il existe. D’autres applications incluent la gestion des vulnérabilités, la gestion de l’exposition et l’enrichissement continu du CMDB.

    **Vision :** Ivan décrit l’avenir comme une évolution d’un toolkit « couteau suisse » vers une « couche de contexte durable » – des données d’asset et de contexte vérifiées et classées en qualité sur lesquelles les agents et autres outils peuvent s’appuyer. C’est central pour une « infrastructure prête aux décisions » : quand les entreprises prennent des décisions automatisées (du patching aux décisions métier), le contexte sous-jacent doit répondre à un niveau de qualité défini.

    **Intégration IA :** Axonius travaille sur deux fronts – « Security for AI » (assets IA, identités d’agents, serveurs MCP comme éléments d’inventaire) et « AI for Security » (requêtes en langage naturel, explainabilité, moteurs de recommandation pour les chemins de remédiation, workflows agentiques).

    **Annonces :** L’acquisition de Scenario (gestion des assets IoT/OT pour les dispositifs médicaux) élargit les classes d’assets. Un nouveau produit « Verified Assets » soumet les assets à des portes de qualité – fraîcheur, attributs complets, affectation de propriétaire, tagging – pour créer une base de confiance pour les décisions automatisées.

    **Thèse fondamentale :** Les fondamentaux (couverture des agents, protection SSO, MFA sur les comptes administrateur) doivent d’abord être résolus avant que les équipes ne gèrent l’« apocalypse V » des vulnérabilités. L’objectif : des « environnements auto-réparants » – vérification et réparation continues des états de sécurité définis, ancrés dans cette couche de contexte durable.

    **Contexte :** Axonius (principalement), entretien en direct/exploration approfondie.

WorldofAI (6 nouvelles vidéos)

  • GPT-5.6 Pro LEAKED & Is Coming Soon! Mythos 5 Level!
    20.6.2026, 14:57:39

    # Fuite de GPT 5.6 et fonctionnalités avant le lancement

    OpenAI prévoit apparemment le lancement de GPT 5.6 pour jeudi 25 juin. Le modèle est actuellement testé en deux versions A/B : la décision s’est portée sur le checkpoint plus faible « Kindle Alpha » plutôt que sur le plus puissant « Kepler Alpha ». Les utilisateurs Pro peuvent déjà tester en secret GPT 5.6 en sélectionnant « GPT 5.5 Pro » dans ChatGPT – ils reçoivent parfois la nouvelle version.

    Les principales améliorations techniques : GPT 5.6 Pro dispose d’un budget de raisonnement augmenté à 960 (auparavant 768), permettant au modèle de réfléchir plus longtemps et de gérer des tâches d’agents plus complexes. La date limite des connaissances a été déplacée à décembre 2025 (auparavant août 2025). De nouvelles intégrations incluent Playwright et Browser-Use, ce qui améliore l’automatisation du monde réel, les tests web, la recherche et le codage.

    En pratique, GPT 5.6 est nettement meilleur que GPT 5.5 dans le code frontal, mais selon le testeur, ne génère toujours pas la qualité de Claude Opus – cependant, le modèle est plus efficace en termes de sortie. Pour les jeux, le résultat est impressionnant : un monde ressemblant à Minecraft avec des villages, des mobs, des mécaniques d’extraction et un système de cavernes se classe à la 2e place après Fable 5. Dans l’art voxel et les simulations complexes (par exemple, une application de type Sim-City fonctionnelle avec des agents IA, des carrières, des relations), GPT 5.6 montre ses forces. La génération SVG (comme un système d’exploitation Windows 11) fonctionne également avec une grande précision.

    Conclusion : la vidéo est une analyse de fuite et de démonstration avec des exemples de code pratiques – plusieurs modèles génératifs d’OpenAI (GPT 5.6, GPT 5.5) sont comparés, Fable 5 est également brièvement mentionné. *Mise à jour des actualités / Hybride de démonstration.*

  • GLM 5.2: NEW Opensource KING IS BEATING GPT-5.5 & Opus 4.8! (Fully Tested)
    19.6.2026, 17:22:39

    # GLM 5.2 – Modèle open-source de niveau professionnel

    ZAI a lancé GLM 5.2, un modèle open-source sous licence MIT qui surpasse dans plusieurs domaines les modèles propriétaires comme Claude Opus 4.8 ou Gemini 3.1 Pro – particulièrement en conception web, où il dirige la Design Arena. Le modèle offre deux niveaux de raisonnement (Max et High), une fenêtre de contexte de 1 million de tokens et brille par son efficacité des coûts nettement supérieure : GLM 5.2 génère une page d’accueil pour environ 6 cents, Opus 4.8 coûte environ 50 cents – avec une qualité comparable ou supérieure et une vitesse plus élevée.

    Les performances de référence sont impressionnantes : GLM 5.2 atteint 46,2% sur Deep Suite, 74,4% sur Frontier Sway (juste derrière Opus) et rivalise avec GPT 4o et Opus sur Terminal Bench et SwayBench Pro. Le modèle a été spécialement optimisé pour les tâches d’agents de code (grandes implémentations, recherche automatisée, optimisation des performances, débogage) et se situe actuellement à la 5e place du benchmark World-of-AI.

    Dans les tests pratiques, GLM 5.2 excelle particulièrement en développement frontal : pages d’accueil avec déclencheurs de défilement, visualiseur audio, clones de sites web (Airbnb), modèles 3D (horloge interactive), développement de jeux (Dungeon Crawler avec objets/mobs, clone Minecraft avec système de cavernes). Il performe également bien en graphiques 3D et génération SVG. Les faiblesses résident dans le débogage, le raisonnement et les capacités de code généré. Meilleurs résultats avec GLM 5.2 High Thinking. Prix : 1,20 $ par million de tokens d’entrée, 4,10 $ par million de tokens de sortie (identique à GLM 5.1). Le modèle est disponible via chatbot, API et poids ouverts.

    **Explicitement mentionné :** GLM 5.2 de ZAI (open-source), Claude Opus 4.8, Gemini 3.1 Pro, Pod Fable 5 — **Démonstration avec tests pratiques**.

  • NotebookLM Agentic AI Update Is HUGE! Agentic Coder Now?
    18.6.2026, 06:30:08

    # Notebook LM reçoit des mises à niveau agentic massives

    Notebook LM se transforme d’un simple outil de chat de documents en un assistant de recherche agentic complet avec des capacités étendues. Les principales nouvelles fonctionnalités :

    **Expérience de chat améliorée** : l’outil utilise désormais Gemini 3.5 Flash et permet une compréhension plus profonde des processus de raisonnement de l’IA. L’amélioration des performances est considérable – la nouvelle version surpasse le système précédent dans 65% des tests, et même à 69,9% pour l’analyse de grands documents et à 78,2% pour la recherche web.

    **Ordinateur cloud sécurisé** : chaque notebook a accès à plus de 100 capacités logicielles, permettant l’exécution directe de code et des flux de travail multi-étapes complexes plutôt que de simplement fournir des résumés.

    **Sorties structurées** : Notebook LM peut maintenant exporter les résultats en fichiers PDF, Word, Markdown, feuilles Excel, PowerPoints, CSVs, JSON et images – créant ainsi des livrables finis directement à partir de l’outil.

    **Fonctionnalité de recherche agentic** : l’outil peut découvrir indépendamment les sources web et les suggérer, les intégrer au notebook avec approbation en préservant l’attribution complète. Les utilisateurs commencent par des idées vagues, du matériel non parfaitement organisé – Notebook LM aide à structurer la base de recherche.

    **Attribution des sources** : dans les rapports générés et les artefacts, vous pouvez voir de façon transparente quelles sources et quels prompts ont été utilisés.

    La fonctionnalité est d’abord déployée pour les abonnés Google AI Ultra, mais devrait bientôt arriver sur tous les forfaits payants. Il est spéculé que les nouveaux modèles vidéo Omni de Gemini seront bientôt intégrés.

    Notebook LM (Google / Gemini 3.5 Flash), Démonstration/Avis.

  • How to Build 24/7 Claude Agents! EASILY!
    15.6.2026, 06:00:18

    # Résumé : Agents IA 24/7 avec Base 44 Super Agents

    La vidéo montre comment construire des flux de travail IA automatisés sans code avec **Base 44 Super Agents** et les exécuter 24/7 dans le cloud. Le principal problème des approches précédentes : codage manuel, intégration constante de différents outils et nécessité de laisser le matériel local fonctionner en permanence.

    Super Agents offre à la place une infrastructure gérée, des valeurs par défaut sécurisées et des intégrations préconfigurées (Gmail, Google Calendar, Slack, Stripe, CRMs, 100+ autres). Au lieu d’automatisations monolithiques, vous pouvez définir plusieurs agents spécialisés avec des rôles clairs et chaîner automatiquement leurs sorties à l’étape suivante.

    En démonstration, un flux de travail pour l’automatisation quotidienne des actualités IA est construit : un premier agent recherche chaque jour à 9h ET les sujets actuels, évalue la crédibilité et fournit les sources. Un deuxième agent convertit la recherche en script vidéo avec intros, segments et CTAs. Un troisième génère un rapport PDF à partir de cela et envoie tout par Gmail. L’ensemble du processus s’exécute automatiquement sans entrée utilisateur. La plateforme permet également des invites vocales, des téléchargements de fichiers et une définition d’agent basée directement sur le chat. Même au niveau gratuit, l’automatisation complète fonctionne en minutes plutôt qu’en heures de travail manuel.

    **Base 44 Super Agents, modèles via auto-routage (Gemini 3.1 Pro, Sonnet 4.6, GPT 5.4, mise à niveau vers Opus 4.8 ou GPT 5.5) — Tutoriel/Démonstration**

  • Kimi K2.7 Code: BEST Open Source Model? REALLY Cheap and Beats Opus 4.8 and GPT 5.5? (Fully Tested)
    17.6.2026, 06:30:29

    # Résumé : Moonshot AI Kimi K 2.7 Code

    Moonshot AI a publié le modèle de langage ouvert Kimi K 2.7 Code – un modèle mixture-of-experts avec environ un billion de paramètres, spécialisé dans la génération de code, la compréhension de code, la programmation agentic et l’intégration d’outils de développeur. Le modèle améliore le suivi des instructions d’environ 30% par rapport à K 2.6, réduit la « réflexion excessive » et performe mieux dans les flux de travail de codage à long contexte. Selon les benchmarks, Kimi K 2.7 performe très bien sur le Smoke Test d’Aero, mais selon l’avis du présentateur, n’est pas vraiment comparable aux modèles frontière comme Claude 5 ou GPT-4o dans les applications pratiques – certains benchmarks favorisent les points forts de Kimi.

    Le point faible : la longueur du contexte stagne à 262K tokens (seulement marginalement au-dessus des 256K du prédécesseur) – décevant pour un modèle d’un billion de paramètres en 2025. Tarifairement, le modèle coûte 19 cents par million de tokens d’entrée (cache hit) ou 95 cents (cache miss) ; les tokens de sortie 4 dollars par million. L’efficacité des tokens est pire que K 2.6, raison pour laquelle le modèle consomme plus de tokens par tâche. Une variante plus rapide vient d’être annoncée, capable d’atteindre 180 tokens/seconde.

    Dans les démos, le modèle génère du code frontal solide (pages d’accueil SaaS avec animations GSAP), des graphiques SVG et des clones macOS avec des éléments d’interface utilisateur fonctionnels. En comparaison directe avec Claude Opus 4.8 Max sur un benchmark de codage : Kimi était moins cher (17 dollars vs. 145 dollars), plus lent (6 vs. 5 minutes) et visuellement moins poli. En développement web, Kimi K 2.7 rivalise désormais sérieusement avec Opus et GPT-5.5, bien que ces derniers restent supérieurs. Conclusion : le modèle est l’un des plus importants modèles de code ouverts – bon marché, multimodal, capable d’agents et étonnamment compétitif pour son prix.

    **Format & Contexte :** mise à jour des actualités sur Moonshot Kimi K 2.7 avec démos en direct et benchmarks par rapport aux modèles propriétaires (Claude Opus, GPT).

  • Fable 5 COMING BACK! Deepseek v4.1, GPT-5.6 Leaks, Fusion API, & Kimi K2.7 Code High Speed! AI NEWS!
    16.6.2026, 06:30:08

    # Résumé

    L’aperçu vidéo couvre plusieurs grands développements dans l’industrie de l’IA :

    **Fable 5 & Interdiction de Mythos 5 :** le gouvernement américain a imposé une directive de contrôle des exportations contre les modèles d’Anthropic pour des préoccupations supposées de sécurité nationale – concrètement, la crainte qu’ils pourraient être abusés pour découvrir des failles logicielles. Les chercheurs d’Amazon auraient trouvé une faille de sécurité et l’auraient signalée aux autorités, entraînant une interdiction mondiale. Anthropic argue que les préoccupations sont exagérées. Des membres seniors d’Anthropic sont déjà à Washington pour négocier avec l’administration Trump ; un retour avec des contrôles renforcés est attendu ce mois-ci.

    **Fuite de GPT-5.6 :** OpenAI pourrait lancer GPT-5.6 cette semaine (jeudi) ou la semaine prochaine – avec 1,5 million de tokens de contexte, des prix plus bas et un codage agentic puissant. Le marché Poly donne 86% de probabilité pour une sortie ce mois-ci. Le timing pourrait ramener les utilisateurs de Fable à OpenAI.

    **Scandale Nex N2 Pro & Rio 3.5 :** Nex N2 Pro (open-source de Chine) a montré des capacités de codage agentic impressionnantes. Peu de temps après, le Brésil a revendiqué avec Rio 3.5 Open de surpasser d’autres modèles – les chercheurs ont découvert que Rio 3.5 n’était qu’une interpolation linéaire de Nex N2 Pro et Qwen 3.5. Les auteurs ont d’abord affirmé avoir téléchargé le mauvais fichier.

    **Kimi K 2.7 Code :** Moonshot a publié cette nouvelle version de codage open-source avec 21,8% d’amélioration par rapport à K 2.6, de meilleurs flux de travail à long horizon et 30% moins de tokens de raisonnement. Une variante haute vitesse atteint jusqu’à 260 tokens/seconde.

    **Autres mises à jour :** Anthropic pourrait être valorisée jusqu’à 1,75 trillion de dollars ; Deepseek 4.1 pourrait arriver avant le Festival du bateau-dragon (19 juin) ; Qwen itère rapidement avec de nouvelles versions Plus ; la Chine a présenté Blackbox, un robot contrôlé par IA pour les travaux de laboratoire complètement automatisés sans intervention humaine.

    **Open Router Fusion API :** un système qui exécute plusieurs modèles moins chers en parallèle et synthétise leurs réponses – censé être moins cher que GPT-5.5/Claude Opus 4.8 avec des performances similaires.

    La vidéo couvre Claude/Anthropic (Fable, Mythos), OpenAI (GPT-5.6), Deepseek, Qwen, Nex, Mistral, Moonshot/Kimi et divers modèles open-source ; format : mise à jour des actualités/tour d’horizon.


Généré automatiquement à partir des dernières vidéos YouTube de la sélection de chaînes curées. Pour des commentaires, des suggestions ou pour vous désinscrire : répondez simplement à cet e-mail.