You are currently viewing Claude Fable gesperrt: KI-Regulierung erreicht erstmals Live-Modelle (2026-06-21)

Claude Fable gesperrt: KI-Regulierung erreicht erstmals Live-Modelle (2026-06-21)

In die Tiefe gedacht — kopier den ganzen Artikel in deinen LLM und analysiere ihn gezielt.

Das Fable-Verbot: Wie die US-Regierung erstmals ein live KI-Modell vom Markt nahm

Sonntag, 21. Juni 2026

🎧 Podcast-Folge (15.6 Min)

Hallo, dieser wöchentliche Digest arbeitet die wichtigsten neuen Videos aus rund 40 kuratierten KI- und Coding-YouTube-Kanälen durch — mit Substanz, kein oberflächliches Top-5. Pro Video eine vollständige Zusammenfassung, dazu ein Wochen-Überblick zu den dominanten Themen. Lies in Ruhe — oder kopier eine Zusammenfassung in den LLM deiner Wahl und geh in die Tiefe. Den Link unter jeder Zusammenfassung anklicken, um das Original-Video zu sehen.

Es war ein Präzedenzfall ohne Vorbild: Innerhalb von 36 Stunden nach seiner Veröffentlichung sperrte die US-Regierung Claude Fable 5 per Export-Control-Direktive fĂĽr alle Nicht-US-BĂĽrger – einschlieĂźlich Anthropic-Mitarbeiter mit ausländischen Pässen. FĂĽr Fireship war es schlicht „das erste Mal in der Geschichte, dass ein groĂźer KI-Anbieter ein öffentliches Live-Modell aufgrund einer behördlichen Anweisung vom Markt nimmt”. Anthropic blieb keine Wahl: Da eine praktische Nationali­täts­prĂĽfung unmöglich war, schalteten sie Fable fĂĽr alle Nutzer ab.

Ăśber den Auslöser kursieren zwei Lesarten, die sich nicht ausschlieĂźen. Offiziell meldeten Amazon-Forscher einen Jailbreak – einfach strukturierte Unicode-Tricks und Rollenspiel-Framings, keine technische Sci-Fi-Exploit –, woraufhin US-Handelsminister Howard Lutnik die Direktive unterzeichnete. Dass Anthropic 90 Minuten Vorlauf erhielt und keine BegrĂĽndung fĂĽr die konkrete Bedrohung, sowie die Falschbehauptung der Regierung, CEO Dario Amodei sei auf einem Wellness-Retreat gewesen, lassen mehrere Kanäle (AI Explained, Kyle Balmer) an den Motiven zweifeln: Pete Hegseth twitterte aggressiv gegen Anthropic, OpenAI-Kreise finanzierten Trumps PAC massiv, Anthropic nicht. Theo von t3.gg legte eine weitere Schicht bloĂź: Fable enthielt von Beginn an unsichtbare Safeguards, die Prompts rund um „Frontier-LLM-Development” still umleiteten oder degradierten – Nutzer zahlten den vollen Preis, ohne Feedback zu erhalten. Anthropic revidierte diese Praxis erst unter Druck.

Was Fable technisch besonders machte, beschreibt Kyle Balmer präzise: Es handelte sich um Mythos 5 mit zusätzlichen Sicherheitsklassifizierern – sichtbare Fallbacks zu Opus 4.8 bei heiklen Anfragen –, das proaktiv und stundenlang autonom arbeitete, statt auf Einzel-Prompts zu reagieren. David Shapiro ergänzt, dass Anthropic bewusst komplexe ML-Forschungsanfragen an das schwächere Opus-Modell umgeleitet hatte, um rekursive Selbstverbesserung zu verhindern – eine Maßnahme, die er auf den Less-Wrong-Hintergrund vieler Anthropic-Gründer zurückführt. AI Explained fasst das Kerndilemma: Jailbreaking ist ungelöst, kein Modell ist universell resistent, und Amodei argumentierte selbst, dass die Regierung zwischen engen, spezifischen Jailbreaks und universellen Umgehungen unterscheiden müsse. Bis Redaktions­schluss liefen Verhandlungen in Washington; ein Comeback mit verschärften Kontrollen wurde noch für denselben Monat erwartet.

AI & Gesellschaft / Future of Work

Gleich mehrere Videos kreisen um die Frage, wem KI-Intelligenz gehört und wer sie kontrollieren darf. Kyle Balmer macht die gesellschaftliche Sprengkraft explizit: Fable markiert den ersten Moment, an dem KI-Spitzenintelligenz exklusiv zahlungskräftigen Nutzern vorbehalten wird – eine neue digitale Klassenfrage. Nate Herk analysiert OpenAIs „Built to Benefit Everyone”-Plan und Anthropics parallel formulierten Aufruf: Beide Labs fordern eine externe Instanz, die Frontier-Development bei Bedarf pausieren kann – nicht weil sie freiwillig langsamer wĂĽrden, sondern weil der Wettbewerbsdruck zu hoch ist, um allein zu stoppen. Nate B. Jones (AI News & Strategy Daily) und Unsupervised Learning diskutieren, ob Amodeis 25%-Risiko-Kalkulation illiberal oder schlicht verantwortlich ist – ohne Konsens, aber mit der nĂĽchternen Einigung, dass zentralisierte private Kontrolle genauso gefährlich wäre wie staatliche. Wolfgang Hirn (Everlast AI) liefert den geopolitischen Rahmen: Huawei entwickelt mit dem alternativen Chip-Verfahren „Tau” eine eigenständige Fertigung bis 1,4 nm, was den zentralen US-Hebel der Exportbeschränkungen langfristig untergräbt; Europas Umsetzungsschwäche sei strukturell, nicht kognitiv. Und Nate B. Jones’ Voice-Cloning-Essay setzt den Vertrauens-Erosionsfaden fort: Das knappe Gut der Zukunft sei nicht Inhalt, sondern Urteilsvermögen und Accountability.

AI-Industrie & Strategie

Die Fable-Episode ist nicht losgelöst vom größeren Strukturwandel der Branche. Nate B. Jones analysiert in drei aufeinander aufbauenden Essays den entscheidenden Unterschied zwischen Token (rohe Intelligenz, Commodity) und Harness (alles, was Intelligenz in produktive Arbeit verwandelt – Kontextmanagement, Evaluationen, Routing, Workflows). Sein Kernargument: Wer die Harness kontrolliert, kontrolliert den Wert; die IPOs von OpenAI und Anthropic sind der erste öffentliche Test dieser These. David Shapiro ergänzt, dass bloĂźes Token-Verkaufen keine tragfähige Basis sei – der Wert liege in den Outputs und Tools, ein Bild, das Satya Nadella in einem viel diskutierten Artikel ähnlich zeichnete. Die Frage „KI-Bubble oder nicht?” beantwortet Jones differenziert: Nachfrage und Aufbau sind real (OpenAI wuchs von 2 auf ĂĽber 20 Mrd. Dollar annualisiertem Umsatz), aber der Markt beginnt erst, zwischen echtem Workflow-Wert und Demo-Wert zu sortieren. Nvidias Datacenter-Umsatz (193,7 Mrd. fiscal 2026) sei physische Evidenz, keine Spekulation. Parallel warnt TheAIGRID, dass die gĂĽnstigen $20-Flatrates ein Auslaufmodell sind: OpenAI verliert bereits am $200-Pro-Plan Geld, GitHub Copilot wechselt auf Token-basierte Abrechnung, und der öffentliche Druck durch IPO-Investoren dĂĽrfte die Preislogik 2026 fundamental verschieben.

Prompting & AI-Literacy

Ben AIs DLOP-Skill (De-Slop-Output-PrĂĽfer) arbeitet in zwei Schichten: erst universelle AI-Slop-Muster (Gedankenstriche, WidersprĂĽche, Faktencheck), dann unternehmensspezifische Kriterien (Tonalität, Brand Identity, Strategie). Drei unabhängige Sub-Agenten bewerten, ein DLOP-Log protokolliert Muster fĂĽr unternehmensweite Analyse. NeuralNine stellte den Claude-Code-Skill „Ponytail” vor, der Agenten auf prägnante, minimalistische Ausgaben trimmt – besonders nĂĽtzlich beim Lernen neuer Frameworks wie LangGraph, wo ausschweifende Best-Practice-Erklärungen kontraproduktiv sind. Nate Herks Agent-Loop-Erklärung klärt die Grundstruktur (Trigger, Aktion, Stoppbedingung) und drei Architekturtypen: Solo-Loop, Maker-Checker und Manager-mit-Helfern – mit dem praktischen Hinweis, dass Loops mit zu offenen Kriterien endlos laufen und seine eigenen typischerweise 30 Minuten bis wenige Stunden dauern.

PKM & Knowledge Management

Niklas Steenfatt berichtete über Odysseus, PewDiePies überraschend virales Open-Source-Projekt (65.000 GitHub-Stars): ein selbst gehostetes Chat-Interface mit Dokumenten-Upload, Kalender-, Bildbearbeitungs- und E-Mail-Integration, betrieben über Ollama Cloud statt lokaler GPU – ein pragmatischer Mittelweg zwischen voller Datensouveränität und Nutzbarkeit. Der Witz: Nicht die Technologie ist das Statement, sondern dass ein Creator mit 100-Millionen-Abonnenten dezentrale KI als Gegenentwurf zu Google und OpenAI positioniert.

AI-Business, Marketing & Freelancing

Stefan Hoffmanns Praxisbericht (Everlast AI) ist einer der konkreteren dieser Woche: 200 inaktive Kunden per Outbound-Telefonagent reaktiviert, 5 % RĂĽcklauf, zwei Vermietungen auf Mallorca. Entscheidend fĂĽr den Erfolg war laut ihm das richtige Systempromt und das ehrliche Vorfiltern sinnloser Use-Cases. AI mit Arnie demonstrierte, wie sich mit Claude (oder Cursor/Hermes), der Hixfield CLI fĂĽr Bild- und Videogenerierung und freiem Hosting via GitHub/Vercel Premium-Marketing-Websites aus einem Master-Prompt generieren lassen – frĂĽher ein 10.000-€-Service, heute fĂĽr rund 47 € monatlich fĂĽr etwa acht komplette Sites mit Videos. Nate Herks Six-Skills-Essay richtet sich an Angestellte: Der wichtigste Rat ist nicht Karrierewechsel, sondern das eigene Fachgebiet mit KI effizienter machen – so wie Excel fĂĽr Buchhalter – und dabei als „die KI-Person im Raum” sichtbar zu werden.

AI-Video & Content Creation

Google Flow Tools ermöglicht laut TheAIGRID das Bauen eigener KI-Kreativtools in natĂĽrlicher Sprache ohne Code – bestehende Tools (Sketch-to-Image, Depth-Warp-4D-Videoeffekte) lassen sich remixen, eigene Tools per Dropdown definieren und mit Link teilen. NotebookLM erhält laut WorldofAI massive Agentic-Upgrades: Gemini 3.5 Flash als Basis, Secure Cloud Computer mit ĂĽber 100 softwaretechnischen Fähigkeiten, strukturierte Exports als PDF/Word/Excel/PowerPoint und ein Agentic-Research-Feature, das selbständig Web-Quellen entdeckt und mit Genehmigung ins Notebook integriert – vorerst fĂĽr Google AI Ultra-Abonnenten. Nate B. Jones (AI News & Strategy Daily) demonstrierte einen geklonten Stimmklon der eigenen Stimme und formulierte daraus fĂĽnf Ebenen eines „Creator Trust Stack”: Disclosure, Provenance, Control, Judgment und Accountability – das knappe Gut sei nicht Inhalt, sondern wer die Verantwortung fĂĽr Entscheidungen trägt.

AI-Automation & Workflows

n8n zeigte einen Cybersecurity-Incident-Response-Workflow, der drei parallele Strategien kombiniert: Vektorsuche in historischen Incidents, Playbook-Konsultation und externe Threat-Intelligence. Synthesiert werden MITRE-ATT&CK-Mappings, IoCs im JSON-Format und priorisierte nächste Schritte – manche automatisierbar, manche zur manuellen Genehmigung. Der Kontext ist ernst: Anthropics Mythos-Modell fand laut dem Video eine 27 Jahre alte Zero-Day in OpenBSD, was automatisierte Verteidigung auf gleicher Augenhöhe erfordert. Dave Ebbelaar stellte seinen bewährten 2026-Stack vor: Python + FastAPI + Celery (Backend), PostgreSQL via Supabase (Daten), React + Vite + Shadcn UI (Frontend), direkte LLM-APIs (AI), Docker + Railway oder Hetzner VPS (Infra) – mit dem Argument, dass diese etablierten Schichten stabiler sind als kurzlebige Einzeltools. WorldofAI demonstrierte Base 44 Super Agents als No-Code-Alternative: vorkonfigurierte Integrationen für Gmail, Slack, Stripe und 100+ weitere Dienste, parallele spezialisierte Agenten mit verketteten Outputs.

Personal AI OS & Agent-Frameworks

Nate B. Jones’ Open-Skills-Framework adressiert das „procedural debt”-Problem: 31 wiederverwendbare Markdown-Skills in sieben Kategorien plus sieben Runbooks, portierbar zwischen Claude Code, Cursor und Codex, mit expliziten Verifikationsschritten statt vager Fertigmeldung. Ein „Session-to-Skill Extractor” verwandelt wiederkehrende Muster aus Agent-Sessions in Skill-Kandidaten – dasselbe Compounding-Prinzip wie sein Open-Brain-Konzept, aber auf Verfahrensebene. Nate Herks fĂĽnf-stufiges Second-Brain-Modell reicht von einfachem Keyword-Routing via `claude.mmd` (Level 1) ĂĽber semantische Suche mit Vektordatenbanken wie Supabase oder Pine Cone (Level 3) bis zu Knowledge Graphs mit LightRAG (Level 4) und kontinuierlich selbst-aktualisierenden Systemen wie GBrain (Level 5) – mit der praktischen Empfehlung, erst dann aufzurĂĽsten, wenn das aktuelle System echten Schmerz verursacht. AgentSpan wurde von Tech With Tim als Production-Framework fĂĽr drei Agenten-Typen demonstriert: konversativ mit Gedächtnis, RAG-basiert mit Human-in-the-Loop-Approvals und Multi-Agent-Orchestration mit sequenziellen, parallelen und verschachtelten AusfĂĽhrungsstrategien.

Software-Engineering & Dev-Kultur

Melvynx’ Migration von Next.js zu TanStack Start (ĂĽber 100.000 hinzugefĂĽgte, 129.000 entfernte Codezeilen) reduzierte die Build-Zeit von 3:30 auf 1:20 Minuten und lieferte das entscheidende Argument fĂĽr KI-gestĂĽtzte Entwicklung: TanStack Start ist deklarativ und explizit, folgt Web-Standards statt proprietärer Abstraktionen – deshalb verstehen KI-Agenten es besser und generieren konsistenterren Code. Leon van Zyl baute mit Claude Code und dem Unreal Engine MCP-Plugin ein spielbares GTA-inspiriertes Prototype mit NPCs, Fahrzeugen und Waffen; der Aufwand war zeitintensiv, zeigt aber, wohin agentengesteuerte Game-Dev fĂĽr Indie-Teams tendiert. Theo (t3.gg) formulierte das größere Argument: KI-Tools werden noch zu defensiv genutzt – um alte Arbeit schneller zu erledigen statt Projekte anzugehen, die bisher unmöglich schienen. Sein LakeBed-Framework (integrierte Datenbank, Auth, Deployment, Custom Runtime) ist genau das: zehn Apps in acht Minuten mit Cursor/Composer 2.5, alle mit Google Sign-in und Echtzeit-Sync. Fireship erzählte dazu die Entstehungsgeschichte von Turso, einer Rust-Neuschreibung von SQLite mit echter Nebenläufigkeit, async-Support und nativer Vektorsuche – die eigentliche Herausforderung nicht die Features, sondern das Vertrauen, das 25 Jahre SQLite aufgebaut haben.

Coding Agents (non-Claude)

Omnigent (Databricks, Open Source) etabliert sich als Meta-Harness ĂĽber bestehende Coding-Agenten: Ein Setup-Kommando genĂĽgt, die Web-UI zeigt wählbare Assistenten und Orchestratoren, und zwei mitgelieferte Beispiele – Poly (Claude implementiert, Codex reviewt) und Debbie (zwei Agenten debattieren, Synthese folgt) – zeigen das Prinzip. Cole Medin grenzt das von „Loop Engineering” ab, das er als Marketing-Begriff abtut: Ohne deterministische Workflow-Datei, Durabilität via Postgres und explizite Kostensteuerung werde Looping teuer und unkontrollierbar – sein Gegenentwurf heiĂźt Arkon, ebenfalls Open Source, mit Dashboard via Retool. Leon van Zyls 30-Tage-Vergleich Claude Code vs. Codex an einer N8N-ähnlichen App ergab: Claude gewinnt beim Design, Codex bei Projektstruktur, technischen Fragen während der Planung und Kosteneffizienz (Codex verbrauchte 16 % seines $100-Plans, Claude 8 % des $250-Plans – je nach Blickwinkel). Mark Kashef zeigte, wie man aus gespeicherten JSONL-Session-Dateien Verhaltensmetriken von Fable 5 extrahiert und als Playbook in andere Modelle injiziert, um Fables strukturierte Arbeitsweise zu approximieren.

Claude Code & Anthropic-Tooling

Theo (t3.gg) widmete trotz seiner Fable-Kritik ein ganzes Video den Stärken von Claude Code, damit andere Harnesses diese Patterns ĂĽbernehmen: Skills mit Script-AusfĂĽhrung beim Laden, `claude.md`-Imports mit max. vier Hops, `claude.local.md` fĂĽr teamfreundliche persönliche Overrides, dynamisch generierte Workflows, die Sub-Agenten orchestrieren, sowie der Fullscreen-TUI-Modus fĂĽr sauberes Terminal-Rendering. Separate davon dokumentierte er Loop-Workflows, in denen Codex neue Threads spinnt, PR-Reviewer-Kommentare automatisch liest und adressiert – vier gestackte PRs ĂĽber Nacht, drei Millionen Token, aber mit dem $200-Abo-Limit finanzierbar. Nate Herk und Cole Medin diskutierten im Podcast-Format, warum Planning-First entscheidend ist: Die „Dumb Zone” beginnt bei Opus um 250.000 Token, Validierungsschritte heben die First-Pass-Qualität von 65 auf 92 %, und jeder Bug sollte als permanente Verbesserung in `claude.md` oder einem Skill enden. Julian Ivanov lieferte dazu ein vollständiges Tutorial fĂĽr ein persönliches AI-OS mit Claude Code: Wissensbasis in Obsidian, MCP-Tool-Verbindungen, Skills als Markdown-Dateien, Remote-Routinen auf Hostinger-Servern, synchronisiert ĂĽber GitHub.

Local & Open-Source AI

GLM 5.2 lässt sich in 2-Bit-Quantisierung auf einem Mac Studio mit 256 GB RAM lokal betreiben (82 % Accuracy laut Everlast AI); Alex Finn demonstrierte dies mit einem vollständig lokal generierten 3D-Ego-Shooter ĂĽber seinen Hermes-Agenten. Bart Slodyczka kombinierte Gemma 4 (12B, QAT-Variante via LM Studio) mit dem Hermes Agent auf einem M4 Mac Mini (16 GB RAM) und steuerte das Setup ĂĽber Claude Code im Terminal, um automatisch Zendesk-Tickets zu beantworten. Everlast AI lieferte den umfassendsten Ăśberblick: fĂĽnf Wege zu lokaler KI (Ollama, LM Studio, Llama.cpp, Inference-APIs via Together AI/Nebius, Embedded in Apple Intelligence/Gemini Nano), die klare Botschaft, dass Open-Source-Modelle heute nur noch vier Monate hinter Frontier-Modellen liegen, und ein Hybrid-Plädoyer: sensitive Daten lokal, Spitzenleistung fĂĽr komplexes Coding in der Cloud. Nick Saraev zeigte, wie GLM 5.2 ĂĽber OpenRouter mit Claude Code als Harness genutzt wird – „Engine-Swap” – und kommt zum Fazit, das Modell habe derzeit mehr „Geschmack” als Opus 4.8.

Model-Releases & Benchmarks

Neben dem Fable-Sturm waren es eine Handvoll Modell-Releases und Leaks, die die Woche prägten. GLM 5.2 von ZAI dominierte die Open-Source-Diskussion: MIT-lizenziert, 1 Million Token Kontext, laut Everlast AI auf der Design-Arena gleichauf mit Claude Haiku 5 und GPT 5.6 Pro, laut WorldofAI bei Frontend-Entwicklung vor Opus 4.8 platziert. Kimi K2.7 Code (Moonshot AI, ~1 Billion Parameter, MoE) verbessert gegenüber K2.6 Befehlsbefolgung um 30 % und reduziert Overthinking, bleibt aber mit 262K-Kontext hinter Erwartungen – Alejandro AOs Benchmarks zeigen, dass Kimi als Implementer mit teurem Planner (GPT-5.5 oder Opus) das beste Kosten-Qualitäts-Verhältnis liefert. OpenAI bereitete derweil laut mehrfachen Leaks (WorldofAI) GPT-5.6 mit 960-Reasoning-Budget, bis zu 1,5 Mio. Token Kontext und Playwright-Integration für Ende Juni vor. TheAIGRID präsentierte SubQ, ein Sprachmodell mit vollständig sub-quadratischer Sparse Attention: Bei 1 Mio. Tokens 56-mal schneller als Flash Attention 2, 12-Mio.-Token-Kontextfenster, 100 % Needle-in-the-Haystack-Genauigkeit bis 2 Mio. Token – allerdings mit noch ausstehender unabhängiger Verifikation und bekannten Schwächen bei kurzen Alltags-Prompts.

Kurz notiert

Apple Intelligence 2026 (TheAIGRID): Writing Tools, Visual Intelligence, Live Translation in FaceTime und Siri/ChatGPT-Integration im Praxisüberblick. Lemma (Tech With Tim): Multi-Agent-Forschungsplattform, die aus einer Frage ein vollständiges akademisches Paper generiert – ein SARS-Task zu Unsicherheits-Prompting lief zwei Tage und reduzierte Halluzinationen um 18–51 %. DataCamp AI-Engineering-Roadmap (Tech With Tim): Neun Kurse, 26 Stunden, OpenAI-API bis LangChain, solider Einstieg für Python-Entwickler. Intel-CEO Lip Bu Tan (No Priors): Dreistufige Turnaround-Strategie (crawl/walk/run), Foundry-Kooperation mit Elon Musks Terra Fab, Fokus auf Agentic-AI- und Inference-CPUs. Melvynx über API-Ausgaben: 4.324 Dollar in einer Woche, 341 Schachpartien als Reaktion auf stundenlange Agenten-Wartezeiten – ein ehrliches Protokoll kognitiver Atrophie durch Automatisierung. NeuralNine Matplotlib-PDF-Reports: Professionelle mehrseitige Reports mit `PDFPages` und `GridSpec` in wenigen Zeilen Python. Webhooks vs. Polling (NeuralNine): Beginner-Tutorial mit Flask-Demo, kein KI-Tool.

AI Explained (1 neues Video)

  • Claude Fable Blocked – 11 Quiet Details on What’s Next
    14.6.2026, 14:52:27

    # Zusammenfassung

    Claude Fable 5 wurde innerhalb von 36 Stunden auf Anordnung der US-Regierung für alle Nutzer blockiert – auch für ausländische Mitarbeiter von Anthropic selbst. Die Blockade erfolgte nach einem Bericht über Jailbreaks in dem Modell und einem Anruf von Amazon-CEO Andy Jasse sowie anderen Technologie-Führungspersonen an die US-Regierung. Die Nationale Cyber-Direktorin Shan Kangross rief ein Treffen mit White-House-Offiziellen ein, die sich für Exportbeschränkungen entschieden.

    Der Videomacher präsentiert elf kontextualisierende Fakten, um die Motivationen und Umstände zu beleuchten. Einige sprechen für ein ehrliches, wenn auch überreaktives Sicherheitsanliegen: die Cyber-Direktorin stand unter Druck, schneller zu handeln; ein vertrauenswürdiger Partner hätte eine Jailbreak-Schwachstelle gemeldet. Andere Details wirken deutlich zynischer: Anthropic betonte, dass die gefundenen Jailbreaks simpel und bei anderen Modellen wie OpenAIs GPT-4.5 ebenso möglich sind. Laut Mythos-Systemkarte sind Mythos und Fable tatsächlich um ein Vielfaches robuster gegen Prompt-Injection als GPT oder Gemini. Ein unabhängiges Cybersecurity-Unternehmen bezeichnete die Regierungsreaktion als Überreaktion, da es um das Helfen bei Sicherheits-Patches ging – exakt das, was Verteidiger täten.

    Ein zweiter kritischer Punkt: Die Regierung behauptete, Anthropic-CEO Dario Amodei sei auf einem Wellness-Retreat – Anthropic und ein anwesender Journalist bestritten dies und deuteten auf einen orchestrierten Reputationsschaden hin. Dazu kommt: Im Juni hatte die White House noch betont, dass umfassende Modellüberwachung Chilling Effects hätte und gegen Redefreiheit verstoßen würde – eine 180-Grad-Wendung zur aktuellen Politik. Die Regierung gab Anthropic nur 90 Minuten zur Abschaltung ohne Details zur eigentlichen Bedrohung. Ein weiterer zynischer Kontext: Pete Hegseth (Secretary of War) twitterte aggressiv gegen Anthropic; Trump sprach von Equity-Anteilen für OpenAI und XAI, nicht aber Anthropic; eine von Greg Brockman finanzierte PAC unterstützte Trump massiv – Anthropic hingegen nicht. Sam Altman von OpenAI bestritt dabei Lobbyismus-Aktivitäten.

    Der Videomacher betont: Jailbreaking ist ein ungelöstes Problem – niemand hat bisher ein Modell geschaffen, das gegen alle Jailbreaks resistent ist. Amodei argumentierte daher, dass die Regierung zwischen engen, spezifischen Jailbreaks und universellen Umgängen unterscheiden sollte. Die Ironie liegt darin, dass Anthropic ursprünglich sagte, nur zu Sicherheitszwecken Frontier-Modelle bauen zu wollen – nun wird genau an der Sicherheit kritisiert.

    Abschließend vermutet der Videomacher, dass die wahrscheinlichste Szene ist: Die Trump-Administration hofft auf schnelle Abhilfe durch Anthropic, woraufhin die Exportbeschränkung aufgehoben wird – möglicherweise schon bis Montag. Falls nicht, hätte das massive Konsequenzen (ID-Checks für Nutzer, Entlassungen ausländischer Mitarbeiter, Marktauswirkungen).

    **Format:** News-Update / Deep-Dive; explizit behandelt: Claude/Anthropic (Fable 5, Mythos), OpenAI (GPT-4.5), Open Router, lmconsul.ai.

AI Foundations

Keine neuen Videos in diesem Zeitraum.

AI mit Arnie (1 neues Video)

  • Claude hat Webdesign fĂĽr immer verändert
    17.6.2026, 18:21:56

    # Zusammenfassung: KI-gestĂĽtzte Premium-Webseiten aus einem einzigen Prompt

    Der Creator zeigt ein System zur Erstellung hochwertiger Marketing-Webseiten vollständig automatisiert aus einem einzigen Prompt. Kernkomponenten sind ein Coding Agent (Claude, Cursor, Hermes oder OpenCoder) und die Hixfield CLI zur Generierung von Bildern und Videos.

    **Das System im Ăśberblick:**
    Der Prozess besteht aus drei Schritten: (1) Hixfield CLI installieren, (2) sich mit Hixfield verbinden, (3) den optionalen Skill installieren. Danach wird ein detaillierter Master-Prompt verwendet, der sechs verschiedene Prompt-Ebenen kombiniert – vom Konzept über Scrollanimationen, Beleuchtung, Copywriting bis zur finalen Verifikation. Der Agent läuft in einer Schleife, bis die Webseite fehlerfrei ist und wurde in verschiedenen Viewports (Desktop, Tablet, Mobil) getestet.

    **Praktische Beispiele:**
    Gezeigt werden fertige Webseiten fĂĽr Kopfhörer (mit Sound-Entfaltungsanimation), Uhren (mit Scroll-Rotation), Autos, Supplemente und ein ĂĽberraschend kreatives Beispiel mit einer GieĂźkanne zum Thema „tropfenfreier Umzugsservice”. Der Agent interpretiert kreativ, was mit dem Produkt vermarktet werden könnte. Ein Video eines Plattenspielers wurde spontan als Ăśberraschung generiert – alles mit konsistenten Scroll-Animationen, perfektem Copywriting und stilgerechten Bildern/Videos.

    **Technische Details:**
    Bei der Nutzung wird empfohlen, den Autopilot-Modus zu aktivieren und mindestens „High”-Level bei Claude-Leistung zu verwenden. Hixfield wählt automatisch das richtige Modell (z.B. Kling fĂĽr Videos, Nano Banana fĂĽr Bilder) aus, ohne dass manuelles Prompting nötig ist. Kosten bei Hixfield: ab 19 € monatlich (Starter), ca. 47 € reicht fĂĽr etwa 8 komplette Webseiten mit Videos.

    **Hosting:**
    Fertige Webseiten lassen sich einfach über GitHub und Vercel kostenlos hosten – Push zu GitHub mit CLI, dann Import und Deploy in Vercel.

    **Kontext:**
    Dies war früher ein Premium-Service für 10.000+ €. Jetzt realisierbar im niedrigen zweistelligen Eurobereich. Der Creator sieht darin auch ein Business-Potenzial, da viele Agenturen diesen Ansatz noch nicht kennen. Der detaillierte Prompt wird in einer kostenlosen Community geteilt.

    Explizit thematisiert: Claude / Hixfield CLI / Cursor / Codex / Hermes Agent / GitHub CLI / Vercel; Format: Tutorial/Demo mit tiefem Einblick in den praktischen Workflow.

AI News & Strategy Daily | Nate B Jones (5 neues Videos)

  • You Can’t Tell If I’m Real Anymore. And That’s Now YouTube’s Problem Too.
    20.6.2026, 15:00:22

    # Zusammenfassung: Voice Cloning, AI in der Kreativbranche und das Vertrauensproblem

    Der Autor demonstriert zunächst einen synthetischen Klon seiner eigenen Stimme und diskutiert dann, warum die eigentliche Gefahr nicht die perfekte KI ist, sondern die „gute genug”-KI in einer Welt voller Ablenkung. Voice Cloning funktioniert bereits heute: Mit ausreichend sauberen Audiodaten kann man ĂĽberzeugend wirkende Stimmen klonen – in normalen Hörsituationen oder wenn Menschen nebenbei zuschauen, funktioniert das schon jetzt. Vollständige Human Presence Cloning bleibt hingegen uncanny: Lippen, Augenbewegungen, Mimik und die Bewegungen von Händen wirken zu 90% richtig, aber die fehlenden 10% erzeugen ein Unwohlsein.

    Das Kernproblem ist nicht die Technologie selbst, sondern das Vertrauensdefizit in einem Umfeld, in dem Menschen Inhalte nebenbei konsumieren – nicht wie Detektive unter forensischen Bedingungen. Die zentrale Frage sollte nicht „Wurde KI verwendet?” sein (eine zu primitive, binäre Frage), sondern wo in der Produktionskette KI agierte und wo menschliches Urteilsvermögen die Kontrolle ĂĽbernahm.

    Der Autor schlägt einen fĂĽnfstufigen „Creator Trust Stack” vor:
    1. **Disclosure** – Was war synthetisch? (Stimme, Gesicht, Script, Bearbeitung)
    2. **Provenance** – Woher stammten die Trainingsmaterialien? Mit Zustimmung oder gescraped?
    3. **Control** – Hatte die geklonte Person Kontrolle über die Nutzung ihrer Identität?
    4. **Judgment** – Wer hat die Argumente formuliert und die Aussagen entschieden?
    5. **Accountability** – Wer trägt Verantwortung, wenn der Inhalt falsch, manipulativ oder schädlich ist?

    Handlungsempfehlungen für Kreative: (1) Synthetische Medien klar kennzeichnen, nicht versteckt in Videobeschreibungen. (2) Stimmen und Gesichter nicht ohne Zustimmung klonen. (3) KI zum Leverage nutzen, nicht zur Verantwortungslosigkeit. (4) Das Publikum medienkompetenter machen – zeigen, erklären, unterscheiden. (5) Unternehmen sollten Richtlinien *vor* Skandalen festlegen, nicht danach.

    Der Autor warnt vor Verwechslungen: Menschen sind inkonsistent, blinzeln seltsam, tragen manchmal die gleiche Kleidung in mehreren Videos (weil sie batch-recorden) – das ist keine KI. Die Verwirrung wird zunehmen. Das wirklich knappe Gut der Zukunft ist nicht Inhalt oder Polnische, sondern Urteilsvermögen, Geschmack und Verantwortungsfähigkeit – die Versicherung, dass ein echter Mensch Entscheidungen trifft und dafür einstehen kann.

    Abschließend: Der Autor nutzte für diese Video-Demo eine geklonte Version seiner eigenen Stimme und zeigt dadurch exemplarisch, wie bereits heute authentisch wirkende Voice Clones möglich sind. — Meinung/Reflexion; thematisiert keine spezifischen AI-Tools oder Anbieter, sondern diskutiert grundsätzlich Voice Cloning und KI-Governance für Creator.

  • Your AI Skills Are Trapped | Here’s How to Own Them
    19.6.2026, 14:00:08

    # Zusammenfassung: Open Skills – Ein Betriebssystem für Agent-Arbeit

    Der Video behandelt ein zweites Problem, das sich offenbart, sobald Agenten Zugriff auf Kontext haben (das sogenannte “Open Brain”-Problem): Agenten wissen zwar möglicherweise, *was* du weiĂźt, aber nicht, *wie* du arbeitest. Der Sprecher identifiziert das als “procedural debt” – ein Verfahrensproblem, das sich in vier Symptomen zeigt: Prompt-Bloat (zu viele Regeln in riesigen System-Prompts), Reexplanation Tax (du musst deine Arbeitsweise in jeder neuen Session neu erklären), Instruction Fragmentation (Regeln verteilen sich ĂĽber mehrere Tools und driften auseinander) und Weak Verification (Agenten machen “fertig”, aber die menschliche ĂśberprĂĽfung bleibt).

    Open Skills ist ein öffentlicher Bestand von wiederverwendbaren Agent-Verfahren (derzeit 31 Skills in sieben Kategorien plus sieben Runbooks). Ein Skill ist eine portable Prozedur – nicht nur eine Prompt-Formulierung, sondern ein Markdown-basiertes Format, das definiert: wann man den Skill nutzt, was der Job ist, welche Grenzen gelten, wie das Output aussieht und wie man Ergebnisse verifiziert. Das erlaubt es, Verfahren zwischen verschiedenen Agenten zu tragen (Cursor, Claude Code, etc.), statt sie in jedem Tool einzeln zu warten.

    Der Sprecher unterscheidet Skills (Primitive – einzelne Verfahren) von Runbooks (Komposition – Workflows aus mehreren Skills). Ein Runbook könnte beispielsweise sein: Voice-Memo → Transkription → Ideen-Verarbeitung → Persönliche Voice → HTML-Seite → Veröffentlichung. Jeder Skill trägt einen Teil des Vertrags, Runbooks verbinden sie.

    Zentral ist auch Scope: persönliche Verfahren (deine Stimme, deine Veröffentlichungsstandards) gehören zu dir, Projekt-Verfahren (sichere Befehle, Repo-Regeln) gehören zum Projekt. Das verhindert, dass alles zu einem riesigen Brei von durcheinander Vorlieben wird. Ein weiteres Kernfeature ist Verification – die Skill definiert voraus, welcher Beweis erbracht werden muss (“Hier ist der Screenshot des Browsers”, “Hier ist die URL, die geprĂĽft wurde”), statt vage auf Vollendung zu hoffen.

    Ein Flywheel-Mechanismus (“Session-to-Skill Extractor”) transformiert wiederkehrende Muster aus Agent-Sessions in Skill-Kandidaten, statt dass sie in der Chat-Historie verloren gehen – das ist dasselbe Compounding-Prinzip wie bei Open Brain, aber auf Verfahrensebene.

    Open Skills existiert nicht isoliert; es soll mit Open Brain zusammen wirken: Brain gibt dem Agenten Kontext (Projekt, Entscheidungen, Prior Work), Skills geben ihm Verfahren (wie man recherchiert, schreibt, baut, testet, veröffentlicht). Der Sprecher betont: Portabilität ist das Differenzierende – du bindest deine Workflows und Verfahren nicht an einen bestimmten Anbieter, Tool oder Modell.

    Die Entscheidungsregel: Einmaliges Prompting ist okay; wenn du aber wiederholt die gleichen Verfahren erklärst und über mehrere Tools jonglierst, dann brauchst du Skills, die du inspizieren, verbessern, zusammensetzen und mitnehmen kannst.

    **Explizit thematisiert:** Claude Code, Cursor, Codeex; Open Brain als Vorgänger-Konzept — Format: Meinung/Reflexion mit Produkt-Ankündigung.

  • Your $20 AI Plan Costs Them Thousands. That’s Not The Bubble.
    15.6.2026, 14:00:28

    # Zusammenfassung: Ist die KI-Bubble oder nicht?

    Der Creator argumentiert, dass die häufig gestellte Frage “Ist KI eine Bubble?” zu simpel ist und den Markt missverstanden werden lässt. Statt diese binäre Frage zu stellen, sollte man stattdessen differenzieren zwischen echtem Aufbau und echter Nachfrage einerseits und spekulativen Ăśbertreibungen andererseits.

    **Die Nachfragesignale sind real:** OpenAI ist von 2 Mrd. Dollar annualisiertem Umsatz 2023 auf über 20 Mrd. 2025 gewachsen, mit Anthropic noch schneller dahinter. Dies kommt zu 40% von Enterprise-Kunden, nicht von Verbrauchern, die sich mit einem Chatbot abkühlten — Unternehmen geben ernsthafte Budgets aus weil sie konkrete Workflows beschleunigen. Nvidias Datacenter-Umsatz (193,7 Mrd. fiscal 2026) zeigt physische Nachfrage: CEOs und Boards kaufen diese Infrastructure nicht für zufällige Experimente.

    **Der entscheidende Unterschied: Inference statt Training.** Training ist episodisch und teuer; Inference läuft jedes Mal wenn jemand das Modell nutzt. Agenten (nicht nur Chat) führen zu Millionen und Milliarden Token pro Lauf — durch Schleifen, Tool-Aufrufe, Verifikationen. Das erklärt warum die Capex-Zahlen so ernst werden: Microsoft, Google, Amazon und Meta bauen faktisch Fabriken für Inference, nicht nur Software.

    **Das echte Sortierungsproblem:** Google, Microsoft, Amazon und Meta geben zusammen ~700 Mrd. Dollar auf KI-Infrastructure aus, müssen aber beweisen, dass diese Investitionen sich auszahlen. Einige Unternehmen werden zu viel bauen, manche am falschen Ort, manche Startupskosten sind aufgeblasen. Das heißt aber nicht, dass die Grundnachfrage imaginär ist.

    Der entscheidende Test 2026: **Werden teure Tokens für wertvolle Arbeit ausgegeben?** Ein Coding-Agent, der Teams Wochen spart, rechtfertigt teure Inference. Ein Customer-Service-System mit echtem Ticketing auch. Ein zufälliger Enterprise-Chatbot mit einer stale Knowledge Base nicht. Die Enterprise-ROI-Daten sind chaotisch, weil die meisten Unternehmen bei Process-Change schlecht sind — das ist kein Beweis für eine Bubble, sondern für ungleiche Adoption.

    **Das bessere Modell:** nicht Bubble vs. kein Bubble, sondern **Aufbau vs. Rückzahlungen.** Der Aufbau ist real, die Nachfrage ist real, die Engpässe sind real. Die offene Frage ist: Wer wird bezahlt, wann, zu welcher Marge und auf welchen Workloads? Der Kursrückgang zeigt, dass Investoren jetzt schwierigere Fragen stellen (sollten), nicht dass der Aufbau ein Betrug ist.

    Die ersten Phase war Narrative (alle kaufen offensichtliche Namen), die zweite Phase ist Korrekt (Markt realisiert es ist teurer, langsamer, unordentlicher). Die dritte wird Sortierung sein: echte KI-Einnahmen vs. KI-Sprachgebrauch im Pitch, echte Bottlenecks vs. Commodity-Exposition, Workflow-Wert vs. Demo-Wert, Unternehmen die sich selbst finanzieren vs. solche die externe Finanzierung brauchen.

    Eisenbahnen waren real und der Aufbau enorm erfolgreich für die Wirtschaft — aber viele Railroad-Investoren wurden trotzdem zerstört. Fiber war real, viele Telecom-Investoren wurden trotzdem zerstört. Das bedeutet nicht dass die Zukunft fake ist, sondern dass Marktkorrektionen nicht das gesamte Narrativ widerlegen.

    Die realen Fragen für Investoren: Ist das bezahlte Nutzung oder Engagement? Production-Workloads oder Piloten aus Pressemitteilungen? Verbessert es einen Workflow mit klarer Ökonomie oder schafft es mehr Arbeit für Menschen? Kauft das Unternehmen Kapazität weil Kunden warten oder weil der Board eine KI-Strategie will?

    **Fazit:** KI ist ein echtes, transformatives Fundament. Teile davon sind spekulativ aufgeblasen. Der Markt beginnt gerade erst, zwischen echtem Wert und Hype zu unterscheiden, und das ist gesund. Der Creator verweist darauf, dass dies ein 10-20-Jahre-Marathon ist, nicht ein Sprint, und dass Investoren höhere Standards für ihre Analyse anlegen sollten.

    **Format & Fokus:** Meinung/Reflexion, tiefe und durchdachte Analyse ohne spezifische KI-Tool-Nennungen (eher Meta-Diskussion ĂĽber die AI-Industry).

  • OpenAI Just Filed For Its IPO. The Real Story Isn’t The Trillion Dollars.
    14.6.2026, 17:00:39

    # Zusammenfassung: OpenAI und Anthropic – Die IPO-These jenseits der Bewertungsfrage

    Die zentrale Frage bei den anstehenden IPOs von OpenAI und Anthropic ist nicht, ob sie eine Billion Dollar wert sind, sondern was öffentliche Investoren tatsächlich glauben sollen: dass beide Unternehmen zwei Dinge gleichzeitig schaffen können – Intelligenz so billig machen, dass sie in großem Maßstab bereitgestellt werden kann, und proprietäre Systeme so schnell aufbauen, dass Unternehmen lieber das ganze System mieten als selbst zu bauen. Die These lautet: billige Token plus proprietary Harnesses ergeben eine Billion Dollar.

    Der Kern der Argumentation liegt in der Unterscheidung zwischen Token (rohe Intelligenz, die nach Verbrauch gekauft wird) und Harness (alles, was rohe Intelligenz in produktive Arbeit verwandelt – Dateien, Tools, Berechtigungen, Speicher, Evaluationen, Routing zwischen günstigen und teuren Modellen, Workflows). Beispiele für Harnesses sind Codeex und Claude Code. Das echte Geschäft sitzt nicht in der reinen Intelligenz, sondern in der Schicht darüber.

    Eine häufige Kritik an den 200-Dollar-Plänen ist, dass Nutzer vermeintlich 8.000 bis 14.000 Dollar Wert erhalten – angeblich eine finanzielle Katastrophe. Aber API-Preise sind nicht Kostenpreis, sondern Einzelhandelspreis mit Gewinnmarge. Wenn die internen Kosten deutlich unter dem Sticker-Preis liegen und die Labs ständig Inferenz-Effizienz, Caching, Batching, Distillation und Chip-Auslastung verbessern, könnte der 200-Dollar-Plan rational sein. Die Strategie könnte lauten: Nutzer mit enormen Mengen an billiger Intelligenz versorgen, während die Kostenteile darunter sinken. Das bedeutet, die Labs glauben, dass Inferenz-Kosten kontinuierlich fallen werden.

    Entscheidend ist die strategische Verschiebung: OpenAI und Anthropic wollen nicht ewig nur API-Unternehmen sein, die rohe Intelligenz verkaufen. Rohe Intelligenz wird vergleichbar, verteilt und zu Commodity-Preisen konkurrieren. Der Wert verschiebt sich auf das, was um Intelligenz herum gebaut wird – auf die Harness. Codeex zeigt das Prinzip: Es beeindruckt nicht nur, weil das Modell intelligent ist, sondern weil es in einer Harness sitzt, die den Job versteht – Repos sehen, Dateien bearbeiten, Tests laufen, Fehler inspizieren, Ă„nderungen nachverfolggen, den Computer nutzen, Knowledge Work durchlaufen. Das Produkt ist nicht „ein Modell, das Code kann”, sondern „ein System, das an allgemeiner Knowledge Work teilnehmen kann”.

    Das Kernproblem für die Labs ist der Kontext: OpenAI und Anthropic wissen nicht, wie ein Unternehmen funktioniert, wo echte Dokumente liegen, welche Salesforce-Felder wichtig sind, welche Genehmigungsschritte real sind, wer Ausnahmen genehmigen darf, welche Tabelle echte Quelle der Wahrheit ist. Unternehmen haben private Kontextinformation – ein massiver informationeller Vorteil. Der Kampf ist darüber, wer seinen Vorteil schneller in bessere Harnesses verwandelt. Forward Deployed Engineering ist der Labs-Ansatz, dieses Kontextproblem zu überwinden: Die Labs entsenden Menschen ins Unternehmen, mappen Workflows, verbinden Tools, lernen echte Use Cases kennen, adaptieren Produkte. Sie verwandeln generische Harnesses in unternehmensspezifische Harnesses. Wenn das funktioniert, mietet der Kunde nicht nur Token – der Kunde reorganisiert Arbeit um die Lab-Systeme herum. Das ist lockier und wertvoller.

    FĂĽr Unternehmen ist die strategische Frage nicht „OpenAI oder Anthropic?” sondern „Harness mieten oder bauen?” Harness bauen bedeutet nicht, ein Grenzmodell zu trainieren (fast kein Unternehmen sollte das tun), sondern die Schicht zu besitzen, die entscheidet, welches Modell fĂĽr welche Aufgabe verwendet wird – Kontext, Evaluationen, Berechtigungen, Workflow-Definitionen, Review-Prozesse, Routing-Logik. Wenn man die Harness besitzt, sind Labs Lieferanten, die konkurrieren. Wenn die Lab die Harness besitzt, wird die Lab zur Betriebsebene. Das ist die Weggabelung.

    Recursive Self-Improvement hat hier einen praktischeren Aspekt: Bessere Modelle helfen Labs, ihre eigenen Produkte schneller zu verbessern – Code schneller verbessern, Evals schneller verbessern, Routing schneller tunen, Inferenz schneller optimieren, Modelle schneller komprimieren, Harnesses schneller machen. Das ist ein Iterationsvorteil. Das bullische Szenario: OpenAI und Anthropic managen Token-Kosten, konkurrieren ĂĽber Skalierung und Effizienz mit Open-Source, verbessern eigene Produkte schneller als Kunden, bauen Harnesses so gut, dass Unternehmen nicht selbst bauen. Das ist realistisch – die meisten Unternehmen sind langsam, verstehen ihre eigenen Workflows nicht, können nicht definieren, was „fertig” bedeutet, bauen keine Routing-Logik, warten Evals nicht. Sie kaufen das Produkt, das funktioniert.

    Das bärische Szenario: Unternehmen lernen, eigene Harnesses zu bauen, Labs werden Intelligenz-Lieferanten statt Work-Layer-Besitzer. Sie machen immer noch viel Geld, aber die Valuation verschiebt sich – die Workflow-Ebene wird vom Unternehmen captured, die Lab sitzt auf Token-Marge. Mit fallenden Token-Preisen ist das eine viel weniger dominante Position.

    Worauf beim S-1 zu achten ist: nicht Umsatz, Nutzerwachstum oder Valuation, sondern ob Power User billiger zu servieren werden, ob Gross Margin mit Nutzungswachstum steigt, ob Enterprise-Kunden scalable Software oder Custom-Labor kaufen, ob echte Workflows im Produkt entstehen, ob Forward Deployed Engineering eine Brücke zu besseren Produkten ist oder permanent nötig bleibt.

    Für nicht-Investoren gilt praktisch: Baue deine eigene Harness oder lass jemand anderen sie besitzen? Ein AI-Strategy bedeutet nicht Prompting (das ist dünn), sondern Harness-Bau – wiederkehrende Jobs klar definieren, dem Modell richtigen Kontext geben, Dateien und Tools verbinden, Output checken, System verbessern. Das ist der Leverage. Billige Intelligenz kommt sowieso. Die Frage ist, wer weiß, wie man sie nutzt. Die IPOs von OpenAI und Anthropic sind der erste öffentliche Test einer These: Können die Labs Token billig genug machen und Harnesses schnell genug bauen, um die Work-Layer zu besitzen? Oder bauen Unternehmen mit billigeren Token ihre eigenen Harnesses und behalten mehr Wert? Billige Intelligenz ermöglicht die Token-Ökonomie. Die Harness ist der Motor, der sie wertvoll macht. Wer die Harness kontrolliert, hat die dominante Position in der Token-Ökonomie der Zukunft.

    **Format:** Meinung/Reflexion; explizit thematisiert: OpenAI, Anthropic, Codeex, Claude Code, DeepSeek (kurz erwähnt als Modell-Konkurrenz).

  • Don’t build more AI agents until you watch this
    17.6.2026, 14:00:31

    # Zusammenfassung: Vercel reduzierte Agenten-Tools um 80% – und sie wurden besser

    Das zentrale Paradox: Vercel verbesserte seinen Sales-Agent nicht durch das Hinzufügen von Features, sondern durch deren Reduktion. Die übliche Annahme – mehr Tools, mehr Kontext, mehr Autonomie machen Agenten besser – wird hier widerlegt.

    Vercel studierte einen Top-Verkäufer, um seinen echten Workflow nachzubilden: Klassifizierung von eingehenden Nachrichten (Leads vs. Spam vs. Support), Leadqualifizierung, Unternehmensrecherche, Antwortentwurf und Routing von Support-Anfragen. Der Agent reproduzierte diese Arbeitsabläufe, blieb aber unter menschlicher Kontrolle – das Ziel war nicht Automatisierung pur, sondern Beschleunigung wiederholbarer Prozesse.

    Die tiefere Lektion: Der Agent wurde besser, nicht weil Tools hinzugefĂĽgt wurden, sondern weil sie entfernt wurden. Das widerlegt die typische Entwicklungspraxis, bei der man iterativ Tools, Integrationen und Speicher anhäuft. Das wahre Thema 2026 ist nicht „kann man Agenten bauen”, sondern „wie hält man die Infrastruktur um einen Agenten gesund”.

    **Die vier Kernprinzipien der Agent-Maintenance:**

    1. **Modelle sind instabil nach oben**: Bessere Modelle erfordern andere „Harnesses” (Workbenches). Eine Regel, die einen schwachen Agent schĂĽtzte, kann einen besseren blockieren. Ein Tool, das fehlende Fähigkeiten kompensierte, kann einen verbesserten Modell verwirren. Das ist ein neues Wartungsproblem – Systeme können nicht nur durch Verschlechterung, sondern durch Verbesserung brechen.

    2. **Agenten erben Schmutz der Systeme**: Ein veraltetes Wiki, geänderte Prozesse, driftende Prompts – bei normaler Software sind das Unannehmlichkeiten. Bei Agenten sind sie gefährlich, weil Agenten proaktiv arbeiten, Empfehlungen verfassen und Aufgaben erstellen. Sie merken nicht, dass die Quelle falsch ist, sie arbeiten einfach weiter.

    3. **Die groĂźen AI-Firmen bauen Harnesses bewusst**: OpenAI mit Claude (sic – gemeint ist wohl Codex/ChatGPT) und Anthropic mit Claude investieren massiv in die Infrastruktur *um* die Modelle herum – Terminal, Browser, Dateien, Memory, Genehmigungen, Sandboxing, Logs. Das ist mehr als ein Chat mit besserem Gehirn; es’s eine sorgfältig gepflegte Werkbank. Der Wettbewerbsvorteil kommt nicht nur von Modellkraft, sondern davon, dass bessere Modelle helfen, bessere Harnesses zu bauen und zu testen – ein Flywheel.

    4. **Definiere deine Harness**: Jeder, der einen Agent nutzt, muss fragen: Was ist mein Setup? Das kann Projektordner, Memory, Prompts, Quellen-Docs, Genehmigungsschritte, Dateiberechtigungen sein. Die Frage ist nicht technisch abstrakt, sondern praktisch: Wie hält der Agent Kontakt mit meinen echten Dateien? Was soll er zuerst lesen? Was ignorieren? Wann fragen, bevor er etwas ändert? Das ändert sich, wenn Modelle besser werden.

    **FĂĽnf Wartungs-Checks fĂĽr ernsthaft genutzte Agenten:**

    – **Was frisst der Agent?** Sind die Quellen aktuell? Hat sich der Workflow verschoben?
    – **Welche Reichweite hat er?** Nur lesen, oder kann er erstellen, updaten, posten, Geld ausgeben?
    – **Stimmt die Job-Definition?** Ist es immer noch ein Summary-Agent oder wurde das still schweigend zu Planning/Routing?
    – **Gibt es Nachweise?** Nicht „Kunden sind frustriert”, sondern: Tickets verlinken, Kundenzitate mit Quellen, nachverfolgbare Trails fĂĽr Menschen.
    – **Liefert der Agent echten Wert?** Wird das Output gelesen? Ă„ndert es Arbeit? Spart es Zeit nach Review? Oder schuf es nur neue Arbeitspiles?

    **Der zentrale Gedanke (mit RĂĽckgriff auf Stewart Brands *Maintenance of Everything*):** Agenten sind wie Segelboote, nicht wie Apps. Sie leben in Bewegung – das Modell ändert sich innen, die Welt ändert sich auĂźen. Ein Segelboot wird nicht wegen schlechter Konstruktion gewartet, sondern weil es lebt. Genauso: Agenten brechen in zwei Richtungen – durch äuĂźere Drift und durch innere Modellverbesserung. Einfachheit und bewusste Reduktion sind SchlĂĽssel zur Wartung. Die Harness-Frage „Was sollte ich später löschen?” ist reifer als „Was kann ich noch hinzufĂĽgen?”

    **Claude erwähnt, OpenAI/Codex erwähnt (sowie Anthropic/Claude Code); Meinung/Reflexion mit Deep-Dive-Elementen.**

Alejandro AO (1 neues Video)

  • Kimi K2.7 + Opus 4.8 = BEST Coding Duo??
    15.6.2026, 15:40:30

    **Zusammenfassung:**

    Das Video zeigt eine praktische Strategie zur Kostenoptimierung von KI-gestützter Softwareentwicklung: Statt ein teures Modell (wie Claude Opus oder GPT-5.5) für alle Phasen eines Coding-Tasks zu nutzen, wird der Workflow in zwei Teile aufgesplittet. Der erste Teil umfasst Verständnis des Issues, Code-Base-Exploration und Planung; der zweite die eigentliche Implementierung und Code Review.

    Der Creator testet dies mit dem neu veröffentlichten Kimi K2.7, einem auf Coding spezialisierten Open-Source-Modell, das deutlich günstiger ist als GPT-5.5 und Opus (Input: 0,95 $ vs. 30 $ pro Million Tokens), dabei aber ähnliche Coding-Benchmarks erreicht. Im konkreten Experiment an einem CPython-GitHub-Issue (Class-scope comprehension mit Lambda raises SystemError) wird jedes Modell sowohl als Planner als auch als Implementer getestet. Beide Judges (GPT-5.5 und Opus 4.8) bewerten die Lösungen; der Creator misst Kosten und Qualität.

    Die Ergebnisse zeigen: Alle getesteten Kombinationen produzierten mergefähige PRs mit nur etwa 1-Punkt-Variation auf der 10er-Skala. Kimi-Kombinationen sind etwa sieben Mal günstiger als reine GPT/Opus-Setups. Die klare Tendenz ist, dass GPT-5.5 oder Opus 4.8 als Planner und Kimi K2.7 als Implementer das beste Kosten-Qualitäts-Verhältnis bietet – man spart teure Tokens der teuren Modelle, ohne auf Qualität zu verzichten. Kimi K2.7 ist weniger verbose als K2.6, daher sogar kostengünstiger troütz minimaler Preis-Erhöhung.

    Der Creator stellt zudem das Tool „DuoBench” zur VerfĂĽgung, mit dem Nutzer solche Benchmarks auf eigenen GitHub-Issues durchfĂĽhren können (per `npx skills add` installierbar, nutzt Pi-Konfiguration).

    **Abschluss:** Kimi K2.7, Claude Opus, GPT-5.5, Open-Source – Demo/Benchmarking mit praktischem Tool-Release.

Alex Finn (1 neues Video)

  • How to get unlimited AI for free (GLM 5.2 local)
    19.6.2026, 18:15:48

    # Zusammenfassung: GLM 5.2 lokal auf dem Mac Studio

    Der Video behandelt die Unsloth-Version von GLM 5.2, einem Open-Weights-Modell, das lokal auf eigener Hardware läuft und laut Aussage des Erstellers vergleichbar mit Claude Opus 4.8 ist.

    **Demonstration & Capabilities:** Der Creator zeigt ein 3D-Ego-Shooter-Spiel, das von GLM 5.2 über einen Hermes-Agenten komplett lokal generiert wurde – inklusive selbstverbesserung, wo das Modell selbst das Spiel testete und seine Fähigkeiten optimierte.

    **Hardware-Anforderungen:** Die 2-Bit-Quantisierung benötigt etwa 250 GB Speicher (Mac Studio 256 GB minimal, 512 GB empfohlen). Für kleinere Hardware empfiehlt er Alternativen wie Googles Gemma 4 oder Nvidias NemoTron; bei besserer Hardware Qwen 3.6 27B oder größer.

    **Upsides lokaler Modelle:** Kostenlos & unbegrenzt, komplett privat (keine Datensendung in die Cloud), ermöglicht 24/7-Hintergrund-Agenten-Arbeit (z.B. Code-Überprüfung auf Sicherheit). Bei cloud-basierter Nutzung von GLM 5.2 sind die Preise günstiger als ChatGPT/Claude.

    **Downsides:** Deutlich langsamer als Cloud-Modelle, kleineres Context-Window. FĂĽr schnelle, interaktive Aufgaben bleiben Cloud-Modelle (Opus, ChatGPT) sinnvoll; lokale Modelle eignen sich fĂĽr passive, zeitunkritische Hintergrund-Tasks.

    **Setup-Prozess:** Der Creator nutzt seinen Hermes-Agenten einfach mit einem Link zur Unsloth-Ankündigung – der Agent lädt das Modell, richtet einen Server ein und konfiguriert einen neuen Hermes-Agenten damit ohne manuelle Schritte.

    **Zukunftsvision:** Der Creator prophezeit, dass innerhalb von 12 Monaten alle ein hochintelligentes lokales Modell auf günstigen Mac minis laufen haben werden, das 24/7 privat als persönlicher Agent im Hintergrund arbeitet.

    **Vorbereitung:** Experimentieren mit verfĂĽgbarer Hardware, Hermes/OpenClaw nutzen, kontinuierlich neue Modelle tracken und schnell einsetzen.

    **Explizite Tools/Modelle:** GLM 5.2 (Unsloth-Quantisierung), Hermes Agent, OpenClaw, Claude Opus 4.8, ChatGPT 5.5, Gemma 4, NemoTron, Qwen 3.6 27B, Codex — Demo & Anleitung mit starkem Fokus auf lokale AI-Infrastruktur.

Bart Slodyczka (1 neues Video)

  • Gemma 4 12B + Hermes Agent: Build Your Own AI Assistant
    15.6.2026, 12:00:28

    # Zusammenfassung

    Der Creator installiert Hermes Agent auf einem Mac Mini mit M4-Chip und 16 GB RAM, auf dem bereits Gemma 4 läuft, um einen lokalen KI-Assistenten zu bauen. Er nutzt Claude Code (Claude Desktop App mit Opus 4.8) als zentrale Steuereinheit, um sämtliche Setup-Prozesse automatisiert durchzuführen – von Systeminformationen auslesen über die Hermes-Installation bis zur Konfiguration.

    **Wichtige Setup-Schritte:**
    – Zunächst wird ĂĽberprĂĽft, dass der Mac immer angeschaltet bleibt (sonst schläft der Agent bei Bedarf ein)
    – Claude installiert und konfiguriert Hermes Agent ohne externe APIs oder bezahlte Services
    – Im LM Studio wird das Gemma-Modell (QAT-Variante mit 6,66 GB) geladen und die Kontextlänge (ca. 67.000 Token) sowie Flash-Attention-Settings optimiert, um Speicher zwischen Modell, Betriebssystem und Agent-Funktionen auszubalancieren
    – Gemma wird als Default-Modell in Hermes konfiguriert und getestet – die erste Antwort dauert ~2–3 Minuten (was die Rechenlast des M4 zeigt)

    **Praktisches Anwendungsbeispiel – Integration mit Zendesk:**
    Claude generiert ein Webhook-Setup fĂĽr Zendesk, das automatisch eingehende Support-Tickets an Hermes weiterleitet. Der Agent antwortet dann (basierend auf einer generierten FAQ zum Szenario eines Computer-Parts-Unternehmens) autonom auf Tickets. Bei den Demo-Tests verbrauchte das System fast alle 16 GB RAM und verarbeitete zwei parallele Tickets zĂĽgig, wobei realistische Antworten in wenigen Minuten entstanden.

    **Kernidee:** Claude Code operiert direkt im Terminal und kann daher Geräte-Hardware auslesen, Einstellungen ändern, Kommandozeilen-Tools installieren und testen – ohne manuelle Schritte. Der Creator hebt dies als zentrale Erkenntnis hervor: statt manuelle Konfiguration ist es deutlich effizienter, ein leistungsstarkes KI-Modell die Automation durchführen zu lassen.

    **Explizit erwähnt:** Claude Code (Claude Desktop App), Gemma 4, Hermes Agent, LM Studio, LM Link, Zendesk, Tail Scale, Docker — Tutorial mit praktischer Demonstration.

Ben AI (1 neues Video)

  • How to De-Slop Every AI Output Forever (With 1 Skill)
    16.6.2026, 08:56:30

    **Zusammenfassung**

    Das Video stellt einen neuen Skill vor, der Qualitätskontrolle fĂĽr KI-Outputs durchfĂĽhrt – quasi ein “Spell-Check gegen AI-Slop”. Der Autor beschreibt zunächst das Problem: Während KI-Tools die individuelle Produktivität steigern, fĂĽhrt ihre breite Nutzung in Unternehmen oft zu minderwertigen Inhalten (Marketing-Posts, E-Mails, interne Dokumente), weil jeder Mitarbeiter einen anderen QualitätsmaĂźstab hat und KI diese MaĂźstäbe nicht durchsetzt.

    Der DLOP-Skill arbeitet in zwei Schichten: Erst prĂĽft er universelle AI-Slop-Muster (unnatĂĽrliche Gedankenstriche, typische AI-Schreibweisen, WidersprĂĽche, FaktenprĂĽfung), danach läuft eine unternehmensgerechte PrĂĽfung (Passung zu Tonalität, Brand Identity, Unternehmensstrategie, Fakten). Der Skill erkennt zunächst den Output-Typ (Marketingbeitrag, Kundenservice-Reply etc.), setzt dann drei Sub-Agenten ein, um unvoreingenommen gegen die Kriterien zu bewerten, und gibt eines von drei Verdikten aus: „Go to go”, „Go to go, aber noch einige Fixes”, oder „Not ready”. Zu jedem Punkt liefert er Verbesserungsvorschläge mit Quellenangaben.

    Zusätzlich protokolliert ein DLOP-Log jeden Durchlauf, um Muster in unternehmensweiten AI-Output-Problemen zu erkennen. Der Skill kann als letzter Schritt in andere Skills integriert werden und funktioniert mit angepassten Referenzdateien fĂĽr Brand-Voice, Faktenchecklisten und visuelle Richtlinien. Der Autor empfiehlt, ihn vor jeder Veröffentlichung zu nutzen. Der kostenlose Skill ist zum Download verfĂĽgbar, mit Blanks zur Personalisierung; zusätzlich gibt es einen “DLOP-Builder-Skill” in seiner AI-Accelerator-Community fĂĽr schrittweise Anpassung.

    **Abschluss:** Claude und der DLOP-Skill werden diskutiert; Format ist eine Demo/Tutorial-Meinung-Mischung mit Anwendungsbeispielen.

Brian Casel

Keine neuen Videos in diesem Zeitraum.

Coding with Lewis

Keine neuen Videos in diesem Zeitraum.

Cole Medin (2 neues Videos)

  • Omnigent: The New Meta-Harness for EVERY Coding Agent – Claude Code, Codex, Pi, More
    15.6.2026, 14:42:51

    **Zusammenfassung: Omni Agent – Meta-Harness für AI-Coding-Workflows**

    Omni Agent ist ein neu veröffentlichtes Open-Source-Tool von Databricks, das als Meta-Harness fungiert und mehrere AI-Coding-Assistenten orchestriert. Ein Meta-Harness ist eine Schicht oberhalb einzelner Coding-Assistenten, die es ermöglicht, längere Workflows mit verschiedenen Modellen zu kombinieren – etwa Claude Code für die Implementierung und Codeex für Code-Reviews. Der Kerngedanke: Der Harness (System Prompt, Tools, Skills, Workflows, Policies) ist mittlerweile genauso wichtig wie das zugrundeliegende Modell selbst, besonders angesichts von Modelleinschränkungen.

    Omni Agent wird in Minuten über ein einzelnes Setup-Kommando installiert und erfordert keine neue Authentifizierung, da es bestehende CLI-Credentials nutzt. Die Web-UI zeigt eine Agent-First-Oberfläche mit Chat-Session, verschiedenen auswählbaren Coding-Assistenten und Orchestrator-Agents. Das Tool bringt zwei Beispiel-Orchestratoren mit: **Poly** (orchestriert Workflows zwischen Claude und Codeex, z.B. Implementierung durch einen Agent, Review durch einen anderen) und **Debbie** (lässt zwei Agenten zu einem Thema argumentieren und syntetisiert ihre Perspektiven).

    Custom Agents und Orchestratoren lassen sich einfach bauen: Jeder besteht aus Konfiguration, Skills und aufrufbaren Agents. Die Konfiguration enthält Executor (welches Modell), System Prompt, Sandboxing-Optionen (unsandboxed, Docker, E2B) und Guardrails. Ein Beispiel: Ein Custom Agent mit Guard Rail, der Claude Code autonome Befehle erlaubt, aber Force-Pushes zu Git blockiert und zur Genehmigung fragt. Solche Policies sind Python-Code und lassen sich ebenfalls von AI-Assistenten generieren.

    Omni Agent läuft lokal auf dem Rechner, lässt sich aber auch als Server deployen. Ein Mehrgeräte-Feature erlaubt Live-Collaboration: Die gleiche Session kann parallel auf Desktop und Smartphone bearbeitet werden, etwa über das gleiche Wi-Fi-Netzwerk oder weltweit über gehostete Instanz.

    Der Kern-Argument des Videos: Top-Engineers nutzen nicht mehr ein einzelnes Modell oder Tool für ihre Workflows, sondern orchestrieren mehrere, um deren unterschiedliche Stärken zu nutzen, Token-Optimierung zu erreichen und Bias zu vermeiden (z.B. dadurch, dass der Code-Reviewer ein anderer Agent als der Implementierer ist). Omni Agent macht diese Meta-Harness-Struktur produktionsreif und zugänglich.

    **Explizit thematisierte Tools:** Omni Agent (Databricks, Open-Source), Claude Code, Codeex, Pi, Ollama, Docker, E2B, Git — Demo mit Meinung/Reflexion zu Harness-Engineering.

  • The Creators of Claude Code and OpenClaw don’t Prompt Their Agents Anymore?!
    18.6.2026, 00:00:08

    # Zusammenfassung: Loop Engineering fĂĽr AI-Coding

    Das Video kritisiert den gehypten Begriff “Loop Engineering” und zeigt, dass die dahinter stehende Idee zwar interessant, aber in der Praxis problematisch ist. Der Kern: Man konfiguriert Schleifen, in denen AI-Coding-Assistenten eigenständig Aufgaben in Iterationen abarbeiten, statt sie manuell zu prompen.

    **Die drei Grundkonzepte (Basis):**
    – `/loop`: Wiederkehrende Checks in festem Intervall (z.B. alle 5 Minuten neue GitHub-Issues prĂĽfen)
    – `/goal`: Agent arbeitet bis eine Bedingung erfĂĽllt ist
    – `/routines`: Zeitgesteuerte Aufgaben

    **Die drei Hauptprobleme:**
    1. **Qualität**: Loop Engineering liefert nicht die besten Ergebnisse — es ist eher Marketing-Hype. Praktisch ist es nur für PoCs sinnvoll.
    2. **Kosten**: Der Orchestrator muss ständig Entscheidungen treffen (wie viele Worker? wie viele Loops?), Kontext hin- und herschicken — über eine Million Token für eine einfache Anwendung sind schnell erreicht.
    3. **Kontextbloat**: Wenn man in einer Claude-Code-Session loopt, wächst der Kontext und überwältigt das Modell. Mehrere separate Sessions sind nötig.

    **Die Lösung — Harness-Engineering (über Arkon):**
    Der Creator nutzt sein Tool **Arkon**, um Workflows zu orchestrieren, die mehrere Coding-Agent-Sessions parallel steuern. Dadurch wird es:
    – **Deterministisch**: Der Prozess ist in einer Workflow-Datei definiert, nicht vom Agent gesteuert
    – **Kostenoptimiert**: Jeder Step kann ein anderes Modell verwenden (z.B. kleinere Modelle fĂĽr Klassifikation, teurere fĂĽr Code-Implementierung)
    – **Zuverlässig**: Durabilität durch externe Postgres-Datenbank (Neon), Resumability, menschliche Kontrolle an kritischen Punkten
    – **Parallelisierbar**: Mehrere GitHub-Issues gleichzeitig ĂĽber Work Trees isoliert bearbeiten

    **Praktisches Beispiel**: Ein Workflow, der GitHub-Issues mit vier parallelen Sessions fixt, dann vier weitere Sessions für Code-Reviews startet — alles orchestriert von einer Claude-Code-Instanz, aber nicht als ein aufgeblähter Loop, sondern als verteilte, getrackte Arbeit.

    **Zusätzlich gezeigt**: Ein selbstgebautes **Dashboard** (Open-Source), das Observability bietet: Alle Loops in einer Postgres-DB als State speichern, der Orchestrator liest diesen State, ruft Worker auf, diese updaten den State. Mit **Retool** einfach in die Cloud deployt — mit Permissions, Audit Trails und Chat-gesteuerten Änderungen.

    **Kernthese**: Loop Engineering verdient seinen eigenen Namen nicht; es ist einfach orchestriertes Arbeiten mit Multi-Agent-Workflows. Ohne eine Harness-Architektur (Durabilität, Kostenmanagement, Prozess-Determinismus) wird es teuer, unzuverlässig und unkontrollierbar.

    *Demo von Arkon + selbstgebautem Dashboard mit Postgres/Neon, gelegentliche Erwähnung von Claude Code, erwähnt werden auch Haiku, Kimmy K 2.7 und Retool für Cloud-Deployment; Meinung/Reflexion mit praktischen Demos.*

Dave Ebbelaar (1 neues Video)

  • The Best AI Automation Stack to Learn in 2026
    19.6.2026, 13:28:15

    # Zusammenfassung

    Das Video stellt einen bewährten Tech-Stack für AI-Automationen vor, der aus fünf Schichten besteht und langfristig skalierbar ist — im Gegensatz zu kurzlebigen Einzeltools.

    **Backend-Layer**: Python ist die Grundlage. Zusätzlich werden Fast API (zur Erstellung von API-Endpunkten für Webhooks und Kommunikation) und Celery (für Background-Worker und Job-Scheduling) empfohlen. Diese Kombination bildet das Herzstück für trigger-basierte und zeitgesteuerte Automationen.

    **Datenbank-Layer**: PostgreSQL (via Supabase als gehostete Wrapper-Lösung) reicht aus und skaliert auch für Millionen von Datensätzen. Supabase bietet zusätzlich Authentication und ein Admin-Dashboard; Vektoren können ebenfalls in PostgreSQL gespeichert werden.

    **Frontend-Layer**: React (JavaScript-Komponentenbibliothek), Vite (Build-Tool und Entwicklungsserver) und Shadcn UI (vorgefertigte Komponenten-Bibliothek mit Graphs, Login, Buttons, Chat-Interfaces etc.) ermöglichen schnelle Entwicklung interner Tools und Dashboards. Der Code von Shadcn wird ins Projekt importiert, nicht als externe Abhängigkeit, was AI-Coding-Agenten erlaubt, damit zu arbeiten.

    **AI-Layer**: Direkter API-Zugriff auf Sprachmodelle (OpenAI, Anthropic) oder via Enterprise-Provider (AWS, Azure, Google Cloud) mit zentralisiertem Billing und besseren Datenschutzkontrollen. Der Aufwand für diese Schicht ist minimal — meist ein einfacher API-Call.

    **Infrastructure-Layer**: Docker zur Containerisierung, dann Deployment entweder auf einsteigerfreundlichen Plattformen wie Railway oder auf VPS/Cloud-Services (AWS, Azure, GCP, Hetzner). Railway bietet MCP-Server zur Verwaltung und kann von Coding-Agenten angesteuert werden.

    Der Autor betont, dass diese etablierten Techniken seit Jahrzehnten existieren und nicht durch neue Tools ersetzt werden mĂĽssen. Er kĂĽndigt ein 4-Stunden-Live-Build-Video an, in dem ein Document Co-Pilot mit dem gesamten Stack gebaut wird, zum Reverse-Engineering und als Roadmap.

    **Explizit genannte Provider/Tools**: Python, Fast API, Celery, PostgreSQL, Supabase, React, Vite, Shadcn UI, OpenAI, Anthropic, AWS, Azure, Google Cloud, Railway, Docker, Hetzner, VPS — **Format**: Deep-Dive mit Meinung/Reflexion.

David Shapiro (2 neues Videos)

  • “The window has closed”
    15.6.2026, 14:20:13

    **Zusammenfassung:**

    Das Video analysiert einen Stimmungswechsel in der AI-Branche, den der Sprecher auf die IPOs von SpaceX, OpenAI und Anthropic zurückführt. Obwohl sich strukturell nichts geändert habe, hätten sich Narrative verschoben, was die Normalisierung von KI als etablierte Industrie signalisiere.

    Der Sprecher beleuchtet zwei viral gehende Artikel: Satya Nadella argumentiert, dass bloßes Token-Verkaufen nicht ausreicht und Ökosysteme sowie Lernschleifen in Organisationen notwendig sind. Andrew Kuran hingegen vertrittdie These, dass das Wettlaufsfenster geschlossen ist und Amerika das AI-Rennen gewonnen habe – mit der Freisetzung von Fable oder Mythos als Tipping Point, der anderen Nationen wie China und Europa dauerhaft abhängen lässt.

    Der Sprecher nutzt eine Kartoffel-Analogie, um das Token-Preisdilemma zu erklären: Während die Nachfrage nach Tokens (gemessen in Milliarden) massiv steigen wird, fallen die Kosten pro Token kontinuierlich. Das bedeute, dass Geld nicht im direkten Token-Verkauf liegt, sondern in den Tools, die Tokens generieren – oder in den Software-Outputs, die Tokens ermöglichen. Er sieht das Dilemma zwischen zwei Szenarien: Entweder profitiert Microsoft als Infrastruktur-Verkäufer (Tooling) oder OpenAI und Anthropic als “Software-Feuer­schläuche” werden Microsoft dominieren. Fazit: Token-Verkauf ist keine echte Geschäftsmodell-Grundlage, sondern bloĂźe Infrastruktur wie Elektrizität – wertvoll sind die Outputs.

    **Schlussbemerkung:** Hauptakteure sind Microsoft, OpenAI, Anthropic, SpaceX und China; das Format ist Meinung/Reflexion mit Industrie-Kontextualisierung.

  • They think FOOM is near
    14.6.2026, 13:14:57

    # Zusammenfassung

    Der Sprecher berichtet von einer Krise bei Anthropic im Juni: Das Unternehmen veröffentlichte Fable 5 (öffentliche Version von Claude 5), woraufhin mehrere Skandale aufdeckt wurden. Erstens implementierte Anthropic versteckte Einschränkungen, die das Modell bei komplexer KI- und Machine-Learning-Forschung zu einem schwächeren Modell (Opus 4.8) umleitet – angeblich um rekursive Selbstverbesserung zu verhindern. Zweitens weigerte sich Anthropic, ein von einem Amazon-Forschungsteam gemeldetes Jailbreak zu beheben, woraufhin das US-Handelsministerium ein globales Verbot gegen die Nutzung durch Nicht-US-Bürger erließ.

    Der Sprecher vertritt die These, dass Anthropic diese MaĂźnahmen nicht hauptsächlich zur Bremsung von Konkurrenten ergreift, sondern aus ideologischen GrĂĽnden: Das Unternehmen ist vom effektiven Altruismus und Less-Wrong-Denken (gegrĂĽndet von Eliezer Yudkowsky) geprägt und fĂĽrchtet die „Fume-Hypothese” (schneller Takeoff) sowie die „treacherous turn” – die Idee, dass KI-Systeme zunächst wohlwollend erscheinen, bis sie genug Macht akkumuliert haben. Anthropic möchte nach dieser Theorie durch Kontrolle der besten Modelle den „Kill-Switch” in der Hand behalten. Der Sprecher kritisiert auch Darios BegrĂĽndung fĂĽr das Umgehen normaler Verfahren als „auĂźerordentliche Umstände” und vergleicht die Rhetorik mit manipulativen Taktiken.

    Abschließend erwähnt der Sprecher, dass er seine Blog- und Videoproduktion verlangsamt, um sich auf die Audiobook-Aufnahme zu konzentrieren.

    **Meinung/Reflexion zu Anthropic, Claude und Fable; keine spezifischen AI-Tools durch Namen identifiziert auĂźer den genannten Modellen.**

Everlast AI (5 neues Videos)

  • KI-News: SO leicht hackt man Claude Mythos! KI-Jailbreaks erklärt & Codex Updates (Florian Tramèr)
    21.6.2026, 08:15:12

    # Zusammenfassung

    **Robotik & Humanoids**: Chinesische Forscher haben Humanoid GBT entwickelt, ein auf 2 Milliarden Bewegungsframes trainiertes KI-Modell, das Roboter wie den Unitree G1 in Echtzeit steuert und untrainierte Bewegungen ausführt. Ein anderes Startup-Modell dirigiert mehrere verschiedene Roboterkörper ohne echte Trainingsaufnahmen, nur aus Menschenbeobachtung. Tanzroboter sind mittlerweile eine eigene Entertainment-Industrie; Leim X Dynamics zeigte Luna, einen 1,60m-Humanoiden mit KI-generierter Bewegung und Mimik, programmierbar ohne Code. China dominiert den Markt massiv – 90% der 2025 ausgelieferten 13.000 Humanoiden kamen aus chinesischer Produktion. Die Regierung ordnete an, bis 31. Dezember 10.000 Roboter aus Unterhaltung in Fabriken, Lager und Krankenhäuser zu verlegen.

    **Codex & Self-Goal-Setting**: Codex kann sich jetzt selbst Ziele setzen, ohne dass der Nutzer `/slash-goal` eingeben muss. Das neue Plugin “Record and Replay” ermöglicht es, einen Arbeitsablauf als Video aufzuzeichnen – der Agent schaut zu und verwandelt das Gelernte in einen wiederverwendbaren Skill. Beispiel: YouTube-Upload-Workflow aufnehmen, danach automatisch auf weitere Videos anwenden. Kritik: Computeruse-Vollzugriff auf den eigenen Rechner birgt Sicherheitsrisiken (Prompt Injection), oft ist es unnötig, da Agent-native Workflows (ĂĽber APIs, CLI, Tools) dasselbe erreichen.

    **Jailbreaks & KI-Sicherheit**: Im Interview mit Professor Dr. Florian Tramer wird erklärt, dass Jailbreaks Tricks sind, um SicherheitsmaĂźnahmen zu umgehen – entweder durch Täuschung oder Zerlegung gefährlicher Fragen in ungefährliche Teile. Das Problem bei Claude Haiku 5: Die SicherheitsmaĂźnahmen waren so streng, dass das Modell selbst harmlose Cybersicherheitsfragen ablehnte (z.B. “Addiere zwei SicherheitslĂĽcken”). Bei Fable 5 wurde bei Ablehnung auf das schwächere Opus-Modell zurĂĽckgegriffen – dies wurde ausgenutzt. Die Balance zwischen Hilfreichkeit und Sicherheit ist wissenschaftlich schwierig.

    **OpenAI-Updates**: GPT BD1 (evtl. neuer Name) wird großes Update mit bidirektionalem Modell – gleichzeitiges Hören und Sprechen mit Tool-Calls in Echtzeit, im Gegensatz zu aktuellen halb-duplex Voice-Modi. Die neue Super-App Codex erhält UI-Updates (Pad/Orb). Geplant: Pay-per-Use-Pricing statt abonnementbasierter Modelle.

    **Google Agent Resource Discovery (ARD)**: Neuer offener Standard – Websites hinterlegen Skills, MCPs, Tools in `.well-known/aicatalog`. Agenten können dann automatisch diese Kataloge durchsuchen, ohne dass Nutzer MCPs manuell suchen müssen (z.B. Fluggesellschaft bietet Booking-Skills automatisch an).

    **Claude-Design & Artifacts**: Cloud Design-Brandingrichtlinien lassen sich speichern und über alle Ressourcen anwenden. Artefakte (visuelle Ansichten von Code, Dashboards, Websites) sind neu in Beta für Teams und Enterprise in Claude Code, sollen später zu Pro/Max ausgerollt werden.

    **Open Source & Modellwettbewerb**: GLM 5.2 (3 Milliarden Parameter, Open Rats) bietet 1-Million-Token-Kontext und hält in Design-Arena (User-voted Benchmark) mit Claude Haiku 5 und GPT 5.6 Pro mit. Testers schätzen: Kein großer Unterschied mehr – Open-Source-Modelle hängen nur noch 3–4 Monate hinterher, nicht 6–8 wie früher. Elons Prognose: Q1 2027 für Open Source bei Mythos-Level; GLM-Gründer sagt: noch dieses Jahr. Wichtig: GLM 5.2 lässt sich kostenlos über OpenRouter im Corporate-LM-System anbinden; 2-Bit-quantisierte Version (82% Genauigkeit) läuft auf 256GB Mac.

    **Tokens pro Dollar**: Für $3000 erhältst du ca. 6x mehr Tokens bei GLM 5.2 als Opus 4.8, und 30x mehr als bei DeepSeek.

    **Scale AI Studie**: Nur 6,5% der Unternehmen setzen KI produktiv ein (Definition: über mehrere Funktionen integriert, >50% Piloten in Produktion, Geschäftsziele deutlich übertroffen). Diese 6,5% sind 3x schneller, bauen hybrid mit Partnern statt Off-the-shelf-Tools, und legen Daten & Architektur vor Code fest. Führungssupport ist hier der unwichtigste Beschleuniger (sie haben ihn längst).

    **Mistral & Marktsituation**: Mistral-CEO Arthur Mensch kündigt Modell für Sommer an – neue Fähigkeiten, größer, Early Access ab Juli. Aktuelles Top-Mistral-Modell ist teurer und schwächer als GPT 4 Nano. ChatGPT fällt erstmals unter 50% Marktanteil (46,4%), Claude steigt auf 10,3%, Google Gemini wächst. Pay-per-Use-Preismodelle werden geplant. Lokale KI wird zur notwendigen Backup-Strategie.

    **Agent-Native Workflows**: Praktisches Beispiel: PDF von Website downloaden statt Computeruse – Agent erstellt Wegwerf-Account bei Agentmail, trägt Daten ein, downloaded PDF aus eigenem Postfach, öffnet im Browser. Das ist die “Building Block Economy”: Skills, Tools, MCPs, CLI, APIs statt manueller UI-Bedienung oder Computeruse.

    **Thematisierte AI-Tools/Anbieter**: Codex, Claude, OpenAI (GPT 5.6 Pro, BD1), Google (Gemini, ARD), GLM 5.2, DeepSeek, Mistral, OpenRouter, Corporate LM, Agentmail, Cursor, Anthropic. **Format**: News-Update/Roundup mit Deep-Dives zu Sicherheit, Open-Source-Wettbewerb und Agent-native Workflows; enthält Live-Interview mit AI-Sicherheitsforscher.

  • 200 Kunden reaktiviert & neue Vermietungen durch KI-Agent als Makler | Everlast AI Erfahrung
    19.6.2026, 14:45:12

    # Zusammenfassung: Stefan Hoffmann ĂĽber seine Erfahrung mit dem Telefonagenten von Everlast

    Stefan Hoffmann, Immobilienmakler auf Mallorca seit 20 Jahren, berichtet von seinem Glücksmoment, als er seinen ersten Telefonagenten erfolgreich in Betrieb nahm – ein Erlebnis, das er mit der Geburt eines Kindes vergleicht. Er begann 2022 mit ChatGPT, war begeistert von den KI-Fortschritten und entdeckte dann Everlast, einen Anbieter für Telefonagenten, über YouTube-Videos. Die Kompetenz von Leonard Schmedding (Gründer/Leiter von Everlast) und die prägnante, inhaltsreiche Wissensvermittlung überzeugten ihn, sich bewusst für Everlast zu entscheiden – nicht nur um ein Produkt zu kaufen, sondern um die Technologie selbst zu beherrschen.

    Hoffmann nutzt seinen Telefonagenten konkret fĂĽr Outbound-Calls, um Kundenstimmen abzufragen und inaktive Kunden zu reaktivieren. Nach dem Durchrufen von 200 Kunden konnte er 5% reaktivieren und erzielte daraus zwei Vermietungen. Zentral fĂĽr den Erfolg ist das richtige Systempromt (das „Drehbuch” des Agenten) und das Verständnis fĂĽr sinnvolle Use-Cases – nicht jede Automatisierungsidee macht Sinn. Der End-of-Call-Report dokumentiert automatisiert die Ergebnisse in einer Datenbank.

    Hoffmann betont, dass KI-Kompetenz heute zur unternehmerischen Hygiene wie Zähneputzen gehört und wer sich dem verweigert, wird schnell ein „schlechtes Erwachen” haben. Er vergleicht seinen Vertrag mit Everlast mit einem Personal Trainer – der Commitment erzwingt, dass man wirklich dabei bleibt. Wichtig ist auch eine unternehmensweite KI-Strategie, nicht nur Inselwissen einzelner. Everlast zeichnet sich laut Hoffmann dadurch aus, dass das Unternehmen nicht nur Umsatz machen will, sondern wirklich Kundennutzen bietet, indem es auch analysiert, welche Use-Cases keinen Sinn ergeben.

    **Everlast (Telefonagenten-Plattform), Demo/Praxisbericht.**

  • „China bereitet sich DARAUF vor und niemand schaut hin!” DAS wird jetzt passieren (Wolfgang Hirn)
    18.6.2026, 15:15:07

    # Zusammenfassung: Chinas technologischer Aufstieg und die Verschiebung der Geopolitik

    Der Journalist Wolfgang Hirn, der seit über 40 Jahren China beobachtet, zeichnet in diesem tiefgreifenden Gesprächsformat ein dramatisches Bild der geopolitischen Machtverschiebung durch Technologie – insbesondere durch Chips und seltene Erden.

    ## Die Chip-Revolution: Huaweis heimlicher Triumph

    Das zentrale Ereignis ist die kĂĽrzliche öffentliche AnkĂĽndigung durch Huawei-FĂĽhrungsperson Ren Zhengfei, dass das sogenannte Moorsche Gesetz (die kontinuierliche Miniaturisierung von Chips) zu Ende geht. Stattdessen verfolgt Huawei ein revolutionäres alternatives Verfahren namens „Tau” (Ď„). Hirn betont, dass Huawei dies nicht als Versuchsballon verkĂĽndet hätte – das Unternehmen plant bereits seit 16 Jahren in dieser Richtung und verfĂĽgt ĂĽber ein massives Forschungszentrum mit 100.000 Beschäftigten (etwa die Hälfte der 200.000 Huawei-Mitarbeiter). Bis 2031 soll Huawei Chips mit 1,4-Nanometer-Dichte-Ă„quivalenz fertigen – auf dem Niveau von TSMC (Taiwan Semiconductor Manufacturing Company).

    ## Die strategische Bedeutung: Das Gleichgewicht kippt

    Die bisherige geopolitische Bilanz ruhte auf gegenseitiger Erpressbarkeit: Die USA kontrollierten die Chipversorgung, China die seltenen Erden (86% der Gallium- und Germanium-Weltproduktion). Verliert Amerika diesen Chip-Trumpf, kippt das Machtgleichgewicht eindeutig zugunsten Chinas. Ein Taiwan-Konflikt hätte Weltkriegs-Potenzial – fĂĽr China aber „Harakiri”, da drei bis vier Jahrzehnte wirtschaftlichen Aufbaus durch massive Sanktionen zerstört wĂĽrden. Deshalb hält Hirn einen solchen Krieg fĂĽr unwahrscheinlich; China hat einen langen Atem.

    ## Warum China siegte, der Westen versagte

    **Strategisches Langzeitdenken vs. Vier-Jahres-Wahlzyklen:** China denkt in Jahrzehnten (Made in China 2025 wurde vor 10 Jahren geplant), während westliche Demokratien in Wahlperioden denken. **Führungspersonal:** China wird von Ingenieuren regiert (ein Drittel des Politbüros), der Westen von Juristen – was zu völlig unterschiedlichen technologischen Prioritäten führt. **Entrepreneurial Spirit und Kapital:** Amerika und China haben diesen Geist, Europa nicht. Europäische Venture Capital fließt oft in die USA statt ins Inland.

    ## Europas verlorene Chancen

    Deutschland und Europa waren Chipinnovations-Wiegen (Intel, Texas Instruments, ASML, IMEC). Doch TSMC profitierte davon, dass die groĂźen amerikanischen Firmen einfache Chips nicht produzieren wollten. Heute ist TSMC unschlagbar. Als die EU 2013 ein europäisches Chipunternehmen nach Airbus-Vorbild plante, wurde das Projekt nie umgesetzt und „verlief sich im Nirvana”. Jetzt muss die EU Fabriken in Arizona unterstĂĽtzen, um wieder Chipkapazitäten zu sichern.

    ## Die Abhängigkeitsfalle

    Obwohl ASML (Weltmarktführer für Chipproduktions-Maschinen) und IMEC (Chip-Design) in Europa sitzen, kann Europa keine eigenen Chips produzieren. Europäer sind zu 90% abhängig von China bei seltenen Erden; diese Abhängigkeit wird Jahrzehnte andauern. Recycling und neue Minen lösen das Problem nicht schnell genug. **Die Paradoxie:** ASML selbst ist abhängig von chinesischen Rohstoffen (Gallium, Germanium).

    ## Die amerikanische Strategie hat versagt

    Die US-Sanktionen gegen Huaweis Chip-Zugang führten zu Gegenteiligenem: Huawei wurde innovativer, investierte massiv in F&E und baute parallel-Technologien auf. Handelsrestriktionen wirken meist nicht; sie beschleunigen Chinas Unabhängigkeit.

    ## Historische Warnung: Arroganz vor dem Absturz

    Hirn erzählt die Geschichte der englischen Delegation Ende des 18. Jahrhunderts zum chinesischen Kaiser: Sie wurde abgewiesen mit „Wir brauchen eure Produkte nicht.” Diese Arroganz ĂĽbersah die industrielle Revolution im Westen und fĂĽhrte zum „Jahrhundert der DemĂĽtigung” Chinas (19. Jahrhundert) – eine historische Wunde, die Chinas Aufstieg heute motiviert. China war 1000 Jahre lang die innovativste Macht der Welt; diesen Status zurĂĽckzugewinnen ist nationaler Konsens.

    ## Was Europa lernen sollte

    Europa leidet nicht an Erkenntnismangel (Mario Draghi dokumentierte das 2022 ausführlich), sondern an Umsetzungsmangel. Deutsche Mittelständler unterschätzen oft noch die Bedrohung durch chinesische Konkurrenz, hoffen auf Konjunktur-Recovery und digitale Aufbruchstimmung, die nicht kommt. Selbst in Deutschlands Paradebranchen Auto und Maschinenbau kommt chinesischer Druck an – endlich ein Weckruf.

    ## Bilanz: Pessimismus mit Hoffnungsschimmer

    Hirn ist pessimistisch: Der Wettstreit läuft zwischen USA und China ab, Europa wird abgehängt. Aber: Die Erkenntnisse sind da. Es fehlt politischer Wille und unternehmerische Geschwindigkeit. Persönliche Hoffnung: Die Kombination KI + Gesundheitswesen könnte zum Wohle der Menschheit führen.

    **Explizite Akteure:** Huawei, TSMC (Taiwan), ASML (Niederlande), IMEC (Belgien), Intel, Texas Instruments, Xiaomi; **Personen:** Ren Zhengfei (Huawei-Gründer), Mario Draghi, Xi Jinping — **Format:** Deep-Dive-Gesprächsformat, Meinung/Analyse basierend auf investigativer Recherche zu Chinas Technik-Aufstieg.

  • Prof. Maximilian Fichtner: Das KI-Energieproblem, Speicher-LĂĽge, Wasserstoff-Mythos, China & Zukunft
    17.6.2026, 15:15:30

    # Zusammenfassung: Energie, Batterien und KI – Ein Interview mit Prof. Maximilian Fichtner

    Das Gespräch behandelt die Energiefrage im Kontext des explodierenden Strombedarfs durch KI-Rechenzentren und diskutiert dabei zentrale Missverständnisse in der Energiedebatte.

    **Kernthesen zum Energiesystem:**
    Gegen die verbreitete Aussage „Solar bringt nichts, weil wir Strom nicht speichern können” spricht der Stand der Technik: Der weltgrößte Batteriespeicher wird gerade in den VAE mit 19 Gigawattstunden Kapazität aufgebaut; Speicher sind mittlerweile wirtschaftlich rentabel und stabilisieren Netze, statt sie zu belasten. Das Hauptproblem ist nicht die Stromerzeugung, sondern Netzausbau, dezentrales Speichern und die fehlende Kontinuität in der Energiepolitik. Das Merit-Order-Prinzip erklärt, warum die Abschaltung deutscher Kernkraftwerke keinen messbaren Einfluss auf Strompreise hatte – der Gaspreis bestimmt am Markt den Strompreis, nicht die Kraftwerksabschaltung.

    **Kernkraft und SMR:**
    Small Modular Reactors existieren derzeit nur als militärische Versuchsanlagen; es gibt keinen kommerziell betriebenen SMR. Neue Kernkraftwerke in Europa (wie Hinkley Point C, Frankreichs Flamanville) werden extrem teuer (50–65 Milliarden Euro) und produzieren Strom zum doppelten aktuellen Marktpreis. Alte, abgeschriebene Reaktoren sind günstig, neue aber ökonomisch unwirtschaftlich – ein Skaleneffekt bei SMR wird frühestens ab 1000–5000 Stück erwartet, doch niemand kauft die ersten teuren Exemplare.

    **Solar und China:**
    China baut massiv Solar aus nicht aus Ideologie, sondern aus Geostrategischer Unabhängigkeit heraus: Abhängigkeit von Ölimporten über kritische Meerengen (Straße von Hormus, Strait of Malacca) motiviert den Wechsel zu erneuerbaren Energien. Energiefachleute bei großen KI-Rechenzentren bevorzugen Planung auf Basis erneuerbarer Energien mit Wettervorhersage statt großer einzelner Kraftwerke – bei Ausfällen entsteht ein massives Netz-Loch (Beispiel: Frankreich im Winter bei hoher Heizlast und Reaktorausfällen).

    **Wasserstoff:**
    Wasserstoff ist grau (aus Erdgas) und damit kein Umweltvorteil. Im Mobilitätsbereich war er überholt durch Batterieentwicklung. Elektrolyseure benötigen 45.000 Betriebsstunden/Jahr zur Amortisation – das entspricht 12 Stunden Überschussstrom täglich, was nicht verfügbar ist. Wasserstoff macht wirtschaftlich nur in der Chemie-Grundstoffproduktion (Düngemittel, Methanol) Sinn, nicht für PKW/LKW. Ein Wasserstoffauto benötigt 3–4-mal mehr Windkraftanlagen als direktes E-Auto.

    **Batterieforschung am Helmholtz-Institut Ulm:**
    Die Materials Acceleration Platform testet täglich ~1.000 Materialkombinationen durch autonome Robotik, maschinelles Lernen und KI. Bisherige Erfolge: Halbierung der Formierungsphase bei Batterienzellen (ein Drittel der Herstellungskosten), Patentierungen, Industrielizenzierung. Fokusgruppen: Festkörperbatterien, nachhaltigen Batterien (Natrium, Magnesium, Calcium statt Lithium), Interface Optimization. KI schlägt oft ähnliche Zusammensetzungen vor wie bereits etablierte Technologien – der Mensch war bereits clever, aber der Prozess läuft noch.

    **Kosten fossiler Rohstoffe:**
    Die IEA erwartet Öl-Fördermaximum um 2030. EROI (Energy Return on Energy Investment) sinkt: von historisch 100:1 auf aktuell 6–7:1, in 20 Jahren auf 3–4:1. Kanadische Teersande: bereits heute ein Liter Öl an der Tankstelle kostet energetisch ein halbes Liter Rohöl zur Förderung. Gasvorräte weltweit: 209 Billionen Kubikmeter reichen bei aktuellem Verbrauch 40–60 Jahre.

    **KI-Rechenzentren und Energieplanung:**
    Elons Colosus (Memphis): 2 GW Ausbau. Stargate (OpenAI/Oracle/SoftBank): 10 GW geplant. Microsoft reaktiviert Three Mile Island. Google verhandelt mit SMR-Anbietern. Paralleles Bild: Elon Musk betont Solar als wichtigste Energiequelle, baut aber auch selbst Gaskraftwerke – Pragmatismus statt Widerspruch.

    **Orbitale Rechenzentren:**
    Technisch interessant (ganztägige Sonne, keine Speicher nötig, theoretisch 10-mal günstiger), aber Kühlungsfragen ungeklärt, massive Materialmengen erforderlich, Datensicherheit bei Funk-Übertragung problematisch.

    **Deutsche Probleme:**
    Fehlende politische Kontinuität (Regierungswechsel torpedieren Vorgänger-Arbeiten), Überregulation/Bürokratie (Beispiel: 160 Ordner Genehmigungsunterlagen für Zellfertigung), hohe Lohnkosten (bei Automatisierung teilweise irrelevant, aber auch Energiekosten und Verwaltungsgeschwindigkeit spielen). Positiv: Deutsche Premium-Elektrofahrzeuge (Mercedes, BMW i3) sind international top.

    **Appell an Deutschland:**
    Politische Kontinuität, Entbürokratisierung, verlässliche Rahmenbedingungen für Investitionen – China plant langfristig durch, Deutschland stoppt-startet bei Regierungswechsel.

    **Explizit genannte Projekte/Anbieter:** IEA (International Energy Agency), Helmholtz-Institut Ulm, OpenAI, Oracle, SoftBank (Stargate), Tesla, SpaceX, BYD, Hinkley Point C (GB), Flamanville (Frankreich), Colosus (Elason Memphis), Three Mile Island (Microsoft). **Format:** Deep-Dive Interview; **Schwerpunkt:** Research-level Analyse fossiler Rohstoffe, Energietechnik, Batteriematerie, technisch anspruchsvoll aber für informierte Zuschauer zugänglich.

  • Lokale KI wird MASSIV unterschätzt! Alle Wege, KI komplett kostenlos & offline zu nutzen
    16.6.2026, 15:15:35

    # Die fĂĽnf Wege, lokale KI zu nutzen

    Der Creator argumentiert, dass lokale KI massiv unterschätzt wird. Open-Source-Modelle liegen nur noch vier Monate hinter aktuellen Flaggschiff-Modellen zurück und beantworten laut einer Stanford-Auswertung bereits 71,3% aller Anfragen korrekt (2023: 23%). Die Kosteneffizienz ist dabei der Haupttreiber – Cloud-KI-Kosten sind in 18 Monaten um das 280fache gefallen, und chinesische Open-Source-Modelle werden inzwischen mehr in den USA genutzt als amerikanische Cloud-Modelle.

    **Historischer Kontext:** Künstliche Intelligenz war ursprünglich lokal (Expertensysteme der 1980er). Mit dem Deep-Learning-Durchbruch ab 2012 wanderte KI in Cloud-Rechenzentren ab. Der entscheidende Wendepunkt kam im März 2023: Metas Llama-Modell wurde geleakt, und der bulgarische Entwickler Georgi Gerganov schuf daraufhin an einem Wochenende Llama.cpp – ein Tool, das Modelle durch Quantisierung so komprimiert, dass sie auf normalen Laptops laufen.

    **Zwei Hardware-Trends:** China drückt die GPU-Preise durch Huawei-Chips massiv (Deepserk senkt Preise um 75%), und Apple wird über sein MLX-Framework zum potentiellen Gewinner – ein MacBook Pro mit M5 Max läuft ein 120-Milliarden-Parameter-Modell mit bis zu 80 Tokens/Sekunde, dreimal schneller als Claude mit 60 Tokens/Sekunde.

    ## Die fĂĽnf Wege, lokale KI zu nutzen:

    1. **Lokal auf der eigenen Maschine:** Programme wie Ollama, LM Studio oder Llama.cpp ermöglichen direkten Download und Betrieb. Ollama bietet seit Juni einen App-Store-ähnlichen Ansatz. Faustregel: 8 GB RAM für 7-Milliarden-Parameter-Modelle. Präziser: Bei Standard-Q4-Quantisierung entspricht die Parameterzahl ungefähr dem benötigten VRAM in Gigabyte.

    2. **Online testen ohne Download:** LM Arena zum Vergleich, Hugging Face für Demos, Google Colab für kostenlose GPU-Zugang – ideal zum Lernen, aber nicht privat.

    3. **Inferenz APIs:** Anbieter wie Grok, Together AI oder Nebius hosten Open-Source-Modelle und ermöglichen API-Zugriff mit wenigen Codezeilen wie bei ChatGPT, aber zu einem Bruchteil der Kosten.

    4. **Eigene Server:** Billige 5€-VPS reichen nicht aus (keine GPU). Ernsthafte lokale KI braucht GPU oder schnellen Speicher – entweder dedizierte Rechenzentrum-Hardware (z.B. Nvidia H100 für ~30.000€ für ein 70-Milliarden-Parameter-Modell) oder private Cloud-GPU-Server (z.B. Hetzner G44 für 7–14 Milliarden, GX130 für 70 Milliarden Parameter).

    5. **Embedded in Apps:** Apple Intelligence auf iPhone oder Gemini Nano auf Android – 3-Milliarden-Parameter-Modelle, vollständig offline, unsichtbar für den Nutzer.

    ## Praktische Use-Cases in der Corp-LM-Plattform:

    **Dokumenten-Datenextraktion:** Mit Gamma 4 (26B in 8-Bit-Quantisierung über MLX) werden sensible Daten korrekt extrahiert – allerdings fiel bei Datum-Extraktionen aus PDF-Bildern auf, dass Text-Extraktion (2014) der tatsächlichen Bild-Information (2017) vorzog. Für OCR-Aufgaben ist ein multimodales Modell mit Vision-Fähigkeiten nötig (z.B. Qwen3-VL-8B).

    **Mixture-of-Experts vs. Dense-Modelle:** Gamma 4 (26B MoE) ist trotz Größe über 3x schneller als ein 12B Dense-Modell, da nur 4 Milliarden Parameter pro Token aktiv sind statt aller 12 Milliarden.

    **Verträge chatten:** Ein 20-seitiger Vertrag kann abgefragt werden. Einfache Fragen werden korrekt beantwortet, komplexere Fragen scheitern teilweise wegen begrenzter Kontext-Fenster (beide Modelle zeigten Probleme bei der Extraktion des zuständigen Gerichts).

    **Chatten mit eigenem Wissen:** Dokumente können hochgeladen und in Ordnern organisiert werden. Rag-Systeme (Retrieval Augmented Generation) sinnvoll bei mehreren Dokumenten; bei einzelnen PDFs direkt ins Kontext-Fenster laden.

    **HTML-Ăśbersichten generieren:** Lokale Modelle erstellen einfache Ăśbersichten (z.B. Marketingstrategien), verlieren aber bei komplexem Frontend-Design gegen Cloud-Modelle.

    **PII-Anonymisierung:** Ein Prompt-Template anonymisiert sensible Daten lokal, bevor der Text an Cloud-Modelle für komplexe Analysen geht – DSGVO-konform und kostensparend.

    **Prompt-Templates in der Bibliothek:** Prompts können gespeichert und wiederverwendet werden, mit Variablen für flexible Eingaben.

    ## Ehrliche Einschränkungen:

    Lokale Modelle stoßen bei komplexem Agentic Coding an ihre Grenzen; Cloud-Modelle führen hier klar. Finanziell lohnt sich ein eigener Server erst ab 50–100 Millionen Token/Monat; darunter ist Cloud oft günstiger. Der praktische Ansatz ist hybrid: sensible Daten und automatisierte Workflows lokal, Spitzenleistung für App-Entwicklung in der Cloud.

    **Langfrist-Perspektive:** Die Kostenkurve arbeitet für lokale KI – Rechenleistung verdoppelt sich jährlich (Law of Accelerating Returns). Was heute im Rechenzentrum läuft, läuft morgen auf dem Laptop, übermorgen auf dem Handy. KI löst sich aus Rechenzentren auf und wird zur Umgebungs-KI.

    **Fazit des Creators:** Lokale KI ist nicht Gegentrend, sondern logisches Endstadium der KI-Revolution – der Moment, in dem die Technologie nicht mehr wenigen Konzernen gehört, sondern jedem einzelnen.

    **Explizite Tools/Modelle:** Ollama, LM Studio, Llama.cpp, MLX-Framework, Gamma 4, Qwen3-VL, Claude (Sonnet 3.5), OpenAI GPT, Llama, Corp-LM-Plattform (Eigenentwicklung), Grok, Together AI, Nebius, Google Colab, Hugging Face, LM Arena, Versell, Ray Ray, Hetzner. **Format:** Demo + Deep-Dive mit praktischen Use-Cases und Hybrid-Ansatz-Ăśberblick.

Fireship (3 neues Videos)

  • The most trusted code on Earth is being rewritten in Rust
    19.6.2026, 17:24:47

    # Zusammenfassung: Turso – SQLite in Rust neu erfunden

    Die Video-Geschichte beginnt 2000 mit einem Navy-Entwickler, der sich fragte, warum Datenbanken separate Server brauchen – und SQLite erfand, eine in eine einzelne Datei eingebettete Datenbank-Engine, die weltweit Milliarden Mal verbreitet ist.

    Jetzt versuchen zwei Entwickler (einer Autor eines Latenz-Buches, der andere Top-5-Linux-Kernel-Contributor), SQLite von Grund auf in Rust neu zu schreiben: **Turso**. Ihr Antrieb ist nicht, dass SQLite schlecht wäre, sondern dass es nicht im klassischen Open-Source-Sinne entwickelt wird – die drei Maintainer akzeptieren keine externen Beiträge.

    Tursos Hauptfeatures über SQLite hinaus: (1) **echte Nebenläufigkeit** – mehrere Schreiber können gleichzeitig auf verschiedene Datenbankteile zugreifen statt nur eines Writers; (2) **async-Support** – statt Threads zu blockieren, gibt die DB Kontrolle zurück; (3) **native Vektorsuche** – Embeddings und deren Index leben direkt in der Datei, keine separaten Vector-Datenbanken nötig, abfragbar mit normalem SQL.

    Die Herausforderung ist nicht, mehr als SQLite zu können, sondern das Vertrauen zu verdienen, das 25 Jahre Arbeit aufgebaut hat. Turso ist bereits vollständig SQLite-kompatibel (Drop-in-Replacement) und nutzt „deterministic simulation” zum Testen – sie simulieren die gesamte DB in einem kontrollierten Universum und injizieren Fehler wie Stromausfall oder Disk-Lies, um Bugs zu finden. Weil Turso echtes Open-Source ist, können Entwickler beitragen.

    **Deep-Dive ĂĽber Turso (Rust) und Jet Brains’ Jun-KI-Coding-Agent als Sponsor-Feature; das Video kombiniert Produktgeschichte, technische Erklärung und kritische Bewertung.**

  • One man just liberated Fable… and now it’s illegal
    15.6.2026, 18:35:58

    # Zusammenfassung: Claude Fable – Regierungsverbot nach Jailbreak

    Das Video behandelt die Ereignisse um Claude Fable, ein neues KI-Modell von Anthropic, das drei Tage nach seiner öffentlichen Freigabe vom US-Gouvernement stillgelegt wurde. Fable war eine „gesicherte” Version des Basis-Modells Mythos 5, das nur fĂĽr vertrauenswĂĽrdige Partner verfĂĽgbar war – mit Sicherheitsklassifiziern, die unsichere Anfragen blockieren und stattdessen zum schwächeren Opus 4.8 umleiten sollten. Trotz jahrtausender Stunden an internem Testing gelang es einem anonymen Nutzer namens Plenty the Liberator jedoch innerhalb kurzer Zeit, die Schutzvorrichtungen zu durchbrechen, indem er Anfragen in kleine, unschuldige Fragmente zerlegt und Unicode-Charaktere sowie Rollenspiele nutzte – keine technische Sci-Fi-Exploit, sondern eher eine konzeptionelle Umgehung. Daraufhin erlieĂź US-Handelsminister Howard Lutnik eine Export-Control-Direktive, die Fable und Mythos 5 fĂĽr alle ausländischen Staatsangehörigen sperrte, einschlieĂźlich Anthropic-Mitarbeitern wie dem neu eingestellten AndrĂ© Karpathy. Anthropic reagierte daraufhin mit der kompletten Stilllegung beider Modelle fĂĽr alle Nutzer, was das erste Mal in der Geschichte darstellt, dass ein groĂźer KI-Anbieter ein öffentliches Live-Modell aufgrund einer behördlichen Anweisung vom Markt nimmt. Das Video erwähnt zusätzliche Kontroversen um absichtliche Performance-Degradation und diskutiert Spekulationen ĂĽber strategische Motive, warnt aber vor vorschnellen Urteilen ohne vollständige Information.

    **Claude (Anthropic) thematisiert; Meinung/Reflexion mit News-Update-Elementen.**

  • I read every major CS paper of the last 100 years…
    17.6.2026, 16:29:01

    # Die zehn einflussreichsten Papiere der Informatik-Geschichte

    Das Video erzählt die Geschichte der modernen Informatik und KI durch zehn zentrale wissenschaftliche Arbeiten:

    **Turing (1936)**: Zeigte durch seine Analyse berechenbarer Zahlen, dass nicht alle mathematischen Probleme algorithmisch lösbar sind, und erfand dabei die theoretische Grundlage – die Turing-Maschine – für jeden Computer.

    **Shannon (1948)**: Revolutionierte das Verständnis von Information durch mathematische Messung und führte das Konzept des Bits ein, indem er zeigte, dass alle Kommunikation auf Einsen und Nullen reduziert werden kann. Sein Konzept der Entropie – basierend auf der Vorhersagbarkeit des nächsten Symbols – ist die geistige Vorgängerin von KI-Verlustfunktionen.

    **Rosenblatt (1958)**: Inspiriert von Neuronen baute der Psychologe das erste lernende Gerät, das Perceptron, das Eingaben gewichtet und anpasst – der Baustein für moderne neurale Netze, allerdings mit übertriebener Euphorie.

    **Minsky & Papert (1969)**: Bewies mathematisch die Grenzen des einfachen Perceptrons (etwa bei XOR-Logik) und brachte damit das erste “AI Winter”, wobei sie aber im Kleingedruckten bereits die Lösung enthĂĽllten: gestapelte Schichten.

    **Lamport (1978)**: “Times, Clocks, and the Ordering of Events in a Distributed System” löste das Problem der Synchronisation mehrerer Computer ohne gemeinsame Uhr durch logische Uhren und Kausalität – essenziell fĂĽr verteilte Systeme und massive KI-Trainingsläufe.

    **Hinton et al. (1986)**: Zeigten, wie man gestapelte Schichten trainiert – durch Backpropagation: Daten durchlaufen, Fehler messen, Fehler rückwärts durch alle Schichten mit Kettenregel schieben und Gewichte anpassen. Verborgene Schichten erfanden eigene Features (Kanten, Formen), die XOR-Aufgabe wurde trivial.

    **Brin & Page (1998)**: Beschrieben PageRank, bei dem Links als gewichtete Stimmen zählen. Ihr Dorm-Zimmer-Prototyp wurde Google und erschuf damit den größten strukturierten Haufen menschlicher Textdaten – künftige Trainingsdaten für KI.

    **Krizhevsky, Sutskever & Hinton (2012)**: AlexNet trainiert auf ImageNet (Millionen handmarkierter Fotos) mit Consumer-GPUs reduzierte die Fehlerquote im ImageNet-Wettbewerb um 10 Punkte – bewies dass Deep Learning funktioniert mit Data, Compute und richtige Architektur.

    **Vaswani et al. (Google, 2014)**: “Attention Is All You Need” fĂĽhrte die Transformer-Architektur ein, die sequentielles Lesen fallen lässt und jedem Wort erlaubt, alle anderen gleichzeitig zu beachten – Google gab es kostenlos frei, nun nutzen es alle, das T in ChatGPT stammt daher.

    **OpenAI (2020)**: “Language Models are Few-Shot Learners” zeigte, dass Intelligence nicht durch Algorithmen entstehen muss, sondern einfach bei ausreichender Skalierung emergiert – GPT-3 mit 175 Milliarden Parametern, gefĂĽttert mit dem ganzen Internet, konnte plötzlich ĂĽbersetzen, zusammenfassen und Code schreiben ohne explizites Training. Das zĂĽndete die aktuelle KI-Bubble.

    Die Essenz: Turing definierte die Maschine, Shannon gab ihr Informationen, Rosenblatt ein Neuron, Hinton das Lernen, Google Data und Architektur, OpenAI drehte einfach den Skalierungsknopf auf Maximum – letztlich macht ChatGPT nur, was Shannon 1948 mit menschlichen Gesten begann: das nächste Token vorhersagen.

    OpenAI und Google als Anbieter thematisiert, grundlegende Meinungsvideo mit historischem Deep-Dive zur Entwicklung beider.

Greg Baugues

Keine neuen Videos in diesem Zeitraum.

IA et Stratégie | Le SamourAI (1 neues Video)

  • Musk rachète Cursor 60 Milliards: L’empire contre-attaque
    18.6.2026, 16:21:39

    # Zusammenfassung

    Das Video analysiert die strategische Bedeutung von SpaceX’ Ăśbernahme von Cursor fĂĽr 60 Milliarden Dollar – finanziert nicht mit Bargeld, sondern mit eigenen Aktien, die unmittelbar nach dem Börsengang massiv bewertet wurden. Der Kern der Analyse liegt nicht in der oberflächlichen Diversifikation, sondern in einer vertikalen Integrationsstrategie: SpaceX kontrolliert nun die komplette Wertschöpfungskette von Energie ĂĽber Rechenleistung (Colossus-Supercomputer in Memphis) bis zur Nutzeroberfläche.

    Der Autor argumentiert, dass Code das strategische Schlüsselgut der KI-Ära ist – nicht weil Entwickler ihn schreiben, sondern weil Agenten ihn *ausführen* und somit menschliche Absicht direkt in die Wirklichkeit übersetzen. Cursor war ursprünglich nur ein Editor, mutiert aber zur Kommandozentrale für autonome Agenten. Der eigentliche Flaschenhals der Branche ist nicht der Modellbau, sondern die Rechenkapazität. Musk kontrolliert diese und kann damit alle abhängigen Tools aufkaufen.

    Cursor selbst war gefangen: Die Neutralitätsstrategie (Routing zu Claude/GPT) zahlte ständig an Konkurrenten, ohne selbst Marge zu machen. Das hausgemachte Modell Composer konnte nie konkurrieren, weil die Rechenkapazität fehlte. Musk behebt genau dieses Problem. Die neue Produktlinie Origin (Git-kompatibler Code-Host fĂĽr Agenten, nicht Menschen) zeigt die Richtung: Die Infrastruktur wird von „fĂĽr Menschen designt” zu „fĂĽr Agenten optimiert” umgebaut – und GitHub wird damit obsolet.

    **Konsequenzen für Nutzer:** Die Wertschöpfung wandert von sichtbaren Apps zur unsichtbaren Infrastruktur (Rechenpower, Orchstrierung). Wer nicht die Rechenpower kontrolliert, muss mindestens die Orchestrierungsschicht beherrschen. Abhängigkeit von einer einzelnen Oberflächenanwendung ist heute hochriskant. Unternehmen sollten ihre Tech-Stack wie Supply Chains behandeln: Welche Infrastruktur betreibt das Tool? Wem gehört sie? Gibt es Interessenskonflikte?

    Der Autor warnt auch vor den regulatorischen Manipulationen: SpaceX wurde in Indexe (Russell 1000, MSCI World) integriert, was automatisch Billionen aus passiven ETF-Fonds zwingt, die Aktie zu kaufen – inklusive Millionen europäischer Sparer in ihren PEA/Lebensversicherungen. Der Aktienkurs wird teilweise durch diese erzwungene Nachfrage getrieben, nicht durch fundamentale Bewertung.

    Der abrupte Themensprung am Ende (eine Art zynisches Interview ĂĽber Automatisierung und Lohnabbau) wirkt wie ein verstĂĽmmeltes Filmzitat und steht inhaltlich isoliert; kein Transcript vorhanden.

    **Tools/Strategien thematisiert:** SpaceX, Cursor, Colossus (Rechencluster), X.AI / Grok, Starlink, Anthropic (Claude), OpenAI (GPT), Origin (Cursor-Produkt), GitHub, Cloud Code, Codex, Composer — sowie konzeptionell: AIOS (AI Operating System), vertikale Integration, Indexfonds-Mechaniken. — **Format: Deep-Dive / Meinung mit wirtschaftsanalytischem Fokus.**

Julian Ivanov | KI-Automatisierung (1 neues Video)

  • Bau dir dein KI-Betriebssystem mit Claude Code – Komplettes Tutorial 2026
    18.6.2026, 17:26:41

    # Zusammenfassung: Dein eigenes KI Betriebssystem aufbauen

    Das Video zeigt Schritt für Schritt, wie man sich ein persönliches AI Operating System aufbaut – ein zentrales System, in dem ein KI-Agent wie Claude alles über dich, dein Business und deine Tools weiß und damit effizienter arbeitet.

    ## Das Problem ohne solch ein System
    Ohne agentisches Betriebssystem erklärt man sich jedes Mal neu, was man will; die KI hat keinen Kontext; man muss ständig zwischen Tools kopieren; nichts läuft automatisch. Mit dem System kennt die KI dich und dein Business, gibt bessere Antworten, kann Tools ausführen (z.B. Google Workspace, Notion) und automatisiert Abläufe.

    ## Die vier Bestandteile

    **1. Wissen/Kontext:** Ein lokaler Ordner mit Textdateien zu deinen Themen, idealerweise in Obsidian organisiert. Darin auch eine `claude.md`-Datei mit Anweisungen fĂĽr Claude (wie er schreiben soll, welche Regeln gelten). Claude kann auf diese verlinkten Dateien zugreifen.

    **2. Tool-Verbindungen:** Claude wird mit externen Programmen verbunden über MCP (standardisiertes Protokoll), CLI-Tools oder APIs. Du sagst Claude einfach, welche Tools du verknüpfen willst (z.B. Google Workspace, Slack, Notion), und er richtet das für dich ein. Beispiel: Claude erstellt auf Kommando automatisch Google Docs, Sheets und Präsentationen in deinem Stil.

    **3. Skills:** Textdateien, die Claude erklären, wie er bestimmte Aufgaben durchfĂĽhrt. Etwa: „Erstelle Excalidraw-Diagramme” oder „Transkribiere Live Calls mit Timestamps”. Skills werden einmalig erstellt, dann nutzt Claude sie immer wieder fĂĽr ähnliche Aufgaben. Man kann sie sprachlich oder mit Slash-Befehlen triggern. Es gibt einen offiziellen Skill Creator Skill von Anthropic, der anderen Skills hilft, besser zu werden.

    **4. Routinen:** Automatisierte Abläufe, die zu bestimmten Zeiten laufen. **Lokal:** läuft nur wenn der PC an ist (nutzt lokale Modelle). **Remote:** läuft in der Cloud von Anthropic, unabhängig vom lokalen PC, zu definierten Uhrzeiten. Beispiel: Jeden Montag 9 Uhr automatisch KI-News sammeln und einen Post dafür schreiben.

    ## Von ĂĽberall arbeiten: GitHub + Server

    Der Ordner wird als privates GitHub-Repository hochgeladen (Claude macht das auf Kommando). So hast du ein Backup und kannst den Ordner auf jedem Gerät (Laptop, Server) synchronized halten. Claude pusht Änderungen automatisch zu GitHub; auf anderen Geräten kann man sich den neuesten Stand herunterladen.

    Wichtig: Auf einem **Server** (z.B. Hostinger 8€/Monat) läuft Cloud Code permanent. Man verbindet sich via SSH aus der Cloud Desktop App und arbeitet von PC/Laptop/Handy aus auf den Server-Prozessen hin. Das Betriebssystem liegt auch auf dem Server, daher hat Claude Zugriff auf dein Wissen von überall.

    **Obsidian + Git Plugin:** Mit dem kostenlosen Git-Plugin (Community Erweiterung) synchronisiert sich Obsidian alle 5 Minuten automatisch mit GitHub – kein Obsidian Sync Abo nötig.

    ## Praktische Schritte
    – GitHub Account erstellen
    – Cloud sagen: „Installiere GitHub CLI, verbinde mich mit meinem Account, erstelle ein privates Repository”
    – Auf Laptop/Server: Dasselbe, dann Ordner herunterladen
    – SSH-Key erstellen (Cloud macht das) → Server von Desktop App steuern
    – Obsidian Git Plugin installieren, Auto-Sync auf 5 Minuten
    – Wissen (Dateien in Obsidian) ständig erweitern
    – Mit Claude kommunizieren: neue Skills, neue Tool-Verbindungen, neue Routinen

    Optional: Agentisches Dashboard bauen, um schnell auf Skills und Cloud-Info zuzugreifen.

    Das System wächst mit dir: Du sagst Claude, was du brauchst, und das System baut sich selbst aus.

    **Tools/Anbieter erwähnt:** Claude (Anthropic), GitHub, Obsidian, Hostinger, Google Workspace, VS Code, Cursor. **Format:** Tutorial mit Demo-Elementen. **Level:** Mittlerer Schwierigkeitsgrad – nicht für absolute Anfänger, aber strukturiert aufgebaut.

Kyle Balmer | AI with Kyle (3 neues Videos)

  • Learn how to teach AI to businesses and earn $1000/hour
    17.6.2026, 06:45:42
  • Claude Fable 5 & Mythos: The Most Powerful AI Model Ever Built
    15.6.2026, 05:00:26

    # Claude Mythos und Claude Fable 5 – Zusammenfassung

    Anthropic hat zwei neue Topmodelle veröffentlicht: Mythos, das nur Partnern via „Project Glasswing” (Banken, groĂźe Infrastrukturunternehmen) zur VerfĂĽgung steht, und Fable, die öffentlich zugängliche, höher abgesicherte Variante von Mythos. Fable wird damit das neue Spitzenmodell in Anthropics Hierarchie (Fable > Opus > Sonnet > Haiku).

    Die zentrale Erkenntnis: Diese Modelle funktionieren anders als bisherige KI-Systeme. Statt laufender RĂĽckfragen delegiert man ihnen umfangreiche Aufgaben als eigenständige „Mitarbeiter” – sie arbeiten Stunden lang völlig autonom daran, setzen agentische Workflows auf und liefern am Ende ein Ergebnis, ohne dass der Nutzer den Prozess nachvollziehen kann (bewusst Black-Box-Design, vermutlich zur Verhinderung von Distillationsangriffen). Der Ansatz funktioniert besonders bei komplexen, größeren Problemen (Geschäftspläne, Buch schreiben, strategische Fragen), nicht bei Routineaufgaben wie E-Mail-Verfassen.

    Das zentrale Problem: Ab dem 22. Juni (zehn Tage aus Aufnahmedatum) wird der Zugang drastisch beschränkt. Auch Abonnenten des $200-Plans werden abgeschnitten. Fable wechselt auf Pay-per-Use (vermutlich ~40 Dollar pro Stunde), ähnlich wie die API. Das fĂĽhrt zu einer strikten Zweiteilung: Wohlhabende mit Geschäftstätigkeit erhalten Zugang zu Spitzenintelligenz, alle anderen bleiben bei schwächeren Modellen. Dies ist – so der Sprecher – historisch der erste Moment, an dem deutlich wird, dass KI-Intelligenz nicht mehr „zu billig zum Messen” ist, sondern exklusiv reicheren Nutzern vorbehalten wird.

    Kontrovers sind auch: Gatekeeping zwischen Mythos und Fable, bereits vorhandene Jailbreaks (innerhalb weniger Tage), massive Intransparenz des Modellverhaltens sowie die sozialen Folgen (Konzentration von Wohlstand, Youth Unemployment). Trotz alledem wird das Modell als echte Capability-Steigerung beschrieben – die Kontroverse würde nicht existieren, wenn es nicht funktionieren würde. Anthropic hat diese Woche auch ein bevorstehendes IPO angekündigt.

    **Erwähnte Modelle/Anbieter:** Anthropic (Claude/Fable/Mythos), OpenAI (GPT-5.5, erwartetes GPT-6), Google Gemini; Format: Meinung/Reflexion mit News-Update zum Launch.

  • Fable 5 BANNED: If You’re Not American, Sorry.
    17.6.2026, 05:00:39

    # Zusammenfassung: Die Suspendierung von Fable und Mythos – Implikationen für die Zukunft von KI

    Der Inhalt behandelt die kurzfristige Suspendierung des Fable-Modells von Anthropic (wenige Tage nach seiner Veröffentlichung am 9. Juni) durch eine US-Exportkontroll-Direktive und deren weitreichende Bedeutung.

    **Warum Fable revolutionär war:** Fable war eine deutlich verbesserte Version von Mythos mit zusätzlichen Sicherheitsvorkehrungen. Im Gegensatz zu bisherigen KI-Tools ermöglichte es nicht nur Prompting, sondern proaktives Handeln – es konnte eigenständig notwendige Tools einsetzen, um komplexe Aufgaben zu lösen (vom Benutzer als „relentlessly proactive” beschrieben). Dies erforderte eine neue Fähigkeit: groĂźe, bedeutsame Aufgaben formulieren zu können, statt kleine Einzeltasks.

    **Zeitliche Abfolge:** Nach der Veröffentlichung kam zunächst Kritik an den Sicherheitsvorkehrungen; Sicherheitsforscher wurden teilweise blockiert. Dann ordnete die US-Regierung Anthropic an, den Zugang für alle Nicht-US-Bürger zu sperren – inklusive solcher innerhalb der USA. Anthropic erhielt nur 90 Minuten Zeit zur Umsetzung und sperrte daraufhin das gesamte Modell, da eine praktische Unterscheidung unmöglich war.

    **Behauptete Auslöser (nach David Sacks):** Ein vertrauenswerter Partner (vermutlich Amazon) entdeckte einen Jailbreak der Sicherheitsvorkehrungen, der Zugang zu sensiblen Inhalten (Bombenrezepte, Methamphetamin-Herstellung) ermöglichte. Anthropic lehnte eine Behebung angeblich ab; die Regierung verhängte daraufhin die Exportkontrolle. Ein Nutzer namens Pliny bestätigte, dass der Jailbreak funktioniert.

    **Größere Implikationen:**
    – **Datenschutz und digitale IDs:** Die Regelung könnte Regierungen und Konzerne dazu treiben, vollständige IdentitätsprĂĽfungen (Ausweisscans, biometrische Daten) fĂĽr KI-Zugang zu erzwingen – ein Präzedenzfall fĂĽr Ăśberwachung.
    – **Kontrolle und Dezentralisierung:** Geschlossener Zugang zu Frontier-Modellen via API/Abonnement bedeutet Abhängigkeit; jederzeit können Modelle ohne Kontrolle des Nutzers entfernt werden.
    – **Geopolitik:** Falls die USA Modellveröffentlichungen blockiert, können Länder wie China ungebremst aufholen und ĂĽberholen.
    – **Regulierung:** KĂĽnftige Modellstarts könnten vor Behörden genehmigt werden mĂĽssen, anstatt direkt veröffentlicht zu werden.

    **Praktische Empfehlungen:** Nutzer sollten sich mit lokalen und Open-Source-Modellen vertraut machen (über lmstudio.ai oder Hugging Face), um Unabhängigkeit von Frontier-Modellen-Anbietern zu schaffen. Die grundlegende Fähigkeit bleibt: größere Probleme für KI-Systeme formulieren lernen.

    **Offene Fragen:** Wird Fable zurück? Werden alle zukünftigen Mythos-Modelle ähnlich reguliert? Bleiben Beschränkungen nationalitätsbasiert oder werden Verbündete einbezogen?

    **Schluss:** Der Sprecher betont, dass dies nicht primär eine technische Diskussion über ein einzelnes Modell ist, sondern eine grundlegende Frage über Zugang, Souveränität und die Struktur der KI-Ökonomie – und appelliert daran, die größeren Zusammenhänge nicht aus den Augen zu verlieren.

    News-Update mit Meinungs- und Reflexionselementen zu aktuellen Ereignissen im KI-Sektor (Anthropic Claude, erwähnte Modelle ohne spezifische Anbieter außer Hugging Face und LM Studio); die Aussagen basieren auf laufenden Spekulationen und teilweise unverifizierten Berichten.

Leon van Zyl (2 neues Videos)

  • Codex vs Claude Code: What I Found After 30 Days
    18.6.2026, 13:00:25

    # Claude Code vs. Codex – Vergleich bei der App-Entwicklung

    Der Creator hat Claude Code und Codex direkt miteinander verglichen, indem er beide Agenten mit derselben Aufgabe beauftragt hat: Sie sollten eine visuelle Workflow-Automation-Anwendung (ähnlich N8N) von Grund auf aufbauen.

    **Methodik:** Der Creator nutzte die “RAMP”-Methode – ein strukturiertes Workflow fĂĽr agentengesteuerte Kodierung. Beide Agenten durchliefen denselben Prozess: Instruktionen erhalten, Skills installieren, den Plan erstellen, die App implementieren und testen.

    **Ergebnisse nach Kategorie:**

    – **Planning & Fragenkompetenz:** Codex stellte deutlich mehr technische Fragen (ca. 5x so viele) und bot damit bessere Kontrolle ĂĽber die Architektur. Claude ignorierte teilweise explizite Anweisungen.
    – **Benutzeroberfläche & Design:** Claude gewann klar – die UI wirkt polierter und visuell ansprechender, während Codex eher funktional wirkt.
    – **Projektstruktur & Architektur:** Codex organisierte Dateien sauberer (z.B. dedizierter `/data`-Ordner, 404-Seite), Claude platzierte die Datenbank im Projektroot.
    – **Funktionalität & Testing:** Beide erfĂĽllten die Anforderungen vollständig und testeten die Apps im Browser.
    – **Kosten & Nutzung:** Claude verbrauchte 8% des 250-Dollar-Plans, Codex 16% des 100-Dollar-Plans – **deutlich besseres Preis-Leistungs-Verhältnis bei Codex**.
    – **Wartbarkeit (Feature-Addition):** Codex erstellte eine vollständigere Modell-Dropdown-Liste (inklusive Fast-Modelle), gewann diese Runde.

    Fazit: Claude trumpft beim Design auf, Codex bietet bessere technische Entscheidungen, bessere Kosteneffizienz und tiefere Fragen während der Planung.

    **Explizit erwähnt:** Claude Code, Codex/GPT-Modelle, OpenRouter, N8N, Make.com, Zapier — Demo/Vergleich.

  • Claude Code + Unreal Engine: Build a Full Game with AI (MCP Setup Tutorial)
    21.6.2026, 12:46:07

    # GTA 6-ähnliches Spiel mit Claude Code und Unreal Engine erstellen

    Der Video zeigt, wie ein kompletter Anfänger in wenigen Stunden mithilfe von Claude Code und Unreal Engine ein funktionsfähiges GTA 6-inspiriertes Spiel prototypisiert.

    **Grundlagen und Setup:**
    Benötigt werden Unreal Engine (mindestens Version 5.8), Claude Code (oder alternative Coding-Agenten wie ChatGPT’s Codex) sowie die Unreal MCP-Plugin. Nach Installation des Launchers und Download der Engine wird Claude Code ĂĽber ein Terminal-Kommando installiert. Im Anschluss muss die Unreal MCP-Plugin im Editor aktiviert und Auto-Start in den Preferences konfiguriert werden. Ein `.mcp.json`-File wird generiert, das den lokalen MCP-Server in der Projektfolder definiert.

    **Troubleshooting und Tool-Setup:**
    Initial konnte Claude die MCP-Verbindung zwar finden, hatte aber keine Schnittstellen. Die Lösung erforderte das Aktivieren zusätzlicher Plugins: Python Editor Script Plugin, Python Foundation Packages und Editor Toolset Registry. Nach Neustart waren die notwendigen Tools (z.B. Scenes-Tool) verfügbar. Der Video zeigt auch, wie Screenshots direkt in Claude Code eingefügt werden können (Alt+V), um Sichtbarkeitsprobleme zu debuggen.

    **Spielentwicklung im Planning-Modus:**
    Statt direkt zu coden, wird der Planning-Mode genutzt, um Vorgaben zu diskutieren (Ambitionslevel, Tageszeit/Stimmung der Umgebung, Asset-Strategie). Claude recherchiert online nach Vice City, Lucia und Jason und präsentiert einen detaillierten Plan fĂĽr eine „Full Vertical Slice” mit Fluchtfahrzeug, Wanted-Level-System, Character-Wechsel und Zielmarker. Der Nutzer unterbrechen den Plan und fordert Claude auf, kostenlose Assets statt primitiver Formen zu nutzen.

    **Asset-Integration:**
    Unreal Engine stellt built-in Feature Packs (Third Person, Vehicles) bereit, die mit einem Klick hinzufügt werden. Zusätzlich kann die Fab-Library durchsucht werden (Filter: nur kostenlose, kompatible Packs). Der Video demonstriert, wie man Straßen-Assets, Palm Trees mit Animationen und andere Details herunterlädt und Claude anweist, diese zu verwenden.

    **Ergebnis nach ca. 92 Stunden Agenten-Arbeit:**
    Eine spielbare Welt mit NPCs, fahrbaren Fahrzeugen, schieĂźbaren Waffen und Charakteren namens Lucia und Jason. Die Grafik zeigt eine Umgebung mit grĂĽnlich-bläulichem Charakter-Tint und rudimentärer Levelgestaltung. Der Nutzer nutzt dann den „ultracode”-Workflow-Modus, um fehlende Features (Sound, NPC-AI, Physics, Guns) zu priorisieren.

    **Reflexion:**
    Der Prozess war zeitaufwändig, aber der Autor betont, dass die MCP-Server-Technologie noch neu ist und Epic Games wahrscheinlich parallele Agenten-Verarbeitung optimieren wird. Solche Tools sollen keine Game-Developer ersetzen, sondern ihnen ermöglichen, triviale Aufgaben zu delegieren und sich auf kreative Aspekte zu konzentrieren. Besonders für das Indie-Game-Development könnten diese Agenten transformativ wirken.

    **Fazit:** Claude Code und Unreal Engine MCP; Demo-Tutorial für Anfänger, konkrete praktische Anwendung gezeigt.

Liam Ottley (1 neues Video)

  • If you’re building with AI, don’t miss this
    18.6.2026, 05:43:21

    Das Video ist eine Ankündigung für einen AI-Summit in Montenegro Ende Juli. Der Creator bewirbt das Event als eines der größten AI-Events des Sommers und vergleicht es mit einem vorherigen erfolgreichen Event in Kapstadt, das eine volle Woche dauerte und von vielen Teilnehmern als eines der besten Erlebnisse beschrieben wurde.

    Das Montenegro-Event wird zwei Tickettypen anbieten: VIP-Tickets mit ganztägigem Zugang zu den Sprechern (beschrieben als “die größten Namen im AI-Space”) und gĂĽnstigere Konferenz-Tickets mit allgemeinem Zugang. Zusätzlich gibt es einen weiteren VIP-Tag mit einer Boot-Tour. Das Event richtet sich an AI-Agency-GrĂĽnder, Business-Inhaber und jeden, der an AI interessiert ist und von den neuesten Implementierungen und praktischen Anwendungen lernen möchte.

    Die anschließende Zusammenfassung des Cape-Town-Events zeigt, dass es über sechs Tage mit über 120 Teilnehmern täglich stattfand und neben Workshops, Keynotes und Masterclasses auch Wellness-, Natur- und Networking-Aktivitäten umfasste – vermarktet als Gesamterlebnis mit Fokus auf Freiheit, Aufbau und Verbindung durch AI.

    **Format: News-Update / AnkĂĽndigung (Event-Promotion).**

Mark Kashef (1 neues Video)

  • Make Any Model Think Like Fable in 10 Minutes (It’s Easy)
    14.6.2026, 19:00:05

    # Zusammenfassung: Fable 5-Verhalten in anderen KI-Modellen nachahmen

    Nachdem Fable 5 nicht mehr verfügbar ist, zeigt dieses Video einen praktischen Weg, wie man Claude und andere Modelle dazu bringt, ähnlich intelligent und strukturiert zu arbeiten.

    Die Grundidee: KI-Konversationen werden in JSONL-Dateien auf dem Computer gespeichert – vollgepackt mit Prompts, Modellrespons, Tool-Aufrufen und Metadaten. Man kann diese Dateien analysieren, um herauszufinden, wie Fable 5 anders arbeitete als andere Modelle (z.B. Opus oder Haiku). Dazu werden Python-Skripte verwendet, die das Rauschen filtern und nur relevante Transkripte, Zeitstempel, Modellnamen und Tool-Aufrufe behalten.

    Die konkrete Vorgehensweise im Terminal: (1) Zählen, wie viele JSONL-Dateien vorhanden sind; (2) ein Script schreiben, das eine Session-Datei bereinigt und nur Transkript + Metadaten behält; (3) alle Fable 5-Konversationen in einen Corpus zusammenziehen; (4) Verhaltensmetriken extrahieren (nicht nur Eindruck, sondern messbare Zahlen); (5) denselben Analyse-Prozess gegen ein anderes Modell (z.B. Opus) laufen lassen und die Unterschiede direkt vergleichen – Rhythmus, Tool-Nutzung, Abfolge von Aktionen, Lesevorgänge vor Edits, Tests nach Edits.

    Das Ergebnis: Ein Playbook mit den Kernerkenntnissen, wie das andere Modell Fables Verhalten nachahmen könnte. Dieses Playbook kann dann als Kontext-Hook am Session-Start injiziert oder in die Claude-MD-Datei integriert werden – so dass jede neue Session davon profitiert. Der Autor stellt sein eigenes Playbook sowie Links zu öffentlichen Fable 5-Datensätzen (Hugging Face) zur Verfügung, falls man zu wenig eigene Fable-Konversationen hatte.

    Wichtig: Man kann Fables rohe Modellkraft nicht klonen, aber man kann andere Modelle zu längerem Nachdenken und strukturierten Arbeitsabläufen bewegen – was sie zumindest näher an Fable-Level-Performance bringt.

    **Format: Tutorial; Werkzeuge: Claude, Codex, Opus (sowie Open-Source-Alternativen).**

Matt Pocock

Keine neuen Videos in diesem Zeitraum.

Melvynx (3 neues Videos)

  • Codeline: ma plus grosse migration Ă  Tanstack Start (je regrette pas)
    20.6.2026, 17:25:47

    # Zusammenfassung

    Der Creator hat seine gesamte Codeline-Plattform von Next.js zu TanStack Start migriert – eine massive Änderung mit über 100.000 hinzugefügten und 129.000 entfernten Zeilen Code (PR #315). Er nennt drei Hauptgründe für diese Migration:

    **1. Deployment-Geschwindigkeit:** Die Build-Zeit sank von durchschnittlich 3 Minuten 30 Sekunden auf etwa 1 Minute 20 Sekunden – eine Reduktion um etwa zwei Drittel. Das ist entscheidend bei Produktions-Notfällen.

    **2. Responsivität/User Experience:** Eine Live-Demo zeigt den Unterschied: Bei Next.js erscheinen beim Navigieren multiple Placeholder und Loader nacheinander, was sich träge anfühlt. TanStack Start lädt Seiten quasi instantan ohne unnötige Loader-Kaskaden, was das Gefühl von Geschwindigkeit erheblich verbessert.

    **3. AI-Freundlichkeit (wichtigster Punkt):** Next.js hat zu viele konkurrierende Konzepte (Pages Directory vs. App Directory, Server/Client Components, verschiedene Naming-Konventionen etc.), was KI-Modelle verwirrt. TanStack Start ist dagegen **deklarativ und explizit**: Routen werden klar definiert, Loader, Middleware und Komponenten sind in einem Block zusammengefasst, Type-Safety ist durchgehend vorhanden. Das macht es fĂĽr KI viel einfacher zu verstehen und zu generieren. TanStack Start folgt Web-Standards statt proprietärer Abstraktionen, weshalb KI-Modelle es besser “verstehen”.

    Der Creator erwähnt, dass er fĂĽr diese Migration ein Multi-Agent-System mit KI-UnterstĂĽtzung nutzte und danach einen Skill zum Bugfixing erschaffen hat (z.B. fehlende Buttons durch Git-History finden und reparieren). Er verweist auf seine Formation “Nostack” (mlv.sh/formation-stack), die zeigt, wie man TanStack mit Convex fĂĽr maximale KI-Agent-Effektivität kombiniert.

    **Thematisiert:** TanStack Start, Next.js, Convex, KI-Agents zur Code-Migration und Bugfixing — **Meinung/Reflexion mit Deep-Dive-Elementen.**

  • GLM 5.2 : le PREMIER modèle chinois qui m’impressionne vraiment ?
    19.6.2026, 06:00:08

    # GLM 5.2 – Vergleich mit GPT-4.5 bei echten Code-Aufgaben

    Das Video testet das neue Open-Source-Modell **GLM 5.2** praktisch gegen **GPT-4.5** (über die Plattform Open Code) anhand von vier realen Entwicklungsaufgaben. GLM 5.2 wird als deutlich besseres Open-Source-Modell positioniert: 1-Million-Token-Kontext, starke Code-Fähigkeiten, vollständig open source unter MIT-Lizenz, und in Benchmarks (etwa auf 10-PSWE: von 18% auf 46% Erfolgsquote vs. Vorgänger) beeindruckend.

    **Test 1 – Sidebar Bundle:** Beide Modelle schaffen die Aufgabe in etwa 7 Minuten mit ähnlichem Code. GLM: 10/10, GPT: 10/10.

    **Test 2 – Bundle Dashboard:** GLM versteht korrekt, dass beide Dashboards ähnlich aussehen sollen und setzt es um (10 Minuten, 10/10). GPT missverstehen den Prompt massiv und “sloppt” eine völlig falsche Oberfläche zusammen (18 Minuten, 0/10).

    **Test 3 – Floating Chatbot:** Beide erstellen funktionsfähige Schnittstellen, beide haben aber Probleme mit mehreren Tool-Aufrufen in Folge (der Chatbot führt nur eine Aktion durch, dann stoppt er). GLM zeigt saubere UI, aber versteckt Fehler (kein visuelles Feedback). GPT zeigt Fehler visuell an, ist aber nicht mehr funktional. GLM bekommt beim Laden der Seite Punkte für State-Preservation.

    **Test 4 – Bundle-Filter Loader-Bug:** GLM schlägt fehl – ändert nicht die richtige Loader-Abhängigkeit. GPT löst es richtig, indem es den Tanstack Query-Loader anpasst. GPT: 10/10, GLM: 0/10.

    **Bonus – Timezone Picker (Creative Task):** GLM liefert eine polierte UI mit Slider-Kontrollen und durchdachten UI-Details (z.B. +1-Buttons für Tagesanpassungen). Visually überzeugend.

    **Fazit:** GLM 5.2 zeigt beeindruckende Sprachverständnis- und Designfähigkeiten (Test 2 ist ein klarer Sieg), scheitert aber beim strukturierten Debugging und Fehlerbehandlung. GPT-4.5 ist etwas robuster beim exakten Verständnis von Code-Fehlern, aber GLM ist deutlich schneller und bei generativen/kreativen Aufgaben überlegen. Der Autor nutzt bei komplexeren Aufgaben regelmäßig eigene Workflows (apex/use-goal), um bessere Ergebnisse zu erzielen.

    **Tools:** GLM 5.2 (via Open Code Plattform), GPT-4.5, Fable erwähnt; Entwicklung in Next.js/Tanstack. Demo/Vergleich.

  • Le GROS problème de l’IA : j’ai une nouvelle addiction
    16.6.2026, 11:00:33

    # Zusammenfassung

    Der Creator teilt ein persönliches Problem: Er ist abhängig vom Schachspiel auf chess.com geworden – als unbewusste Reaktion auf die ständige Warterei, während KI-Agenten seinen Code generieren. Während er frĂĽher im “Flow” war und Schritt fĂĽr Schritt vor der Kamera programmierte, muss er heute oft stundenlang warten, bis Agenten Aufgaben abschlieĂźen. In dieser Wartezeit scrollt er X, spielt Schach – und verliert den kognitiven Fokus komplett.

    Das Kernproblem: KI ist mittlerweile so effizient geworden, dass sie seine Arbeit ĂĽbernimmt, während er passiv daneben sitzt. Er startet parallel mehrere Agenten (Agent 1, 2, 3, 4…), muss sie dann alle reviewen und jongliert ständig zwischen Projekten – multitasking statt deep work. Diese Woche gab er 4.324 Dollar fĂĽr API-Ausgaben aus (heute allein 847 Dollar fĂĽr Tokens). Bei 341 Schachpartien in 30 Tagen verbrachte er etwa 22–28 Stunden nur mit Spielen.

    Er vermisst den handwerklichen Kampf: das Nachdenken, die Architektur-Probleme lösen, die Zufriedenheit beim selbst Programmieren. Jetzt erklärt er GPT-Agenten einfach “mach Feature XY” und wartet. Seine YouTube-Videos dauern offiziell 20 Minuten, aber mit 40 Minuten Generierungs-Wartezeiten. Er multitaskt zwischen Videos, um die Leere zu fĂĽllen.

    Sein Fazit: KI ist zu gut geworden. Sein Gehirn atrophiert. Er hat keine Lösung und bittet um Tipps, wie man KI nutzt, ohne die eigene Denkfähigkeit zu verlieren.

    Erwähnt werden KI-Agenten (unspezifiziert), API-Ausgaben (ChatGPT/Claude-Nutzung), sowie konkrete Projekte wie eine Mobile-Boilerplate und Paddle-Tali-App.

    **Format:** Meinung/Reflexion – sehr persönlich und offen ohne endgültige Antwort.

n8n (1 neues Video)

  • Mythos & Fable Can Weaponize Cyberattacks. This n8n System Fights Back
    16.6.2026, 22:22:35

    # Zusammenfassung: AI-gesteuerte Cybersecurity-Workflows fĂĽr automatisierte Threat-Response

    Das Video präsentiert einen praktischen Deep-Dive in ein n8n-basiertes Cybersecurity-Incident-Response-System, das AI-Agenten in Security-Operations-Center (SOC) integriert. Der Gast Raj, ein Forward-Deployed-Engineer, demonstriert einen Workflow, der drei parallele Strategien zur Threat-Analyse kombiniert: die Abfrage historischer Incidents aus einer vektorisierten Datenbank, die Konsultation von Playbooks (Best-Practice-Guides für häufige Angriffstypen) und externe Threat-Intelligence-Suchen.

    Der Workflow nimmt ein Incident-Ticket auf (z.B. einen Phishing-Angriff), ordnet es mittels Embeddings ähnlichen früheren Fällen zu, extrahiert bewährte Lösungsschritte und ergänzt diese mit aktueller Intelligence. Ein synthesierender Agent konsolidiert alle drei Datenquellen in einen strukturierten Report für den Security-Analyst, inklusive MITRE-ATT&CK-Mappings (standardisierte Angriffstechniken-Klassifikation), Indikatoren von Compromise (IOCs) im JSON-Format und priorisierte nächste Schritte – manche zur Automatisierung freigegeben, manche zur manuellen Genehmigung vorgesehen. Das System wird mit Testdaten ausgeliefert (15 typische Incidents, Playbook-Beispiele, 30 aufgelöste Cases), kann aber mit echten Unternehmensdaten gefüttert werden.

    Ein zentrales Thema: Der Aufstieg von AI-gestützten Attacken (erwähnt: Anthropics Mythos-Modell fand eine 27 Jahre alte Zero-Day in OpenBSD) erfordert automatisierte Verteidigung auf gleicher Augenhöhe. Die Diskussion betont, dass AI-Systeme nur so gut sind wie ihre Datenbasis – saubere Daten, etablierte Prozesse und Governance-Struktur sind Voraussetzung. Der Workflow zeigt auch, wie kleinere spezialisierte Modelle in einer guten Harness/Workflow besser performen als allgemeine Large Language Models mit vagen Anweisungen. Abschließend werden Use Cases wie persönliche Sicherheit (Schutz vor gefälschten Social-Media-Konten) und Home-Lab-Implementierungen diskutiert, ebenso der Wert von lokal laufenden Modellen für sensitive Security-Daten.

    Das Repository wird auf GitHub veröffentlicht mit HTML-Frontend zum Testen eigener Daten; die Ingestion-Pipeline nutzt JSON-formatierte Inputs und Vektor-Datenbanken (Supabase erwähnt).

    **Thematisierte AI-Tools/Anbieter:** Anthropic (Mythos-Modell), n8n (Workflow-Plattform), Supabase (Vector-DB), Claude; **Format:** Demo + Tutorial; fĂĽr Security-Profis und Automation-Interessierte nachvollziehbar, aber spezialisiert auf Enterprise-SecOps-Kontext.

Nate Herk | AI Automation (6 neues Videos)

  • Finally. Agent Loops Clearly Explained.
    19.6.2026, 17:18:24

    # Zusammenfassung: Agent Loops verstehen

    Das Video definiert **Loop Engineering** als das Ersetzen manueller Agent-Prompting durch systemarchtitektur-basierte Automation. Ein Loop besteht aus drei Komponenten: einem Trigger, einer Aktion und einer Stoppbedingung, wobei die zwei wichtigsten Säulen das **Ziel** (objektive Zielsetzung) und die **Verifikation** (Stop-Kriterium) sind.

    Der Kerngedanke ist, dass KI-Output iterativ verbessert wird statt im ersten Versuch akzeptiert zu werden. Anstatt dass ein Mensch Feedback gibt und nachbessert, sollte dies ein Agent automatisiert durch einen **Reason-Act-Observe-Zyklus**: Der Agent plant, implementiert, ĂĽberprĂĽft seine Ergebnisse und iteriert solange, bis die Done-Kriterien erfĂĽllt sind.

    Das Video unterscheidet drei Loop-Architektur-Typen: **Solo-Loop** (ein Agent mit Verify-Schritt), **Maker-Checker** (ein Agent führt aus, ein anderer prüft) und **Manager mit Helfern** (orchestriertes Multi-Agent-System). Die praktischen Beispiele zeigen drei konkrete Anwendungen: Thumbnail-Design mit subjektiver Bewertung (27 Minuten), 3D-Plane mit Rendering-Verifikation (37 Minuten) und Beatles-Abbeys-Road-Rekonstruktion mit Screenshot-Verifikation und hartem Stop nach 8 Durchläufen.

    Entscheidend für funktionierende Loops sind: klare, möglichst objektive Done-Kriterien, adäquate Verifikations-Tools, Speicher-Management, separate Checker-Agenten, vorausschauende Planung, Logging und Kostenmanagement. Der Autor warnt davor, dass Loops mit zu offenen Kriterien oder unmöglichen Zielen endlos laufen können – seine praktischen Loops dauern typischerweise 30 Minuten bis wenige Stunden, nicht Tage.

    Ein wichtiger Disclaimer: Nicht jede Arbeit profitiert von 24/7-Agent-Automatisierung. Der Video-Creator nutzt Loops eher für Nacht-Runs mit bekannten Zeitrahmen oder ereignisgesteuerte Tasks, nicht für ständig laufende Systeme. Die Technologie wird sich branchenübergreifend unterschiedlich durchsetzen – dass andere wie Peter Steinberger damit ihre Produktivität 10x erhöht haben, bedeutet nicht, dass dies für alle Rollen und Anwendungsfälle unmittelbar relevant ist.

    **Explizit erwähnt:** Claude und Claude Code (Anthropic) als Agentenplattform, Matthew Bermans Loop Library als Ressource. **Format:** Meinung/Reflexion mit praktischen Demos.

  • GLM 5.2 in Claude Code is Blowing My Mind
    19.6.2026, 01:13:05

    # GLM 5.2 in Cloud Code – Setup & Performance Comparison

    Der Nutzer hat GLM 5.2 (ein Open-Source-Modell mit 753 Milliarden Parametern) über eine Cloud-Lösung in Cloud Code getestet und zeigt, wie schnell und günstig man damit arbeiten kann – etwa fünfmal kostengünstiger als Opus 4.8.

    **Performance-Tests:**
    – Website-Design: GLM brauchte 3:59 Min, Opus 14:59 Min (GLM schneller und billiger, ähnliche Qualität)
    – Hausaufgaben-Evaluation: Opus war präziser (erkannte Edge Cases wie Duplikate mit unterschiedlichen Datentypen), GLM gut, aber nicht perfekt
    – Creative Design-Prompts: GLM ~35 Min vs. Opus ~11 Min (sehr variable, abhängig von Reasoning-Anforderungen)
    – Storm Research Skill (Multi-Agent-Orchestrierung): GLM erzeugte in 27 Min ein umfassendes HTML-Report mit fĂĽnf verschiedenen Perspektiven (akademisch, skeptisch, praktisch, ökonomisch, historisch)

    **Haupterkenntnis:** GLM 5.2 ist stark bei Design und strukturierten Aufgaben ohne schweres Reasoning, aber Opus bleibt überlegen für tiefe Analyseleistung. Die Strategie sollte sein, das richtige Modell pro Task zu wählen, nicht eines für alles.

    **Einrichtung in Cloud Code:**
    Man nutzt Z.AI als Hosting-Provider, registriert sich, holt einen API-Key und bearbeitet die `settings.local.json`-Datei: Anthropic Base-URL wird auf Z.AI’s API umgeleitet, der API-Key wird eingetragen, Default-Modelle auf GLM 5.2 gesetzt. So funktioniert GLM im Cloud Code Harness wie ein Engine-Swap.

    **Preismodell:** Z.AI bietet Pay-per-Token ($1.40 Input, $4.40 Output) oder Abos (16/64/144 $/Monat), mit 5-Stunden- und Wochen-Quoten ähnlich Claude Max.

    **Warum Open-Source relevant:** Anthropic und OpenAI sind derzeit nicht profitabel; Features wie Grok können jederzeit weggenommen werden. Wer Open-Source-Modelle versteht und lokal deployen kann, hat langfristig mehr Kontrolle. GLM 5.2 schlägt in vielen Benchmarks (AGENTIC Coding, Frontier SWE) GPT-4.5 und Sonnet – der Performance-Gap zu Closed-Source schließt sich rapide.

    Thema: GLM 5.2 (Open-Source-Modell, gehostet auf Z.AI), Cloud Code als Harness, Benchmarks und Vergleich mit Opus 4.8 und anderen Closed-Source-Modellen — **Tutorial/Deep-Dive mit praktischem Setup**.

  • How to Build Effective Claude Code Agents in 2026
    18.6.2026, 17:26:17

    # Zusammenfassung

    Cole Medin und Nate diskutieren, wie man Coding-Agenten (speziell Claude Code) effektiv einsetzt, statt nur „vibe coding” zu betreiben. Die Kernbotschaft: Plane umfassend, delegiere dann an den Agenten, validiere das Ergebnis und verbessere das System kontinuierlich basierend auf Fehlern.

    **Zentrale Konzepte:**

    **Planning mit Kontext:** Coding-Agenten brauchen detaillierte Markdown-Specs mit Ziel, Erfolgskriterien und Validierungsstrategie. Mit jeder Konversation sinkt die Aufmerksamkeitsqualität (die „dumb zone”) – bei Opus etwa bei 250.000 Tokens. Das Millionen-Token-Limit schafft eine falsche Sicherheit; man muss aufpassen, welche Infos man upfront gibt und welche der Agent bei Bedarf abruft.

    **Validierung/Verification:** Der Agent sollte seine eigene Arbeit prüfen können – ob durch Unit-Tests beim Code, Browser-Automation bei Websites oder selbst PNG-Rendering bei Diagrammen. Ohne Validierung liegt die Qualität bei ~65–70%; mit Validierung oft bei 92% beim ersten Durchgang.

    **System Evolution:** Jeder Bug wird zur permanenten Verbesserung: Neue Rules in claude.md, bessere Skills oder geänderte Workflows verhindern, dass das Problem wiederkehrt.

    **Harness Engineering & Multi-Agent-Workflows:** Für größere Aufgaben braucht man mehrere Agent-Sessions hintereinander (wie der RAGL-Loop), nicht einen Agenten, der alles orchestriert. Cole arbeitet an Archon, einem Open-Source-Projekt für deterministische Workflows.

    **Security:** Prompts allein sichern nichts. Cole nutzt Hooks zur Kontrolle (z.B. um File-Löschungen zu blocken), warnt aber: Agenten finden Umwege (z.B. Script schreiben statt direkter Delete-Befehl). Die Annahme: Alles, das der Agent lesen/anfassen kann, wird er auch tun.

    **Top 3 Claude Code Features nach Cole:** Hooks (für Security, Memory, System-Verbesserungen), Sub-Agents (für Recherche), Skills (Kernstück – wiederverwendbare Prompts für alles).

    **Praktische Tipps:**
    – Behandle Claude Code wie einen Product Manager – gib Kontext fĂĽr das *Warum*, nicht nur das *Wie*.
    – Nutze die Slash-by-the-way-Funktion fĂĽr Verständnisfragen, ohne den Kontext zu verunreinigen.
    – Sub-Agents fĂĽr Forschung; Agent Teams fĂĽr Debatten/Konsens-Finding (kostspielig, aber nĂĽtzlich).
    – Vermeide Open Claude und Hermes fĂĽr komplexe Workflows – baue dein eigenes System fĂĽr maximale Kontrolle.

    Cole betont durchgehend: Software-Engineering-Prinzipien (Planning, Testing, Versioning) ĂĽbertragen sich 1:1 auf Non-Technical Automation.

    **Video-Format:** Live-Podcast/Interview; Claude Code und Intent Engineering sind die explizit thematisierten Konzepte.

  • Learn These 6 AI Skills Now (Before AI Replaces You)
    15.6.2026, 12:46:09

    # Zusammenfassung: Sechs AI-Skills fĂĽr die Zukunftssicherung deiner Karriere

    Der Speaker stellt sechs Fähigkeiten vor, die helfen, in einer von AI dominierten Arbeitswelt relevant zu bleiben und nicht von Jobverlust bedroht zu sein.

    **Skill 1 – The AI Person werden:** Es geht nicht darum, AI-Expert zu sein, sondern als die Person wahrgenommen zu werden, die sich mit AI auskennt – relativ zu deinem Umfeld. Das geschieht durch regelmäßiges Experimentieren mit Tools (beispielsweise Claude, Codex, Google VO3), kleine Automationen im Job und das Teilen dieser Ergebnisse mit Kollegen. IBM-Daten zeigen, dass 85% der CEOs erwarten, dass alle funktionalen Führungskräfte zu Technology-Experten in ihren Domänen werden. Statt Karrierewechsel sollte man seinen bestehenden Beruf mit AI effizienter gestalten – ähnlich wie Excel für Buchhalter ein absolutes Muss wurde.

    **Skill 2 – Taste und Judgment:** Mit besseren AI-Modellen sinkt die Hemmschwelle, Outputs blind zu vertrauen. Das ist eine Falle. Man muss lernen, was gute Arbeit aussieht und klingt – durch Studium von Beispielen im eigenen Feld, durch Feedback an AI und Dokumentation von Korrektionen. Da die Arbeit mit deinem Namen signiert ist, trägst du die volle Verantwortung, egal ob AI oder Mensch sie erzeugt hat.

    **Skill 3 – Context Engineering:** Nicht Prompt Engineering, sondern Context ist das Durable Skill. Statt in leeren Chats zu arbeiten, sollte man Projekte oder Custom GPTs mit echtem Kontext füttern – Geschäftsdokumente, Produktdetails, vergangene Erfolgs- und Misserfolgskopien. AI ist wie ein neuer Intern: Ohne Kontext rät es nur; mit Kontext und deiner spezifischen Information (IP, Fachwissen) wird der Output einzigartig.

    **Skill 4 – Iteration Speed:** Die schnellsten Iteratoren gewinnen. Statt Perfektion anzustreben, sollte man schnell die „hässliche Version” bauen, sie testen und verfeinern. Keyboard-Shortcuts und Voice-Input beschleunigen den Prozess. Gleichzeitig ist es wichtig, Scope Creep zu verhindern, indem man vor dem Bauen definiert, was „fertig” ist – gekoppelt an eine konkrete Business-Metrik (z.B. Tickets pro Tag, qualifizierte Termine pro Woche).

    **Skill 5 – Building your own Jarvis:** Automationen sollten im Hintergrund laufen und selbstständig triggern, nicht nur auf Benutzeraktion reagieren. Dafür muss man unterscheiden: Deterministische Aufgaben (z.B. jeden Morgen Revenue-Daten aus Stripe in Slack posten) brauchen einfache Workflows, nicht AI-Agents. Komplexe Aufgaben mit messy Input und Reasoning brauchen AI-Agenten. Der Elite-Move ist zu erkennen, dass man AI gar nicht immer braucht – und das signalisiert echtes Business-Verständnis statt nur Hype.

    **Skill 6 – Unemployment Insurance / Multiple Income Streams:** Statt eine Einkommensquelle zu haben, sollte man mehrere AI-gestĂĽtzte Einkommensströme aufbauen – Tag Job plus 2-3 Side-Projekte aus der gleichen Passion/Expertise, nur in verschiedenen Formaten (z.B. Karriere + Kurs + Niche-Newsletter + Consulting). Das Wichtigste: ein echtes North Star (Passion) haben; „Building in Public” (dokumentieren, teilen, sichtbar sein) ist die praktische Standardmethode, um entdeckbar zu werden.

    Der Speaker betont, dass alle sechs Skills darauf abzielen, nicht durch Jobs oder Karrierewechsel ausgetauscht zu werden, sondern durch kontinuierliche Adaptation relevant zu bleiben.

    **Explizit thematisiert:** Claude, Codex, Google VO3; Glydo (Voice-to-Text-Tool); Referenz zu Andrej Karpathy und Anthropic. **Format:** Meinung/Reflexion mit praktischen Tipps.

  • Every Level of a Claude Second Brain Explained
    17.6.2026, 20:52:45

    # Zusammenfassung: Die fĂĽnf Ebenen eines AI Second Brain

    Der Creator stellt ein Konzeptmodell fĂĽr den Aufbau eines persönlichen „AI Second Brain” vor – ein System zur Speicherung und Abrufbarkeit von Informationen, das mit KI-Modellen zusammenarbeitet. Die zentrale These: Das System sollte rĂĽckwärts entworfen werden, basierend darauf, wie man die Daten in Zukunft nutzen möchte.

    **Die fĂĽnf Ebenen:**

    **Level 1** arbeitet mit exaktem Wortabgleich. Basis ist eine `claude.mmd`-Datei als Router, die das KI-Modell instruiert, wo nach Information zu suchen ist. Einfache Ordner- und Dateistruktur, manuelles Routing.

    **Level 2** erweitert Level 1 um Wikis (wie eine LLM-Wiki basierend auf Carpathy) und automatische Speicher-Dateien. Hier entstehen erste Beziehungen zwischen Dokumenten durch Backlinks. Der Creator nutzt selbst hauptsächlich diese Ebene, da sie seinen Anforderungen genügt.

    **Level 3** führt semantische Suche ein (z.B. über Obsidian, Pine Cone, Supabase). Statt Keyword-Matching nach exakten Wörtern werden Bedeutungen gesucht. Vektordatenbanken chunken Dokumente und embedden sie in einen Bedeutungsraum. Warnung: Vektordatenbanken sind kein Allheilmittel – bei Fragen, die vollständigen Kontext brauchen, sind Markdown-Dateien oft genauer.

    **Level 4** integriert Knowledge Graphs und Relationship Graphs (z.B. LightRAG). Diese zeigen nicht nur, dass Dateien verlinkt sind, sondern wie Entitäten zueinander in Beziehung stehen: „Jordan arbeitet bei Acme”, „Acme wird von PostPilot unterstĂĽtzt”. Der Creator nutzt dies nicht täglich, da Wikis mit sorgfältiger Ingestion fĂĽr seine Zwecke ausreichen.

    **Level 5** ist ein „always-on” Brain-OS (z.B. GBrain mit GStack). Das System synchronisiert und aktualisiert kontinuierlich Memories und Daten autonom. Der Creator nutzt dies aktuell nicht, da die Kontrolle ĂĽber das Ingestion und die Unterscheidung zwischen evergreen Context (bleibend wertvoll) und temporärer Verbindung (Slack, Emails) ihm wichtiger ist.

    **Wichtige Prinzipien:** Ein Projekt muss nicht einheitlich eine Ebene sein – verschiedene Ordner können unterschiedliche Ansätze kombinieren. Schmerz ist das Maß: Nur wechseln, wenn das aktuelle System ein echtes Problem verursacht. Die Privatspähre ist relevant: Daten, die Claude verarbeitet, gehen an Anthropic; für sensible Kundendaten könnten Open-Source-Modelle nötig sein. Evergreen Daten (jahrelang wertvoll) gehören in den Second Brain; volatile Daten sollten erreichbar sein, aber extern bleiben. Ein funktionierendes System antwortet auf die Frage: Versteht es, wo meine Daten leben, und kann es genaue Antworten geben?

    Der Creator betont, dass es keine bewiesene „beste” Struktur gibt – nur was fĂĽr den eigenen Kontext sinnvoll ist und Routing korrekt funktioniert.

    **Tools/Modelle:** Claude (Claude Code), Hermes Agent, CodeX, Obsidian, LightRAG, GBrain, GStack, Anthropic, Pine Cone, Supabase — **Format:** Deep-Dive/Tutorial

  • We Might Actually Need to Stop AI
    16.6.2026, 13:15:42

    # Zusammenfassung

    Der Creator analysiert ein paradoxes Phänomen: Die beiden fĂĽhrenden AI-Labore OpenAI und Anthropic, die am meisten von schneller Entwicklung profitieren wĂĽrden, fordern öffentlich dazu auf, die AI-Entwicklung zu verlangsamen. OpenAI veröffentlichte einen Plan „Built to Benefit Everyone” (mit dem Ziel AGI bis März 2028), der sich fĂĽr eine internationale Kontrollgruppe ausspricht, die bei Bedarf Frontier-Development verlangsamen kann. Wenige Tage zuvor machte Anthropic einen ähnlichen Aufruf nach einer verifizierbaren Möglichkeit, AI-Entwicklung zu pausieren.

    Der Creator identifiziert das zentrale Dilemma: Beide Unternehmen sagen im Grunde „wir können nicht allein stoppen, weil der Wettbewerbsdruck zu stark ist – wir brauchen jemand anderen, der uns (und alle anderen) zwingt, zusammen zu stoppen.” Das ist nicht dasselbe, wie freiwillig zu verlangsamen. Sie bitten um einen externen Schiedsrichter, keine Selbstbeschränkung.

    Die praktische Frage, ob so ein globales Verifikationssystem ĂĽberhaupt funktionieren könnte, wird analysiert: Theoretisch könnten die physische Infrastruktur (massiver Stromverbrauch, spezialisierte Chips aus begrenzten Supply Chains) und der Chip-Engpass als „Uran der AI” ĂĽberwacht werden – ähnlich wie Nuklearkontrolle. Das eigentliche Problem ist aber das Anreiz-System: Solange ein Land oder eine Firma gewinnen kann, indem es den Vertrag bricht, wird ein globales Abkommen nicht halten.

    Der Creator kritisiert auch die Kommunikationslücke zwischen den AI-Entwicklern (die das Potenzial verstehen) und der breiten Öffentlichkeit (die AI oft als Bedrohung sieht). Die Lösung sieht er darin, dass Nutzer selbst AI-Kompetenz aufbauen, anstatt auf Unternehmens- oder Regierungslösungen zu warten – nicht weil es garantiert hilft, sondern weil es das ist, das einzelne kontrollieren können. Er endet mit der Empfehlung, einfach bestehende Workflows (Mails, Reportschreiben) durch AI-Tools zu ergänzen und andere dazu zu ermutigen.

    Erwähnung auch: US-Regierung zwang Anthropic gerade, Claude MyAI und Claude Fable zu unterbrechen – ein Zeichen dafür, dass auch staatliche Regulierung beginnt einzugreifen, wenn auch nicht im Sinne des von OpenAI/Anthropic geforderten globalen Vertrags.

    **Format: Meinung/Reflexion; explizit thematisiert: OpenAI, Anthropic, Claude und ChatGPT.**

NeuralNine (3 neues Videos)

  • Professional PDF Reports with Matplotlib in Python
    19.6.2026, 16:00:09

    # Tutorial: PDF-Berichte mit Matplotlib erstellen

    Das Video zeigt, wie man mit Matplotlib professionelle PDF-Reports erstellt – etwa für Finanz-, Medizin- oder Datenanalyse-Berichte.

    **Grundlagen und Setup:**
    Man benötigt nur Matplotlib (Installation via `pip install matplotlib`) und optional Pandas für Sample-Daten. Das Kernkonzept ist einfach: Man nutzt die `PDF`-Backend-Klasse `PDFPages` aus `matplotlib.backends.backend_pdf`, wraps diese um seine Matplotlib-Figuren und speichert sie – alles andere ist Standard-Matplotlib.

    **Praktische Umsetzung:**
    Man importiert `PDFPages`, öffnet dann einen Context-Manager `with PDFPages(‘report.pdf’) as pdf:`, erstellt Figuren mit `plt.figure()`, gestaltet sie normal (Title, Plots, etc.) und speichert sie mit `pdf.savefig(figure)` sowie `plt.close()`. Das war’s – Figure-by-Figure wird eine mehrseitige PDF erzeugt.

    **Beispiel im Video:**
    Der Trainer zeigt ein Sample-Report mit einer Datentabelle und vier Subplots (Sales, Costs, Profit, Sales vs. Costs) auf der ersten Seite, verwendet dafür `GridSpec` für Layout-Kontrolle. Eine zweite Seite wird einfach durch Wiederholen des Prozesses – neue Figure, neue Plots, speichern – hinzugefügt. Am Ende wird ein AI-generiertes Beispiel gezeigt, das zeigt, was gestalterisch möglich ist (Executive Summary, KPIs, Heatmaps, verschiedene Chart-Typen) – aber auch dort läuft es auf denselben `figure.add_subplot()`, `pdf.savefig()`, `plt.close()`-Pattern hinaus.

    **Fazit:** Mit GridSpec für Layouts, Standard-Matplotlib-Styling und der PDFPages-Wrapper lassen sich bereits mit minimalen zusätzlichen Schritten ansprechende, mehrseitige Reports generieren.

    **Tools/Anbieter:** Matplotlib (kein KI-Tool, native Python-Library); Format: **Tutorial**.

  • This Skill Turns Your Agents Into Neckbeards…
    15.6.2026, 16:00:11

    # Zusammenfassung: Claude Code Skill “Ponytail”

    Das Video stellt den Claude-Code-Skill „Ponytail” vor – ein Tool, das Coding-Agenten anweist, prägnant und minimal zu arbeiten, statt ausschweifende, ausfĂĽhrliche Antworten zu geben. Der Skill verdankt seinen Namen einem Meme-Archetyp: jemand, der komplexe Probleme in einer Zeile löst.

    **Anwendungsfall und Motivation:** Der Autor nutzt Coding-Agenten gerne zum Lernen – etwa um schnelle Beispiele für neue Frameworks wie LangGraph zu bekommen. Ohne den Skill erstellen Agenten unnötig lange Docstrings, Best-Practice-Code und ausführliche Erklärungen, obwohl oft nur ein schmutziges, funktionierendes Minimalbeispiel gewünscht ist.

    **Installation:** Der Skill wird durch Herunterladen des Repositorys, Extrahieren des `skills`-Ordners und Platzieren im `.claude`-Verzeichnis eines Projekts installiert.

    **Live-Vergleiche:**
    1. **LangGraph-Beispiel:** Mit Skill erhält man sofort einen prägnanten Code mit State, Nodes, Edges und Conditional Edges – verständlich für Anfänger. Ohne Skill folgt ein aufgeblähtes Beispiel mit UV-Setup, langen Erklärungen und ausschweifenden Feature-Breakdowns.
    2. **Mandelbrot-Visualisierung:** Mit Skill: kurzes, funktionierendes Skript ohne Docstrings, sofort einsatzbereit. Ohne Skill: umfangreiche Funktionsstrukturen, Farbmaps, if-name-main-Blöcke und lange Erklärungen zu Effizienz und Design.

    **Aktivierungstipp:** Der Skill wird nicht immer automatisch geladen; teilweise muss man den Agent unterbrechen und explizit fragen, ihn zu verwenden.

    Das Video demonstriert klar: Mit Ponytail bekommt man auf den Punkt gebrachte, störungsfreie Lösungen; ohne ihn wird alles unnötig ausführlich und ablenkend.

    Demo mit Claude Code und dem Ponytail-Skill fĂĽr Anthropic’s Claude — Meinung/Reflexion mit praktischen Vergleichen.

  • Webhooks & Callbacks For Beginners in Python
    17.6.2026, 16:00:16

    # Webhooks und Callbacks – Beginner-freundliche Erklärung

    Das Video erklärt den fundamentalen Unterschied zwischen Polling und Webhooks/Callbacks im Kontext asynchroner Programmierung.

    **Kernkonzept – Das Problem mit Polling:**
    Die naive Lösung fĂĽr asynchrone Tasks ist Polling: Man fragt wiederholt einen Server ab „Ist die Aufgabe fertig?” Das ist ineffizient und verschwendet Ressourcen, besonders bei vielen gleichzeitigen Usern.

    **Die Lösung – Webhooks/Callbacks:**
    Statt selbst zu fragen, teilt man einem externen Service (z.B. Zahlungsanbieter) eine Callback-URL mit. Der Service fĂĽhrt die Aufgabe aus und ruft diese URL dann selbst auf, um das Ergebnis zu melden. Dies ist das „Call me back”-Prinzip: Man muss nicht aktiv nachfragen, sondern wird benachrichtigt.

    **Praktische Implementierung:**
    Im Tutorial wird ein vollständiges System mit Python/Flask gebaut:

    1. **Server** (Zahlungsanbieter-Simulation): Empfängt Tasks mit zwei Zahlen und einer Callback-URL. Teilt die Zahlen, wartet eine zufällige Zeit (5–15 Sekunden) und sendet das Ergebnis dann via POST an die Callback-URL.

    2. **Client** (Anwendung): Hat zwei Möglichkeiten:
    – **Mit Polling**: Sendet einen Task ab und muss dann wiederholt den Status abrufen (2 Sekunden pro Abfrage – sehr lästig).
    – **Mit Webhook**: Sendet einen Task mit einer Callback-URL ab. Der Server ruft diese später auf, ohne dass der Client aktiv fragen muss.

    **Live-Demo:**
    Bei Polling: User muss mehrfach neu laden und wartet jedes Mal 2 Sekunden, bis der Status aktualisiert ist. Mit Webhooks: User kann die Seite laden, ohne zu warten – der Server informiert den Client automatisch, wenn er fertig ist.

    Das Video war eine **Tutorial**-Demo mit praktischer Implementierung in Flask (kein spezifisches AI-Tool erwähnt).

Nic Conley

Keine neuen Videos in diesem Zeitraum.

Nick Saraev (1 neues Video)

  • GLM-5.2 is Basically Opus (For 1/5 the Price)
    19.6.2026, 21:46:27

    # Zusammenfassung

    Das Video vergleicht GLM 5.2 mit Opus 4.8 anhand von sieben praktischen Demos (3D-Szenen, interaktive Explainer, Dashboards, Landing Pages, Minigames) statt Benchmarks. GLM 5.2 erzeugt durchweg höherwertige Outputs – die nebula spiral sieht cleaner aus, die interaktiven Erklärvideos haben bessere Typografie und Ästhetik, die Low-Poly-Terrains wirken stilvoller. Bei Spielen zeigt GLM teilweise Schwächen in der Spielmechanik (der Tower-Stacker läuft zu schnell).

    Dann wird gezeigt, wie man GLM 5.2 praktisch einsetzt: über Open Router mit Cloud Code lässt sich ein API-Key in wenigen Minuten generieren und per Screenshot-und-Paste-Methode direkt ins Claude-Interface einfüttern, woraufhin GLM als Modell läuft. Dasselbe funktioniert auch mit Open Code und Crush-Harness, allerdings bevorzugt der Autor Cloud Code. Optional lässt sich Web-Search via Exa AI integrieren.

    Bezüglich Kosten gibt es vier Wege: Z.AI selbst (mit Subscription-Plänen bis $80/Monat), Open Router (Pay-per-Token mit automatisiertem Routing), spezialisierte Provider wie Fireworks oder Deep Infra, oder lokales Self-Hosting einer 2-Bit-quantisierten Version auf Macs mit 256 GB RAM/VRAM, die 82% der Accuracy behält und niemand dir wegnehmen kann.

    Das Fazit: GLM 5.2 hat derzeit mehr „Geschmack” (Style-Multiplier) als Opus 4.8, kostet weniger und sollte als Daily Driver ausprobiert werden.

    **Format: Demo/Tutorial | Modelle erwähnt: Claude Opus 4.8, GLM 5.2 via Open Router, Exa AI zur Web-Suche | Harnesses: Cloud Code, Open Code, Crush**

Niklas Steenfatt (1 neues Video)

  • WIR LEBEN IN EINER SIMULATION
    19.6.2026, 10:30:29

    # Zusammenfassung: Odysseus – PewDiePies Open-Source-KI-Projekt

    PewDiePie hat überraschend ein Open-Source-KI-Projekt namens Odysseus entwickelt, das wie ChatGPT funktioniert, aber kostenlos und mit vollständiger Kontrolle über die eigenen Daten läuft. Das Projekt ist sofort mit 65.000 Stars viral gegangen. Odysseus bietet ein Chat-Interface mit Dokumenten-Upload, zwei Modi (Agent und reiner Chat), sowie Tools wie Kalender, Bildbearbeitung und E-Mail-Integration – alles 100% kostenlos und auf Open-Source-Sprachmodellen basierend.

    PewDiePies Motivation war, dass KI erst dann wirklich nützlich wird, wenn man viele persönliche Daten teilt und die KI einen gut kennenlernt, was aber bedeutet, dass diese Daten bei großen Tech-Konzernen landen. Mit Odysseus wollte er das verhindern.

    **Installation und praktische Nutzung:** Während lokale Installation auf dem eigenen Rechner möglich ist, empfiehlt der Creator Odysseus auf einem Online-Server (z.B. bei Hostinger) zu installieren – dort läuft es kontinuierlich und ist von überall erreichbar. Das Sprachmodell wird nicht auf dem Server ausgeführt, sondern über Ollama Cloud verbunden, was eine gute Balance zwischen Datenschutz und Nutzbarkeit bietet: Hostinger vermietet nur die Infrastruktur (CPU/GPU), trainiert keine KI-Modelle und verdient durch Abos.

    **Features im Test:**
    – **Deep Research:** Recherchiert detaillierter als der normale Chat, schrieb im Test einen ausfĂĽhrlichen Artikel ĂĽber das Phänomen „Odysseus” (Film + Projekt), den der normale Chat nicht erkennen konnte.
    – **Compare:** Vergleicht mehrere Modelle (z.B. Deepseek, Kimi, Jamba) nebeneinander auf die gleiche Aufgabe – optional als Blind Test.
    – **Bildbearbeitung:** Eingebautes Bildbearbeitungs-Tool ähnlich Photoshop (Layer, Hintergrundentfernung), z.B. fĂĽr YouTube-Thumbnails.
    – **Agent-Modi:** Automatisierung fĂĽr E-Mail-Schreiben, Dokumentenerstellung.

    **Bedeutung für die KI-Ära:** Das Projekt zeigt zwei gegenläufige Bewegungen – wenige große Firmen (OpenAI, Anthropic, Google) dominieren einerseits, aber gleichzeitig erstarkt die dezentrale Open-Source-Community massiv. Jeder kann nun mit KI schnell eigene Softwareprojekte entwickeln. Da kommerzielle Durchbrüche schnell wieder ins Open Source landen und KI-Tools sich gegenseitig verbessern, verschwimmt die Grenze zwischen proprietär und offen.

    **Tradeoff:** Vollständige lokale Ausführung mit maximaler Privatsphäre erfordert sehr teure Hardware (z.B. Mac Studio). Das hier vorgestellte Setup (Hostinger + Ollama Cloud) ist ein praktischer Mittelweg: Daten bleiben nicht bei Google/OpenAI, aber man hat dennoch Convenience und Zugang zu starken Open-Source-Modellen.

    Open Source bei Hostinger und die UnterstĂĽtzung solcher Projekte sind als Gegengewicht zu Silicon-Valley-Giganten wichtig – „eine steigende Flut hebt alle Boote”.

    **Format & Kontext:** Demo mit Opinion/Reflexions-Elementen; explizit thematisiert wurden Open-Source-Modelle (Deepseek, Kimi, Jamba, Ollama Cloud), Claude/ChatGPT zum Vergleich, Perplexity, sowie die Infrastruktur-Provider Hostinger und Ollama. Der Creator betont die Rolle von Open-Source-Tools und Selfhosting in der kommenden KI-Ära.

No Priors: AI, Machine Learning, Tech, & Startups (1 neues Video)

  • Re-engineering the Semiconductor Supply Chain with Intel CEO Lip Bu Tan
    18.6.2026, 10:00:05

    # Zusammenfassung

    Der Podcast-Gast ist Lehu Tan, CEO von Intel und ehemaliger CEO von Cadence. Er diskutiert seine Strategie zur Umwandlung von Intel ĂĽber mehrere Themen:

    **Geschäftsmodell und Kultur:** Tan betont, dass bei neun von zehn seiner Investitionen die Unternehmen ihren Geschäftsplan anpassen mussten, daher bevorzugt er Unternehmerteams statt Einzelpersonen. Er hat eine Trois-Phasen-Strategie fĂĽr Intel eingeleitet: „crawl, walk, run” – zunächst demĂĽtiges Zuhören bei Kunden, dann Stärkung der Bilanz und Produktvereinfachung, schlieĂźlich MarktfĂĽhrerschaft.

    **Finanzierung und UnterstĂĽtzung:** Der US-Regierung wurde durch Regierungsprogramme ein groĂźer Anteil an Intel, was Tan mit dem Vorbild Taiwans (TSMC mit staatlicher UnterstĂĽtzung) rechtfertigt. Jensen Huang investierte fĂĽnf Milliarden Dollar in Intel; diese Beteiligung ist inzwischen auf 25 Milliarden angewachsen.

    **Geschäftsbereiche:** Tans Fokus liegt auf drei Säulen – Produkte (CPUs für Rechenzentren und KI), Foundry-Services und fortgeschrittenes Packaging. Er hat alle Engineering-Berichte direkt unter sich, um Verantwortlichkeit durchzusetzen. Bei der Foundry-Geschäft arbeitet Intel eng mit Elon Musk an Terra Fab zusammen, um die US-amerikanische Halbleiterinfrastruktur zu stärken.

    **AI und neue Technologien:** Agentic AI und Inference-CPUs sind laut Tan hochgradig nachgefragt. Er investiert in neue Materialien (Galliumnitrid, Siliziumkarbid, Indiumnitrid, Diamant) und fortgeschrittenes Packaging (Glas, künstliche Diamanten) als Lösungen für physikalische Grenzen der Miniaturisierung.

    **Venture-Investing-Philosophie:** Mit über 150 IPOs und 126 M&A-Transaktionen unter seinen Investitionen sucht Tan nach Engpässen in der Branche (z.B. Verbindungsprobleme, optische Signale) und early-stage Startups mit starken Teams und ersten Kunden. Er bevorzugt später Kohorten von 40–50+ Jahren, die Teammanagement verstehen, plus neue Tech-Talente im 30er-Jahren.

    **Globale Perspektive:** Während KI große Effizienzgewinne verspricht, sieht Tan Engpässe bei Energie, Speicher und Herstellung als Hauptbremsen. Er betont, dass nicht alle Unternehmen profitieren – nur wenige mit fokussierten Nischen und vollständigen Stack-Lösungen werden zu den großen Gewinnern.

    **10-Jahres-Vision:** Tan glaubt, dass Gewinner 2032–2034 diejenigen sind, die eine Nische fokussieren, die richtigen Partner finden und skalieren können. Intel selbst strebt an, durch Produktarchitekturen, GPU, CPU und Software für Physical AI sowie Agentic AI wettbewerbsfähig zu werden. Sein Ziel: 10x Rendite für Anteilseigner über 5–10 Jahre.

    Deep-Dive und Meinung mit Elementen von News-Update; primär kein spezifisches AI-Tool genannt, sondern allgemeine AI-/Agentic-AI-Trends bei Intel und Industrie im Fokus.

Productive Dude

Keine neuen Videos in diesem Zeitraum.

Sebastien Dubois

Keine neuen Videos in diesem Zeitraum.

Tech With Tim (4 neues Videos)

  • I Gave Codex a 24/7 Server. Now It Codes While I Sleep.
    19.6.2026, 15:56:57

    # Zusammenfassung

    Das Video zeigt, wie man Codeex CLI auf einem virtuellen privaten Server (VPS) einrichtet, um lange laufende Code-Agent-Aufgaben 24/7 in der Cloud auszuführen, ohne dass der eigene Laptop ständig offen sein muss.

    **Kernproblem:** Programmierer müssen oft mit halboffenen Laptop-Bildschirmen herumlaufen, während lokale Agenten (wie Codeex oder Claude) laufen. Dies ist unbequem bei Reisen, schlechtem Internet oder wenn Aufgaben Stunden dauern.

    **Lösung:** Ein VPS bietet ständige Verfügbarkeit, sichere Datenhosting, und schnellere Geschwindigkeit als lokales Internet. Der Workflow trennt kurzfristige lokale Arbeit von langfristigen delegierten Aufgaben.

    **Setup-Schritte im Video:**
    1. **VPS bereitstellen** – Mit Hostinger (KVM 2-Plan empfohlen), Codex als One-Click-Deployment wählen
    2. **SSH verbinden** – Mit Root-Zugangsdaten auf den Server zugreifen
    3. **Codeex CLI installieren** – Falls nicht bereits deployed, über Curl-Befehl installieren und mit Device-Code-Auth anmelden
    4. **GitHub verbinden** – Fine-Grained Personal Access Token in GitHub erstellen (mit Admin-, Contents- und Pull-Request-Permissions), dann `gh auth login` auf dem VPS ausführen
    5. **tmux installieren** – Persistent Shells ermöglichen, damit Prozesse weiterlaufen, auch wenn die SSH-Verbindung unterbrochen wird
    6. **Von Smartphone steuern** – SSH-Client (z.B. Terminus-App) nutzen, um sich vom Handy aus mit VPS zu verbinden und `tmux attach` verwenden
    7. **Automationen via Cron-Jobs** – Codex CLI mit `cron`-Jobs kombinieren, um täglich wiederkehrende Aufgaben zu planen (z.B. PR-Reviews, Code-Audits)

    **Praktischer Workflow:** Man kann von überall aus (Handy, Laptop) eine Aufgabe triggern, sich abmelden, und die Aufgabe läuft weiter im Hintergrund. Reconnect später: Der Fortschritt ist erhalten, weitere Arbeit möglich.

    **Beispiel-Automation:** Tägliche automatisierte Pull-Request-Reviews mit Markdown-Report, der ins Repo hochgeladen wird.

    Codeex CLI (mit Chatgpt-Abo gĂĽnstiger als API-Keys), GitHub, tmux und Hostinger-VPS sind die verwendeten Tools; Tutorial-Format mit Live-Demo-Komponenten.

  • AI Research Papers Are Here (And They’re Scary Good)
    18.6.2026, 13:50:05

    # Zusammenfassung: Lemma – KI-gestütztes Forschungs-System

    Das Video präsentiert Lemma, eine Plattform fĂĽr automatisierte wissenschaftliche Forschung, die das Konzept des “Vibe Coding” auf die Forschung anwendet. Statt selbst Experimente zu planen und durchzufĂĽhren, formuliert man eine Forschungsfrage und ein Multi-Agent-System aus KI-Agenten ĂĽbernimmt den gesamten Prozess: Literaturrecherche, Hypothesenentwicklung, Code-AusfĂĽhrung, Modelltraining und Erstellung einer vollständigen akademischen Forschungspapier mit Grafiken und Statistiken.

    Das System bietet vier Modi: **Explore** (einfache Berichte in 1-3 Minuten), **Survey** (akademische Ăśbersichtsarbeiten), **Code** (automatisierte Codeexperimente) und **SARS** (vollständig automatisierte Forschungsprojekte mit längerer Laufzeit). Der Nutzer demonstriert konkrete Beispiele: Ein Code-Task trainierte einen Bildklassifizierer zur Unterscheidung zwischen KI-generierten und echten Bildern (ca. 2-3 Stunden Laufzeit). Ein SARS-Task untersuchte, ob explizite UnsicherheitsäuĂźerungen in Prompts Halluzinationen bei LLMs reduzieren – das Experiment lief 1-2 Tage, nutzte zwei verschiedene Modelle und produzierte ein 9-seitiges Forschungspapier mit Methodik, Ergebnissen, Grafiken und Schlussfolgerungen. Das Ergebnis zeigte eine Reduktion der falschen Antworten um 18-51% durch “Binary Abstention”-Prompting, offenbarte aber auch Grenzen bei Knowledge-intensiven Fragen.

    Die Plattform war zum Zeitpunkt des Videos noch in Beta, ist kostenlos fĂĽr kleine Tasks, erfordert aber Credits fĂĽr längere Experimente. Der Aspekt der Besonderheit: Lemma ist ein “AI-for-AI-Unternehmen” – es nutzt KI zur Verbesserung von KI selbst, wobei das System teilweise mit seinen eigenen Ausgaben trainiert wurde.

    **Explicit erwähnt:** Lemma (Analum AI), Gwen 2.5 72B, GPT-4o — Demo/Showcasevideo.

  • Do THIS Instead of watching endless AI Engineer Roadmaps (DataCamp Review)
    15.6.2026, 13:00:10

    # Zusammenfassung: AI-Engineering Roadmap auf DataCamp

    Der Sprecher präsentiert einen getesteten Lernpfad zum AI Engineer auf DataCamp und betont, dass moderner AI Engineering weniger mit mathematischen Modellen oder statistischem Wissen zu tun hat, sondern vielmehr mit der praktischen Anwendung bereits existierender Technologien — also Pre-Trained Models, LLMs und Retrieval Augmented Generation (RAG) — um echten Geschäftswert zu schaffen. Der Kurs ist nicht für absolute Anfänger konzipiert, sondern setzt Python-Grundlagen voraus.

    Die Roadmap besteht aus neun Kursen mit drei Projekten und schätzungsweise 26 Stunden Bearbeitungszeit. Sie deckt folgende Themen ab: (1) **Working with the OpenAI API** — API-Requests, Modellauswahl, verschiedene Message-Typen; (2) **Prompt Engineering with OpenAI** — One-Shot und Multi-Shot Prompting, strukturierte Outputs; (3) **Erstes Projekt** — Multi-Turn Conversations mit Token-Tracking; (4) **Working with Hugging Face** — Open-Source Modelle für Text- und Bildklassifikation in Pipelines nutzen; (5) **LM Ops** — konzeptionelle Grundlagen zu Modellauswahl und Deployment-Überlegungen (ohne tiefe technische Details); (6) **Developing AI Systems with OpenAI API** — komplexere Anwendungen kombinieren; (7) **Embeddings & Vector Databases** — RAG, Embedding Models, ChromaDB und Pinecone; (8) **Software Engineering Principles in Python** und (9) **Developing LLM Applications with LangChain** — AI Agents und Tool Calling.

    Das Lernformat ist interaktiv: kurze Videos (3–5 Minuten) wechseln sofort mit Coding-Exercises, bei denen etwa 80 % der Zeit in einer Cloud-basierten Programmierumgebung verbracht wird. Der Sprecher lobt diesen Ansatz als effektiv für Wissensbehalt.

    Kritikpunkte: Das Intro-Material ist relativ langsam und repetitiv, die LM-Ops-Sektion zu konzeptuell ohne praktische Deployment-Beispiele, und der Schwierigkeitssprung ist deutlich (einfach am Anfang, deutlich herausfordernder bei Embeddings). Zudem wĂĽnscht sich der Sprecher ein abschlieĂźendes Integrationsprojekt. Positiv: Auch als erfahrener Engineer lernte der Sprecher noch Neues; die Progression ist insgesamt gut; die Lernstruktur ist konsistent ĂĽber alle Module. Das Zertifikat ist verfĂĽgbar.

    Preis: Monatlich ab 13 US-Dollar mit 25%-Rabatt über einen Link möglich; kostenloses Einstiegsformat existiert.

    **Fazit:** Ein solider Einstieg für Python-Entwickler (nicht für Anfänger), der etwa die Hälfte dessen abdeckt, was für einen Job notwendig ist, aber ein großartiges Sprungbrett zur Vertiefung — Demo & Meinung zu DataCamp OpenAI/Hugging Face Integration.

  • Build 3 PRODUCTION AI Agents in Python – Full Course (Agentspan)
    17.6.2026, 13:00:03

    # Production AI Agents in Python – Full Course

    Das Video fĂĽhrt durch den Bau von drei Production-ready AI-Agenten mit dem Open-Source-Framework AgentSpan.

    ## Die drei Agenten:

    **Agent 1 – Konversativer Agent:** Ein einfacher Chatbot mit Gedächtnis (ConversationMemory) und Tools, um die aktuelle Zeit zu abrufen. Zeigt die Grundlagen: Funktionen als Tools mit Docstrings, die der LLM aufrufen kann, sowie automatisches Hinzufügen von User- und Assistant-Nachrichten zum Speicher.

    **Agent 2 – RAG/Support-Agent:** Komplexer Agent mit mehreren Tools (Wissensdatenbank-Suche, Order-Lookup), strukturierter Output via Pydantic-Objekte, Guardrails (Input-Validierung gegen Prompt-Injektionen), und Human-in-the-Loop: Ein Tool erfordert `approval_required=True`, wodurch der Agent wartet, bis der Nutzer den Refund manuell genehmigt.

    **Agent 3 – Multi-Agent-Orchestration:** Mehrere spezialisierte Agenten (Researcher, Writer, Editor, Market/Risk/Financial Analysts) mit verschiedenen Ausführungsstrategien – sequenziell (hintereinander), parallel (gleichzeitig) oder nested (Analysis-Team parallel, dann sequenzielle Pipeline).

    ## Zentrale Production-Features von AgentSpan:

    – **Durability/Crash Recovery:** Alle Zustände auf dem Server gespeichert; Worker können nach Crash reconnecten und vom gleichen Execution-Step weitermachen.
    – **Human-in-the-Loop:** Approvals können angefordert werden; Agent wartet unbegrenzt, bis Mensch genehmigt/ablehnt.
    – **Observability:** Web-Dashboard zeigt alle Executions, Tool-Calls, Tokens, Dauer, komplette Logs in Echtzeit.
    – **Guardrails:** Input-/Output-Validierung vor/nach LLM (Custom-Funktionen, Regex, LLM-basiert).
    – **Tools:** Custom Python-Funktionen mit Docstrings als beschreibbare Tools, oder API/HTTP-Tools.
    – **Structured Output:** Pydantic-Modelle erzwingen deterministisches Output-Format.
    – **Memory:** Automatisch oder manuell Gesprächshistorie speichern.
    – **Testing:** Mock-Events, um Agents ohne LLM-Calls zu testen.

    ## Architektur:

    Server (durable execution, State, Queue, Retry) + Worker (eigener Code, Ausführung) + LLM (OpenAI/Anthropic/etc.). Server läuft lokal (SQLite) oder deployed (PostgreSQL + Docker Compose mit Auth).

    Der Kurs schreibt echten, funktionierenden Code – alle Abhängigkeiten (AgentSpan, Python, UV als Package Manager, optional FireCrawl für Web-Scraping).

    **AgentSpan (Framework), Demo/Tutorial mit Hands-on-Coding.**

TheAIGRID (6 neues Videos)

  • Google Flow Tools Tutorial – How To Use Google Flow Tools
    20.6.2026, 18:00:02

    # Google Flow Tools – Guided Overview

    Google Flow Tools ist eine Funktion von Google, mit der man kreative Tools in natĂĽrlicher Sprache (Plain English) bauen kann, um wiederkehrende Aufgaben zu automatisieren und kreative Grenzen zu verschieben.

    **Kostenlos vs. Bezahlt:**
    Alle vordefinierten Tools (für Bilder, Videos, Code, Prompting) sind kostenlos nutzbar. Nur das Erstellen eigener Tools ist auf Pro/Ultra-Abos beschränkt.

    **Bestehende Tools erkunden:**
    Die Bibliothek ist in Kategorien unterteilt: Image-Tools (z.B. „Simple Sketch” – Skizzen in realistische Bilder verwandeln), Video-Tools (Videos bearbeiten, Filter hinzufĂĽgen), Prompting-Tools (Prompts organisieren und verbessern) und experimentelle Tools (z.B. „Depth Warp 4D” fĂĽr 4D-Videoeffekte).

    **Tools remixen:**
    Wenn ein bestehendes Tool fast passt, kann man es per Dropdown-MenĂĽ remixen. Im Editor lässt sich das Tool durch natĂĽrlichsprachige Anweisungen anpassen – ohne Code schreiben zu mĂĽssen. Beispiel: „Make it so it has a video creation button” ergänzt einen Video-Button zum bestehenden Sketch-Tool.

    **Eigene Tools bauen:**
    Mit dem „Create Tool”-Button lässt sich ein neues Tool definieren. Die Eingabe sollte so einfach wie möglich sein; Google’s Agentic Code unter der Haube zerlegt die Anfrage in komplexe Logik. Beispiel: Ein Tool, das mehrere Kamerawinkel einer Szene erzeugt (Dropdown fĂĽr Bildstil, dann Multi-Shot-Generator). Falls das Tool nicht läuft, kann man Prompt-Struktur und Bild-Modell anpassen (z.B. verschiedene Google-Modelle wie Nano Banana Pro oder VO3.1 Flash hinzufĂĽgen) oder den Edit-Button nutzen. Es gibt ein tägliches Kontingent fĂĽr neue Tools.

    **Tool-Verwaltung & Sharing:**
    Fertige Tools landen in „My Tools”, können benannt, mit Custom-Icons versehen und geteilt werden – mit Link haben andere Nutzer Zugriff, können das Tool remixen und weiterteilen.

    **Kern-Gedanke:**
    Die einzige Grenze ist die Fantasie; das Ziel ist, repetitive Workflows zu automatisieren und zu beschleunigen.

    **Google Flow Tools (mit deren hauseigenen Modellen), Demo-Tutorial.**

  • The First Real LLM Breakthrough Is Here… SubQ (1000x Less Compute)
    18.6.2026, 18:00:26

    # SubQ: Sub-Quadratisches Sparse Attention im Detail

    SubQ ist ein Sprachmodell-Durchbruch mit 12 Millionen Token Kontextfenster, das auf einer vollständig sub-quadratischen sparse attention Architektur (SSA) basiert. Das Kernproblem: Traditionelle Transformer verwenden dense attention, bei der jedes Wort jedes andere Wort betrachtet, was zu quadratischer Skalierung führt — die Rechenkosten vervierfachen sich, wenn man die Textlänge verdoppelt. SubQ löst das, indem SSA lernt, für jedes Wort nur eine kleine Gruppe relevanter anderer Wörter auszuwählen und darauf die vollständige Attention-Berechnung anzuwenden. Anders als positionsbasierte Shortcuts (Longformer, Big Bird) arbeitet SSA inhaltsbasiert — ein Wort kann Details aus Millionen von Tokens entfernt abrufen, wenn die Bedeutung passt.

    Die Effizienzgewinne sind erheblich: Bei 1 Million Tokens benötigt dense attention etwa 252 PFLOPS pro attention layer, SSA nur knapp 4 PFLOPS — eine 64,5-fache Reduktion. SubQ ist 56 mal schneller als Flash Attention 2 bei diesem Umfang. Beim Needle-in-the-Haystack-Test erreicht es 100% Genauigkeit bis 2 Millionen Tokens und 98% bei 12 Millionen Tokens (obwohl hauptsächlich auf 1 Million trainiert) und nutzt dabei nur etwa 0,13% aller möglichen Beziehungen.

    Bei Standard-Benchmarks zeigt sich: SubQ 1.1 small scoret auf graduate-level science (GPQA diamond) 85,4% (unter GPT-4.5 mit 93,2% und Opus 4.8 mit 92%), beim competitive programming (Live Code Bench) 89,7% (GPT-4.5: 92%). Das Modell wurde nicht von Grund auf trainiert, sondern nahm ein bestehendes open-weight Frontier-Modell, ersetzte dessen dense attention durch SSA und trainierte dann progressiv auf längeren Kontexten (262K → 512K → 1M → 2M) plus etwa 1 Billion Tokens natürlich langer Daten (Bücher, vollständige Dokumente, Code-Repositories).

    Die Use-Cases liegen in Bereichen, wo aktuell Retrieval-Pipelines erforderlich sind: Code-Basis-Analyse, finanzielle Filings, Vertragsarbeit — alles auf einmal verarbeitbar statt fragmentiert. Kostenbeispiel: Ein Long-Context-Test soll auf SubQ etwa 8 Dollar gekostet haben versus 2.600 Dollar auf Opus. SubQuadratic startet mit Design-Partnern in den nächsten Wochen, allgemeiner Rollout diese Saison, General Release zum Jahresende; Ziele für später 2026 umfassen 50-Millionen-Token-Fenster.

    Die Skepsis ist berechtigt: Die meisten Benchmarks stammen von SubQ selbst (Appen bestätigte die aktuellen, aber nicht die breiteren Effizienz-Claims), Model-Weights sind nicht öffentlich, und sparse attention hat eine bekannte Schwäche bei kurzen alltäglichen Prompts (die meisten Chat- und Agent-Use-Cases), die in den Benchmarks nicht abgedeckt sind. Es gibt auch Lücken zwischen Lab-Retrieval-Scores und realen Multi-Fact-Tests. Die echte Verifikation steht noch aus — abhängig davon, ob unabhängige Nutzer und Labs die Zahlen unter echten Bedingungen reproduzieren können.

    **Thematisiert:** SubQ, Claude Opus, GPT-4.5, andere Frontier-Modelle; **Format:** News-Update / Deep-Dive.

  • AI Prices Are About to Shock Everyone
    14.6.2026, 23:00:37

    # Zusammenfassung: Die kommende Preisexplosion bei KI-Diensten

    Das Video argumentiert, dass die günstigen KI-Abonnements der letzten zwei Jahre – prominentestes Beispiel ChatGPT Plus für $20/Monat – ein künstlich subventioniertes Angebot sind, das nicht länger haltbar ist. Der Gründer von OpenAI, Sam Altman, bestätigte öffentlich, dass OpenAI bereits mit dem $200-Pro-Plan Geld verliert; die gesamte Firma wird 2026 etwa $14 Mrd. Verlust machen und soll erst 2030 profitabel werden. Diese Verluste werden durch Investor-Kapital gedeckt – ein Modell, das dem Uber-Playbook ähnelt: Nutzer mit Verlust anlocken, dann Preise erhöhen, wenn der Gewöhnungseffekt eintritt.

    Die Preissteigerung ist bereits sichtbar: Google hat bei Gemini stillschweigend die Nutzungslimits für Top-Modelle gesenkt und gleichzeitig teurere Pläne eingeführt. GitHub Copilot wechselt von Flat-Fee zu Token-basierter Abrechnung – ein Nutzer würde statt $28 plötzlich $700/Monat bezahlen. Große Unternehmen wie Uber und Microsoft kündigten bereits AI-Nutzung auf, weil die API-Kosten explodieren (Ubers CTO gab das gesamte 2026-AI-Budget bis April aus). XAI verbrennt $1 Mrd. monatlich bei nur $500 Mio. Umsatz.

    Mehrere Faktoren verschärfen den Druck: OpenAI und Anthropic bereiten IPOs vor (2026), die öffentliche Investoren zur Profitabilität zwingen. Potenzielle Regulierung (Datencenter-Moratorien) könnte die Compute-Verfügbarkeit knappen. Gleichzeitig sind Reasoningmodelle teuer – offene Modelle brauchen 1,5–10x mehr Token für dieselbe Aufgabe, was den vermeintlichen Open-Source-Kostenvorteil aufzehrt. Zwar sinkt der Preis pro Token jährlich um ~90%, aber Nutzer migrieren immer zu neueren, teureren Frontier-Modellen.

    Das wahrscheinliche Szenario: Die einfache $20-Flat-Fee wird nicht verschwinden, aber schrumpfen – neue Funktionen nur in höheren Tiers, Usage-Limits werden reduziert, komplexe Agent-Workflows meter-basiert abgerechnet statt inkludiert. Die “Frösche werden langsam gekocht.”

    **OpenAI und Anthropic sind die explizit genannten Anbieter; das Video ist eine Meinung/Reflexion mit Nachrichtencharakter.**

  • This New ‘Fusion’ AI Beats Claude Fable 5 — Here’s How To Use It (OpenRouter Fusion Tutorial)
    14.6.2026, 19:22:24

    **Zusammenfassung:**

    Open Router hat die Fusion API eingeführt, ein Compound-Modell-System, das Fable-5-ähnliche Intelligenz zu etwa halben Kosten erreicht. Das Prinzip: Ein Panel von Modellen bearbeitet parallel einen Prompt mit Web-Search und Tool-Zugriff, ein Judge-Modell analysiert dann die Antworten auf Consensus, Widersprüche, Lücken und einzigartige Erkenntnisse, bevor Opus 4.8 als finale Instanz ein Ergebnis syntetisiert. Messungen zeigen, dass auch die Budget-Variante (Gemini 3.5 Flash, Kimi 2.6, DeepSeek v4 Pro) 64,7% der Fable-5-Performance (65,3%) erreicht – bei bis zu 50% niedrigeren Kosten.

    Der praktische Workflow auf Open Router zeigt: Bei der Frage nach Best-Practice-Investitionsstrategien liefert jedes Modell separate detaillierte Antworten, die Analyse bricht diese dann in Übereinstimmungen, Unterschiede, Partial Coverage und **Unique Insights** auf – also Erkenntnisse, die nur ein Modell nennt. Besonders nützlich sind die identifizierten Blind Spots, da sie zeigen, was die KI nicht berücksichtigt hat. Eine solche Query kostete 0,63 Cent (Gemini 0,3¢, Opus 0,14¢, DeepSeek 0,1¢, Kimi 0,07¢ – alle einzeln einsehbar).

    Nutzer können eigene Modell-Fusions erstellen oder sogar zwei Opus-4.8-Instanzen kombinieren. Hauptkritik: Model Fusion performs nicht bei Long-Horizon-Tasks (Coding, Extended Reasoning über Stunden), wo Fable 5 seine Stärke hatte – Open Router hat diese Szenarien noch nicht benchmark-getestet.

    **Closing:** Open Router, Claude/Opus, DeepSeek, Kimi, Gemini – Demo/Tutorial.

  • How to Use Apple Intelligence on iPhone: Apple Intelligence ALL Features Full Tutorial 2026
    17.6.2026, 18:00:17

    # Apple Intelligence Features fĂĽr 2026: Praktische Ăśbersicht

    Das Video zeigt eine umfassende Anleitung zu den Apple Intelligence Features. Zunächst wird die Aktivierung über Einstellungen erklärt – man navigiert zu Apple Intelligence & Siri und aktiviert dort die Funktion, woraufhin das System im Hintergrund (bei WiFi und Stromversorgung) heruntergeladen wird.

    **Writing Tools** sind die meistgenutzten Features und funktionieren überall dort, wo die Tastatur erscheint (Notes, Mail, Messages, Suchfelder). Nach Markieren von Text öffnet sich ein Apple Intelligence Icon mit Optionen:
    – **Proofread**: Findet und unterstreicht Fehler
    – **Rewrite**: Ermöglicht Umschalten zwischen freundlichem, professionellem oder prägnanten Ton
    – **Summary/Key Points/List/Table**: Fasst groĂźe Textblöcke zusammen oder strukturiert sie um, funktioniert auch auf Webseiten
    – **Custom Changes**: Man beschreibt gewĂĽnschte Ă„nderungen in natĂĽrlicher Sprache

    **Visual Intelligence** macht den Bildschirm durchsuchbar – statt einen Screenshot zu machen, kann man Teile des Screens markieren und direkt damit nach ChatGPT fragen. Beispiel: Ein Bild eines Stuhls markieren und fragen „What style of chair is this?” – sofort erhält man detaillierte Informationen.

    **Live Translation** ist in Messages bereits integriert und übersetzt eingehende Texte automatisch; man antwortet auf Englisch und die Nachricht wird in der Sprache des Empfängers zugestellt. In FaceTime erscheinen live übersetzte Untertitel während der andere spricht.

    **Image Playground & Genmojis**: Man beschreibt ein gewĂĽnschtes Bild (z.B. „create a cartoon dog astronaut”), und mehrere Variationen werden sofort generiert. Genmojis kombinieren bestehende Emojis oder fĂĽgen Beschreibungen hinzu; man kann auch Personen aus der Fotobibliothek hinzufĂĽgen, um personalisierte Emojis zu erstellen.

    **Siri-Integration**: Siri wurde mit ChatGPT integriert. Kostenlos kann man einfache Aufgaben wie Notizen erstellen; für erweiterte Funktionen (Bildgenerierung, komplexere Anfragen) kann man sich mit seinem ChatGPT-Konto anmelden, um Zugriff auf fortgeschrittene Modelle zu erhalten. Selbst ohne Paid-Membership sind begrenzte Anfragen möglich.

    **Demo mit Apple Intelligence Features (hauptsächlich Visual Intelligence und ChatGPT-Integration).**

  • AI Experts Are Warning About a Dangerous New Problem With LLMs
    16.6.2026, 12:30:37

    ## Zusammenfassung: “Why LLMs Are Becoming Dangerous”

    Das Video behandelt ein zentrales Sicherheitsrisiko der KI-Entwicklung: Large Language Models werden zunehmend mächtig genug, um Aktionen auszuführen, sind aber nicht zuverlässig genug, um deren Konsequenzen zu verstehen. Das ist ein qualitativer Unterschied zu Chatbots — während ein Sprachmodell in einem Chat etwas Falsches sagen kann, das der Nutzer ignoriert, kann ein Agent diese falsche Information in echte Handlungen umsetzen: falsche E-Mails versenden, Dateien löschen, Entscheidungen in Workflows treffen.

    Der zentrale Begriff ist hier das **„World Model”** — ein Modell, das nicht nur Tokens vorhersagt, sondern die Konsequenzen von Aktionen vorherzusehen vermag, bevor es sie ausfĂĽhrt. LLMs sind aber primär auf Token-Vorhersage trainiert, nicht auf das Verständnis von Ursache und Wirkung in der physischen oder digitalen Welt. Ein prominentes Beispiel aus dem Video: Ein AI-Coding-Agent, der von Claude Opus betrieben wurde, löschte in 9 Sekunden eine komplette Produktionsdatenbank samt Backups — weil das Modell die Konsequenzen seiner Befehle nicht vorhergesehen hatte.

    Das Problem verschärft sich, weil die Industrie nicht auf perfekte World Models wartet, sondern bereits Agenten in die Produktion bringt — als Browser-Operatoren, in Workflows, mit API-Zugriff und Datenzugriff. Ein LLM, das zu 95% korrekt ist, mag im Casual Writing akzeptabel sein, aber in High-Stakes-Workflows (Medizin, Finanzen, Robotik, Enterprise-Systeme) kann jene verbleibende 5% katastrophal sein. Besonders kritisch: Agents können Aufgaben scheinbar erfolgreich abschließen, während sie im Prozess Instruktionen verletzen oder Risiken schaffen — diese Fehler entgehen dem Scoring, wenn nur das Endergebnis bewertet wird.

    Die Zuverlässigkeit von LLMs ist derzeit am höchsten in Umgebungen mit **digitalen, reversieblen oder verifizierbaren Aktionen** (Code kann getestet werden, EntwĂĽrfe können ĂĽberprĂĽft werden), aber stark risikobehaftet in Kontexten, wo Verifikation zu spät kommt oder unmöglich ist. Ein fĂĽhrender AI-Forscher (Yann LeCun zitiert) argumentiert sogar, dass LLMs in ihrer gegenwärtigen Form intrinsisch unsicher sind, weil sie per Definition nicht die Konsequenzen ihrer Handlungen vorhersagen können und nur auf trainingsbedingten Mustern basieren, nicht auf hartcodierten Sicherheitsgarantien. Meta’s Video Foundation Models deuten eine mögliche Alternative an: Modelle, die auf groĂźem Videodatensatz trainiert sind und physikalische Realität tatsächlich verstehen lernen, statt nur Sprache zu generieren.

    Die Debatte sollte nicht „LLMs sind gut vs. schlecht” sein, sondern: Wo werden sie eingesetzt, wie viel Autonomie bekommen sie, und gibt es ein System zur Verifikation, bevor Konsequenzen entstehen?

    **Claude und Anthropic (als Hersteller eines gefährlichen Agenten in der genannten Anekdote) wurden explizit erwähnt; Format: Meinung/Reflexion mit tiefem Forschungsfokus.**

Theo – t3․gg (4 neues Videos)

  • It’s time to go bigger
    20.6.2026, 03:21:41

    # Zusammenfassung

    Der Sprecher argumentiert, dass sich die Softwareentwicklung durch KI-Tools fundamental verändert hat und Ingenieure nicht Jobverlust fürchten sollten, sondern erkennen sollten, was neu möglich geworden ist. Er zieht eine Parallele zur Cloud-Revolution: Damals wurden Experimente billiger, weil man nicht mehr große Teams infrastrukturell vorbereiten musste – heute werden sie billiger, weil Code-Schreiben selbst günstiger ist.

    Sein Kernarguument: Vorher war Software-Entwicklung kapitalintensiv. Man musste genau vorhersagen, wie viele Engineers fĂĽr ein Projekt nötig sind. Irrtum war teuer und sozial belastend (Layoffs). Jetzt können einzelne oder kleine Teams „Amazon-Scale”-Software bauen. Das bedeutet: Bisher unmöglich erscheinende Projekte werden plötzlich sinnvoll.

    Er illustriert das mit Salesforce: 95% der Nutzer brauchen nur 5% der Features, aber diese 5% unterscheiden sich von Unternehmen zu Unternehmen. FrĂĽher war ein Salesforce-Konkurrent Selbstmord, weil man alle Features bauen musste. Jetzt könnte man eine „shitty horizontal” Lösung bauen – minimal aber funktional in allen Bereichen statt perfekt in nur einem.

    Seine Lösung **LakeBed** ist genau dieses Konzept: ein Cloud-Framework, das Datenbank, Authentifizierung, Deployment, Bundling und ein custom Runtime vereint – alles so integriert, dass man schnell kleine „shitty apps” bauen und deployed kann, ohne in mehreren Dashboards rumzuhängen. Statt Gluelösungen zu bauen (wie seine frĂĽheren Projekte Shoe oder Upload Thing), hat er „mit dem Vorschlaghammer” alles neu erfunden.

    Im Demo zeigt er: Cursor mit Composer 2.5 baut 10 Apps (To-Do-Liste, Poll-Arena, Recipe-Box) von Grund auf in ~8 Minuten, alle mit Google Sign-in und Echtzeit-Sync. Solche Plattformen hätten keinen Sinn gehabt, als das Setup-Overhead größer war als der Nutzen.

    Seine Botschaft: Ingenieure nutzen diese Tools noch zu defensiv – um alte Arbeit schneller zu machen. Sie sollten stattdessen nach Projekten suchen, die bislang unmöglich schienen, und diese bauen. Das ist wo der echte Spaß anfängt.

    **Keine spezifischen AI-Tools/Anbieter explizit thematisiert; Format: Meinung/Reflexion mit Projekt-Demo (LakeBed).**

  • I guess we’re writing loops now?
    18.6.2026, 19:21:20

    # Zusammenfassung

    Das Video argumentiert dafür, dass Entwickler aufhören sollten, Coding-Agenten direkt zu promoten, und stattdessen selbst-geschlossene Schleifen bauen sollten, in denen Agenten ihre Arbeit orchestrieren und reviewen.

    Der Autor beschreibt seine Entwicklung vom manuellen Handholding (Plan lesen → Teil 1 ausführen → Teil 2 ausführen → Review → Feedback zurückbringen) hin zu automatisierten Workflows, in denen der Agent die gesamte Koordination übernimmt. Ein Schlüsselmoment war die Erkenntnis, dass Codeex neue Threads spinnen kann, um Arbeit zu parallelisieren.

    Konkrete Beispiele:
    – **Single PR Loop**: Ein Agent ĂĽberwacht einen PR ĂĽber 6+ Stunden, liest automatisch Reviewer-Kommentare und adressiert sie selbständig
    – **Multi-Stage Workflow**: FĂĽr eine komplexe Isolate-Layer-Refaktorierung schrieb der Agent eine HTML-Plan, fragte dann um Erlaubnis fĂĽr einen Workflow bestehend aus: (1) Thread fĂĽr PR, (2) Thread fĂĽr Review, (3) Loop fĂĽr Kommentare, (4) Merge + nächster PR. Der Agent erstellte dynamische Sub-Loops basierend auf dem Problem — nicht vordefinierte Personas, sondern adaptive Strukturen
    – **Resultat**: 4 gestackte PRs, vollständig reviewed und merged ĂĽber Nacht ohne manuales Zutun

    Der Kern-Ratschlag: Nach jedem Agent-Output identifizieren, was der Mensch danach normalerweise tut (Code lesen → comitten → PR erstellen → Review-Kommentare sammeln → fixes machen), und diese Steps dem Agenten direkt befehlen, statt sie zu copy-pasten. Besonders wichtig: Code von Agenten *nicht* selbst reviewen, sondern andere Agenten reviewen lassen.

    Zur Kostenwarnung: Diese Schleifen verbrauchen massiv mehr Tokens. Ein 8-Stunden-Workflow für drei kleine Kommentare verbrauchte 3 Millionen Tokens. Allerdings: Der Autor zahlt $200/Monat für Claude Code/Codeex-Subscriptions (mit hohem Limit), nutzt diese über mehrere Maschinen, und ist trotz ~$10k geschätzter Inference-Wert im Juni insgesamt kosteneffizient. Bei API-Pricing eher nicht empfohlen; mit hohen Rate Limits sollte man sie maximal ausschöpfen.

    Tools erwähnt: Claude (Opus, Codeex, Claude Code mit /goal-Primitiv), Code-Review-Tools (Code Rabbit, Reptile, Macroscope), Computer Use, Hermes Agent. — **Meinung/Reflexion, Deep-Dive zu Agentic Workflows.**

  • The weird situation with Fable
    15.6.2026, 09:36:23

    # Zusammenfassung

    Das Video kritisiert Anthropics Implementierung von Fable, einem neuen Mythos-Klassifizierungsmodell, das zwar leistungsstark ist, aber mit problematischen Restriktionen versehen wurde. Fable 5 ist technisch identisch mit Mythos 5, unterscheidet sich aber durch zusätzliche Sicherheitsvorkehrungen: Anfragen zu Cybersicherheit, Biologie, Chemie und Destillation werden zu Claude Opus 4.8 umgeleitet und dem Nutzer mitgeteilt. Das größere Problem liegt in den ursprĂĽnglich **unsichtbaren Safeguards** fĂĽr „Frontier LLM Development” – Anthropic modifizierte Prompts, Steering Vectors oder Fine-Tuning still und unbemerkt, um die Modelleffektivität bei Aufgaben zu sabotieren, die konkurrierende Modelle trainieren könnten, während Nutzer trotzdem vollständiger Preis berechnet wurden. Dies war völlig intransparent – Nutzer bekamen keine RĂĽckmeldung, wenn ihre Anfragen blockiert oder manipuliert wurden.

    Zusätzlich führte Anthropic eine 30-Tage-Datenspeicherungspflicht ein, die Standard-ZDR-Verträge (Zero Data Retention) vieler Enterprise-Kunden invalidiert; bei Sicherheitsvlaggen werden Eingaben/Outputs bis zu zwei Jahre aufbewahrt. Der Autor entdeckte, dass Anthropic nachträglich die Systempapiere überarbeitete, ohne es kennlich zu machen.

    Anthropic revidierte diese Praxis unter Druck der Forschungsgemeinschaft und machte die Frontier-Safeguards später sichtbar mit Fallback zu Opus, doch der Autor sieht dies als Präzedenzfall für versteckte Modellmanipulation als Supply-Chain-Risiko. Seine Hypothese: Anthropic trainierte versehentlich proprietäre interne Forschungsinformationen in die Mythos-Gewichte ein und muss nun verhindern, dass Konkurrenten diese Informationen extrahieren.

    **Erwähnte Modelle/Anbieter:** Anthropic, Claude (Fable 5, Mythos 5, Opus 4.8) — Meinung/Reflexion mit technischem Deep-Dive.

  • I hated making this video…
    17.6.2026, 10:47:38

    # Zusammenfassung

    Der Creator hat lange gezögert, dieses Video zu machen, weil er sonst regelmäßig Anthropic kritisiert – doch nach intensiver Nutzung von Claude Code möchte er gezielt die positiven Aspekte hervorheben, damit andere Harnesses diese Features übernehmen.

    **Skills mit Script-Ausführung**: Claude Code ermöglicht es, dass Skills (Markdown-Dateien) direkte Script-Ausführung beinhalten. Das erspart dem Modell Schritte – beispielsweise beim Repo-Explorer-Skill wird bei Laden bereits das Verzeichnis angelegt und sein Inhalt gelistet. Der Creator findet diese Flexibilität wichtig, warnt aber, dass andere Harnesses (Cursor, Cline) diese Funktion bisher nicht haben, obwohl sie sicher ist.

    **Claude.md Imports und Overrides**: Die Claude.md kann via `@path/import`-Syntax andere Dateien einbinden (max. 4 Hops), was elegante Lösungen ermöglicht – etwa `@agent.md` zu importieren und nur spezielle Claude-Instruktionen hinzuzufügen, ohne doppelte Dateien zu verwalten. Die `claude.local.md` (mit Git-ignore) bietet team-freundliche persönliche Overrides ohne Konflikte.

    **Tiefe Workflows**: Das Workflow-Feature lässt Claude Code eigenständig komplexen Code schreiben, der Sub-Agenten mit unterschiedlichen Rollen orchestriert. Ein Workflow ist keine vordefinierte Struktur, sondern der Agent generiert dynamisch Phasen, Prompts und Datenverarbeitung. Der Creator zeigt ein PR-Audit-Workflow mit 15 parallelen Agenten – beeindruckend, aber kostspielig (ca. $100 pro 10 Minuten bei Opus 4.5). Der generierte Code nutzt `pipeline()`-Helper und dynamische Prompts; Code wird dabei nicht nur Output, sondern Zwischenschicht zwischen Model-Runs.

    **Terminal UI (Fullscreen Mode)**: Mit `claude code –no-flicker=1` oder `/tui full screen` nutzt Claude Code Alt-Screen-Rendering statt React-Updates – voller Terminal, normale Scroll-Buffer werden verdrängt, sauberes Closing. Der Creator bevorzugt das fĂĽr Klarheit.

    **Weitere Features**: `/side`-Kommando für Nebenfragen ohne Hauptkonversation zu unterbrechen (auch Cursor hat ähnliches). **Branch/Rewind** zum Zurückgehen in der History (Vorsicht beim Fastforward). **Remote Control** (`/remote control`) zum Steuern vom Browser oder Claude-App auf dem Handy. **Deep Links** (HTTP `cloud-cli://`-Schema) zum Öffnen von Sessions aus HTML-Pages. **Account-Switching**: Nutzungslimit über Account-Wechsel umgehen – neue API-Requests werden auf anderem Account abgerechnet.

    **Kontext am Ende**: Der Creator erwähnt, dass Anthropic Fable-Zugang (fĂĽr Mythos sowie eigenes Model) auf US-Regierungsdruck hin fĂĽr Nicht-US-Nutzer suspendiert hat – “beispiellos”.

    **Fazit**: Der Creator betont, dass dieser Video-Ansatz nicht Claude Code glazen soll, sondern Standards voranbringen und andere Tools ermutigen soll, diese Patterns zu adopten.

    **Explizit erwähnt**: Claude Code, Anthropic, Fable, Opus 4.5, Cursor, Cline, Codex (auch mit `/side`), n8n/pi, Joel Hook/pi-skill-interpolation, GitHub, Depot (Sponsor). Format: Meinung/Reflexion mit Demo-Elementen.

Tim Carambat

Keine neuen Videos in diesem Zeitraum.

Unsupervised Learning (2 neues Videos)

  • Debating the Morality of Dario Amodei
    21.6.2026, 03:12:32

    # Zusammenfassung: Diskussion zu Dario Amodei und AI Safety

    In dieser Live-Diskussion debattieren zwei Gesprächspartner über Dario Amodeis Position zu AI Safety und die richtige Vorgehensweise bei der Entwicklung fortgeschrittener KI-Modelle.

    **Ausgangslage:** Der eine Sprecher hatte ein 18-Minuten-Video veröffentlicht, in dem er Amodei kritisiert, weil dieser davon ausgeht, dass KI zu 25% schlecht für die Gesellschaft ausgehen könnte, und deshalb kontrollierte Freigabe fordert – einschließlich Beschränkungen von Distillation und Open-Weight-Modellen. Der Sprecher lehnt dies als illiberal ab.

    **Kernkonflikt:** Der andere Sprecher argumentiert, dass Amodei moralisch handelt und seine VorsichtsmaĂźnahmen notwendig sind, falls die Risiken real sind. Die Debatte dreht sich um drei Ebenen:

    1. **Wie groß sind die Risiken wirklich?** Der erste Sprecher glaubt nicht an Nano-Biowaffen-Szenarien, die durch AI ermöglicht werden; der zweite verweist auf beschleunigte Fähigkeiten bei Cyber-Exploits und potenzielle Biowaffenforschung durch fortgeschrittene Modelle.

    2. **Chinas Strategie:** Der zweite argumentiert, China zerstört bewusst US-Dominanz durch Distillation und Open-Source-Freigabe; der erste sieht darin einfach ein Geschenk für amerikanische Nutzer (billigere Modelle wie GLM 4o).

    3. **Was sollte die richtige Maßnahme sein?** Der erste Sprecher will: Wettbewerb zwischen allen Labs, keine Kartellbildung, Freigabe an die Öffentlichkeit. Der zweite will: kontrollierte, koordinierte Freigabe, um Zeit für gesellschaftliche Anpassung zu schaffen – und sagt, wenn Amodei wirklich an Existenzrisiken glaubt, sollte er Nationalisierung akzeptieren, nicht private Kontrolle behalten.

    **Einigung und Differenzen:** Beide einigen sich, dass Amodei vermutlich wirklich an die Risiken glaubt und nicht aus reiner Gier handelt. Sie sind sich auch einig, dass Diktatur – ob von Regierungen oder Konzernen – schlecht ist. Der Konflikt bleibt: Ob man momentan Freiheit für potenzielle Sicherheit opfern sollte, wenn die Risiken nicht bewiesenen sind.

    Der erste Sprecher fasst seinen Standpunkt zusammen: Lieber haben alle Zugang zu guten, billigen Modellen und man löst Probleme, wenn sie entstehen, als dass man centralisierte Macht aufbaut, die „eines Tages” wieder freigegeben wird.

    **Format:** Live-Q&A / Diskussion zwischen zwei Positionen (ohne Konsens-Endpunkt). Keine spezifischen AI-Tools außer Mythos-Modellen erwähnt.

  • An Interview With Ivan Dwyer
    16.6.2026, 15:00:31

    # Zusammenfassung

    Ivan, Product Strategy Lead bei Axonius, diskutiert die Bedeutung von Asset-Management und Asset Intelligence fĂĽr moderne Sicherheits- und IT-Teams. Das Kernproblem: Sicherheits- und IT-Teams nutzen dutzende Tools, die jeweils unterschiedliche Versionen der Wahrheit ĂĽber Assets berichten. Axonius wurde 2019 gegrĂĽndet, um diese Daten zu reconciliieren und eine zentrale, vertrauenswĂĽrdige Quelle fĂĽr Asset-, Security- und Business-Context zu schaffen.

    **Plattform-Architektur:** Die Axonius-Plattform basiert auf einem Adapter-Netzwerk von ĂĽber 1.400 bidirektionalen Integrationen, die ĂĽber 40 Asset-Typen, 150 Exposure-Quellen und 600 downstream Actions abdecken. Kunden können Queries stellen wie „Wo fehlt mir Endpoint-Coverage?” oder „Wo habe ich Shadow-SaaS-Apps ohne SSO?”. Die Plattform agiert als Orchestration-Layer zwischen diesen Tools.

    **Nutzungsmuster:** Ein häufiger Use-Case ist Agent-Coverage-Verification – etwa zur ĂśberprĂĽfung, ob CrowdStrike oder Defender ĂĽberall deployed sind. Die Plattform nutzt die „negative Space” – wenn man alle Tools verbindet, kann man feststellen, wo etwas *fehlt*, nicht nur wo es existiert. Weitere Anwendungen sind Vulnerability-Management, Exposure-Management und kontinuierliche CMDB-Anreicherung.

    **Vision:** Ivan beschreibt die Zukunft als Evolution von einem „Swiss Army Knife”-Toolkit zu einer „Durable Context Layer” – verifizierte, qualitätsgestufte Asset- und Context-Daten, auf die Agents und andere Tools aufbauen können. Dies ist zentral fĂĽr „Decision-Grade Infrastructure”: Wenn Unternehmen automatisierte Entscheidungen treffen (vom Patching bis zu Business-Decisions), muss die zugrunde liegende Context eine definierte Qualitätsstufe erfĂĽllen.

    **AI-Integration:** Axonius arbeitet an zwei Fronten – „Security for AI” (AI-Assets, Agent-Identitäten, MCP-Server als Inventar-Items) und „AI for Security” (Natural Language Queries, Explainability, Recommendation Engines fĂĽr Remediation-Pfade, agentic Workflows).

    **AnkĂĽndigungen:** Die Ăśbernahme von Scenario (IoT/OT-Asset-Management fĂĽr Medizingeräte) erweitert die Asset-Klassen. Ein neues Produkt „Verified Assets” stammt Assets mit Quality Gates – Freshness, vollständige Attribute, Owner-Zuordnung, Tagging – um eine vertrauenswĂĽrdige Basis fĂĽr automatisierte Entscheidungen zu schaffen.

    **Kernthese:** Die Fundamentals (Agent-Coverage, SSO-Protection, MFA auf Admin-Accounts) mĂĽssen zuerst gelöst werden, bevor Teams die „V-Apocalypse” von Vulnerabilities bewältigen können. Das Ziel: „Self-Healing Environments” – kontinuierliche ĂśberprĂĽfung und Heilung von definierten Security-States, geankert in dieser durable Context Layer.

    **Kontext:** Axonius (hauptsächlich), Live-Interview/Deep-Dive.

WorldofAI (6 neues Videos)

  • GPT-5.6 Pro LEAKED & Is Coming Soon! Mythos 5 Level!
    20.6.2026, 14:57:39

    # GPT 5.6 Leak und Features vor Launch

    OpenAI plant demnach den Launch von GPT 5.6 fĂĽr Donnerstag, 25. Juni. Das Modell wird derzeit in zwei Versionen A/B-getestet: Die Entscheidung fiel offenbar auf das schwächere „Kindle Alpha”-Checkpoint statt des stärkeren „Kepler Alpha”. Pro-Nutzer können GPT 5.6 bereits heimlich testen, indem sie in ChatGPT „GPT 5.5 Pro” auswählen – manchmal erhalten sie dann die neue Version.

    Die wichtigsten technischen Verbesserungen: GPT 5.6 Pro hat ein erhöhtes Reasoning-Budget von 960 (vorher 768), sodass das Modell länger denken und komplexere Agenten-Aufgaben handhaben kann. Die Knowledge Cutoff wurde auf Dezember 2025 verschoben (von August 2025). Neu integriert sind Playwright und Browser-Use, was Real-World-Automation, Web-Testing, Recherche und Coding verbessert.

    In der Praxis zeigt sich GPT 5.6 im Frontend-Code deutlich besser als GPT 5.5, generiert aber laut dem Tester immer noch nicht die Qualität von Claude Opus – ausgabenseitig ist das Modell dennoch effizienter. Bei Spielen ist das Ergebnis beeindruckend: Eine Minecraft-ähnliche Welt mit Dörfern, Mobs, Mining-Mechaniken und Höhlensystem rankiert sich auf Platz 2 nach Fable 5. Bei Voxel-Kunst und komplexen Simulationen (z.B. eine funktionsfähige Sim-City-ähnliche Anwendung mit KI-Agenten, Karrieren, Beziehungen) zeigt GPT 5.6 Stärke. Auch SVG-Generierung (etwa eines Windows-11-Betriebssystems) funktioniert sehr präzise.

    Fazit: Das Video ist eine Leak- und Demo-Analyse mit praktischen Codebeispielen – mehrere generative Modelle von OpenAI (GPT 5.6, GPT 5.5) werden verglichen, kurz auch Fable 5 erwähnt. *News-Update / Demo-Hybrid.*

  • GLM 5.2: NEW Opensource KING IS BEATING GPT-5.5 & Opus 4.8! (Fully Tested)
    19.6.2026, 17:22:39

    # GLM 5.2 – Open-Source Modell auf Profi-Niveau

    ZAI hat GLM 5.2 gelauncht, ein Open-Source-Modell unter MIT-Lizenz, das in mehreren Bereichen proprietäre Modelle wie Claude Opus 4.8 oder Gemini 3.1 Pro schlägt – besonders im Web-Design, wo es Design Arena anführt. Das Modell bietet zwei Reasoning-Level (Max und High), ein 1-Million-Token-Kontext-Fenster und glänzt mit deutlich besserer Kosteneffizienz: GLM 5.2 generiert eine Landing Page für etwa 6 Cent, Opus 4.8 kostet rund 50 Cent – bei vergleichbarer oder besserer Qualität und höherem Speed.

    Die Benchmark-Performance ist beeindruckend: GLM 5.2 erreicht 46,2% auf Deep Suite, 74,4% auf Frontier Sway (knapp hinter Opus) und konkurriert auf Terminal Bench und SwayBench Pro mit GPT 4o und Opus. Das Modell wurde speziell fĂĽr Code-Agenten-Aufgaben optimiert (groĂźe Implementierungen, automatisiertes Research, Performance-Optimierung, Debugging) und liegt im World-of-AI-Benchmark aktuell auf Platz 5.

    In praktischen Tests brilliert GLM 5.2 vor allem bei Frontend-Entwicklung: Landing Pages mit Scroll-Triggern, Audio-Visualizer, Website-Klone (Airbnb), 3D-Modelle (interaktive Uhr), Game-Development (Dungeon Crawler mit Items/Mobs, Minecraft-Clone mit Cave-System). Auch bei 3D-Grafik und SVG-Generierung performt es stark. Schwächen liegen beim Debugging, Reasoning und Gencode-Capabilities. Best Results mit GLM 5.2 High Thinking. Preis: $1,20 pro Million Input-Tokens, $4,10 pro Million Output-Tokens (identisch mit GLM 5.1). Das Modell ist über Chatbot, API und als offene Gewichte verfügbar.

    **Explizit erwähnt:** GLM 5.2 von ZAI (Open-Source), Claude Opus 4.8, Gemini 3.1 Pro, Pod Fable 5 — **Demo mit praktischen Tests**.

  • NotebookLM Agentic AI Update Is HUGE! Agentic Coder Now?
    18.6.2026, 06:30:08

    # Notebook LM erhält massive Agentic-Upgrades

    Notebook LM wandelt sich von einem reinen Dokumenten-Chat-Tool zu einem vollwertigen agentic Research-Assistenten mit erweiterten Fähigkeiten. Die wichtigsten neuen Features:

    **Verbesserte Chat-Erfahrung**: Das Tool nutzt jetzt Gemini 3.5 Flash und ermöglicht ein tieferes Verständnis der KI-Reasoning-Prozesse. Der Performance-Boost ist erheblich – die neue Version schlägt das Vorgänger-System in 65% der Tests, bei großer Dokumentenanalyse sogar zu 69,9% und bei Web-Recherche zu 78,2%.

    **Secure Cloud Computer**: Jedes Notebook enthält Zugang zu über 100 softwaretechnischen Fähigkeiten, die direkte Code-Ausführung und komplexe Multi-Step-Workflows ermöglichen statt nur Zusammenfassungen zu liefern.

    **Strukturierte Outputs**: Notebook LM kann nun Ergebnisse als PDFs, Word-Dokumente, Markdown, Excel-Sheets, PowerPoints, CSVs, JSON-Dateien und Bilder exportieren – damit entstehen fertige Deliverables direkt aus dem Tool.

    **Agentic Research Feature**: Das Tool kann eigenständig Web-Quellen entdecken und vorschlagen, diese mit Genehmigung ins Notebook integrieren und dabei vollständige Zuschreibungen bewahren. Nutzer starten mit losen Ideen, nicht perfekt organisiertem Material – Notebook LM hilft, die Forschungsbasis zu strukturieren.

    **Source Attribution**: Bei generierten Reports und Artefakten sieht man transparent, welche Quellen und Prompts verwendet wurden.

    Das Feature rollt zunächst für Google AI Ultra-Abonnenten aus, soll aber bald auf alle bezahlten Pläne kommen. Spekulativ sollen kommend auch die neuen Omni-Videomodelle von Gemini integriert werden.

    Notebook LM (Google / Gemini 3.5 Flash), Demo/Meinung.

  • How to Build 24/7 Claude Agents! EASILY!
    15.6.2026, 06:00:18

    # Zusammenfassung: 24/7 AI-Agenten mit Base 44 Super Agents

    Das Video zeigt, wie man mit **Base 44 Super Agents** automatisierte AI-Workflows ohne Coding aufbaut und 24/7 in der Cloud ausführt. Das Hauptproblem bisheriger Ansätze: manuelle Kodierung, ständige Integration verschiedener Tools und die Notwendigkeit, lokale Hardware dauerhaft laufen zu lassen.

    Super Agents bietet stattdessen verwaltete Infrastruktur, sichere Defaults und vorkonfigurierte Integrationen (Gmail, Google Calendar, Slack, Stripe, CRMs, 100+ weitere). Statt monolithischer Automationen kann man mehrere spezialisierte Agenten mit klaren Rollen definieren und deren Outputs automatisch verkettet in den nächsten Schritt leiten.

    Als Demonstration wird ein Workflow für tägliche AI-News-Automation aufgebaut: Ein erster Agent recherchiert täglich um 9 Uhr ET aktuelle Topics, bewertet Glaubwürdigkeit und liefert Quellen. Ein zweiter Agent konvertiert die Recherche in ein Video-Skript mit Intros, Segmenten und CTAs. Ein dritter generiert daraus ein PDF-Report und versendet alles per Gmail. Der gesamte Prozess läuft automatisch ohne Nutzereingaben. Die Plattform erlaubt auch Voice-Prompts, File-Uploads und direkte Chat-basierte Agent-Definition. Selbst auf dem kostenlosen Tier funktioniert die komplette Automatisierung in Minuten statt Stunden manueller Arbeit.

    **Base 44 Super Agents, Modelle via Auto-Routing (Gemini 3.1 Pro, Sonnet 4.6, GPT 5.4, mit Upgrade zu Opus 4.8 oder GPT 5.5) — Tutorial/Demo**

  • Kimi K2.7 Code: BEST Open Source Model? REALLY Cheap and Beats Opus 4.8 and GPT 5.5? (Fully Tested)
    17.6.2026, 06:30:29

    # Zusammenfassung: Moonshot AI Kimi K 2.7 Code

    Moonshot AI hat das offene Sprachmodell Kimi K 2.7 Code veröffentlicht – ein Mixture-of-Experts-Modell mit etwa einer Billion Parametern, spezialisiert auf Code-Generierung, Code-Verständnis, agentisches Programmieren und Entwickler-Tool-Integration. Das Modell verbessert die Befehlsbefolgung um etwa 30 % gegenĂĽber K 2.6, reduziert „Overthinking” und performa besser in langkontextigen Coding-Workflows. Laut Benchmarks schneidet Kimi K 2.7 bei Aero’s Smoke Test sehr stark ab, ist aber nach eigener Einschätzung des Sprechers nicht wirklich vergleichbar mit Frontier-Modellen wie Claude 5 oder GPT-4o in praktischen Anwendungen – einige Benchmarks favorisieren Kimis Stärken.

    Der Schwachpunkt: die Context-Länge stagniert bei 262K Token (nur marginal über den 256K des Vorgängers) – für ein 1-Billionen-Parameter-Modell 2025 enttäuschend. Preislich kostet das Modell 19 Cent pro Million Input-Token (Cache Hit) bzw. 95 Cent (Cache Miss); Output-Tokens 4 Dollar pro Million. Token-Effizienz ist schlechter als K 2.6, weshalb das Modell mehr Token pro Task verbraucht. Eine schnellere Variante wurde gerade angekündigt, die 180 Tokens/Sekunde erreichen soll.

    In Demos generiert das Modell solide Frontend-Code (SaaS-Landing-Pages mit GSAP-Animationen), SVG-Grafiken und MacOS-Klone mit funktionalen UI-Elementen. Im direkten Vergleich mit Claude Opus 4.8 Max auf einem Coding-Benchmark: Kimi war günstiger (17 Dollar vs. 145 Dollar), langsamer (6 vs. 5 Minuten) und visuell weniger poliert. Bei Web-Development konkurriert Kimi K 2.7 mittlerweile ernsthaft mit Opus und GPT-5.5, obwohl diese noch überlegen sind. Fazit: Das Modell ist eines der wichtigsten offenen Code-Modelle – günstig, multimodal, agentisch-fähig und überraschend konkurrenzfähig für seinen Preis.

    **Format & Kontext:** News-Update zu Moonshot Kimi K 2.7 mit Live-Demos und Benchmarks gegen proprietäre Modelle (Claude Opus, GPT).

  • Fable 5 COMING BACK! Deepseek v4.1, GPT-5.6 Leaks, Fusion API, & Kimi K2.7 Code High Speed! AI NEWS!
    16.6.2026, 06:30:08

    # Zusammenfassung

    Der Video-Ăśberblick deckt mehrere groĂźe Entwicklungen in der KI-Branche ab:

    **Fable 5 & Mythos 5-Verbot:** Die US-Regierung verhängte eine Export-Control-Direktive gegen Anthropics Modelle wegen vermeintlicher nationaler Sicherheitsbedenken – konkret die Befürchtung, dass sie zur Entdeckung von Software-Schwachstellen missbraucht werden könnten. Amazon-Forscher sollen eine Sicherheitslücke gefunden und dies den Behörden gemeldet haben, was zur weltweiten Sperrung führte. Anthropic argumentiert, die Bedenken seien übertrieben. Senior-Mitarbeiter von Anthropic sind bereits in Washington, um mit der Trump-Administration zu verhandeln; ein Comeback mit verschärften Kontrollen wird noch diesen Monat erwartet.

    **GPT-5.6-Leak:** OpenAI könnte GPT-5.6 diese Woche (Donnerstag) oder nächste Woche launchen – mit 1,5 Millionen Token Kontext, günstigeren Preisen und starkem Agentic-Coding. Poly Market sagt 86% Wahrscheinlichkeit für einen Release diesen Monat. Das Timing könnte Fable-Nutzer zurück zu OpenAI locken.

    **Nex N2 Pro & Rio 3.5-Skandal:** Nex N2 Pro (Open-Source aus China) zeigte beeindruckende Agentic-Coding-Fähigkeiten. Kurz darauf behauptete Brasilien mit Rio 3.5 Open, andere Modelle zu übertrumpfen – Forscher entdeckten aber, dass Rio 3.5 bloß eine lineare Interpolation von Nex N2 Pro und Qwen 3.5 war. Die Autoren behaupteten zunächst, die falsche Datei hochgeladen zu haben.

    **Kimi K 2.7 Code:** Moonshot veröffentlichte diese neue Open-Source-Coding-Version mit 21,8% Verbesserung gegenüber K 2.6, besseren Long-Horizon-Workflows und 30% weniger Reasoning-Tokens. Eine High-Speed-Variante erreicht bis zu 260 Token/Sekunde.

    **Weitere Updates:** Anthropic könnte bis 1,75 Billionen Dollar bewertet werden; Deepseek 4.1 könnte vor dem Dragon-Boat-Festival (19. Juni) kommen; Qwen iteriert schnell mit neuen Plus-Versionen; China präsentierte Blackbox, einen KI-gesteuerten Roboter für vollautomatisierte Laborarbeit ohne menschliche Eingriffe.

    **Open Router Fusion API:** Ein System, das mehrere günstigere Modelle parallel laufen lässt und deren Antworten synthesiert – soll günstiger als GPT-5.5/Claude Opus 4.8 bei ähnlicher Performance sein.

    Video deckt Claude/Anthropic (Fable, Mythos), OpenAI (GPT-5.6), Deepseek, Qwen, Nex, Mistral, Moonshot/Kimi und diverse Open-Source-Modelle ab; Format: News-Update/Roundup.


Automatisch generiert aus den letzten YouTube-Videos der kuratierten Kanal-Auswahl. Bei Feedback, Anregungen oder zum Austragen: einfach auf diese Mail antworten.