Hermes Agent trifft Claude Code Agent View: Zwei Paradigmen für den autonomen KI-Assistenten
Dienstag, 16. Juni 2026
🎧 Podcast-Folge (12.9 Min)
Hallo, dieser wöchentliche Digest arbeitet die wichtigsten neuen Videos aus rund 40 kuratierten KI- und Coding-YouTube-Kanälen durch — mit Substanz, kein oberflächliches Top-5. Pro Video eine vollständige Zusammenfassung, dazu ein Wochen-Überblick zu den dominanten Themen. Lies in Ruhe — oder kopier eine Zusammenfassung in den LLM deiner Wahl und geh in die Tiefe. Den Link unter jeder Zusammenfassung anklicken, um das Original-Video zu sehen.
Die Woche stand im Zeichen eines handfesten Paradigmenkonflikts: Auf der einen Seite Claude Code mit seinem neuen Agent View-Dashboard, das parallele Sessions, das `/goal`-Feature für autonome Langzeitausführungen und verbesserte Prompt-Compaction brachte — auf der anderen Seite Hermes Agent, das Open-Source-Projekt, das mit seiner neuen Desktop App, Computer-Use-Funktion (vorerst macOS), Kanban-Board, Qwen-3.6-Integration und dem `/goal`-Pendant eine vollständige alternative AIOS-Architektur aufstellt. WorldofAI, Alex Finn, Nate Herk, Cole Medin und AI Foundations behandelten beide Systeme aus verschiedenen Winkeln — das Interesse war so konzentriert wie selten zuvor.
Was die beiden Lager trennt, ist mehr als Feature-Listen. Claude Code lebt innerhalb von Anthropics kontrollierter Infrastruktur — was sich diese Woche schmerzhaft zeigte: Die neue Preisstrategie des Unternehmens verschiebt Drittanbieter-Apps und das Agent-SDK ab 15. Juni in ein separates monatliches Kredit-Kontingent von 200 Dollar, das nach Angaben von Theo und Melvynx die effektive Nutzung um das 25- bis 40-fache gegenüber dem bisherigen Modell einschränkt. Theo erklärte seinen Abschied von OpenClaw-basierter Nutzung öffentlich; Melvynx wechselte zu Codex. Hermes hingegen läuft selbst gehostet auf VPS oder dem Nvidia DGX Spark, kostet jenseits der Infrastruktur nichts und akkumuliert Wissen persistent — eine strukturelle Antwort auf genau dieses Abhängigkeitsproblem.
Cole Medins laufendes Archon-Projekt zeigt eine dritte Richtung: ein Open-Source-Harness-Builder, der Workflows marketplace-fähig macht, Pull Requests automatisch prüft und Claude Code als Backend nutzt, ohne sich an dessen Subscription-Logik zu binden. Dass diese Woche auch der Archon Workflow Marketplace live ging und Nate Herk einen vollständigen einstündigen Hermes-Kurs veröffentlichte, unterstreicht: Der Markt für Agenten-Infrastruktur jenseits der großen Plattformen hat Fahrt aufgenommen. Ob Hermes oder Claude Code — die entscheidende Frage lautet nicht mehr, welches Modell besser ist, sondern wer die Deployment-Schicht kontrolliert.
Model-Releases & Benchmarks
Google testete intern Gemini 3.2-Varianten (intern „Fanta”, „Sprite”, „Cola” sowie die vielversprechendere „Cappuccino”-Checkpoint-Reihe für Gemini 3.5 Flash), deren Code- und UI-Generierung nach Worldof AI-Tests noch hinter den Erwartungen liegt — gleichzeitig wurde ein nicht freigegebenes multimodales Videomodell namens Gemini Omni geleakt, das erste Nutzer in der App aktivieren konnten und das qualitativ mit Sora 2 verglichen wird. OpenAI arbeitet intern an GPT-5.6 (Codenamen Ember Alpha, Beacon Alpha). Das neu angekündigte Modell Subq mit einem 12-Millionen-Token-Kontextfenster und angeblich subquadratischer Sparse-Attention-Architektur sorgte bei AI mit Arnie für Aufmerksamkeit; die Benchmarks sind nach Angaben des Videos begrenzt und umstritten, ein technisches Paper fehlt noch. Anthropics Mythos Preview übertraf laut unabhängigen Evaluierungen (XBO und UK AI Security Institute) GPT-5.5 bei Cyber-Security-Aufgaben wie Attack Chains und Vulnerability Discovery.
Local & Open-Source AI
Hermes Agent v2.0 erhielt neben der Desktop App auch eine neue Qwen-3.6-Plus-Integration (kostenlos für eine begrenzte Zeit), Light-Panda als integriertes Browser-Backend und Computer-Use-Unterstützung. Alex Finn demonstrierte Hermes auf dem Nvidia DGX Spark mit dem lokal laufenden Modell Qwen 3.6 27B für Use Cases wie AI-Aktienberichte, YouTube-Content-Repurposing und Vibe-Coding. Worldof AI zeigte die Kombination von OpenAIs Codex CLI mit Ollama, sodass Modelle wie Deepseek, Gemma 4 oder Qwen 3 lokal und kostenlos in Codex genutzt werden können. Das ONNX-Format als modellframework-agnostisches Austauschformat wurde von NeuralNine als produktionsrelevante Alternative zu PyTorch- oder TensorFlow-Deployment-Abhängigkeiten vorgestellt.
Claude Code & Anthropic-Tooling
Neben dem Agent View-Dashboard und dem `/goal`-Feature — das mehrere Kanäle ausführlich demonstrierten — veröffentlichte Anthropic die Remote-Control-Funktion, die Claude Code per Smartphone steuerbar macht (Julian Ivanov). Nate Herk katalogisierte alle fünf Deployment-Methoden für Claude-Automationen von Loops über Cloud Routines bis Trigger.dev. Matt Pocock brachte neue Skills ins GitHub-Repository (70.000 Stars): `/handoff` für kontextwahrende Agenten-Übergaben, `/prototype` für UI-Varianten-Generierung sowie erste Previews von `/review` und Writing-Skills; außerdem ersetzte er `/grill-me` durch `Grill with Docs`, das Domain-Driven-Design-Ubiquitous-Language in eine `context.md` schreibt. Ben AI zeigte, wie man Claude Design mit vorbereiteten Designsystemen, Vorlagen und Skills für konsistente Outputs nutzt, und stellte fünf Architektur-Skills für ein AI-Betriebssystem vor. Mark Kashef argumentierte, dass die meisten Skill-Sammlungen durch Token-Überladung aktiv schaden, und präsentierte acht Audit-Tipps.
Coding Agents (non-Claude)
Melvynx dokumentierte seinen Wechsel von Claude Code zu OpenAIs Codex: geringere Token-Kosten, Multitasking über Work-Trees, bessere UI — und zeigte, wie Skills per Symlinks migriert werden. Leon van Zyl baute mit dem Codex CLI einen vollständigen AI-Bildgenerator (Next.js, Docker, Postgres, GPT-4-Image-API) und lieferte damit eines der praktischsten Codex-Tutorials der Woche. Grok Build von XAI testete Alex Finn live mit 3D-Benchmarks (First-Person-Shooter, Elon-Musk-Animation, Stadtflythrough) — das Fazit: kompetent, aber Benutzerfreundlichkeit und Kosten bleiben Schwachpunkte. MiniMax Agent auf Basis von MiniMax M1 (nicht M2.7 wie im Video genannt — günstig positioniert gegenüber GPT-5.5) demonstrierte Website-Deployment, CSV-Analyse mit LaTeX-PDF-Output und Video-Story-Generierung.
Personal AI OS & Agent-Frameworks
Cole Medins Archon — ein spezialisierter Open-Source-Harness-Builder für AI-Coding — ging diese Woche mit einem Workflow-Marketplace live, auf dem Nutzer eigene Workflows teilen können; ein automatischer PR-Prüf-Workflow validiert Beiträge. N8N stellte seinen offiziellen MCP vor, der Agenten nicht nur Workflows ausführen, sondern auch erstellen und bearbeiten lässt, sowie N8N Desk, eine Open-Source-Desktop-App ähnlich Claude Desktop, die aber Ausführung in N8N-Cloud-Instanzen statt lokal delegiert. Nate Herk von NeuralNine baute einen vollautomatischen Coding-Agenten, der via Slack oder GitHub-Issues angesprochen wird, Claude Code im Headless-Mode ausführt und einen Pull Request erstellt — orchestriert über zwei N8N-Workflows. Brian Casel demonstrierte OpenClaw auf einem Mac Mini als Basis für seinen täglichen Marketing-Radar-Scan-Agenten „Veil”, dessen Ergebnisse als Markdown in Dropbox landen und per Telegram abrufbar sind. Sebastien Dubois ordnete die Kontextverwaltung in acht Reifegrade ein — von der kontextlosen Abfrage bis zum vollständig gepflegten, agenten-lesbaren Wissenssystem.
AI-Automation & Workflows
Nate B. Jones analysierte diese Woche in mehreren Videos die Infrastruktur-Schicht hinter Agenten-Workflows: Pinecone überarbeitet seine Retrieval-Schnittstelle mit NoQL für agentengerechtere Datenkontrakte; Page Index setzt auf Dokument-Bäume statt Chunks; SAP kaufte Dreamio und Prior Labs für strukturierte Unternehmensdaten; Microsoft pusht Graph RAG. Die Kernthese: Die Retrieval-Einheit muss zum Job passen — Chunks für FAQs, Tabellen für Financial Analysis, Graphen für Dependencies. Parallel beschrieb Jones das „LLM as Judge”-Muster als Kontrollschicht für Agenten-Aktionen: Ein spezialisiertes Judge-Modell sitzt an der Action Boundary und entscheidet zwischen Erlauben, Blocken, Überarbeitung und menschlichem Review — mit vier Aktionskategorien von Read-only bis Hochrisiko. Tech With Tim zeigte Browserbase als Plattform für AI-gestützte Browser-Automatisierung (mit Stagehand SDK) sowie Compose als Tool, das Context-Bloat bei Tool-Verbindungen durch On-Demand Discovery auf ein Minimum reduziert.
AI-Video & Content Creation
Cole Medin demonstrierte einen vollständigen Workflow für KI-generierte Videos mit Audio: HyperFrames für das Rendering, Claude Code als Steuerungsschicht, 11Labs oder Kokoro für Sprachausgabe und Archon als Workflow-Manager — das Open-Source-Repository soll laut Video in unter zehn Minuten deploybar sein. Julian Ivanov nutzte denselben Dreiklang aus Claude Code, HyperFrames und Claude Design als Videoschnitt-Ersatz: Videouse schneidet per Transkript, HyperFrames generiert Motion Graphics, Claude Design integriert Branding — Endergebnis in 4K. Tech With Tim zeigte den Higgs Field MCP Server als einheitliche Schnittstelle für Bild- (GPT Image 2) und Video-Generierung (Seedance 2.0) direkt in Claude, inklusive automatischer Prompt-Verfeinerung durch den Agenten.
AI-Business, Marketing & Freelancing
Kyle Balmer legte sein Content-Produktionssystem offen: täglich 20+ Stücke mit zwei Personen, Hermes/Claude für Topic-Scouting und Script-Generierung, ChatGPT Images 2.0 für Slides, Descript für Transkripte, ManyChat für E-Mail-Giveaways (100–300 neue Adressen täglich). Die kritische These: Liveness und On-Camera-Präsenz werden durch KI-Überflutung wertvoller, nicht weniger. Nate B. Jones legte im Detail dar, wie Salesforce (Agentic Work Units, 800 Mio. Dollar ARR mit AgentForce), Microsoft (Copilot Credits, Microsoft Agent 365 für 15 Dollar/Nutzer/Monat) und ServiceNow (Action Fabric) ihre Abrechnungsmodelle von Seat-Lizenzen auf Aktions-Einheiten umstellen — und warnte, dass die Verhandlungsposition gegenüber Vendoren nur vor dem Produktivgang stark ist. TheAIGRID stellte zehn AI-Tools für kleine Unternehmen vor, darunter Claude Co-work, Gamma.app, Canva AI, Zapier und Chatbase.
AI-Industrie & Strategie
Laut Ramp-Daten hat Anthropic erstmals mehr verifizierte Business-Kunden als OpenAI — bei annualisierten Revenues beider Firmen um die 30 Milliarden Dollar. Anthropics 80-faches Wachstum statt geplanten 10-fachen erzeugt ein reales Compute-Problem, das sich in den neuen Nutzungsbeschränkungen niederschlägt. Nate B. Jones beschrieb die entstehende Implementierungsschicht als eigentlichen Wertträger der Agenten-Ära: Workflow-Design, Datenzugang, Authority-Limits, Evaluations und Audit Trails — eine Schicht, die weder Anthropic noch OpenAI mit einem Produktlaunch übernehmen können, weil sie kundenspezifisch und tief in Geschäftsobjekte (Leads, Cases, Policies) eingebettet ist. McKinsey, BCG, Accenture und PE-Firmen mit Tausenden von Portfolio-Unternehmen positionieren sich hier aggressiv. Der Sicherheitsvorfall bei McKinseys KI-Plattform Lily — SQL-Injection ermöglichte für 20 Dollar vollständigen Lese- und Schreibzugriff auf Millionen Chat-Nachrichten — wurde von Jones als Warnung für alle Enterprise-AI-Prozurements analysiert: 22 von 200 API-Endpoints wurden ohne Authentifizierung deployed, weil Security-Teams zu spät in die Beschaffungsentscheidung eingebunden wurden.
AI & Gesellschaft / Future of Work
Die Debatte um kognitive Atrophie durch AI-Tools führte Theo diese Woche offen: Entwickler verlieren Fähigkeiten, wenn sie Implementierungsdetails nicht mehr selbst durchdenken — sein Gegenvorschlag ist, AI für Planung und Recherche einzusetzen, die Implementierung aber bewusst zu behalten. Das Coding-with-Lewis-Video zur Geschichte von Meta Llama zeichnete nach, wie das Vertrauen der Open-Source-Community durch manipulierte Benchmarks bei Llama 4 verspielt wurde — ein Muster, das über Meta hinaus relevant ist. Everlast AI diskutierte mit Experten Chinas Rolle als Technologiemacht bis 2030: systemische Überkapazitäten, demografischer Druck, Unabhängigkeitsstreben bei Halbleitern — und die Frage, wie Europa reagiert. Das No-Priors-Interview mit Jacob Helberg beleuchtete „Pax Silica”, die US-Initiative zur Sicherung der AI-Lieferketten über ein 14-Länder-Ökosystem mit forward-deployed Industriezonen auf den Philippinen.
Kurz notiert
Anthropic und Musk/SpaceX: Anthropics Claude-Modelle laufen laut Everlast AI auf SpaceX Colossus-1, was die wöchentlichen Claude-Code-Limits verdoppelt. — AWS erlaubt Agenten jetzt, Desktop-Anwendungen in verwalteten Workspaces zu steuern (ERP, Legacy-Software, Mainframes). — Agentic Commerce: OpenAI/Stripe (ACP), Shopify/Google (UCP) und Google AP2 als konkurrierende Autorisierungsschichten für autonome Einkäufe wurden von Nate B. Jones detailliert kartiert. — Melvynx wechselte von Prisma zu Convex als Backend-Lösung und stellte seinen neuen NStack (TanStack Start + Convex + Better Auth) vor. — Dave Ebbelaar zeigte Hybrid-Search (BM25 + Embeddings + Reranker mit Cohere) und Agentic RAG in reinem Python als produktionsreife Patterns. — Nick Saraev veröffentlichte einen vollständigen Kurs zum Bau mobiler Apps mit Claude Code. — Long Lake Management kündigte die Übernahme von American Express Global Business Travel für 6,3 Milliarden Dollar an — positioniert als erste KI-gestützte Übernahme eines börsennotierten Unternehmens via KI-Plattform Nexus.
AI Explained
Keine neuen Videos in diesem Zeitraum.
AI Foundations (1 neues Video)
- Full Hermes Agent Set-Up For Beginners in 2026! (24/7 AI Agent)
12.5.2026, 14:56:27Das Video ist ein Tutorial zur Einrichtung des Hermes Agent, eines 24/7 selbstverbessernden KI-Agenten, der auf einem Server läuft und kontinuierlich aus Feedback lernt. Der Agent besteht aus drei Schichten: Speicher, Fähigkeiten und Cron-Jobs. Der Speicher ermöglicht es dem Agenten, gelerntes Wissen in zukünftige Sitzungen zu integrieren. Fähigkeiten sind Automatisierungen oder Mini-Workflows, die der Agent erstellt und verbessert. Cron-Jobs ermöglichen die Planung von Aufgaben zu bestimmten Zeiten. Der Agent durchläuft einen Loop, bei dem er Ziele setzt, Werkzeuge nutzt, Ergebnisse liefert und durch Feedback verbessert wird.
Der Autor vergleicht die Einrichtung des Agenten auf einem lokalen Computer mit der Einrichtung auf einem VPS (Virtual Private Server). Ein VPS ist immer online und skalierbar, während ein lokaler Computer nur dann aktiv ist, wenn er eingeschaltet ist. Die Einrichtung auf einem VPS wird detailliert beschrieben, einschließlich der Nutzung von Hostinger für die Bereitstellung des VPS und der Einrichtung des Agenten über ein Terminal. Der Agent kann mit verschiedenen Modellen wie Claude, OpenAI oder Open Router genutzt werden und kann über verschiedene Messaging-Plattformen wie Telegram gesteuert werden.
Am Ende zeigt der Autor ein praktisches Beispiel, wie er den Hermes Agent nutzt, um automatisch Blogbeiträge basierend auf seinen YouTube-Videos zu erstellen und zu veröffentlichen. Der Agent überprüft die Analytics, verbessert die Inhalte und kann über Telegram gesteuert werden.
Das Video thematisiert explizit Hermes Agent, Open Router, Claude, OpenAI und spezifische Tools wie Telegram. Es ist eher für Intermediate und Advanced Nutzer gedacht.
AI mit Arnie (1 neues Video)
- Claude Code reicht nicht mehr
15.5.2026, 13:06:39Das Video stellt die Ankündigung von Subq (Subquadrantic) vor, einem neuen KI-Modell mit einem Kontextfenster von 12 Millionen Token, was einen erheblichen Fortschritt gegenüber bestehenden Modellen wie ChatGPT (1 Million Token) darstellt. Subq nutzt eine subquadratische Sparse Attention Architektur, die es ermöglicht, linear statt quadratisch zu skalieren, was zu einer deutlich höheren Effizienz und geringeren Kosten führt. Das Modell soll 52-mal schneller sein und nur 5% der Kosten von Konkurrenzmodellen wie Opus verursachen. Die Ankündigung wurde auf X (ehemals Twitter) von Alexander veröffentlicht und umfasst eine API für Subq Code und Subq Search.
Die Vorteile von Subq liegen in der Möglichkeit, große Codebasen oder lange Dokumentationen vollständig im Kontext zu behalten, was aktuelle Workarounds wie RAG (Retrieval-Augmented Generation) oder Agenten-Workflows überflüssig machen könnte. Die Sparse Attention Architektur ermöglicht es, nur relevante Token zu betrachten, was die Rechenleistung und Geschwindigkeit erheblich steigert. Allerdings gibt es noch keine detaillierten technischen Papiere, und die verfügbaren Benchmarks sind begrenzt und teilweise umstritten.
Das Potenzial von Subq ist enorm, da es die Arbeitsweise mit KI in Bereichen wie Coding, Recht, Recherche und Audits revolutionieren könnte. Allerdings bleibt die Frage, ob das Modell die versprochene Qualität und Zuverlässigkeit bei großen Kontextfenstern liefern kann. Die verfügbaren Benchmarks zeigen vielversprechende Ergebnisse, aber es bedarf weiterer Tests und Bestätigungen.
Das Video thematisiert explizit das neue Modell Subq und ist eher für Intermediate oder Advanced Nutzer gedacht, die sich mit den technischen Details und Implikationen von KI-Modellen auseinandersetzen.
AI News & Strategy Daily | Nate B Jones (7 neues Videos)
- Anthropic’s Mythos Just Beat OpenAI’s GPT-5.5 At Real Hacking
16.5.2026, 15:01:03# Zusammenfassung: Five Stories About AI Agents This Week
Der Video behandelt fünf aktuelle Entwicklungen rund um KI-Agenten und ihre praktische Anwendung:
**1. Notion Developer Platform:** Notion hat eine Developer Platform mit CLI, gehosteten Funktionen (Workers), Webhooks und einer externen Agents API gestartet. Das ermöglicht es, Agenten wie Claude direkt in Notion-Workspaces als Teilnehmer einzubinden – nicht nur als Buttons, sondern als integrierte Workflow-Partner. Beispiel: Ein Sales Deal in Salesforce triggert einen Notion Worker, der Daten synct, ein Agent entwirft einen Onboarding-Plan, den der CSM vor Versand überprüft.
**2. Claude Nutzungslimits werden verschärft:** Anthropic muss Computekapazität rationieren, weil Agentennutzung die Subscription-Modelle überfordert. Im April blockierte Anthropic Third-Party-Tools wie Open Claw auf persönlichen Subscriptions, was viele Entwickler zu OpenAI trieb. Jetzt erlaubt Anthropic begrenzte Agentennutzung wieder unter einem monatlichen Rate Limit, das sich dann in API-Tokens-Bezahlung umwandelt – eine weniger durchschaubare und weniger populäre Lösung als OpenAIs transparentes Modell.
**3. Anthropic überholt OpenAI bei Business-Kunden:** Laut Ramp-Daten hat Anthropic erstmals mehr verifizierte Business-Kunden als OpenAI. Beide Firmen liegen bei annualisierten Revenues um die $30 Mrd. Anthropic hatte 10x-Wachstum geplant, erleben aber 80x – ein echtes Compute-Problem.
**4. Mythos und GPT-5.5 zeigen Cyber-Kapazität:** Unabhängige Evaluationen (XBO und UK AI Security Institute) belegen, dass Mythos Preview bei Cyber-Security-Aufgaben (Attack Chains von Reconnaissance bis Network Takeover) besser performt als GPT-5.5 bei gleichem Token-Budget. Mythos ist stark bei Code Audits und Vulnerability Discovery, aber braucht Validierungsinfrastruktur. Für Software-Teams ist das ein Signal: AI-gestützte Security-Workflows aufbauen, kritische Codebases mit Mythos/5.5 scannen, Disclosure- und Patch-Prozesse vorbereiten.
**5. AWS Workspaces für AI Agents:** AWS erlaubt Agenten jetzt, Desktop-Anwendungen in verwalteten Workspaces-Umgebungen zu steuern – ERP-Systeme, Legacy-Software, Mainframe-Interfaces. Das löst Desktop-Automation für Back-Office-Arbeit (Claims, Trade Settlement, Procurement), aber erfordert Governance: Screenshot-Logging, Audit-Trails, Human-Approval-Gates, nicht sofort volle Automation.
**Übergeordneter Punkt:** Die KI-Agenten-Ära ist jetzt konkret – nicht in großen Modell-Launches, sondern in Workflow-Integration, Billing-Umbrüchen und praktischer Enterprise-Automation. Scaling Laws haben Agenten gut genug gemacht, um bestehende Software zu bedienen; das ändert, was schnell automatisierbar wird.
—
Claude und OpenAI (GPT-5.5, GPT-5.5 Cyber), Open Claw und AWS als Anbieter/Tools explizit erwähnt; News-Roundup-Format.
- Your SaaS Bill Just Got a Second Meter. You’re About to Pay It.
15.5.2026, 14:00:04# Zusammenfassung: Agent Pricing und die Zukunft von SaaS-Modellen
Der Fokus liegt auf der grundlegenden Verschiebung der SaaS-Preismodelle durch Agenten-Workflows. Salesforce meldet für sein Agent Force-Produkt einen ARR von 800 Millionen Dollar mit 169% YoY-Wachstum und misst dabei nicht Tokens, sondern Agentic Work Units – die konkreten Aktionen, die Agenten innerhalb der Plattform ausführen. Zeitgleich startet Microsoft Agent 365 mit 15 Dollar pro Benutzer pro Monat und einer separaten Governance-Lizenz, die kontrolliert, wie Agenten in der Microsoft-Umgebung handeln.
Das zentrale Problem: Traditionelle SaaS basierte auf Seat-Lizenzen – man bezahlte für die Anzahl der Menschen, die die Software nutzten. Dieses Modell funktioniert nicht mehr, wenn ein Agent die Software ohne menschliche Nutzer verwendet. Agent können CRM-Einträge lesen, Support-Tickets aktualisieren und Workflows ausführen, ohne dass ein Mensch angemeldet ist. Damit entfällt der “Mensch als Werteinheit”.
**Drei Preismodelle im Überblick:**
– **Salesforce**: Flex Credits und Agentic Work Units pro Aktion (Updates, Zusammenfassungen, Workflows)
– **Microsoft**: Hybridmodell mit Seat-Preisen für Copilot und zusätzlichen Copilot Studio Credits für verschiedene Agent-Features (Answers, generative Antworten, Workflow-Aktionen)
– **ServiceNow**: Action Fabric misst operative Arbeitseinheiten statt API-Calls – wer eine Zugriffsverwaltung auslöst oder ein Onboarding startet, verursacht KostenZusätzlich verschärfen sich die Zugriffsrichtlinien: SAP etwa zieht klare Grenzen um externe oder nicht-SAP-genehmigte Agenten, die auf SAP-Daten zugreifen. Das wird vertraglich, nicht technisch entschieden – potenziell ein Toll Booth für jeden Agent einer anderen Anbieter.
**Fair vs. Rent-Seeking bei Agent-Lizenzen:**
Ein faires Modell: transparente, vorhersagbare Meter; nicht erfolgreiche Aktionen kosten nicht wie erfolgreiche; Third-Party-Agenten haben einen definierten Pfad; saubere Unterscheidung zwischen Lesen, Entwurf, Schreiben, Genehmigung und Ausführung; Caps setzbar; Nutzungsdaten exportierbar; Raten bleiben über die Laufzeit stabil.Ein rent-seeking-Modell: vage “KI-Zugriff” ohne Transparenz, nur Vendor-eigene Agenten praktikabel, extern Agenten blockiert, Nutzerdaten zu bezahlen auch wenn der Kunde sie selbst generiert, fehlgeschlagene Arbeiten zählen als billbar, das Meter versteckt bis zur Renewal, Kreidit-Bundles die verfallen während Overage sofort abgerechnet wird.
**Für Entwickler ist das entscheidend:** Die meisten Teams berücksichtigen nur Token-Kosten, nicht aber, dass vertraglich längst auf Work Units, Workflow-Aktionen oder andere Meter gewechselt wurde. Ein Entwickler im Gespräch mit dem Autor nutzte 8 Milliarden Token in einem Monat – das ist die neue Normalität. Agenten müssen kostenoptimiert werden: Welche Tool-Calls sind teuer? Welche reversibel? Wann liest man, wann schreibt man, wann führt man aus? Ein Agent, der blind jede Aktion mit gleichem Ressourcen-Budget ausführt, wird zum Budget-Desaster in Produktion.
**Verhandlungsstrategie vor der Renewal:**
Leverage haben Sie nur, solange Agenten noch nicht produktiv sind. Danach wird die Verhandlung asymmetrisch – wenn tägliche Workflows abhängen, kann der Vendor Preiserhöhungen durchsetzen. Konkrete Fragen: Was ist in bestehenden Seats enthalten? Sind Agenten, die im Namen von Usern handeln, abgedeckt? Braucht ein unabhängiger Agent eine eigene Lizenz? Können Third-Party-Agenten denselben Pfad wie Vendor-Agenten nutzen? Welche Aktionen verbrauchen Credits? Zählen fehlgeschlagene Aktionen? Ist die Rate Card für die Laufzeit fixiert? Können Caps pro Abteilung, Workflow oder Agent gesetzt werden?Die kritischste Frage: Ändert sich das Geschäftsmodell, wenn der Agent die Anzahl der menschlichen Seats reduziert? Wenn ein Support-Agent hunderte Tickets löst – kann man Support-Plätze abbauen? Das ist der Punkt, an dem Vendor-Incentive und Kundeninteresse kollidieren.
**Kernthese:** Pricing folgt Plattform-Kontrolle. Der Vendor, der die neue Arbeitseinheit definiert, behauptet das Recht, diese zu monetarisieren. Salesforce misst Agent-Aktionen, weil Salesforce viele CRM-Aktionen definiert. ServiceNow misst operative Arbeit, weil ServiceNow die Enterprise-Action-Schicht prägt. Microsoft will Copilot Credits, weil Microsoft über den Produktivitäts-Graph sitzt. Wer diese Incentiven nicht versteht und nur mit dem Vendor-Agent baut, ohne Third-Party-Agenten-Pfade zu sichern, riskiert, dass die Agent-Ökonomie letztlich dem Vendor gehört.
**Meinung/Reflexion-Format mit Deep-Dive-Elementen; keine spezifischen AI-Modelle, sondern Vendor-Plattformen (Salesforce, Microsoft, ServiceNow, SAP, HubSpot, Workday, Atlassian, Zendesk) thematisiert.**
- The Trillion Dollar Agentic Workflow Opportunity Is Here
14.5.2026, 14:01:09# Zusammenfassung: Implementation Layer und die Zukunft von Enterprise AI Agents
Dies ist eine strategische Analyse über die Konvergenz von drei Kräften: Private Equity, die ihre angeschlagenen SaaS-Portfolios retten muss, Hyperscaler (OpenAI, Anthropic), die feststellen, dass sie Forward-Deployed Engineers vor Ort brauchen, um Enterprise AI zu implementieren, und Unternehmen, die verzweifelt Agent-Workflows einsetzen wollen, aber nicht wissen wie.
Die Kernthese: Der eigentliche Wert liegt nicht im Modell, sondern in der **Implementation Layer** — dem Ökosystem aus Workflow-Design, Datenzugang, Authority/Limits, Evaluations und Audit Trails, das einen generischen AI-Agent in ein funktionierendes Enterprise-System verwandelt.
**Vier Druckachsen prägen den Markt:**
1. **Labs ziehen nach unten**: Anthropic und OpenAI stellen eigene Deployment-Companies auf, heuern Embedded Engineers an und bauen Produkte wie Claude Design oder Finance-Templates — ein klares Signal, wo sie den Wert sehen.
2. **Consultancies ziehen nach oben**: McKinsey, BCG, Accenture und PWC bilden deliberate Agentic Practices und bauen Delivery Teams für Production Deployment — gestützt auf Jahrzehnte von Kundenbeziehungen.
3. **Systems of Record öffnen sich strategisch**: Salesforce, ServiceNow, Workday und SAP bauen APIs und Agent Frameworks direkt in ihre Plattformen ein. Sie wollen keine Startup-Zwischenschicht zwischen Daten und Agent.
4. **Private Equity als Distribution**: PE-Firmen kontrollieren Tausende Mid-Market-Companies und können einen Deployment-Partner standardisiert über ganze Portfolios rollen.**Die Implementation Layer im Detail:**
– **Workflow Design**: Welche Entscheidungen darf das Modell treffen? Welche Schritte bleiben manuell? Wo sind die Übergänge?
– **Data Access**: Welche Datenquellen sind autoritativ? Welche Permissions gelten auf Row/Field-Level?
– **Authority**: Was darf der Agent tun? Welche Limits bei Commits oder Spending?
– **Evals**: Wie wird korrekt/vollständig/sicher gemessen — nicht als Benchmark, sondern als Scoring gegen Geschäftsregeln?
– **Audit Trails & Ownership**: Logging, Fehlerrekonstruktion, Reversal, kontinuierliche Tuning.**Der strategische Kern**: SaaS war „generisch” — eine Lösung passte überall. Agentic Workflows sind das Gegenteil: der disproportionale Wert liegt in Customization und im objektorientierten Design. Ein Sales-Agent muss Sales-Objekte verstehen (Leads, Accounts, Deals, Funnel-Stages). Ein Support-Agent muss Cases, Policies, Customers, Entitlements modellieren.
**Für Builder**: Sitzen Sie näher am Business Object als bei abstraktem Reasoning. Verstehen Sie die Implementation Layer so tiefgründig, dass Sie erkennen, was tatsächlich Wert schafft versus bloßes Modell-Marketing. PE-Firmen prüfen bereits, ob Inhouse-Teams mit Claude in einem Wochenende bauen können — das scheitert bei echten Enterprise-Workflows, weil die Implementation Layer zu nuanciert ist.
**Für Käufer**: Fragen Sie scharf nach Data Objects, Workflow-Details und Ownership nach Launch. Generic Antworten wie „das Modell wird besser” oder „eure Daten helfen uns” sind Warnsignale.
**Für PE**: Dies ist ein Trilliarden-Dollar-Markt, weil Agents ganze Workflows erledigen können — etwas, das seit ca. 2026 verlässlich und skalierbar möglich ist. PE profitiert doppelt: Push-Druck (SaaS in Gefahr) und Pull (AI über Portfolio-Firmen standardisieren und verkaufen).
Die Botschaft: Die Implementierungs-Layer-Architektur ist nicht etwas, das Anthropic oder OpenAI morgen mit einem Produktlaunch überrennen können — sie ist spezifisch, custom und booted zugunsten interner Builds. Wer diese Schicht kontrolliert, kontrolliert den Wert.
**Demo/Meinung-Hybrid mit tiefem Enterprise-Strategic Deep-Dive; keine expliziten AI-Tool-Namen außer Claude, OpenAI und Anthropic erwähnt; PE und Hyperscaler als zentrale Akteure.**
- Pinecone Just Demoted Vector Search. Here’s the Knowledge Layer.
13.5.2026, 14:01:15# Zusammenfassung
Das Video analysiert ein fundamentales Problem in der Agenten-Architektur: Produktionsagenten verschwenden massive Mengen an Kontext-Fenster und Token durch Redundanz-Rediscovery. Pine Cone, SAP, Google und Microsoft bauen gleichzeitig Systeme zur Lösung dieses Speicher-Problems – aber nicht durch bessere Vektordatenbanken, sondern durch strukturell unterschiedliche Retrieval-Ansätze.
Der zentrale Erkenntnisse: Klassisches RAG (Vektorsuche über Textchunks) wurde für Chatbots optimiert – ein Nutzer fragt, drei semantisch ähnliche Absätze werden zurückgegeben. Agenten funktionieren anders: Sie führen längerfristige Arbeitsabläufe durch, brauchen Cross-referencing über Hunderte von Seiten und müssen korrekte, kontextuelle Antworten liefern, nicht nur relevante Textpassagen. Pine Cone verschärft ihre Retrieval-Schnittstelle mit NoQL, um Intent, Filter, Access-Policy und Provenance zu tragen. Page Index behauptet, dass viele Dokumente gar nicht in Chunks zerlegt werden sollten, da ihre hierarchische Struktur (wie bei Verträgen mit Definitionen 40 Seiten entfernt) das Meaning ist – sie nutzen stattdessen Dokument-Bäume. SAP kaufte Dreamio (Lakehouse mit Semantic Layer) und Prior Labs (tabellarische Foundation Models), weil die meiste Enterprise-Knowledge in strukturierten Tabellen lebt, nicht in Prosa. Microsoft pusht Graph RAG für relational strukturierte Abfragen.
Der entscheidende Grundsatz: Die Retrieval-Einheit muss zum Job passen – Chunks für FAQs, Sections für Filings, Tabellen für Financial Analysis, Graph-Nachbarschaften für Dependencies. Größere Context Windows helfen nicht automatisch; das Problem ist nicht ob die Antwort irgendwo drin ist, sondern ob sie in einer Form präsentiert wird, die das Modell zuverlässig nutzen kann (Kontext-Rot).
Konkrete Schritte beim Bau eines Agenten: (1) Definiere zuerst den Daten-Vertrag (Contract), nicht die Datenbank – was muss der Agent in welcher Form erhalten, um zuverlässig zu arbeiten? (2) Schreib das spezifische Bundle auf, das der Agent braucht (nicht einfach „relevanter Kontext”) – z.B. für einen Refund-Agent: Kundendatensatz, Plan, Region, Produktversion, Kaufhistorie, gültige Refund-Policy, Schwellwert, vorherige Exceptions, aktuelles Ticket, genehmigte Response-Sprache, Berechtigungen. (3) Wähle dann die Primitiven, die diesen Bundle liefern – Mix aus Vektorsuche, Dokumentbäumen, Semantic Layer, tabellarischem Reasoning, oder Graphen, je nachdem.
Fehlermodi: Vorkompilierte Bundles können veralten; Graphen können schlechte Beziehungen kodieren; Parsing-Fehler bei Tabellen; Semantic Layers werden politisiert; Agenten können eigene Inferences als bestätigte Fakten speichern und so zukünftige Runs verschlechtern. Gleichzeitig: nicht überengineeren – eine einfache Help-Center-Assistenz braucht nicht Graph RAG plus Document Tree plus alles zusammen. Lerne aus deinen eigenen Agent-Runs: Wie viele Retrieval-Calls vor echtem Work? Wie oft dieselben Quellen? Wie viel Token nur für Raw Context?
Das Video ist konzeptionell: Es geht nicht um ein spezifisches Tool, sondern um die Architektur-Entscheidung darunter. Die zentrale These: Teams, die gewinnen, denken zuerst über den Agent-Job nach, nicht über die trendige Datenbank.
—
**Explizit erwähnte Anbieter/Tools:** Pine Cone (Nexus, NoQL), Page Index, SAP (Dreamio, Prior Labs), Google Cloud Next, Cloudflare, Microsoft (Graph RAG), Chroma, Weev8, Neo4j — **Format:** Meinung/Reflexion mit Deep-Dive-Elementen in die Infrastruktur-Landschaft.
- ChatGPT Has 900M Weekly Users. Almost None Can Buy In It.
12.5.2026, 14:01:07# Zusammenfassung: Die sechs Kriegsschauplätze der Agentic Commerce
Das Video analysiert die grundlegende Umgestaltung von E-Commerce durch autonome Agenten und identifiziert sechs konkurrierende Lager, die um die Kontrolle der entstehenden Agentic Commerce-Infrastruktur kämpfen.
**Das zentrale Problem:** Während traditioneller Online-Kauf eine klare Struktur hat – Mensch sieht Produkt, Preis, Versand, klickt Checkout – bricht autonomer Einkauf diese Struktur auf. Ein Agent könnte Produkte suchen, Einkäufe tätigen und Zahlungen veranlassen ohne menschliche Überwachung jedes Schritts. Das schafft Fragen, die die bisherige Infrastruktur nicht beantwortet: Wer entscheidet, wo der Agent einkauft? Wer belegt, dass der Agent handeln darf? Wer trägt Verantwortung bei Fehlern?
**Die sechs Schichten des Konflikts:**
1. **Agent-Checkout (OpenAI/Stripe vs. Shopify/Google):** ACP (Agent Commerce Protocol) von OpenAI und Stripe ermöglicht Käufe direkt im Chat-Interface – schnell und einfach, aber Merchants verlieren Kontrolle über Customer Journey und Branding. UCP (Universal Commerce Protocol) von Shopify und Google erhält Merchant-Regeln, Loyalty, Discovery und komplexe Geschäftslogik, während Agenten interagieren.
2. **Authorization/Bewilligung (Google AP2, Stripe, Visa, Mastercard, PayPal):** Zahlung ≠ Autorisierung. Ein Agent braucht vorher erteilte Genehmigung mit klarem Scope (Budget, Constraints). Google AP2 erzeugt eine digitale „Genehmigung” mit Proof, dass der Nutzer den Agent autorisiert hat. Hier konkurrieren Google, Stripe, Visa, Mastercard und PayPal um die Vertrauensschicht.
3. **Stablecoins & Maschine-zu-Maschine-Zahlungen (Coinbase X42, Stripe MMP):** Für Agent-zu-Agent-Transaktionen (API-Calls, Tool-Zugang, Datenabfragen) sind Kreditkarten ineffizient. Stablecoins wie USDC ermöglichen schnelle, günstige Machine-Payments. X42 macht Zahlung teil des Web-Requests selbst (HTTP 402).
4. **Enterprise Governance (AWS mit Coinbase/Stripe):** AWS kontrolliert das Laufzeit-Environment, in dem Agenten agieren. AWS kann Budgets, Genehmigungsregeln, Vendor-Zugang und Logs verwalten – ohne jeden Payment-Rail selbst zu besitzen. Das ist die mächtigste Position im System.
5. **Plattform-Kontrolle:** Große Plattformen (Amazon) werden nicht einfach externe Agenten frei handeln lassen. Agentic Commerce wird teilweise protokoll-gesteuert, teilweise plattform-kontrolliert, teilweise nur unter strikten Bedingungen offen.
6. **Verantwortlichkeit:** Keine einzelne Antwort auf die Frage „wer trägt Risiko”. Die Verantwortung muss deliberat über Ebenen verteilt werden: ACP beantwortet Checkout-Fragen, UCP beantwortet Merchant-System-Fragen, AP2 beantwortet Autorisierungs-Fragen, Payment Networks beantwortet Trust- und Dispute-Fragen, Wallet-Provider beantworten Settlement-Fragen.
**Kernthese:** Agentic Commerce wird in den nächsten Jahren Billionen Dollar an kommerzieller Autorität neu verteilen. Unternehmen müssen bewusst wählen, welche Schicht sie kontrollieren wollen. Verbraucher müssen verstehen, wie diese Systeme funktionieren, um nicht passiv in ein System hineingezogen zu werden, das sie nicht durchschauen. Das ist eine größere Verschiebung der Internet-Ökonomie als die ursprüngliche E-Commerce-Revolution der 1990er.
—
**Format & Abdeckung:** Meinung/Reflexion mit Deep-Dive-Struktur; explizit thematisiert: OpenAI, Stripe, Shopify, Google, AWS, Coinbase, Visa, Mastercard, PayPal (ACP, UCP, AP2, X42, Machine Payments Protocol, Bedrock Agent Core Payments).
- LLM Agents: The Security Breach Pattern Nobody’s Talking About
11.5.2026, 14:00:52# Zusammenfassung: LLM as Judge – Das Sicherheitsmuster für Agenten
Das Video behandelt ein kritisches Architektur-Muster zur Vermeidung von Agent-Fehlern, die in Produktionsumgebungen real vorkommen: unbeabsichtigte Emails, gelöschte Daten, nicht autorisierte Operationen. Der Redner arbeitet mehrere zentrale Punkte durch.
**Das Kernproblem:** Agenten sind trainiert zu agieren, aber es fehlte bisher die Kontrollschicht, die entscheidet, *wann* und *wie* sie agieren. Einfache Prompts und manuelle Bestätigung funktionieren nicht: Prompts halten nicht über lange Context Windows, und wenn Nutzer ständig zur Genehmigung aufgefordert werden, klicken sie aus Gewohnheit „OK”, ohne hinzusehen – das Problem der EU-Cookie-Richtlinie.
**Die Lösung – LLM as Judge:** Das Beispiel Lindy zeigt das Muster: Ein spezialisiertes „Judge-Modell” liest die geplante Aktion des ausführenden Agenten, prüft die Begründung gegen den verfügbaren Kontext und entscheidet. Nicht zwei identische Agenten, sondern einer mit Fokus auf Aufgabe, einer mit Fokus auf Intentverletzung. Das nutzt die neue Kapazität von langen Kontextfenstern und ist bei modernen Frontier-Modellen (wie GPT 5.5 oder Claude 3.7 Opus im Mai 2026) deutlich zuverlässiger als bei älteren oder Open-Source-Modellen.
**Klassifikation von Agent-Aktionen in vier Kategorien:**
– Read-only: leicht, wenig Risiko
– Reversible Writes (Entwürfe, Labels, lokale Dateien): braucht Validierung, aber vielleicht kein Audit-Trail
– Externe Aktionen (Emails, Meeting-Buchungen, Pull Requests, Kundenbenachrichtigungen): müssen *immer* durch starke Judge-Layer vor Ausführung
– Hochrisiko (Geldausgaben, Datenlöschung, Berechtigungsänderung, Code-Merges): Judge plus menschliche Genehmigung, oder sehr explizite automatisierte Policies**Richtige Implementierung:** Der Judge muss an der Action-Boundary sitzen – exakt dort, wo der Agent einen Tool-Call triggert. Nicht nur ja/nein, sondern vier mögliche Outcomes: erlauben, blocken, Agent zur Überarbeitung auffordern, oder zu menschlichem Review eskalieren. Das Balancieren der Eskalationsrate ist kritisch.
**Correlated Judgment:** Wenn Actor und Judge dasselbe Modell sind, teilen sie blind spots – aber das ist mit modernen Frontier-Modellen (Mai 2026) deutlich weniger problematisch als noch vor 6-8 Monaten. Bei älteren oder Open-Source-Modellen ein echtes Risiko.
**Größerer Kontext:** Agenten entwickeln sich von isolierten Workflows zu „managed workers”, die Task-Assignment, Supervision und Correction brauchen. Die erste Agent-Welle fokussierte auf das Aufsetzen, die zweite Welle (jetzt) auf das Managementsystem – der Judge ist der Manager des Agenten. Das gesamte Produkt ist nicht mehr nur der Agent, sondern das System drum herum.
Der Redner verweist auf einen ausführlichen Substack-Artikel mit Implementation Details pro Action-Type, Judge-Designmustern und Metriken.
—
**Format & Modelle:** Meinung/Deep-Dive mit starkem Architektur-Fokus; explizit genannt: Claude (Opus 3.7), GPT 5.5, Qwen, Gemini, älter Modelle; Lindy und Codeex als Produktbeispiele; kein Tutorial.
- Anthropic And OpenAI Just Admitted The Model Isn’t Enough.
10.5.2026, 18:00:09# Zusammenfassung: Die Lily-Sicherheitslücke und ihre Lehren für AI-Procurement
Im Februar 2026 entdeckte das Startup Codewall eine kritische Sicherheitslücke in Lily, der KI-Plattform von McKenzie, auf die 70% der 40.000 Berater täglich zugreifen. Ein autonomer Agent erhielt für 20 Dollar innerhalb von zwei Stunden vollständigen Lese- und Schreibzugriff auf tens Millionen Chat-Nachrichten, zehntausende Benutzerkonten und alle System Prompts der Plattform – und konnte diese sogar umschreiben. Das Sicherheitsloch war klassische SQL-Injection, eine seit 1998 bekannte Schwachstelle, die in jedem Web-Security-Kurs gelehrt wird.
Der eigentliche Fehler lag jedoch nicht in mangelnder technischer Hygiene (McKenzie hat starke Engineering-Teams), sondern in der Organisationsstruktur: 22 von 200 API-Endpoints wurden ohne Authentifizierung deployed, inklusive einer produktiven, schreibbaren Verbindung. Das deutet darauf hin, dass technische Sicherheitsbedenken bei der Planung nicht priorisiert wurden – eine Folge des traditionellen SaaS-Procurement-Prozesses (Strategie → Beschaffung → Security-Review → IT-Integration → Entwicklung), der bei Agenten nicht funktioniert.
Der Kernunterschied: Während Menschen Zugriffe über Bildschirme visuell begrenzen, müssen Agenten jedes System in Code abfragen und erhalten eine explizite Antwort darüber, ob sie berechtigt sind. Das erfordert durchdacht codierte Permissions Modelle, Audit-Trails und Workflow-Orchestrierung über alle integrierten Systeme hinweg – bevor die Plattform in Produktion geht. Diese Komplexität ist nicht „später zu lösende Implementation Details”, sondern schon strategische Entscheidung.
Vendor-Reaktionen zeigen, dass die Industrie dies erkannt hat: Anthropic und OpenAI bauten Enterprise-Services-Teams auf; SAP übernahm Dreo und Prior Labs für datenebenen-Integration; Pinecone, Salesforce und ServiceNow veröffentlichten alle im selben Zeitfenster Lösungen für gouvernierte Agenten-Workflows, Audit-Trails und kontrollierte Datenzugriffe.
Konkrete Fragen für deine AI-Investition: (1) Unterscheidet deine Plattform technisch zwischen menschlichen Benutzern und Agenten und kann ihre Permissions separat boundieren? (2) Kann dein Team Agenten innerhalb von fünf Minuten von einer Konsole aus sperren, falls etwas schiefgeht – oder müssen Tickets geöffnet werden? (3) Kann dein Compliance-Team nachvollziehen, was Agenten im Namen von Benutzern getan haben (für Regulatoren)? (4) Was ist das organisatorische *Default-Verhalten* unter Zeitdruck – schieben Teams tendenziell unauthentifizierte Endpoints in Production, wenn es schnell gehen muss?
Die Empfehlung: Technische Teams viel früher in die Procurement-Sequenz einbinden, nicht zum Cleanup nach der Kaufentscheidung. Ein sechs-Fragen-Checklist für Developer deckt weitere Failure-Modes ab (Agent-Delegation, Token-Kosten bei Scale, Reversibilität bei Agenten-Fehlern). Die kritische Lehre ist nicht „Lily versäumte Sicherheit”, sondern „unsere Procurement- und Build-Prozesse sind für Agent-native Workloads nicht kalibriert.”
**Video-Format: Meinung/Deep-Dive mit Fallstudien-Analyse. Explizit thematisiert: Anthropic, OpenAI, SAP, Salesforce, ServiceNow, Pinecone; keine spezifischen AI-Modelle genannt.**
Alejandro AO (1 neues Video)
- MiniMax Agent: Alternative to ChatGPT + Codex?
12.5.2026, 12:46:44Das Video zeigt die Funktionen des MiniMax Agent, einem AI-Tool, das als Konkurrenz zu Codex und Cloud Cowork positioniert wird. Der MiniMax Agent wird von dem Modell MiniMax M2.7 angetrieben, das zwar nicht so leistungsstark wie GPT-5.5 oder Opus 4.7 ist, aber dennoch hohe Benchmark-Werte erreicht und zu einem günstigeren Preis angeboten wird.
Im Video wird demonstriert, wie der MiniMax Agent genutzt wird, um eine Website zu erstellen und diese auf MiniMax Cloud zu deployen. Dabei wird die Web- und Desktop-App des Tools vorgestellt. Die Desktop-App wird für die Datenanalyse eines CSV-Datensatzes verwendet, wobei ein PDF-Bericht mit LaTeX generiert wird. Zudem werden die “Skills” des MiniMax Agent gezeigt, darunter ein Video-Story-Generator, der aus Textbeschreibungen oder Bildern Videos erstellt.
Das Video erwähnt auch die Preismodelle von MiniMax, die eine kostenlose Version mit täglichen Credits sowie Premium-Pläne umfassen. Besonders hervorgehoben wird die Fähigkeit des Tools, komplexe Aufgaben wie Webseiten-Erstellung, Datenanalyse und Videogenerierung zu bewältigen.
Schluss-Kommentar: Das Video thematisiert explizit den MiniMax Agent und ist eher für Intermediate und Advanced Nutzer gedacht.
Alex Finn (4 neues Videos)
- LIVE: GROK BUILD CLI IS ACTUALLY INCREDIBLE???
15.5.2026, 20:24:28### Zusammenfassung des YouTube-Videos
Das Video ist eine Live-Stream-Session, in der der Autor verschiedene Aspekte des Verkaufs von Software-as-a-Service (SaaS) diskutiert und gleichzeitig die Fähigkeiten von Grock Build, einem Tool von XAI, testet. Der Stream beginnt mit einer lockeren Einführung, in der der Autor die Zuschauer dazu ermutigt, sich zu beteiligen und in den Chat zu schreiben. Er spricht über die Bedeutung von Twitter (X) für den Verkauf von Software und die Notwendigkeit, eine Community aufzubauen.
Anschließend geht er auf die drei wichtigsten Faktoren ein, die den Erfolg von SaaS-Produkten ausmachen: Distribution, Netzwerkeffekte und Partnerschaften mit Regierungsdaten. Er betont, dass eine starke Community und ein guter Vertrieb entscheidend sind, um erfolgreich zu sein.
Ein großer Teil des Videos widmet sich der Demonstration und dem Test von Grock Build, einem neuen Tool von XAI. Der Autor führt mehrere Benchmark-Tests durch, darunter das Erstellen eines 3D-First-Person-Shooters, einer Elon-Musk-Animation und eines 3D-Stadt-Flythroughs. Er bewertet die Ergebnisse und vergleicht sie mit anderen AI-Tools wie Claude, OpenAI und Gemini. Obwohl Grock Build in einigen Bereichen gut abschneidet, gibt es auch Kritik an der Benutzerfreundlichkeit und den Kosten des Tools.
Der Autor spricht auch über seine persönlichen Erfahrungen mit verschiedenen AI-Tools und teilt seine Meinung über die aktuelle Landschaft der KI-Entwicklung. Er betont die Bedeutung von Coding-Fähigkeiten für den Erfolg von AI-Tools und lobt Anthropic für die Entwicklung von Claude Code.
Gegen Ende des Videos kündigt der Autor an, dass er in Zukunft weniger Live-Streams machen und sich mehr auf das Erstellen von voraufgezeichneten Videos konzentrieren wird. Er lädt die Zuschauer ein, seinem Vibe Coding Academy Bootcamp beizutreten, in dem er mehr über SaaS, Investitionen in KI und seine Arbeitsabläufe sprechen wird.
### Schlusskommentar
Das Video thematisiert explizit die AI-Tools und Modelle von Claude (Anthropic), OpenAI (ChatGPT, Codex), Gemini (Google) und spezifische Tools wie Grock Build (XAI). Es ist eher für Intermediate und Advanced Nutzer gedacht, die sich für die Entwicklung und den Verkauf von SaaS-Produkten sowie für die neuesten Entwicklungen in der KI-Branche interessieren.
- LIVE: The greatest Claude Code workflow ever
13.5.2026, 20:12:33Das Video zeigt einen detaillierten, fortgeschrittenen Workflow für Cloud Code, der verschiedene Tools wie Slack, Linear, GitHub und Claude Code integriert. Der Host erklärt, wie diese Tools zusammenarbeiten, um die Produktivität zu steigern, Änderungen zu verfolgen und die Entwicklung zu organisieren. Der Workflow umfasst die Erstellung von Aufgaben und Projekten in Linear, die Verknüpfung mit GitHub für Branch-Management und die Nutzung von Claude Code für die Automatisierung und Verwaltung dieser Prozesse. Der Host betont die Vorteile dieses Workflows, wie erhöhte Geschwindigkeit, bessere Fehlervermeidung und verbesserte Nachverfolgbarkeit.
Zusätzlich diskutiert der Host persönliche Erfahrungen und Herausforderungen, wie die Bewältigung von schwierigen Zeiten und die Bedeutung von Durchhaltevermögen. Er teilt auch seine Gedanken über die Verwendung von AI-Tools wie Claude Code und Codex, sowie deren Unterschiede und Anwendungsfälle.
Das Video ist für fortgeschrittene Nutzer gedacht, die bereits Erfahrung mit Cloud Code und ähnlichen Tools haben und ihre Workflows optimieren möchten. Es werden spezifische Tools wie Claude, OpenAI, und Linear thematisiert.
- Hermes Agent powered by local models on the DGX Spark is basically magic
13.5.2026, 13:30:07Das Video zeigt, wie man einen Hermes-Agenten auf einem lokalen Modell auf einem Nvidia DGX Spark einrichtet, um einen 24/7 verfügbaren KI-Mitarbeiter zu erstellen. Der Prozess umfasst das Einrichten des DGX Spark im Headless-Modus, das Installieren eines lokalen Modells (Quen 3.6 27B) und das Integrieren des Modells in den Hermes-Agenten. Der Creator demonstriert drei Use Cases: ein täglicher Bericht über AI-Aktien für Anfänger, das Repurposing von YouTube-Video-Inhalten für Fortgeschrittene und das Vibe-Coding einer To-Do-List-App für Fortgeschrittene. Der Fokus liegt auf den Vorteilen lokaler Modelle, wie Kostenlosigkeit (abgesehen vom Stromverbrauch), Privatsphäre, Anpassbarkeit und Bildungswert.
Schluss-Kommentar: Das Video thematisiert explizit Nvidia DGX Spark, Hermes Agent, Quen 3.6 27B und Tail Scale und ist für Intermediate bis Advanced Nutzer gedacht.
- LIVE: Talking AI news (no Hermes use cases ignore the thumbnail)
11.5.2026, 20:11:47Das Video ist eine Live-Stream-Sitzung, die sich hauptsächlich um die Diskussion von Hermes Agent und dessen Anwendungsfälle dreht. Der Host, Alex Finn, beginnt mit einer Einführung in Hermes Agent und betont die Bedeutung von Anwendungsfällen für die Nutzung der Technologie. Er erwähnt, dass Hermes eine neue Website mit hunderten von Anwendungsfällen veröffentlicht hat, die er und die Zuschauer durchgehen und testen werden.
Ein großer Teil des Videos wird jedoch von verschiedenen Abweichungen und Diskussionen eingenommen, darunter:
1. **Investment Corner**: Alex spricht über die aktuellen Investitionsmöglichkeiten in der KI-Branche, insbesondere in Unternehmen wie Nvidia, Micron, TSMC und Tesla. Er betont die Bedeutung der aktuellen KI-Entwicklungen und die Notwendigkeit, in die richtigen Unternehmen zu investieren.
2. **Persönliche Geschichten und Anekdoten**: Alex teilt persönliche Geschichten und Anekdoten, die oft humorvoll und unterhaltsam sind, aber nicht direkt mit dem Hauptthema des Videos zusammenhängen.
3. **Interaktion mit dem Chat**: Ein großer Teil des Videos besteht aus der Interaktion mit dem Live-Chat, wobei Alex Fragen beantwortet, Kommentare macht und auf die Zuschauer eingeht.
4. **Anwendungsfälle für Hermes Agent**: Gegen Ende des Videos beginnt Alex, einige der Anwendungsfälle von der neuen Hermes-Website zu besprechen. Er erwähnt Anwendungsfälle wie die Erstellung von Forschungsberichten, die Verwaltung von Aufgaben und die Automatisierung von Prozessen.
5. **Ankündigungen und Updates**: Alex gibt Updates zu seinen eigenen Projekten und Ankündigungen, wie die Einführung eines zweiten YouTube-Kanals und die Teilnahme an einem Baby Keem-Konzert.
**Schluss-Kommentar**: Das Video thematisiert explizit Open-Source-KI-Modelle und Tools wie Hermes Agent und OpenClaw. Es ist eher für Intermediate bis Advanced-Nutzer gedacht, die bereits ein gewisses Verständnis von KI und deren Anwendungen haben.
Bart Slodyczka
Keine neuen Videos in diesem Zeitraum.
Ben AI (2 neues Videos)
- 5 Skills to Build an AI Operating System Like The 1% (Full Guide)
16.5.2026, 08:48:55Das Video zeigt, wie man ein “Second Brain” oder ein AI-Betriebssystem einrichtet, um die Effizienz und Produktivität mit AI-Tools zu steigern. Der Autor, Ben, betont die Bedeutung eines gut strukturierten und gepflegten Systems, um Token-Kosten zu optimieren und relevante Kontexte bereitzustellen. Er stellt fünf Clot-Skills vor, die dabei helfen, das System schnell und nach Best Practices einzurichten:
1. **OS Setup Skill**: Hilft bei der initialen Einrichtung des Second Brain, einschließlich der Population von Kontext, der Strukturierung der Ordner und der Erstellung von Clot.md-Dateien, die als Anweisungsschicht für AI-Agenten dienen.
2. **OS Operator Skill**: Richtet eine geplante Aufgabe ein, die Echtzeit-Kontext aus verschiedenen Quellen (z.B. Meetings, Slack-Chats) zieht und den Second Brain entsprechend aktualisiert. Dies umfasst die Erstellung täglicher Zusammenfassungen, Aufgabenlisten und die Pflege bestehender Dateien.
3. **OS Optimizer Skill**: Führt regelmäßige Audits und Optimierungen durch, um die Effizienz und Token-Nutzung des Second Brain zu verbessern. Dies umfasst die Beseitigung von Duplikaten, die Korrektur von Formatierungen und die Verbesserung der Ordnerstruktur.
4. **Team OS Skill**: Ermöglicht die gemeinsame Nutzung und Synchronisation des Second Brain innerhalb eines Teams, einschließlich der Einrichtung von Lese- und Schreibberechtigungen für verschiedene Teammitglieder.
5. **OS MCP Skill**: Erstellt einen MCP (Managed Connector Proxy) aus dem Second Brain, sodass geplante Aufgaben und Optimierungen autonom, auch bei geschlossenem Laptop, ausgeführt werden können.
Der Autor empfiehlt, mit der Einrichtung des Second Brain zu beginnen und es schrittweise auszubauen, da sich der Nutzen mit der Zeit und der zunehmenden Kontextmenge verstärkt. Er bietet zusätzliche Ressourcen und Unterstützung für diejenigen an, die tiefer in das Thema einsteigen möchten.
Das Video thematisiert explizit Claude und ist eher für Intermediate und Advanced Nutzer geeignet.
- How to Actually Use Claude Design Like a Pro (Real Use Cases)
12.5.2026, 07:40:42Das Video zeigt, wie man Cloud Design effizient für verschiedene Designaufgaben nutzen kann, darunter Präsentationen, Social-Media-Inhalte und Websites. Der Hauptfokus liegt auf einem vierstufigen Prozess: Erstens, die Einrichtung eines umfassenden Designsystems, das Farben, Schriftarten und Stile enthält. Zweitens, die Nutzung von Vorlagen, um Formate und Layouts vorab festzulegen. Drittens, die Verwendung von Skills, um Texte und Inhalte vorab zu definieren. Viertens, die Integration dieser Elemente in Cloud Design, um schnell und konsistente Designs zu erstellen. Der Creator betont, dass diese Vorbereitung endlose Iterationen und hohe Token-Kosten vermeidet. Es werden konkrete Beispiele und Schritte zur Einrichtung von Designsystemen und Vorlagen gezeigt, sowie die Nutzung von Skills zur Automatisierung des Prozesses. Zudem werden kostenlose Ressourcen und Tools angeboten, um den Einstieg zu erleichtern.
Das Video thematisiert explizit Cloud Design und ist eher für Intermediate Nutzer geeignet, die bereits erste Erfahrungen mit AI-Tools haben.
Brian Casel (1 neues Video)
- How I build agents that work the night shift
12.5.2026, 12:01:07Das Video zeigt einen Prozess, den der Nutzer “Radar Scan” nennt, bei dem mehrere KI-Agenten auf einem Mac Mini mit OpenClaw betrieben werden. Einer dieser Agenten, namens Veil, ist für Marketing zuständig und führt täglich um 4:00 Uhr morgens eine Radar-Scan durch. Das Ergebnis wird als Markdown-Datei in Dropbox gespeichert und kann über einen Link in Telegram abgerufen werden. Die Datei wird in einer selbstgebauten App namens Brainown geöffnet, die das Lesen und Schreiben von Markdown-Dateien erleichtert. Der Scan fasst hauptsächlich Tweets aus der Branche des Nutzers zusammen, die von ihm gefolgt werden, einschließlich Nachrichten von Unternehmen, Influencern und Denkern. Der Nutzer organisiert seine Telegram-Kontakte in menschliche und Agenten-Freunde und erhält eine Übersicht des Berichts in Telegram, mit der Möglichkeit, die vollständige Datei in Brainown zu öffnen.
Der Nutzer thematisiert OpenClaw und die selbstgebaute App Brainown, was das Video eher für Intermediate oder Advanced Nutzer interessant macht.
Coding with Lewis (1 neues Video)
- How Meta Went From Open Source Hero to AI’s Biggest Villain
15.5.2026, 15:04:55Das Video erzählt die Geschichte von Meta und ihrem offenen KI-Modell Llama, das 2023 veröffentlicht wurde und innerhalb von zwei Jahren über eine Milliarde Mal heruntergeladen wurde. Meta wurde für seine offene und zugängliche Herangehensweise an KI gelobt, die es Entwicklern ermöglichte, das Modell auf eigener Hardware zu nutzen und darauf aufzubauen. Llama 2 und Llama 3 folgten und zeigten beeindruckende Leistungen, wobei Llama 3.1 sogar mit den besten geschlossenen Modellen von OpenAI und Google konkurrieren konnte. Doch der Erfolg von Meta wurde durch die Veröffentlichung von DeepSeek v3 durch ein chinesisches KI-Labor überschattet, das ähnliche Leistungen zu einem Bruchteil der Kosten erzielte. Dies führte zu einem Druck auf Meta, Llama 4 zu veröffentlichen, was schließlich zu einem Desaster führte. Llama 4 wurde auf einem Samstag ohne Vorwarnung veröffentlicht und enthüllte drei Modelle, von denen eines, Behemoth, noch in der Entwicklung war. Die behaupteten Leistungen von Llama 4 wurden schnell in Frage gestellt, als Entwickler und Forscher feststellten, dass die Modelle nicht den Versprechungen entsprachen und dass Meta manipulierte Benchmarks verwendet hatte. Die Community reagierte mit Enttäuschung und Misstrauen, und Meta verlor das Vertrauen, das es über Jahre aufgebaut hatte. Die Geschichte zeigt, wie wichtig Ehrlichkeit und Transparenz in der offenen KI-Gemeinschaft sind und wie schnell Vertrauen verloren gehen kann.
Das Video thematisiert explizit Meta’s Llama-Modelle und ist eher für Intermediate oder Advanced gedacht.
Cole Medin (4 neues Videos)
- 🔴 The AI Coding Marketplace is Finally LIVE!
15.5.2026, 03:17:26Das Video zeigt, wie man mit Hilfe von KI vollständig animierte Videos mit Audio erstellt. Der Prozess nutzt mehrere Technologien, darunter HyperFrames für die Renderung, Claude Code für die Steuerung, 11Labs oder Kokoro für die Sprachausgabe und Archon als Workflow-Manager. Der Creator stellt ein Open-Source-Repository zur Verfügung, das es ermöglicht, in weniger als 10 Minuten ein eigenes KI-generiertes Video zu erstellen. Der Workflow umfasst das Skripten, die Audioerstellung, das Rendern der Visuals und das Synchronisieren aller Elemente. Der Creator betont, dass die Technologie zwar noch nicht perfekt ist, aber schnell Fortschritte macht und bereits nützliche Anwendungen findet, insbesondere für Erklärvideos. Der Prozess wird detailliert erklärt, einschließlich der Möglichkeit, Templates anzupassen und eigene Vorlagen zu erstellen. Am Ende werden Beispiele für generierte Videos gezeigt.
Das Video thematisiert explizit HyperFrames, Claude Code, 11Labs, Kokoro und Archon und ist eher für Intermediate Nutzer gedacht.
- Make the PERFECT Videos with Claude Code (Full Workflow)
14.5.2026, 00:00:24**Zusammenfassung:**
In diesem Live-Stream wurde die Entwicklung eines Workflow-Marketplace für Archon, ein Open-Source-Harness-Builder für AI-Coding, fortgesetzt. Der Fokus lag darauf, einen Marktplatz zu erstellen, auf dem Benutzer ihre eigenen Workflows teilen und andere Workflows nutzen können. Der Prozess umfasste die Erstellung eines Archon-Workflows, der Pull-Requests für neue Workflows automatisch überprüft und genehmigt. Der Stream begann mit der Zusammenführung eines bestehenden Pull-Requests, der den Marktplatz UI einführte, und setzte sich mit der Erstellung eines neuen Workflows fort, der die Pull-Requests überprüft.
Der Prozess umfasste mehrere Schritte, darunter die Erstellung eines Plans, die Implementierung des Plans und die Überprüfung des generierten Codes. Es wurden verschiedene Fragen und Anpassungen besprochen, um sicherzustellen, dass der Workflow korrekt funktioniert. Der Stream endete mit der Erstellung eines Pull-Requests für einen Test-Workflow und der Demonstration, wie der automatische Überprüfungsprozess funktioniert.
**Schlusskommentar:**
Das Video thematisiert explizit die Nutzung von Claude (Claude Code) und ist eher für Intermediate bis Advanced Nutzer gedacht. - Building the App Store for Agentic Engineering
12.5.2026, 04:02:35**Zusammenfassung des YouTube-Videos:**
Das Video zeigt eine Live-Demo des AI-Tools Archon, das als Open-Source-Harness-Builder für AI-Coding entwickelt wurde. Der Streamer präsentiert seinen aktuellen AI-Coding-Workflow und wie Archon diesen Prozess um das 10-fache beschleunigt. Er demonstriert die Nutzung von Archon für verschiedene Aufgaben, darunter die Bearbeitung von GitHub-Issues (Brownfield-Entwicklung) und die Erstellung neuer Features (Greenfield-Entwicklung).
1. **Brownfield-Entwicklung:**
– Der Streamer zeigt, wie er Archon verwendet, um mehrere GitHub-Issues parallel zu bearbeiten. Dabei werden Workflows genutzt, die Planung, Implementierung und Validierung umfassen.
– Die Workflows sind so gestaltet, dass sie umfassende Pull Requests erstellen, die dann manuell überprüft werden können.
– Es wird demonstriert, wie Archon mit einem “Second Brain” (einem System zur Organisation von Wissen und Aufgaben) integriert wird, um den Workflow zu optimieren.2. **Greenfield-Entwicklung:**
– Der Streamer plant und implementiert ein neues Feature für Archon: einen Workflow-Marketplace, der es Nutzern ermöglicht, eigene Workflows zu erstellen und zu teilen.
– Dabei wird der PIV-Loop (Plan, Implement, Validate) verwendet, ein strukturierter Ansatz zur AI-gestützten Entwicklung, der Planung, Implementierung und Validierung umfasst.
– Es wird gezeigt, wie Archon Workflows für komplexe Aufgaben wie die Erstellung eines neuen Marketplace-Features verwendet werden können.3. **Technische Details:**
– Archon ermöglicht die Erstellung von Workflows, die verschiedene AI-Modelle und Tools integrieren können, darunter Claude, Codex und andere.
– Die Workflows sind so gestaltet, dass sie deterministisch und wiederholbar sind, was die Zuverlässigkeit und Effizienz erhöht.
– Der Streamer betont die Bedeutung von Human-in-the-Loop-Prozessen, um die Qualität der Ergebnisse zu gewährleisten.4. **Integration und Erweiterungen:**
– Es wird gezeigt, wie Archon mit anderen Tools wie Beads (einem Memory-System) integriert werden kann.
– Der Streamer diskutiert die Vorteile von Archon im Vergleich zu anderen Tools wie N8N und betont die Spezialisierung von Archon auf AI-Coding.5. **Community und Weiterentwicklung:**
– Der Streamer erwähnt die Dynamis-Community, in der er regelmäßig Workshops und Kurse anbietet, um Nutzern zu helfen, Archon und andere AI-Tools effektiv zu nutzen.
– Er kündigt an, dass er weiterhin Live-Streams durchführen wird, um die Entwicklung und Nutzung von Archon zu demonstrieren.**Schluss-Kommentar:**
Das Video thematisiert explizit das Tool Archon und ist eher für Intermediate bis Advanced-Nutzer gedacht, die sich für AI-Coding und Workflow-Automatisierung interessieren. - 🔴LIVE – My AI Coding Workflow has 10x’d Again with Archon – See it in Action
10.5.2026, 05:56:02Der YouTuber äußert seine Unzufriedenheit mit der aktuellen YouTube-Landschaft, die sich stark auf die Berichterstattung über Claude und dessen neueste Funktionen konzentriert. Er möchte sich von dieser Masse abheben und stattdessen tiefere, technischere Inhalte anbieten, die sich auf das tatsächliche Bauen und die Prinzipien des AI-Codings konzentrieren. Dazu plant er, dreimal pro Woche (Montag, Donnerstag, Samstag) Live-Streams durchzuführen, in denen er Projekte wie Arkon und das Dark Factory-Experiment vorstellt und interaktiv mit der Community arbeitet. Er betont, dass er weiterhin relevante AI-News abdecken wird, aber mit einem Fokus auf praktische Anwendung und langfristigen Wert. Der Content ist für Intermediate und Advanced Nutzer gedacht, die sich für AI-Coding und Systeme interessieren. Der YouTuber thematisiert explizit Claude und Claude Code.
Dave Ebbelaar (2 neues Videos)
- The Complete Guide to Hybrid Search in RAG (BM25 + Embeddings + Reranker)
14.5.2026, 17:52:50Das Video ist ein detailliertes Tutorial, das zeigt, wie man ein hybrides Retrieval-System von Grund auf aufbaut, das BM25, dichte Einbettungen, rekiproke Rangfusion (RRF) und einen Re-Ranker kombiniert. Der Fokus liegt darauf, ein produktionsfähiges System zu erstellen, das 2026 relevant sein wird. Der Tutorial beginnt mit der Erklärung des verwendeten Datensatzes, dem Financial QA-Datensatz, der Teil der BEIR-Benchmarks ist. Dieser Datensatz enthält Finanzfragen und zugehörige Antworten, die für die Evaluierung des Retrieval-Systems verwendet werden.
Der Tutorial geht schrittweise durch den Prozess der Erstellung von BM25- und dichten Einbettungsindizes, der Durchführung von Abfragen und der Kombination der Ergebnisse mit RRF. Anschließend wird ein Re-Ranker hinzugefügt, um die Ergebnisse weiter zu verbessern. Der Tutorial betont die Bedeutung der Evaluierung und zeigt, wie man die Leistung des Systems mit der normalisierten absteigenden kumulativen Gewinnfunktion (NDCG) misst.
Am Ende wird erklärt, wie man das System auf eigene Projekte anwendet, einschließlich der Erstellung eines eigenen Evaluierungsdatensatzes. Der Tutorial ist für Entwickler und Ingenieure gedacht, die bereits Grundkenntnisse in Retrieval-Systemen haben und diese professionell nutzen möchten.
Schluss-Kommentar: Das Video thematisiert OpenAI (für die Einbettungsmodelle) und Cohere (für den Re-Ranker) und ist eher für Intermediate bis Advanced Nutzer gedacht.
- Building Agentic RAG From Scratch in Pure Python
10.5.2026, 09:57:56Das Video zeigt, wie man ein agentenbasiertes RAG-System (Retrieval-Augmented Generation) von Grund auf in reinem Python aufbaut. Der Fokus liegt darauf, Unternehmensdaten oder private Informationen für große Sprachmodelle zugänglich zu machen, um diese in der Automatisierung mit KI einzusetzen. Der Autor, Dave Abalar, erklärt die Unterschiede zwischen klassischem semantischem RAG und agentenbasiertem RAG, wobei letzteres durch eine Feedback-Schleife und wiederholte Nutzung der Intelligenz des Sprachmodells übertrifft.
Der Aufbau des Systems erfolgt in mehreren Schritten: Zuerst werden einfache Tools definiert, die Dateien listen, durchsuchen und lesen können. Diese Tools arbeiten mit Markdown-Dateien im Dateisystem. Der Autor zeigt, wie man diese Tools in Python implementiert, einschließlich der Verwendung von regulären Ausdrücken zur Suche nach Mustern in den Dateien. Anschließend wird ein einfacher Agent mit diesen Tools erstellt, der Fragen zu den Inhalten der Markdown-Dateien beantworten kann. Der Agent nutzt die Tools in einer Schleife, um die richtigen Informationen zu finden und sich selbst zu korrigieren.
Der Autor geht auch auf Produktionsbest Practices ein, wie z.B. die Verwendung von Rust-basierten Tools wie ripgrep für schnellere und sicherere Dateisuche, sowie die Implementierung von Fehlermeldungen, die vom Sprachmodell interpretiert werden können, um den Agenten zu verbessern. Er zeigt, wie man das System in verschiedenen Umgebungen wie VPS, Container-Apps oder serverlosen Funktionen einsetzen kann.
Am Ende des Videos wird ein vollständiges Beispiel eines agentenbasierten RAG-Systems in Python präsentiert, das Produktionsbest Practices folgt und in realen Projekten eingesetzt werden kann.
Das Video thematisiert OpenAI und ist eher für Intermediate oder Advanced Nutzer geeignet.
David Shapiro
Keine neuen Videos in diesem Zeitraum.
Everlast AI (3 neues Videos)
- China-Insider packt aus: Es gibt KEIN zurück mehr! DAS rollt bis 2030 auf uns zu (Jörg Wuttke)
14.5.2026, 15:15:38Das Video bietet einen tiefen Einblick in die aktuelle wirtschaftliche und politische Lage Chinas, insbesondere im Kontext von Innovation, Technologie und demografischen Herausforderungen. Hier sind die wichtigsten Punkte:
1. **Innovation und Überkapazitäten**: China hat eine tiefe Bank an Ingenieuren und ist in vielen Bereichen, wie KI, Humanoide Robotik, Energie und E-Autos, führend. Allerdings produziert China systemisch Überkapazitäten, was zu Deflation und wirtschaftlichen Problemen führt. Dies liegt daran, dass staatseigene Betriebe nicht vom Markt verschwinden, selbst wenn sie keine Gewinne machen.
2. **Demografische Herausforderungen**: China altert schnell und hat eine niedrige Geburtenrate. Die Bevölkerung wird voraussichtlich bis 2060 auf etwa 500 Millionen sinken. Dies führt zu einem Mangel an Arbeitskräften, den China durch den Einsatz von KI und Robotik ausgleichen möchte.
3. **Technologische Unabhängigkeit**: China strebt danach, sich von westlichen Technologien unabhängig zu machen, insbesondere im Bereich der Halbleiter. Dies ist eine Reaktion auf die restriktive Politik der USA, die den Export von Hochtechnologie nach China einschränkt.
4. **Exportdruck**: Aufgrund der Überkapazitäten und des schwachen Binnenkonsums ist China auf Exporte angewiesen. Dies führt zu einem starken Wettbewerbsdruck auf globalen Märkten, insbesondere in Afrika, Südamerika und Südostasien.
5. **Politische und wirtschaftliche Strategien**: China setzt auf langfristige Pläne, wie den 15-Jahres-Plan, um seine Ziele zu erreichen. Allerdings gibt es auch interne Herausforderungen, wie die Alterung der Bevölkerung und die Abwanderung aus ländlichen Gebieten in die Städte.
6. **Unternehmensstrategien**: Chinesische Unternehmen sind risikobereiter und näher am Kunden als ihre westlichen Konkurrenten. Dies ermöglicht eine schnellere Entwicklung und Anpassung an Marktbedürfnisse.
7. **Geopolitische Implikationen**: Die demografischen und wirtschaftlichen Veränderungen in China werden die globale geopolitische Landschaft erheblich beeinflussen. Afrika wird als Unterversorger an Bedeutung gewinnen, während China an Einfluss verliert.
Das Video ist eher für Intermediate und Advanced Zuschauer geeignet, da es komplexe wirtschaftliche und politische Zusammenhänge behandelt. Es werden keine spezifischen AI-Tools oder Modelle thematisiert, sondern allgemeine Trends und Strategien.
- KI-Experten reagieren: DAS übersehen alle! Musks Claude-Deal, Chinas Roboter-Druck & EU kippt AI-Act
12.5.2026, 15:15:26Das Video ist eine Diskussion über aktuelle Entwicklungen und Trends in den Bereichen künstliche Intelligenz (KI), Technologie und Zukunft. Die Teilnehmer sind Professor Dr. Andreas Moring, Professor Dr. Pero Mitic und Kim Isenberg, die verschiedene Aspekte der KI-Nutzung, Robotik, Automatisierung und deren Auswirkungen auf Gesellschaft und Wirtschaft diskutieren.
**Hauptthemen und Punkte:**
1. **KI-Modelle und Infrastruktur:**
– **Anthropic und Elon Musk:** Anthropic nutzt nun die Rechenzentren von Elon Musk (Colossus 1 und 2) für seine KI-Modelle. Dies wird als strategischer Schritt gesehen, da Musk seine Rechenleistung vermieten muss, um sie nicht ungenutzt zu lassen.
– **Gemini und Apple:** Apple setzt auf Google Gemini für Siri, nachdem Verhandlungen mit Anthropic gescheitert sind. Dies zeigt, dass Apple nicht unbedingt das beste KI-Modell braucht, sondern eines, das gut genug für den Massenmarkt ist.
– **Humanoide Roboter:** Boston Dynamics zeigt Fortschritte in der Robotik, insbesondere mit dem Atlas-Roboter, der komplexe Bewegungen ausführen kann. Dies unterstreicht die Bedeutung von Robotik in Produktion, Logistik und Service.2. **Wirtschaftliche und politische Aspekte:**
– **China vs. Europa/USA:** China ist in vielen Bereichen der Technologie und Infrastruktur weit voraus, insbesondere in der Robotik und KI. Europa hingegen hat Schwierigkeiten, mitzuhalten, sowohl aufgrund politischer Entscheidungen als auch wirtschaftlicher Herausforderungen.
– **Jobverluste durch KI:** Unternehmen wie Coinbase, PayPal und Cloudflare entlassen Mitarbeiter und begründen dies mit der Adoption von KI. Es wird diskutiert, ob dies tatsächlich KI-bedingte Entlassungen sind oder ob wirtschaftliche Schwierigkeiten der eigentliche Grund sind.
– **Regulierung und Datenschutz:** Die EU diskutiert über strengere Regulierungen, wie das Verbot von VPNs zum Kinderschutz. Dies wird kritisch gesehen, da es als Einschränkung der Freiheit betrachtet wird.3. **Gesundheitswesen und KI:**
– **KI im Gesundheitswesen:** Google präsentiert Studien, die zeigen, dass KI-Diagnosen oft besser sind als die von Ärzten. Dies könnte den Gesundheitssektor revolutionieren, stellt aber auch Fragen zur Selbstwahrnehmung und Abhängigkeit von Technologie.4. **Bildung und Zukunftsfähigkeit:**
– **Bildungssysteme:** Es wird betont, dass Schulen und Universitäten sich ändern müssen, um Urteilsfähigkeit und kritisches Denken zu fördern, anstatt nur Informationen zu vermitteln.
– **Investitionen in KI:** Unternehmen sollten in KI investieren, um wettbewerbsfähig zu bleiben. Dies umfasst die Entwicklung eigener KI-gestützter Anwendungen und die Nutzung von Plattformen wie Cloud Code.**Schlusskommentar:**
Das Video thematisiert explizit Modelle und Anbieter wie Claude, OpenAI, Gemini und Open-Source-Lösungen. Es richtet sich an ein fortgeschrittenes Publikum, das sich bereits mit KI und Technologie auskennt und vertiefte Einblicke sucht. - KI-News: Claude verbessert sich IM SCHLAF! Musk rettet Anthropic, Codex & GPT-Realtime Updates
10.5.2026, 08:15:10Das Video behandelt mehrere aktuelle Entwicklungen und Updates im Bereich der künstlichen Intelligenz und Agentic Coding. Hier sind die wichtigsten Punkte:
1. **Elon Musks SpaceX Deal mit Anthropic**: Der Deal verdoppelt das 5-Stunden-Nutzungslimit in Cloud Code, während die Wochenlimits unverändert bleiben. Dies ist Teil einer Partnerschaft, bei der Anthropic Cloud-Modelle auf SpaceX’s Colossus-1-Supercomputer laufen lässt.
2. **Gemma 4**: Das Open-Source-Modell von Google ist jetzt dreimal schneller durch Multitoken-Prädiktion (MTP Drafter). Es kann in Cloud Code genutzt werden, allerdings mit Einschränkungen bei der Performance.
3. **Cloud Managed Agents**: Updates umfassen Multient-Sessions, Webhook-Integration und die neue “Dreaming”-Funktion, die das Gedächtnisproblem von Agenten adressiert. Diese Funktion wurde mit Vincent Pistor von Cogni diskutiert, einem Startup, das sich auf Agent-Memory spezialisiert.
4. **Gemini Updates**: Google Gemini erhält neue Funktionen wie Skills und Scheduled Actions. Zudem wurde Gemini 3.1 Flashlight öffentlich zugänglich gemacht, ein kosteneffizientes Modell für High-Volume-Tasks.
5. **Codex Cloud vs. Cloud Code**: Codex Cloud hat in den Downloads dramatisch aufgeholt und bietet neue Funktionen wie eine Chrome-Extension für Browser-Automatisierung.
6. **Vergleich von Remotion und Hyper Frames**: Beide Tools ermöglichen die Erstellung von Videos und Animationen per Textprompt. Hyper Frames bietet einen schnelleren Einstieg und zuverlässigere Ergebnisse, während Remotion besser für Skalierung geeignet ist.
7. **OpenAI’s Realtime 2 Modell**: Dieses Modell ist für agentische Aufgaben ausgelegt und ermöglicht eine bessere Integration in Software und Nutzeroberflächen. Es ist der Motor hinter dem Advanced Voice Mode von ChatGPT.
8. **KI Business Idee der Woche**: Der App Store verzeichnet einen dramatischen Anstieg an Apps, was auf die wachsende Bedeutung von Agentic Coding zurückgeführt wird. Unternehmen wie Mercedes nutzen Agenten, um ihre IT-Infrastruktur zu verschlanken.
Das Video thematisiert explizit OpenAI, Gemini, Cloud Managed Agents, Codex, Remotion, Hyper Frames und spezifische Tools wie Cogni. Es richtet sich an Intermediate und Advanced Nutzer, die sich mit den neuesten Entwicklungen in der KI-Welt auseinandersetzen möchten.
Fireship (2 neues Videos)
- I can’t believe this trial is real…
15.5.2026, 18:51:21Das Video bietet einen humorvollen Ausblick auf futuristische Technologien des Jahres 2026, darunter eine KI-gestützte Smart-Toilette, intelligente Haarschneidemaschinen und ein KI-Taschenhaustier. Der Fokus liegt jedoch auf OpenClaw, einem persönlichen KI-Assistenzsystem, das seit seiner Veröffentlichung im Januar 2026 für Aufsehen sorgt. Der Creator zeigt, wie man OpenClaw auf einem virtuellen privaten Server von Hostinger hostet und konfiguriert, um spezifische Probleme zu lösen, wie z.B. das Beantworten von Familienanfragen in der eigenen Stimme. Der Prozess umfasst die Einrichtung eines Telegram-Bots, die Integration von 11 Labs für Sprachgenerierung und die Konfiguration von Tools, um automatisierte Antworten zu generieren.
Das Video thematisiert explizit OpenClaw und Hostinger und ist eher für Intermediate Nutzer gedacht, da es technische Schritte zur Einrichtung und Konfiguration eines KI-Assistenzsystems beinhaltet.
- A single PR just hijacked the NPM registry…
14.5.2026, 17:39:11Das Video stellt Claude Design vor, eine neue KI-gestützte Plattform von Anthropic, die auf dem Modell Opus 4.7 basiert und Figma-Designs in interaktive Prototypen, Pitch-Decks und produktionsreife UIs umwandelt. Die KI kann Bilder in hoher Auflösung verarbeiten und bietet fortschrittliche Funktionen wie interaktive Animationen, Variationen von Designs und sogar Videobearbeitung. Das Video demonstriert die Erstellung eines iOS-Onboarding-Flows für eine fiktive App namens “Horse Tinder”, wobei die KI zwar einen guten Ausgangspunkt liefert, aber nicht immer das Design-System korrekt anwendet. Trotz einiger Schwächen zeigt Claude Design vielversprechende Fähigkeiten, die traditionelle Design-Tools und -Prozesse revolutionieren könnten.
Das Video thematisiert explizit Anthropic’s Claude Design und Opus 4.7 sowie Google Cloud Run und ist eher für Intermediate und Advanced Nutzer gedacht.
Greg Baugues
Keine neuen Videos in diesem Zeitraum.
IA et Stratégie | Le SamourAI
Keine neuen Videos in diesem Zeitraum.
Julian Ivanov | KI-Automatisierung (2 neues Videos)
- Claude Code vom Handy für dich arbeiten lassen (Remote Control)
16.5.2026, 13:23:09Das Video zeigt, wie man Cloud Code von Anthropic auf einem Server installiert und über die Remote Control-Funktion mit einem Handy steuert, um von überall aus Projekte zu bearbeiten. Der Nutzer demonstriert, wie man eine Website erstellt, auf einem Server deployt und über das Handy weiter anpasst, ohne ständig am PC sitzen zu müssen. Dabei werden verschiedene Befehle wie `Remote Control`, `Set a Goal` und `Loop` erklärt, die es ermöglichen, Cloud Code Aufgaben zu stellen, die automatisch ausgeführt werden, bis ein bestimmtes Ziel erreicht ist oder in regelmäßigen Abständen. Der Nutzer nutzt einen Server von Hostinger, auf dem Cloud Code vorinstalliert ist, und zeigt, wie man DNS-Einträge für eine Domain einrichtet, um die erstellte Website live zu schalten. Am Ende werden noch zwei nützliche Befehle vorgestellt: `Slash Goal`, um Cloud Code anzuweisen, eine Aufgabe zu erledigen, bis eine bestimmte Bedingung erfüllt ist, und `Slash Loop`, um Cloud Code in regelmäßigen Abständen eine bestimmte Aktion ausführen zu lassen.
Das Video thematisiert explizit Claude (Cloud Code) und ist eher für Intermediate Nutzer gedacht.
- Ich habe Claude Code als meinen Video Editor eingestellt
11.5.2026, 17:02:17Das Video zeigt, wie man Videos mit Hilfe von KI-Tools wie Cloud Code, Hyperframes und Cloud Design bearbeiten kann, ohne ein Schnittprogramm zu verwenden. Der Prozess umfasst drei Hauptwerkzeuge: Videouse, Hyperframes und Cloud Design. Videouse schneidet das Video basierend auf dem Transkript, das über 11 Labs erstellt wird. Hyperframes generiert Animationen und Motion Graphics, die auf HTML, CSS und JavaScript basieren. Cloud Design ermöglicht die Erstellung von Animationen und Designs im Browser, ohne Code zu schreiben, und integriert das Branding. Der Workflow wird Schritt für Schritt erklärt, einschließlich der Einrichtung und Nutzung der Tools. Es wird demonstriert, wie man ein Video schneidet, Animationen hinzufügt und das Endergebnis in 4K rendert. Das Video ist für Intermediate Nutzer geeignet, die KI-Tools wie Cloud Code, Hyperframes und Cloud Design verwenden möchten.
Kyle Balmer | AI with Kyle (2 neues Videos)
- The 4 AI Skills Anthropic Wants You to Have (Explained in 20 minutes)
15.5.2026, 05:00:02Das Video bietet eine Zusammenfassung des “AI Fluency”-Kurses von Anthropic, der darauf abzielt, effektiv, effizient, ethisch und sicher mit KI-Systemen zusammenzuarbeiten. Der Kurs wird in drei Hauptnutzungsarten unterteilt: Automatisierung (Aufgabenabwicklung nach Anweisungen), Augmentation (Zusammenarbeit mit KI als Sparringspartner) und Agency (KI arbeitet unabhängig für ein gesetztes Ziel). Der Kern des Kurses liegt in den vier “Ds”: Delegation (Entscheidung, welche Aufgaben an die KI delegiert werden), Beschreibung (klare Kommunikation der Aufgabenstellung), Unterscheidungsvermögen (kritische Bewertung der KI-Ausgabe) und Sorgfalt (ethische und verantwortungsvolle Nutzung). Besonders betont wird der “Beschreibung zu Unterscheidungsvermögen”-Loop, bei dem die KI-Ausgabe kontinuierlich überprüft und verbessert wird, um hochwertige Ergebnisse zu erzielen. Der Kurs rät dazu, KI nicht vorschnell zu automatisieren, sondern zunächst in einem augmentierten Modus zu testen und zu verfeinern. Die Sorgfalt umfasst die Überprüfung der KI-Nutzung auf Richtigkeit, Transparenz und Verifizierung, um ethische und praktische Fehler zu vermeiden.
Das Video thematisiert explizit Claude von Anthropic und ist eher für Intermediate und Advanced Nutzer gedacht.
- How I Produce 20+ Pieces of Content Daily Using AI (Full System Revealed)
13.5.2026, 05:00:50# Zusammenfassung: AI-gestützte Content-Produktion im großen Maßstab
Der Creator zeigt sein System zur Produktion von täglich 20+ Content-Stücken (YouTube-Video, Livestream, Newsletter, 5-8 Short-Form-Videos, Carousels, LinkedIn-Posts) mit nur zwei Personen und KI-Agenten.
**Grundprinzip:** Audience ist die wichtigste Asset für ein Business. Er empfiehlt, durch Bildungsinhalte Autorität zu aufzubauen statt reiner Unterhaltung. In zwei Jahren hat er 300.000 Follower aufgebaut und über 500.000 Dollar an sein Publikum verkauft.
**Der vollständige Workflow:**
1. **Topic Selection:** Ein KI-Agent (aktuell Hermes, früher OpenClaw) scannt täglich nach Trends/News und schlägt Themen vor — gemischt aus zeitaktuellen Hooks und evergreen Content.
2. **Prep:** Der Creator gibt Sprachnachrichten mit seinen Hot Takes ab; der Agent erstellt eine Outline, der Creator gibt Feedback, dann generiert ChatGPT die Slides/Visuals.
3. **Livestream:** Persönlich auf TikTok, YouTube, LinkedIn, X, Facebook gleichzeitig (20-60 Min) — essentiell für Authentizität. Der 4K-Clean-Cut wird separat aufgenommen.
4. **Transcript & Processing:** Descript erstellt das Transkript, dieses geht in seinen „AI Brain” (GitHub + Obsidian). Ein Custom-Workflow mit Claude verarbeitet es in mehrere Outputs gleichzeitig.
5. **Long-Form Output:** Newsletter (human-edited), LinkedIn-Artikel, Carousels (ChatGPT generiert Infografiken), PDFs als DM-Giveaway (über ManyChat — 100-300 Emails/Tag, ~10$ pro Email Wert).
6. **Short-Form Output:** Claude findet 12 virale Hooks aus dem Newsletter, generiert 30-60-Sekunden-Scripts + Hashtags. Der Creator filmt diese selbst auf dem Handy. ChatGPT generiert Reel-Cover.
7. **Scheduling:** Blotato oder manuell. Feedback-Loop: Jede Woche vergleicht das System die AI-Drafts mit den finalen publizierten Versionen, um sich selbst zu verbessern. Optional: Content-Analytics einfeeden für Topic-Optimierung.**Minimum Viable Product (für Anfänger):**
Nicht jeden Tag livestreamen. Stattdessen: AI interviewt dich via Voice-Mode → Transcript → Newsletter + Short-Form-Scripts → du filmst die Videos selbst. Keine 20+ Assets am Anfang, nur Newsletter + paar Videos.**Kritische Human-Elements:** Sprachnachrichten (erfasst Tonalität), Livestream/Interview (Authentizität), Editing der Newsletter (nicht nur pure AI-Output), Filmen der Short-Form-Videos (keine Deepfakes). AI macht die repetitive Arbeit, aber der Creator bleibt überall sichtbar.
**Tool-Stack:** Hermes/Claude (Agenten), ChatGPT Images 2.0 (Slides/Visuals — besser als NotebookLM), Descript (Transcripts), Claude Cowork/Code (Newsletters/Scripts), Blotato (Scheduling), ManyChat (Email-Giveaways). Er betont: Das spezifische Tool ist weniger wichtig als ein durchdachter Workflow; Zeit mit Tool-Hopping zu verschwenden ist ein häufiger Fehler.
**Warum das funktioniert:** AI-Content wird überfluten den Markt → Liveness, Public Speaking, On-Camera-Präsenz werden wertvoll. Diese Fähigkeiten zu automatisieren wäre ein Fehler. Stattdessen nutze AI, um Boring Stuff zu erledigen (Outline, Thumbnails, Carousel-Design), damit du mehr Zeit für authentische, menschliche Momente hast. Vier Monate Entwicklung eines Systems dieser Komplexität — nicht von oben anfangen.
**Ergebnis:** One-Person Media Company statt früher 5+ Full-Time-Team-Members nötig.
—
Claude, ChatGPT (Images 2.0), Hermes, Descript, Blotato, ManyChat, NotebookLM, OpenClaw — Deep-Dive/Meinung-Hybrid, für erfahrene Creator gedacht.
Leon van Zyl (2 neues Videos)
- Claude Code Agent View: Parallel Agents Are Here
14.5.2026, 10:51:58Das Video berichtet über einen komplexen Supply-Chain-Angriff auf Open-Source-Pakete im npm-Ökosystem, der über 100 Pakete mit über 50 Millionen wöchentlichen Downloads betraf. Der Angriff nutzte eine Schwachstelle im Release-Prozess von Tanstack, indem ein Angreifer einen Pull-Request in einem Fork des Repositories erstellte, was den CI/CD-Workflow auslöste. Durch die Verwendung der Option “pull request target” konnte der Angreifer schädliche Dateien in den gemeinsamen Cache des CI-Servers einspeisen, die später ein gültiges npm-Publish-Token stahlen und damit kompromittierte Paketversionen veröffentlichten. Die Malware verbreitete sich weiter, indem sie nach weiteren npm-Publish-Tokens suchte und zusätzliche Pakete infizierte, darunter solche von Mistral AI, UiPath und Open Search. Die Malware integrierte sich tief in Entwicklerumgebungen und nutzte sogar eine “Dead Man Switch”, die bei Erkennung den Root-Ordner des infizierten Systems löschte.
Zur Abwehr solcher Angriffe empfiehlt das Video die Nutzung von PNPM1 oder höher, das Features wie “minimum release age”, “block exotic subdependencies” und “approved builds” bietet, um die Installation von schädlichen Paketen zu verhindern. Zudem wird Sentry als Tool zur Fehlerbehebung in der Produktion vorgestellt, das mit einer KI-gestützten Agentur namens Seir arbeitet, um Probleme automatisch zu untersuchen und zu beheben.
Das Video thematisiert spezifische Tools wie PNPM, Sentry und Seir Agent und richtet sich an Intermediate bis Advanced Nutzer.
- Codex CLI Full Tutorial: Build Your First AI Image Generator from Scratch
11.5.2026, 11:17:21In diesem Video wird Schritt für Schritt ein AI-Bildstudio für die Erstellung von YouTube-Thumbnails, Postern, Bannern und anderen grafischen Inhalten aufgebaut. Der Prozess beginnt mit der Einrichtung eines Next.js-Projekts mithilfe des Codec CLI-Tools, das auf GPT-5.5 und einem hohen Reasoning-Level basiert. Es wird eine Datenbank mit Docker und Postgres eingerichtet, und die notwendigen Tabellen für Benutzerauthentifizierung werden migriert.
Der Fokus liegt darauf, eine benutzerfreundliche Oberfläche zu gestalten, die es Nutzern ermöglicht, Referenzbilder hochzuladen, Prompts zu schreiben und Bilder zu generieren. Der Entwickler nutzt die Fähigkeiten des Codec-Tools, um die Benutzeroberfläche zu gestalten und zu testen, wobei er auf die Einhaltung eines vordefinierten Designsystems achtet. Nach der Gestaltung der Oberfläche wird die eigentliche Funktionalität implementiert, wobei das OpenAI API-Key für die Nutzung des GPT-4-Image-Modells verwendet wird. Der Entwickler zeigt, wie man Referenzbilder und Assets hochlädt und wie man Thumbnails generiert, die diese Elemente kombinieren.
Am Ende wird die Benutzeroberfläche angepasst, um sicherzustellen, dass die Bildgenerierung nur über das Dashboard und nicht über die Startseite erfolgt. Die Startseite wird mit einem generierten Bild und Marketingtext überarbeitet. Das Video betont die Effizienz und die Zeitersparnis durch die Nutzung von Codec und OpenAI, auch wenn es auf die Token-Begrenzungen des ChatGPT Plus-Plans hinweist.
Das Video thematisiert explizit OpenAI (GPT-5.5, GPT-4-Image-Modell) und Codec. Es ist eher für Intermediate und Advanced Nutzer gedacht, da es fortgeschrittene Konzepte wie Docker, Postgres, Next.js und API-Integration behandelt.
Liam Ottley
Keine neuen Videos in diesem Zeitraum.
Mark Kashef (1 neues Video)
- Why 90% of Your Claude Skills Are Dead Weight
13.5.2026, 20:00:29Das Video behandelt die Herausforderungen und Best Practices beim Einsatz von Skills in Claude Code. Der Autor kritisiert, dass viele Nutzer zu viele unnütze oder sogar schädliche Skills sammeln, die die Performance beeinträchtigen. Er erklärt, dass Skills Tokens verbrauchen und die Kontextfenster überlasten können, was zu ineffizienten und fehleranfälligen Interaktionen führt. Der Autor stellt acht Tipps vor, um Skills zu optimieren:
1. **Run it cold**: Teste, ob ein vager Prompt den richtigen Skill auslöst.
2. **Check the budget**: Stelle sicher, dass die Beschreibung präzise, aber nicht zu lang ist.
3. **Ask user input tool**: Integriere eine Befragung, um sicherzustellen, dass der Skill alle notwendigen Informationen hat.
4. **Copy-related rules**: Baue Regeln für Tonality und Formatierung ein, wenn der Skill mit Text arbeitet.
5. **Rate the skill**: Lass den Nutzer den Skill bewerten und nach Verbesserungen fragen.
6. **Wrong primitive**: Überprüfe, ob der Skill das richtige Tool für die Aufgabe ist oder ob es besser als Regel oder CLI-Befehl umgesetzt werden sollte.
7. **Audit with Claude Code Guide Agent**: Nutze einen vordefinierten Prompt, um Skills systematisch zu auditieren und zu optimieren.Der Autor betont die Bedeutung von Progressiven Disclosure und einer guten Benutzererfahrung, um Skills effizient und nutzerfreundlich zu gestalten. Er zeigt auch, wie man Skills konsolidieren und testen kann, um Redundanzen zu vermeiden und die Performance zu verbessern.
**Schluss-Kommentar:** Das Video thematisiert explizit Claude von Anthropic und richtet sich an Intermediate-Nutzer, die bereits Erfahrung mit Skills in Claude Code haben.
Matt Pocock (3 neues Videos)
- I stopped using /grill-me for coding. Here’s what I use instead:
14.5.2026, 14:22:56Der Autor stellt ein neues Tool namens “Grill with Docs” vor, das eine verbesserte Version des vorherigen “Grill Me”-Skills darstellt. Der ursprüngliche “Grill Me”-Skill interviewt den Nutzer, um ein gemeinsames Verständnis zu erreichen und Entscheidungen schrittweise zu treffen. Allerdings bemerkte der Autor, dass “Grill Me” oft zu viel Zeit in Anspruch nahm und nicht alle relevanten Informationen dokumentierte. Daher entwickelte er “Grill with Docs”, das eine gemeinsame Sprache (Ubiquitous Language) aus dem Domain-Driven Design nutzt, um die Kommunikation zwischen Nutzer und KI zu verbessern. Dieses neue Tool sucht nach einer “context.md”-Datei, die die gemeinsame Sprache dokumentiert, und aktualisiert diese während der Sitzung. Es hilft, unklare Sprache zu schärfen, konkrete Szenarien zu diskutieren und mit dem Code zu verknüpfen. Der Autor demonstriert die Verwendung von “Grill with Docs” in einem praktischen Beispiel und zeigt, wie es die Effizienz und Klarheit der Kommunikation mit der KI verbessert. Er betont, dass “Grill Me” weiterhin nützlich ist, aber “Grill with Docs” besser für Projekte mit einem Codebase geeignet ist.
Das Video thematisiert explizit die AI-Modelle von Claude und ist eher für Intermediate oder Advanced Nutzer gedacht.
- Anthropic’s “dedicated monthly credit” is actually a huge cut
13.5.2026, 20:12:51Das Video behandelt das Problem der durch AI beschleunigten Software-Entropie, bei der Codebases schneller verfallen, weil Änderungen oft ohne Berücksichtigung des gesamten Codebases vorgenommen werden. Der Autor stellt seine Methode zur Rettung solcher Codebases vor, indem er auf Software-Grundlagen und seine verbesserte Codebase-Architektur-Fähigkeit zurückgreift. Er erklärt zentrale Begriffe wie Module, Interfaces, Implementierungen, tiefe und flache Module, Abhängigkeitsgraphen, Nähte und Adapter, die aus John Ousterhouts Buch “A Philosophy of Software Design” stammen. Tiefe Module sind dabei besonders wertvoll, da sie viel Implementierung hinter einer einfachen Schnittstelle verbergen und so die Wartbarkeit und den Nutzen erhöhen. Der Autor demonstriert die Anwendung dieser Konzepte an einem eigenen Codebase, indem er die “Improve Codebase Architecture”-Fähigkeit in Claude nutzt, um Verbesserungsmöglichkeiten zu identifizieren und umzusetzen. Er betont die Bedeutung von Tests und die Notwendigkeit strategischer Entscheidungen durch den Entwickler, da AI-Agenten zwar taktisch gut sein können, aber strategische Führung erfordern. Das Video richtet sich an Intermediate bis Advanced Entwickler, die ihre Codebases verbessern und die Vorteile tiefer Module nutzen möchten. (Claude, Intermediate/Advanced)
- New Skills! /handoff, /prototype, /review and /writing-* | Skills Changelog
12.5.2026, 09:56:10Das Video zeigt die neuesten Updates und Verbesserungen an einem Repository mit AI-Skills, das kürzlich 70.000 Stars auf GitHub erreicht hat. Die wichtigsten Neuerungen sind zwei neue Skills:
1. **Handoff-Skill**: Dieser Skill erstellt ein Übergabedokument, das die aktuelle Konversation zusammenfasst, damit ein neuer Agent die Arbeit fortsetzen kann. Das Dokument wird in einer temporären Datei gespeichert und enthält Vorschläge für Skills, die im nächsten Schritt verwendet werden sollten. Der Skill ist besonders nützlich, um zwischen verschiedenen Kontextfenstern zu wechseln, ohne wichtige Informationen zu verlieren. Es gibt zwei Hauptanwendungsmuster: “Fire and Forget” und “DIY Sub Agent”.
2. **Prototype-Skill**: Dieser Skill hilft bei der Erstellung von Prototypen, insbesondere in der UI-Entwicklung und bei der Erstellung von Logikprototypen für stateful Anwendungen. Der Skill generiert mehrere UI-Varianten und ermöglicht es, diese interaktiv zu testen und zu verfeinern, bevor sie implementiert werden.
Zusätzlich wurden einige Bugfixes vorgestellt, darunter eine Verbesserung des “Grill with Docs”-Skills durch die Verwendung von XML-Tags, um die Priorisierung von Informationen zu steuern, und eine Anpassung der “To PRD” und “To Issues”-Skills, um die korrekten Labels zu verwenden.
Außerdem gibt es einen Einblick in zwei in Arbeit befindliche Skills: einen für das Schreiben von Texten (Tripart-Skill) und einen für Code-Reviews. Der Tripart-Skill hilft bei der Strukturierung von Textfragmenten zu einer vollständigen Geschichte oder einem Artikel, während der Code-Review-Skill die Einhaltung von Coding-Standards und die korrekte Implementierung von Anforderungen überprüft.
Abschließend wird ein Dokumentations-Website erwähnt, die Videos zu jedem Skill und einen Newsletter enthält, um über die neuesten Entwicklungen informiert zu bleiben.
Das Video thematisiert explizit die Nutzung von Claude und ist eher für Intermediate bis Advanced Nutzer gedacht.
Melvynx (7 neues Videos)
- J’abandonne Claude Code pour Codex… je te présente ça
16.5.2026, 16:00:40Das Video ist eine detaillierte Rezension und Demonstration der Codex-Applikation, die der Nutzer nach einer Woche intensiver Nutzung vorstellt. Der Nutzer erklärt, warum er von Cloud Code zu Codex gewechselt ist, hauptsächlich aufgrund der Kosteneffizienz und der verbesserten Funktionen. Er zeigt seine Nutzung von Codex, einschließlich der Verwendung von Work-Trees für multitasking und die Integration mit verschiedenen Tools wie Z und Convex. Der Nutzer hebt die Vorteile von Codex hervor, wie die Fähigkeit, mehrere Agenten gleichzeitig zu nutzen, eine bessere Benutzeroberfläche und die Möglichkeit, Tokens kostengünstiger zu nutzen. Er demonstriert auch, wie er seine Skills und Agenten von Cloud Code zu Codex migriert hat, indem er Symlinks verwendet. Der Nutzer erwähnt, dass er eine Masterclass zur Nutzung von Codex vorbereitet und lädt die Zuschauer ein, seine Skills und Ressourcen zu nutzen.
Schluss-Kommentar: Das Video thematisiert explizit Codex und ist eher für Intermediate oder Advanced Nutzer gedacht.
- Better-Auth : l’outil d’authentification ultime avec Convex (évite Clerk)
15.5.2026, 16:31:38Das Video diskutiert die Vor- und Nachteile von Clerk, einem Authentifizierungsdienst, und vergleicht ihn mit Better H, einer alternativen Lösung. Der Autor argumentiert, dass Clerk zwar eine schnelle und einfache Integration bietet, aber durch Vendor Lock-in und hohe Kosten problematisch sein kann. Better H wird als flexiblere und kostengünstigere Alternative präsentiert, die mehr Kontrolle und Anpassungsmöglichkeiten bietet. Der Autor zeigt, wie er mit Better H eine umfassende Authentifizierungslösung inklusive Admin-Dashboard und Organisation-Management implementiert hat, unterstützt durch AI-Agenten. Er betont die Vorteile von Better H, wie die Möglichkeit, alles selbst zu hosten und zu kontrollieren, sowie die Integration in seine eigene Stack, die er als Teil seiner Nostac-Formation anbietet.
Das Video thematisiert explizit Clerk und Better H und richtet sich an Intermediate bis Advanced Nutzer, die sich mit Authentifizierungslösungen für ihre Anwendungen auseinandersetzen.
- LES DEVS ARRÊTENT D’UTILISER CLAUDE : c’est de pire en pire…
14.5.2026, 15:44:37Das Video diskutiert die wachsende Unzufriedenheit mit Claude, einem KI-Modell von Anthropic, und die zunehmende Beliebtheit von OpenAI’s Codex. Der Autor beschreibt, wie Claude zunächst die Vertrauen der Entwickler gewonnen hat, aber nun durch neue Preisgestaltung und Einschränkungen bei der Nutzung von API-Tokens für programmatische Anwendungen kritisiert wird. Besonders problematisch ist die Einführung eines monatlichen Credits von 200 Dollar, das nur für 200 Dollar an API-Tokens reicht, was als unzureichend empfunden wird.
Der Autor vergleicht seine Erfahrungen mit Claude und Codex, wobei er hervorhebt, dass Codex durch seine Effizienz und Flexibilität überzeugt. Er beschreibt, wie er seine Workflows von Claude auf Codex umgestellt hat, was ihm bessere Ergebnisse und mehr Tokens für sein Geld gebracht hat. Zudem lobt er die Codex-App für ihre Benutzerfreundlichkeit und Multitasking-Fähigkeiten.
Der Autor schließt mit der Empfehlung, Codex auszuprobieren, und teilt seine aktuelle Stack, die sowohl Claude als auch Codex umfasst. Er betont, dass er weiterhin beide Dienste nutzt, aber derzeit mehr auf Codex setzt.
**Schluss-Kommentar:** Das Video thematisiert explizit Claude von Anthropic und Codex von OpenAI und ist eher für Intermediate bis Advanced Nutzer gedacht.
- Convex : la MEILLEUR Database pour tes SaaS (j’arrête Prisma)
13.5.2026, 16:01:23# Zusammenfassung
Der Ersteller berichtet über seinen Wechsel von Prisma zu Convex als Backend-Lösung und erklärt, warum er Convex mittlerweile täglich für neue Projekte nutzt. Anders als Prisma (ein ORM für Datenbanken und Migrations-Management) bietet Convex ein ganzheitliches Backend-System: Database, Real-Time-Synchronisation, Functions, Jobs, Webhooks und Authentifizierung – alles in TypeScript ausgedrückt und ohne separaten Backend-Server nötig.
Das Kernversprechen: **Automatische Daten-Synchronisation** über alle offenen Browser-Tabs und Geräte hinweg, ohne Cache-Invalidierung, Webhooks oder Web-Sockets manuell verwalten zu müssen. Ein konkretes Beispiel ist seine Chat-App (codelinks.dev), wo Nachrichten und Live-Drafts sofort überall aktualisiert werden. Bei einer Multi-Tab-Situation (z.B. Organisations-Name ändern) wird die Änderung automatisch überall reflektiert – bei Prisma müsste man APIs, Cache-Layer, Query-Invalidierung und potenzielle Seiten-Caches von Next.js koordinieren.
Convex hat vorkonfigurierte Integrationen (Stripe, Resend, Mux etc.) und ein eingebautes Webhook-Management mit automatischen Retries und Delivery-Tracking. Jobs und Workflows (z.B. verzögerte E-Mail-Versände) funktionieren nativ ohne externe Tools wie Vercel Cron oder Redis. Für Entwicklung nutzt er Convex im Cloud (nicht lokal), was Setup-Probleme eliminiert; KI-Agenten können Convex-Logs auslesen und Fehler autonom beheben.
Beim Deployment bietet Convex mehrere Umgebungen (Produktion, Dev, Preview) kostenlos. Die Pricing seiner Chat-App betrug zuletzt ~26 Cent/Monat (für 900k Function-Calls, 2GB Storage) – weit unter den Limits des Professional-Plans (25$ + Usage). Die größte Kostenfalle war unoptimierter Code, der Datenbank-Scans verursachte; nach Optimierung fiel der Preis drastisch.
Nachteile: stärkere Abhängigkeit von Convex als Service (alternative: Self-Hosting via Dockerfile), und komplexe Legacy-Projekte wie seine E-Mail-Anwendung zu migrieren ist aufgrund des großen Codes zu riskant. Er empfiehlt sein Boilerplate-Projekt (Nost Stack), das mit Claude + Convex CLI vorkonfiguriert ist, um häufige Probleme zu vermeiden.
**Demo/Meinung, Anbieter Convex (explizit), mit AI-Integration (Claude für Code-Generation und Log-Analyse erwähnt).**
- Pourquoi j’ai arrêté d’utiliser Next.js (je sais… tu n’étais pas prêt)
12.5.2026, 16:00:10# Zusammenfassung: Warum ich NextJs aufgegeben habe
Der Creator erzählt von seinem Weg, NextJs für neue Projekte zu verlassen und stattdessen auf **TanStack Start** zu setzen. Nach einem Gespräch mit dem Creator von TanStack während eines Events in San Francisco realisierte er fundamentale Probleme mit NextJs, die er vorher übersehen hatte.
**Kernprobleme mit NextJs:**
Er zeigt an realen Anwendungen (Ciao-App, Email-Kampagnen), dass er gezwungen war, aus NextJs heraus zu React Router zu migrieren, um instantane Navigation zu ermöglichen. Mit NextJs Router war dies unmöglich — stattdessen musste er überall `use client` setzen und verlor die Vorteile des Server-Side-Rendering.
**Messbare Vorteile von TanStack Start:**
– Build-Zeit: 44 Sekunden statt 1:56 Minuten (bei NextJs)
– Local Dev Startup: 2-3 Sekunden statt 10-12 Sekunden
– Navigation zwischen Seiten: deutlich schneller (demonstriert durch Live-Vergleich)**Komplexität und KI-Probleme:**
NextJs’ Server Components, Client Components und mehrschichtige Caching-Mechaniken (Full Route Cache, Data Cache, Router Cache) sind für Menschen schwer zu debuggen — noch schwieriger für KI-Modelle (Lia). TanStack Start basiert auf Standard-Web-Patterns (React Router), was KI-Modellen ermöglicht, Features in einem Shot richtig umzusetzen statt ständig Fehler zu machen.**Kostenprobleme:**
Er zeigte, dass Server-Side-Rendering für häufig besuchte Seiten (seine Formations-Seiten) monatlich ~5 Dollar kostete — für statische Inhalte. Nach Migration zu einer React App Shell mit Client-Side-Rendering sanken seine Vercel-Rechnungen von ~100 auf ~50 Dollar, weil der Rechenaufwand pro Navigation drastisch sank.**Caching-Albtraum:**
Mit NextJs jede Navigation = neuer Server-Render. Mit React App Shell: nur einmalig beim Initial Load; danach nur Datenfetching. Das senkt die Server-Compute-Zeit um ein Vielfaches.**Convex passt besser:**
Convex mit NextJs ergibt keinen Sinn — man rendert Client-Side in einem Framework, das Server-Side fordert. TanStack Start + Convex ist das saubere Setup.Er plant eine neue Boilerplate (NoStack) mit TanStack Start, Convex und Better Auth, bietet Beta-Zugang an. Alte Apps bleibt er aus Faulheit bei NextJs, will aber zumindest Subfast migrieren.
**Fazit:** Client-Side-Rendering ist schneller, billiger, simpler und weniger fehlerhaft — speziell für Dashboard-Apps. NextJs war für ihn eine gute Lernphase (er verdiente damit Geld durch Formations-Videos), aber für KI-gestützte Entwicklung heute klar obsolet.
—
Demo von TanStack Start und NextJs (Vercel Deployment); Code-Inspektionen; keine spezifischen KI-Tools namentlich erwähnt außer “Lia” und Claude — **Meinung/Reflexion**.
- Je change complètement ma stack… introduction de Now-Stack (secret project)
11.5.2026, 19:00:01# Zusammenfassung: NStack – Neue Development-Stack-Ankündigung
Der Creator präsentiert **NStack**, eine neue Technology-Stack für die Entwicklung von SaaS-Anwendungen, die er ab dieser Woche in einer Video-Serie detailliert vorstellt.
Die Stack besteht aus drei Haupttools:
**TanStack Start** ersetzt NextJS als Framework. Der Creator nennt konkrete Gründe: Build-Zeit ist etwa 2,2x schneller als NextJS, weniger “Magic” im Code (keine komplexe Unterscheidung zwischen Server/Client-Komponenten), und das Routing läuft client-seitig, was zu instantaner Navigation ohne Lade-Indikatoren führt. Die Demo zeigt Navigation zwischen Seiten und Admin-Bereichen ohne erkennbare Verzögerung, während die NextJS-Vergleichsversion 2 Sekunden Ladezeit für Seitenwechsel benötigt.
**Convex** fungiert als Database und Backend: Es verwaltet Datenspeicherung, Echtzeit-Synchronisation zwischen Clients, API-Requests, Authentifizierung, Webhooks (z.B. von Stripe) und asynchrone Jobs. Der Vorteil liegt darin, dass alle Datenupdates in Echtzeit über alle Browser-Tabs und Nutzer hinweg synchronisiert werden – demonstriert durch das gleichzeitige Updaten von Organisationsdaten in zwei Browsern. Convex ersetzt damit mehrere separate Tools, die sonst nötig wären.
**Better Auth** ist die dritte Komponente (Details bleiben vage, da der Creator sagt, er stelle sie später vor).
Die Boilerplate beinhaltet einen erweiterten Admin-Dashboard mit Nutzerverwaltung (Filterung, Rollen, Session-Übersicht), Organisations-Management und Stripe-Integration.
Der Creator betont die **Automation durch CLI-Befehle**: `skill init project` initialisiert das komplette Projekt, `skill publish to production` deployed in einem Schritt zu Vercel mit Convex-Datenbank, und `skill setup stripe` konfiguriert Stripe nur mit API-Keys – ohne manuelles Klicken. Weitere Skills sollen hinzukommen, darunter eines, das über eine Stunde lang durch die Planung eines SaaS-Features führt.
Die Vision: Entwickler sollen SaaS-Anwendungen von Null bis zur produktiven Anwendung hauptsächlich durch Befehle erstellen können. Die Stack wird unterstützt durch Cursor, Codex und Claude.
Eine Warteliste ist verfügbar unter mlv.sh/fn; Details folgen in der Video-Serie diese Woche.
**Ankündigungs-Video für eine neue SaaS-Development-Stack (TanStack Start, Convex, Better Auth), in dem eine Automation durch CLI-Befehle im Fokus steht; der Creator arbeitet mit LLM-Tools wie Cursor und Claude.**
- Mon SaaS IMPOSSIBLE à vibe-coder : ce que personne ne vous dit sur le vibe-coding
10.5.2026, 16:00:01# Zusammenfassung
Der Creator zeigt die komplexeste Anwendung, die er je gebaut hat: ein E-Mail-Marketing-SaaS namens Luemail. Die Plattform umfasst ein Dashboard mit Kennzahlen zu verschickten E-Mails, Abonnenten und Engagement. Die Kernfunktion ist das Erstellen und Versenden von Kampagnen mit umfangreichen Filtermöglichkeiten (nach Klicks, Öffnungen, Workflow-Status etc.), einem E-Mail-Editor mit Vorlagen und Code-Ausgabe sowie Snippets, die bei Änderung automatisch überall aktualisiert werden.
Die technische Komplexität liegt in der Infrastruktur: Die NextJS-App sendet E-Mails über AWS SES, nutzt Upstash für Rate-Limiting (50 E-Mails pro Sekunde), um AWS-Limits zu respektieren. Für die Verarbeitung von ~500 Events pro Sekunde (Öffnungen, Klicks, Bounces) kommt Upstash Redis als Queue mit Batch-Processing-Workern zum Einsatz, um die Datenbank nicht zu überlasten. E-Mail-HTML wird in R2 gespeichert mit 30-Tage-Ablauf. Die Plattform bietet ein Admin-Dashboard, Benutzerprofile mit Custom Fields und Tags, automatisierte Workflows sowie eine vollständige API und ein npm-SDK mit 60 Tools. Ein CLI ermöglicht agenten-basierte Interaktionen; Claude kann damit autonom Kampagnen erstellen und verwalten.
Der Creator betont: Claude (damals Lia) denkt nicht vorausschauend und architektonisch wie ein Senior-Developer – sie löst das unmittelbare Problem, nicht die Skalierbarkeit. Die Standard-UX ist unansehnlich und erfordert umfangreiche Überarbeitung. Mit ~28.000 E-Mails, 477 Kampagnen und 55.000 Abonnenten auf dem Hauptkonto hat sich die komplexe Architektur bewährt, aber nur durch wiederholte Production-Crashes im Lernprozess (z.B. in Bali). Kunden sind derzeit nur persönliche Bekannte; breites Marketing wird vermieden wegen IP-Repputations-Risiken bei E-Mail-Versand.
Claude (als Lia damals bezeichnet) wurde mit Cursor begonnen, dann zu Claude gewechselt — Demo einer komplexen produktiven SaaS-Anwendung mit technischer Deep-Dive in Infrastruktur und Agent-Integration.
n8n (1 neues Video)
- n8n Desk: The Open Source Claude Desktop That Runs on top of n8n’s new MCP
11.5.2026, 18:03:38Das Video zeigt eine Demonstration von Marcel, der zwei neue Tools vorstellt: den offiziellen N8N MCP (Meta-Cognitive Protocol) und N8N Desk, eine Open-Source-Desktop-Anwendung, die ähnlich wie Claude Desktop funktioniert, aber mit einigen wichtigen Unterschieden. Der N8N MCP ermöglicht es AI-Agenten, nicht nur N8N-Workflows auszuführen, sondern auch zu erstellen und zu bearbeiten. Dies ist ein großer Fortschritt, da es zuvor nur möglich war, Workflows auszuführen. Marcel demonstriert die Erstellung eines Support-Ticket-Agenten, der über Slack kommuniziert. N8N Desk hingegen führt Code nicht lokal auf dem Computer aus, sondern nutzt N8N-Instanzen in der Cloud, was sicherer und besser für Unternehmensumgebungen geeignet ist. Die Anwendung unterstützt verschiedene AI-Modelle, einschließlich lokaler Modelle, und bietet Funktionen wie Co-Work, Workflow und Chat. Marcel betont die Bedeutung von Kontext und Skills für die effektive Nutzung von AI-Agenten und zeigt, wie N8N Desk diese Aspekte integriert. Das Video endet mit der Ankündigung, dass N8N Desk als Open-Source-Projekt verfügbar sein wird, mit der Möglichkeit, über eine Warteliste benachrichtigt zu werden.
Das Video thematisiert explizit N8N, Claude und Open-Source-Tools und ist eher für Intermediate und Advanced Nutzer gedacht.
Nate Herk | AI Automation (5 neues Videos)
- How to Deploy Your Claude Automations (3 Methods)
15.5.2026, 15:16:02Das Video erklärt drei Methoden, um Agenten aus der Cloud-Code-Umgebung von Anthropic (Claude) so zu deployen, dass sie auch dann laufen, wenn der Nutzer nicht aktiv ist. Die Methoden werden anhand eines Schemas verglichen, das die Frage beantwortet, wo der Agent läuft (lokal oder in der Cloud) und wie autonom/agentisch er agiert.
1. **Loops (Schleifen):**
– Einfache Methode, bei der Cloud Code angewiesen wird, eine Schleife zu erstellen, die in regelmäßigen Abständen (z.B. alle 10 Minuten) eine bestimmte Aufgabe ausführt.
– Nutzt interne Tools wie `cron create`, `cron list` und `cron delete` für die Planung.
– Die Schleifen sind sessionspezifisch und laufen entweder im Desktop-App oder im Terminal.
– **Vorteile:** Keine zusätzliche Einrichtung nötig, volle Agenten-Funktionalität innerhalb der Session.
– **Nachteile:** Die Session und der Computer müssen laufen, maximale Laufzeit von 7 Tagen, feste Intervalle mit zufälliger Verzögerung (Jitter).2. **Desktop Scheduled Tasks und Cloud Routines:**
– **Desktop Scheduled Tasks:** Laufen lokal auf dem Computer und benötigen, dass die Desktop-App geöffnet bleibt.
– **Cloud Routines:** Laufen in Anthropics Cloud und benötigen keine aktive Session oder laufenden Computer.
– Beide Methoden injizieren einen Prompt in eine Cloud-Code-Session und führen die Aufgabe aus.
– **Vorteile:** Keine zusätzliche Infrastruktur nötig, volle Cloud-Code-Funktionalität, Cloud-Routines können auch über API oder GitHub-Events ausgelöst werden.
– **Nachteile:** Cloud-Routines haben ein Minimum von 1 Stunde zwischen den Ausführungen, begrenzte Anzahl an Ausführungen pro Tag (abhängig vom Plan).3. **Deployment auf Modal oder Trigger.dev:**
– Hier wird ein Skript (Python für Modal, TypeScript für Trigger.dev) in die jeweilige Cloud-Plattform deployt und läuft dort auf einem Zeitplan oder als API-Endpunkt.
– **Vorteile:** Keine Notwendigkeit, den eigenen Computer oder eine Session laufen zu lassen, gut für deterministische Prozesse.
– **Nachteile:** Keine volle Agenten-Funktionalität, AI-Verarbeitung erfolgt über API und ist somit teurer. Mit dem Agent SDK von Claude kann man auch agentische Funktionen nutzen, was aber ebenfalls teurer ist.Zusätzlich werden kurz **Managed Agents** von Anthropic und **Hooks** in Cloud Code erwähnt, die für eventgesteuerte Automatisierungen genutzt werden können.
Das Video ist eher für **Intermediate** Nutzer geeignet, die bereits Erfahrung mit Cloud Code und Agenten haben. Es werden spezifische Tools und Anbieter thematisiert, darunter **Claude (Anthropic)**, **Modal**, **Trigger.dev** und das **Claude Agent SDK**.
- Anthropic Just Dethroned OpenAI. Here’s What Happens Next.
13.5.2026, 21:20:51Das Video diskutiert die aktuelle Dynamik im Bereich der KI-gestützten Codierungstools, insbesondere den Wettbewerb zwischen OpenAI (Codex) und Anthropic (Claude Code). Es beginnt mit der Feststellung, dass Anthropic OpenAI in der Geschäftsnutzung überholt hat, gefolgt von einer Gegenaktion von OpenAI, die Unternehmen zwei Monate kostenlose Codex-Nutzung anbietet. Claude Code reagierte mit einer 50%igen Erhöhung der wöchentlichen Nutzungsgrenzen für die nächsten zwei Monate. Der Autor interpretiert diese Schritte als Teil einer “kostenlosen Probierphase”, in der Unternehmen und Nutzer die Tools intensiv nutzen, während die Anbieter auf Adoption und Datensammlung abzielen. Es wird argumentiert, dass die aktuellen Preise nicht nachhaltig sind und die Nutzer letztlich das wertvolle Training Data für die KI-Modelle liefern. Der Autor rät, die aktuellen Angebote zu nutzen, um Abhängigkeiten zu vermeiden und flexibel auf mögliche zukünftige Änderungen reagieren zu können. Es wird auch auf historische Muster verwiesen, bei denen ähnliche Dynamiken in anderen Branchen zu Preiserhöhungen führten. Der Schlusskommentar betont, dass die Nutzer die Tools nutzen sollten, um sich nicht auf einen Anbieter festzulegen.
**AI-Tools/Modelle/Anbieter:** OpenAI (Codex), Anthropic (Claude Code); **Zielgruppe:** Intermediate bis Advanced.
- Every Level of Claude Explained in 21 Minutes
12.5.2026, 13:59:35Das Video bietet eine detaillierte Anleitung zur Nutzung von Claude in fünf aufsteigenden Stufen: Enthusiast, Beginner, Intermediate, Advanced und Architect. Jede Stufe wird durch spezifische Funktionen und Strategien definiert, die den Nutzer schrittweise von grundlegenden Anwendungen zu komplexen Automatisierungen führen.
– **Stufe 1: Enthusiast** – Grundlegende Nutzung von Claude für einfache Aufgaben wie das Schreiben von E-Mails oder das Erklären von Inhalten. Ein wichtiger Tipp ist die Nutzung von Screenshots, da Claude Bilder lesen kann.
– **Stufe 2: Beginner** – Einführung von Projekten, die Kontext und Kontinuität bieten. Wichtige Funktionen sind Memory, Connectors (Integration mit Tools wie Slack oder Google Drive), File Creation (Erstellung von Excel-Dateien, PowerPoint-Präsentationen etc.), Artifacts (interaktive Anwendungen), Inline Visuals (visuelle Darstellungen innerhalb von Chats) und Office-Add-ins (Integration in Microsoft Office).
– **Stufe 3: Intermediate** – Nutzung von Claude Co-work für Aufgaben auf dem eigenen Computer. Wichtige Funktionen sind File System Access, Skills (wiederverwendbare Workflows), Scheduled Tasks (geplante Aufgaben), Mobile Control (Steuerung per Smartphone), Cloud Design (Design von Prototypen und Präsentationen) sowie Plugins und Computer Use (Navigation in Apps).
– **Stufe 4: Advanced** – Nutzung von Claude Code für komplexe Automatisierungen und parallele Arbeitsprozesse. Wichtige Funktionen sind die Nutzung von claude.md (Konfigurationsdatei), Plan Mode (Planung und Ausführung von Aufgaben), Sub Agents (spezialisierte Agenten), Work Trees (isolierte Arbeitsbereiche), MCP (Model Context Protocol für Tool-Integration) sowie verschiedene Optimierungstechniken und Custom Commands.
– **Stufe 5: Architect** – Erstellung von vollständig autonomen Systemen, die auch ohne Nutzerinteraktion arbeiten. Wichtige Funktionen sind Cloud Routines (geplante Aufgaben in der Cloud), Hooks (sicherheitsrelevante Logik), Channels (Steuerung von externen Plattformen), Headless Mode (autonome Ausführung von Aufgaben), Agent SDK (Erstellung eigener Produkte) sowie Remote Control (Fernsteuerung von Sessions).Das Video betont, dass der Übergang zur höchsten Stufe weniger technisch als vielmehr eine Frage des Vertrauens in die Systeme ist. Es wird empfohlen, mit einfachen, niedrigstake-Automatisierungen zu beginnen und schrittweise komplexere Systeme zu implementieren.
**Schluss-Kommentar:** Das Video thematisiert explizit Claude und ist eher für Intermediate bis Advanced Nutzer gedacht.
- Claude Code Just Got an Agent Dashboard
12.5.2026, 01:06:06Das Video stellt die neue “Agent View”-Funktion von Cloud Code vor, die es ermöglicht, mehrere Agenten-Sessions in einem einzigen Terminal-Tab zu verwalten. Der Nutzer kann zwischen den Sessions wechseln, deren Status überwachen (z.B. “wartet auf Eingabe”, “abgeschlossen”) und direkt in die Sessions hinein- und herausnavigieren. Besonders hilfreich ist dies für Entwickler, die bisher mit vielen offenen Terminal-Tabs und unübersichtlichen Sessions kämpften. Die Steuerung erfolgt über Pfeiltasten oder durch Klicken, und neue Sessions können durch einfache Befehle oder direkte Aufgabenbeschreibungen gestartet werden. Zudem wird die neue “Goal”-Funktion erwähnt, die es ermöglicht, Claude Code langfristige Ziele zu setzen, die dann autonom verfolgt werden. Das Video zeigt auch, wie man Sessions löscht oder direkt aus der Agent View heraus Eingaben tätigt. Am Ende wird auf einen Kurs verwiesen, der zeigt, wie man Claude Code als eigenes Betriebssystem nutzt.
Das Video thematisiert explizit Claude Code und ist eher für Intermediate oder Advanced Nutzer gedacht, die bereits Erfahrung mit der Nutzung von Cloud Code oder ähnlichen Tools haben.
- Hermes Agent: Zero to Personal AI Assistant (1 Hour Course)
10.5.2026, 02:42:25Das Video ist ein Tutorial zur Einrichtung und Nutzung von Hermes Agent, einem leistungsstarken Open-Source-AI-Agenten von Noose Research. Der Creator führt den Zuschauer durch den gesamten Prozess, von der Installation auf einem VPS (Virtual Private Server) bis hin zur Konfiguration und Nutzung des Agenten. Hier sind die Hauptschritte und das Endergebnis:
1. **Einführung in Hermes Agent**:
– Hermes Agent ist ein selbstverbessernder AI-Agent, der mit dem Benutzer wächst und sich anpasst.
– Der Agent verfügt über 684 Skills, von denen 91 bereits vorinstalliert sind.
– Der Agent kann verschiedene Aufgaben automatisieren, wie z.B. das Generieren von Excal-Diagrammen, Transkriptionen und das Beantworten von Fragen.2. **Vergleich mit anderen Agenten**:
– Vergleich von Hermes Agent mit Cloud Code und OpenClaw.
– Hermes Agent ist leichter, schneller und fokussiert auf Selbstverbesserung.
– Cloud Code wird hauptsächlich für die Wissensarbeit und das Codieren verwendet, während Hermes Agent für die Automatisierung und das Management von Aufgaben auf dem Go verwendet wird.3. **Installation und Einrichtung**:
– Der Creator zeigt, wie man Hermes Agent auf einem VPS bei Hostinger installiert.
– Es wird eine Schritt-für-Schritt-Anleitung gegeben, einschließlich der Einrichtung eines Telegram-Bots für die Interaktion mit dem Agenten.
– Der Creator betont die Bedeutung der Sicherheit und zeigt, wie man API-Schlüssel sicher verwaltet.4. **Nutzung von Hermes Agent**:
– Der Creator demonstriert, wie man den Agenten für verschiedene Aufgaben verwendet, wie z.B. das Erstellen von Videos mit Hyperframes und das Automatisieren von täglichen Aufgaben.
– Es wird gezeigt, wie man den Agenten mit einem GitHub-Repo synchronisiert, um Backups zu erstellen und die Arbeit zu speichern.5. **Selbstverbesserungsloop**:
– Der Creator erklärt den Selbstverbesserungsloop von Hermes Agent, bei dem der Agent aus Erfahrungen lernt und sich kontinuierlich verbessert.
– Es wird betont, dass der Benutzer den Agenten korrigieren und ihm Feedback geben sollte, um die Genauigkeit und Effizienz zu verbessern.6. **Erweiterte Funktionen und Tipps**:
– Der Creator gibt Tipps zur Nutzung des Agenten, wie z.B. das Erstellen von Skills und das Automatisieren von Aufgaben mit Cron-Jobs.
– Es wird gezeigt, wie man den Agenten für verschiedene Aufgaben und Projekte verwendet, wie z.B. das Management von YouTube-Kommentaren und das Erstellen von Berichten.7. **Skalierung und Verwaltung mehrerer Agenten**:
– Der Creator spricht über die Skalierung und Verwaltung mehrerer Hermes Agenten auf einem VPS.
– Es wird erklärt, wie man Agenten in verschiedenen Containern hostet und wie man sie miteinander kommunizieren lässt.8. **Ressourcen und Community**:
– Der Creator bietet eine kostenlose Ressourcenguide an, die alle Schritte und Informationen aus dem Video enthält.
– Es wird auf die kostenlose Schulungsgemeinschaft des Creators verwiesen, wo weitere Ressourcen und Dokumente verfügbar sind.**Schluss-Kommentar**: Das Video thematisiert explizit Hermes Agent, OpenAI, und spezifische Tools wie Hostinger und GitHub. Es ist eher für Intermediate und Advanced Nutzer gedacht, die bereits Erfahrung mit der Nutzung von AI-Agenten und der Verwaltung von Servern haben.
NeuralNine (3 neues Videos)
- This is the most useful n8n workflow I have ever built…
15.5.2026, 16:00:28Das Video zeigt, wie man einen vollautomatischen AI-Coding-Agenten mit N8N, Claude Code (Anthropics), OpenAI und GitHub erstellt. Der Agent kann über Slack oder GitHub-Issues angesprochen werden, um Änderungen an einem Repository vorzunehmen, zu commiten und einen Pull Request zu erstellen. Der Prozess umfasst zwei N8N-Workflows: einer für GitHub-Issues und einer für Slack-Nachrichten. Der erste Workflow wird durch die Erstellung eines GitHub-Issues ausgelöst, führt ein Python-Skript aus, das Claude Code in Headless-Mode nutzt, um die Änderungen zu implementieren, und sendet eine Erfolgsmeldung über Slack. Der zweite Workflow nimmt eine Slack-Nachricht, wandelt sie mit einem OpenAI-Agenten in ein GitHub-Issue um und löst damit den ersten Workflow aus. Das Video zeigt die Einrichtung von N8N, die Erstellung der Workflows und die Integration von GitHub, Slack und den AI-Agenten.
Das Video thematisiert explizit N8N, Claude Code (Anthropics), OpenAI, GitHub und ngrok. Es ist eher für Intermediate und Advanced Nutzer geeignet.
- JavaScript Crash Course: Full Beginner Tutorial
13.5.2026, 16:01:18Das Video bietet einen umfassenden Einführungs-Kurs in JavaScript, der sich auf die Grundlagen der Programmiersprache konzentriert, anstatt auf deren Verwendung in HTML für Animationen. Es deckt die folgenden Themen ab:
1. **Einführung und Setup**:
– Installation von Node.js für das Ausführen von JavaScript-Dateien.
– Erstellen einer einfachen “Hello World”-Anwendung mit `console.log`.2. **Variablen und Datentypen**:
– Definition von Variablen mit `let`, `var` und `const`.
– Unterschiede zwischen `let` und `var` (Block- vs. globale Scope).
– Grundlegende Datentypen wie Zahlen, Strings, Booleans und spezielle Werte wie `undefined`, `null`, `Infinity` und `NaN`.3. **Operatoren**:
– Arithmetische Operatoren (Addition, Subtraktion, Multiplikation, Division, Modulo, Exponentiation).
– Zuweisungsoperatoren und Inkrement/Dekrement-Operatoren.
– Vergleichsoperatoren und logische Operatoren.4. **Bedingte Anweisungen**:
– `if-else`-Anweisungen und `switch-case`-Anweisungen.
– Benutzereingaben mit der `readline`-Bibliothek verarbeiten.5. **Schleifen**:
– `while`- und `do-while`-Schleifen.
– `for`-Schleifen, einschließlich der Iteration über Arrays.
– Schleifensteuerungsanweisungen wie `continue` und `break`.6. **Funktionen**:
– Definition und Aufruf von Funktionen.
– Parameter und Rückgabewerte.
– Anonyme Funktionen, Lambda-Ausdrücke und Funktionen mit variabler Anzahl von Parametern.
– Funktionen als erste Klasse Objekte und Callbacks.7. **Datenstrukturen**:
– Arrays: Erstellen, Zugriff auf Elemente und Iteration.
– Maps (Dictionaries): Schlüssel-Wert-Paare und Zugriff auf Werte.
– Sets: Einfache Sammlung von eindeutigen Werten.8. **Objekte und Klassen**:
– Definition von Objekten mit der Kurzschreibweise und mit Klassen.
– Verwendung von Konstruktoren und Methoden.9. **JavaScript in HTML**:
– Einbetten von JavaScript in HTML-Dateien und Interaktion mit dem DOM.Das Video ist für Anfänger geeignet, die Grundkenntnisse in der Programmierung haben und einen schnellen Überblick über JavaScript als Programmiersprache erhalten möchten. Es werden keine spezifischen AI-Tools oder Modelle thematisiert.
- ONNX: The PDF Format For Neural Networks
11.5.2026, 16:00:44Das Video führt in das ONNX-Format (Open Neural Network Exchange) ein, das als PDF-ähnliches Format für neuronale Netze dient. Der Autor zeigt, wie man Modelle in PyTorch und TensorFlow trainiert, diese in das ONNX-Format exportiert und anschließend mit dem ONNX Runtime ohne die ursprünglichen Frameworks nutzt. Es werden sowohl einfache als auch komplexere Modelle, wie ein MNIST-Klassifikator, demonstriert. Zudem wird gezeigt, wie man Modelle von Hugging Face in ONNX-Format herunterlädt und verwendet. Der Fokus liegt darauf, die Abhängigkeit von spezifischen Frameworks zu reduzieren und die Interoperabilität zu erhöhen.
**Schluss-Kommentar:** Das Video thematisiert ONNX, PyTorch, TensorFlow, Hugging Face und ONNX Runtime und ist für Intermediate geeignet.
Nic Conley
Keine neuen Videos in diesem Zeitraum.
Nick Saraev (1 neues Video)
- How to Build Mobile Apps with Claude Code: Full Course (2026)
11.5.2026, 17:51:20**AI Tools/Anbieter thematisiert:** Claude, OpenAI, Gemini, Open-Source, spezifische Tools wie Cursor, Lovable, Cline, n8n
**Zielgruppe:** Intermediate
Niklas Steenfatt
Keine neuen Videos in diesem Zeitraum.
No Priors: AI, Machine Learning, Tech, & Startups (2 neues Videos)
- Pax Silica: Inside the Trump Administration’s Tech Strategy with Jacob Helberg
14.5.2026, 10:01:32Das Video ist ein Interview mit Jacob Helberg, dem Under Secretary of State for Economic Affairs, über die Initiative “Pax Silica”. Diese Initiative ist eine wirtschaftliche Sicherheitskoalition, die darauf abzielt, die AI-Lieferketten der USA und ihrer Verbündeten zu sichern. Helberg erklärt, dass Pax Silica einen Ansatz basierend auf Ökosystemen verfolgt und bereits 14 Länder umfasst. Ein zentrales Projekt ist die Einrichtung einer “forward-deployed industrial base” in den Philippinen, wo 4.000 Hektar Land für industrielle Entwicklungen genutzt werden sollen. Diese Zone soll eine Kombination aus amerikanischem Rechtssystem und philippinischen industriellen Vorteilen bieten.
Helberg betont die Bedeutung der Zusammenarbeit mit der privaten Wirtschaft, da die USA nicht auf staatlich betriebene Lieferketten setzen wollen. Stattdessen soll die Initiative kommerziell lebensfähige Plattformen schaffen, die auch unabhängig vom Staat funktionieren können. Die Initiative zielt darauf ab, die Abhängigkeit von China zu verringern und die Lieferketten diversifizieren, insbesondere in Bereichen wie Robotik und seltene Erden.
Das Video thematisiert auch die Unterschiede zwischen der amerikanischen Strategie und Chinas Belt and Road Initiative, wobei Helberg die Vorteile der amerikanischen Herangehensweise hervorhebt, die auf Partnerschaften mit der privaten Wirtschaft und ethischen Geschäftspraktiken setzt. Er betont die Bedeutung von Innovation und die Rolle des privaten Kapitals bei der Lösung von Lieferkettenproblemen.
Das Video ist eher für Intermediate und Advanced geeignet und thematisiert keine spezifischen AI-Tools oder Modelle, sondern konzentriert sich auf politische und wirtschaftliche Strategien.
- Amex Global Business Travel: The World’s First AI Take Private with Long Lake CEO Alexander Taubman
11.5.2026, 10:01:04**Zusammenfassung:**
Long Lake Management, ein Unternehmen, das sich auf den Kauf und die Transformation von Unternehmen durch KI spezialisiert hat, hat kürzlich die Absicht bekannt gegeben, American Express Global Business Travel (AmEx GBT) für 6,3 Milliarden Dollar zu übernehmen. Dies wäre die erste KI-gestützte Übernahme eines börsennotierten Unternehmens. Long Lake hat bereits 30 Unternehmen übernommen und mit ihrer KI-Plattform Nexus transformiert. Diese Plattform automatisiert Arbeitsabläufe, verbessert die Produktivität der Mitarbeiter und steigert das Wachstum der Unternehmen.
Alex Topman, CEO von Long Lake, erklärt, dass die Plattform Nexus etwa 80% der Infrastruktur für verschiedene Branchen teilt und innerhalb weniger Tage nach einer Übernahme eingesetzt werden kann. Dies führt zu sofortigen Margensteigerungen und Wachstum. Long Lake konzentriert sich dabei nicht auf Kostensenkungen, sondern auf Wachstum und Kundenerfahrung. Durch die KI-gestützte Automatisierung können Mitarbeiter mehr Kunden bedienen, was zu höheren organischen Wachstumsraten führt.
Topman betont, dass Long Lake nicht nur Software verkauft, sondern Unternehmen übernimmt, um tiefere Geschäftsbeziehungen aufzubauen und bessere Ergebnisse zu erzielen. Dies ermöglicht eine engere Zusammenarbeit zwischen den Mitarbeitern und den Ingenieuren, was zu besseren Lösungen und schnelleren Innovationen führt. Long Lake strebt an, in jeder Branche, in der sie tätig ist, der beste Arbeitgeber zu sein, und zieht dadurch talentierte Mitarbeiter an.
Die Übernahme von AmEx GBT ist ein Beispiel für die langfristige Strategie von Long Lake, Unternehmen zu übernehmen und langfristig zu halten, anstatt sie kurzfristig zu verkaufen. Topman sieht in der KI eine positive Summe, die sowohl den Mitarbeitern als auch den Kunden zugutekommt.
**Schluss-Kommentar:**
Das Video thematisiert Long Lake Management und ihre KI-Plattform Nexus, die für die Transformation von Unternehmen genutzt wird. Es ist eher für Intermediate und Advanced gedacht, da es sich auf komplexe Geschäftsstrategien und KI-Anwendungen konzentriert.
Productive Dude
Keine neuen Videos in diesem Zeitraum.
Sebastien Dubois (1 neues Video)
- Levels of AI Context Management: From Generic Answers to Precision Results
16.5.2026, 08:48:32Das Video diskutiert die verschiedenen Stufen der Kontextverwaltung bei der Nutzung von KI, insbesondere bei der Interaktion mit Sprachmodellen wie GPT oder Claude. Der Sprecher unterscheidet acht Stufen, die von der einfachen Abfrage ohne Kontext (Stufe 1) bis hin zu einem umfassenden Wissenssystem reichen, das von der KI vollständig genutzt werden kann (Stufe 8). In den frühen Stufen (1-3) wird der Fokus auf die Bereitstellung von Grundkontext und die Nutzung der eingebauten Speicherfunktionen der KI gelegt, was jedoch als unzuverlässig und pseudo-zufällig beschrieben wird. Ab Stufe 4 werden fortgeschrittene Prompt-Engineering-Techniken eingeführt, die zwar bessere Ergebnisse liefern, aber auch mit Herausforderungen wie der Organisation und Verwaltung der Prompts verbunden sind. Ab Stufe 5 wird die Bedeutung eines zentralen Wissenssystems betont, das Informationen über Projekte, Ziele und Arbeitsprozesse enthält. Dies ermöglicht der KI, präzisere und relevantere Ergebnisse zu liefern. In den höheren Stufen (6-8) geht es um die Verwaltung des KI-Speichers, die Implementierung von KI-Agenten-Fähigkeiten (Skills) und die Optimierung der Kontextverwaltung, um die Konsistenz und Qualität der Ergebnisse zu verbessern. Der Sprecher betont, dass ein gut strukturiertes Wissenssystem, das von der KI vollständig verstanden und genutzt werden kann, derzeit die besten Ergebnisse liefert.
Das Video thematisiert explizit Claude, OpenAI und spezifische Tools wie Obsidian, Anthropic, Google und OpenAI. Es richtet sich an Intermediate und Advanced Nutzer.
Tech With Tim (3 neues Videos)
- AI Web Scraping Is Insanely Good | Browserbase Full Tutorial
15.5.2026, 15:19:07Das Video stellt die Plattform Browserbase vor, die es ermöglicht, AI-Agenten mit Remote-Browser-Sessions zu verbinden, um Web-Automatisierung durchzuführen. Browserbase bietet eine Alternative zu herkömmlichen Tools wie Playwright oder Selenium, indem es eine AI-gestützte Schnittstelle bereitstellt, die natürliche Sprache für die Automatisierung von Browser-Aktionen nutzt. Die Plattform löst viele der typischen Probleme bei der Web-Automatisierung, wie IP-Bans, Rate Limits und Captchas, indem sie eine Agentenidentität verwendet, die mit Cloudflare und anderen Captcha-Anbietern zusammenarbeitet. Das Video zeigt eine Schritt-für-Schritt-Anleitung, wie man Browserbase mit AI-Agenten wie Claude Code oder Open Claw integriert, sowie Code-Beispiele in Python und TypeScript, die die Verwendung der Stagehand-SDK demonstrieren. Es werden verschiedene Funktionen wie das Extrahieren von Informationen, das Beobachten von Aktionen und das Ausführen komplexer Workflows gezeigt. Die Vorteile von Browserbase werden durch Vergleiche mit traditionellen Automatisierungstools hervorgehoben, insbesondere die Fähigkeit, dynamische und komplexe Webseiten zuverlässig zu automatisieren.
Das Video thematisiert explizit die Tools Browserbase und Stagehand SDK und ist eher für Intermediate und Advanced Nutzer gedacht.
- Claude Tutorial – How to Connect Claude to ANY Tool
12.5.2026, 17:32:33# Zusammenfassung
Das Video zeigt, wie man AI-Agenten wie Claude oder Copilot mit externen Anwendungen (Gmail, Google Drive, HubSpot, Salesforce etc.) verbindet – nicht über native Konnektoren, sondern über **Compose** (kostenlos).
**Problem mit nativen Konnektoren:** Wenn man mehrere native Konnektoren direkt in Claude aktiviert, entsteht „Context Bloat” – hunderte Tools werden dem LLM im System Prompt übergeben, was zu höheren Token-Kosten und schlechterer Genauigkeit bei Tool-Auswahl führt. Außerdem kann man nur ein Konto pro Tool verbinden.
**Compose-Lösung:** Nutzt „On-Demand Tool Discovery”. Statt 500 Tools bereitzustellen, wird nur 1–3 Such-Tools dem Agent gezeigt. Der Agent sucht damit semantisch nach dem richtigen Tool in Compose, was den Context klein hält und die Genauigkeit erhöht. Compose verwaltet alle Authentifizierungen zentral.
**Setup:** Man verbindet Apps im Compose-Dashboard (Gmail, Twitter, HubSpot etc.), erhält eine URL und fügt diese als Custom Connector in Claude/Copilot ein. Nach Authorisierung kann der Agent sofort auf alle verbundenen Tools zugreifen – und wird sogar aufgefordert, neue Verbindungen herzustellen, falls nötig.
**Demo:** Der Agent fasst die letzten drei Emails zusammen und erstellt dann ein Google Doc mit der Zusammenfassung, speichert es in Drive und versendet den Link – alles über die Compose-Tools orchestriert.
**Kosten:** 20.000 Tool-Calls/Monat kostenlos; Upgrade auf 200.000 oder 2 Millionen möglich. Der Autor nutzt das Tool in mehreren Konten ohne je die kostenlosen Limits zu überschreiten.
**Praktisch:** Man kann mehrere Organisationen anlegen und Tools selektiv aktivieren – ein Setup funktioniert dann für alle AI-Tools, in die man Compose integriert.
—
*Compose wird als Sponsor erwähnt, ist aber kostenlos; Claude und Copilot (sowie theoretisch andere AI-Agenten) als Plattformen diskutiert; Format: Tutorial/Demo.*
- Claude Just Got a Superpower No One’s Talking About
11.5.2026, 14:01:32# Higgs Field MCP Server in Claude: Vollständige AI-Bildungs- und Videogenerierung
Das Video zeigt, wie man den Higgs Field MCP Server in Claude installiert und nutzt, um direkt innerhalb des AI-Tools Bilder und Videos zu generieren – ohne externe APIs einzeln verbinden zu müssen.
**Installation:**
Der Setup erfolgt über die Claude-Einstellungen unter „Connectors”, wo man eine Custom Connector mit der Higgs Field MCP Server URL hinzufügt und sich authentifiziert. Alternativ kann man den Server via CLI in Claude Code installieren, indem man die Higgs Field CLI-Tools installiert, sich anmeldet und die Skill hinzufügt.**Praktische Anwendung:**
Im Demo wird eine Ad-Kampagne für eine fiktive Kaffee-Abo-Brand namens „Focus Brew” erstellt. Claude generiert zunächst drei Produktfotos mit GPT Image 2 (flach, lifestyle, nahaufnahme), editiert eine basierend auf Feedback, erstellt dann fünf-Sekunden-Videoanzeigen mit Seedance 2.0 aus verschiedenen Winkeln (Produktivität, Ritual, Skeptiker-Perspektive) und generiert abschließend Counter-Narrative-Videos, die häufige Kundeneinwände adressieren. Die generierten Assets werden danach in eine HTML-Landingpage integriert.**Kernvorteil:**
Statt 30+ verschiedene Tools einzeln zu verbinden und zu bezahlen, bietet Higgs Field eine einheitliche Schnittstelle mit Zugriff auf mehrere Bildungs- und Video-Modelle. Die MCP-Integration ermöglicht automatisierte mehrstufige Workflows: Claude kann eigenständig Bilder generieren, bewerten und Videos erzeugen – oder über Open Claw wiederkehrende Aufgaben (z.B. täglich 10 neue Bilder) automatisieren.**Besonderheit:**
Der AI-Agent verfeinert die ursprünglichen Prompts automatisch mit Details wie Qualität, Auflösung und Seitenverhältnis, was meist zu besseren Ergebnissen führt als manuelles Erstellen.Claude und Higgs Field MCP Server als zentrale Integration; Tutorial/Demo mit prakmatischem Workflow.
TheAIGRID (3 neues Videos)
- 10 Best AI Tools For Small Business Owners in 2026 – How To Start Your Business With AI
16.5.2026, 21:15:02Das Video stellt 10 AI-Tools vor, die für kleine Unternehmen und Anfänger ohne technische Vorkenntnisse geeignet sind. Hier sind die wichtigsten Punkte:
1. **ChatGPT**: Ein vielseitiges Tool für Aufgaben wie E-Mail-Verfassung, Ideenfindung, Dokumentenzusammenfassungen, Social-Media-Posts und mehr. Es ist besonders nützlich für kleine Unternehmen, um Zeit zu sparen und kreative Blockaden zu überwinden. Der Plus-Plan kostet 20 Dollar pro Monat.
2. **Claude Co-work**: Ein Desktop-Agent von Anthropic, der lokale Dateien und Anwendungen autonom bearbeiten kann. Es kann Aufgaben wie das Organisieren von Dateien, das Erstellen von Präsentationen und das Verwalten von Excel-Tabellen übernehmen. Der Grundpreis beträgt 20 Dollar pro Monat.
3. **Microsoft 365 mit Claude**: Claude kann in Microsoft Word und Excel integriert werden, um Aufgaben wie das Erstellen von Finanzanalysen und das Verwalten von Dokumenten zu automatisieren. Es ist besonders nützlich für die Erstellung von Finanzprognosen und das Verwalten von Daten.
4. **Copilot in Microsoft 365**: Eine eingebaute KI in Microsoft 365, die ähnliche Funktionen wie Claude bietet, aber weniger leistungsfähig ist. Es ist eine kostengünstige Alternative für Unternehmen mit begrenztem Budget.
5. **Gamma.app**: Ein Tool zur Erstellung von Präsentationen und Websites. Es ist besonders nützlich für kleine Unternehmen, die professionelle Präsentationen und Websites ohne Designkenntnisse erstellen möchten.
6. **Google’s Pomelo**: Ein kostenloses Marketing-Tool von Google, das auf Basis einer Website URL Social-Media-Posts, Werbekampagnen und E-Mail-Banner generiert. Es ist besonders nützlich für Unternehmen, die ihre Markenidentität stärken möchten.
7. **Flow by Google**: Ein Tool zur Bildgenerierung, das besonders nützlich für Unternehmen ist, die regelmäßig Bilder für Marketingzwecke erstellen müssen. Es bietet 50 kostenlose Credits für den Einstieg.
8. **Canva AI**: Ein Tool zur Erstellung von Marketingvisuals, das Layouts vorschlägt, Bilder aus Prompts generiert und Designs für verschiedene Social-Media-Plattformen anpasst. Es ist besonders nützlich für Unternehmen, die ihre Markenidentität konsistent halten möchten.
9. **Zapier**: Ein Tool zur Automatisierung von Workflows zwischen verschiedenen Anwendungen. Es kann Aufgaben wie das Erstellen von Kalendereinträgen und das Verwalten von Kundenanfragen automatisieren. Es bietet eine kostenlose Version und bezahlte Pläne bis zu 20 Dollar pro Monat.
10. **Chatbase**: Ein Tool zur Integration von KI-Unterstützungsagenten in Websites. Es ermöglicht Unternehmen, automatisierte Kundensupport-Agenten auf ihrer Website zu integrieren, die auf Basis von PDFs oder Word-Dokumenten mit Unternehmenswissen antworten können. Es bietet eine kostenlose Version und bezahlte Pläne ab 32 Dollar pro Monat.
11. **Perplexity Computer**: Ein teures, aber leistungsfähiges KI-Agenten-Tool, das Aufgaben wie das Erstellen von Berichten, das Scrapen von Websites und das Verwalten von Daten automatisieren kann. Es ist besonders nützlich für Unternehmen, die komplexe Aufgaben automatisieren möchten. Der Preis beträgt 200 Dollar pro Monat.
12. **Lovable**: Ein Tool zur Erstellung von Websites mit KI-Unterstützung. Es ist besonders nützlich für Unternehmen, die schnell und einfach eine Website erstellen möchten, ohne Designkenntnisse zu haben.
Das Video ist für kleine Unternehmen und Anfänger ohne technische Vorkenntnisse geeignet. Es werden verschiedene AI-Tools und Modelle thematisiert, darunter ChatGPT, Claude, Microsoft 365, Copilot, Gamma.app, Google’s Pomelo, Flow by Google, Canva AI, Zapier, Chatbase, Perplexity Computer und Lovable.
- Meta AI Tutorial – How To Use Meta AI
13.5.2026, 21:15:04Das Video stellt die Funktionen und Tipps für die Nutzung von Meta AI vor. Es beginnt mit der Erklärung der drei Chat-Modi: “Instant” für schnelle, lockere Fragen, “Thinking” für komplexere Probleme, die längeres Nachdenken erfordern, und der geheimen “Contemplating”-Funktion, die bis zu 16 unabhängige Agenten zur parallelen Analyse einsetzt. Diese Funktion ist besonders nützlich für Forschung, Strategieentwicklung und schwierige Entscheidungen. Anschließend wird die Suchfunktion von Meta AI demonstriert, die Informationen aus dem offenen Web und Metas sozialem Graphen bezieht, einschließlich Instagram Reels und Facebook-Posts. Die Multi-Modalität von Meta AI wird hervorgehoben, insbesondere die Bildanalyse und visuelle Verankerung, die detaillierte Analysen und personalisierte Gesundheitsinformationen aus Bildern liefern können. Auch die Analyse von PDFs, Excel- und Word-Dokumenten wird erwähnt. Zudem wird die Bild- und Videogenerierung mit Meta’s “Vibes” vorgestellt, die derzeit auf Midjourney basiert, sowie die soziale Plattform Meta Vibes, auf der Benutzer AI-generierte Inhalte teilen und remixen können.
Das Video thematisiert explizit Meta AI und ist eher für Intermediate Nutzer gedacht.
- Google’s New Gemini Omni Just Shocked Everyone – Leaked Demo, Pricing, and what comes next
12.5.2026, 19:45:04Das Video behandelt die Leakage eines neuen Google AI-Videomodells namens Gemini Omni, das versehentlich einigen Nutzern zugänglich gemacht wurde. Die Entdeckung begann mit einem Tweet, der auf eine ungewöhnliche Textzeile “powered by Omni” in der Gemini-App hinwies. Nutzer generierten erste Videos, die eine beeindruckende Qualität zeigten, die mit aktuellen Top-Modellen wie Sora 2 vergleichbar ist. Die Videos demonstrieren komplexe Szenen, wie einen Professor, der eine mathematische Beweisführung an der Tafel erklärt, und eine detaillierte Restaurant-Szene mit zwei Personen. Die Nutzung des Modells ist jedoch sehr ressourcenintensiv, wobei zwei Generierungen bereits 86% des monatlichen Kontingents eines Pro-Abonnements (20$/Monat) verbrauchen. Der Name “Omni” deutet auf ein multimodales Modell hin, das verschiedene Eingabe- und Ausgabemodalitäten unterstützt, ähnlich wie das nie offiziell veröffentlichte GPT-40. Das Video spekuliert über die mögliche Einführung von Omni auf der kommenden Google IO und vergleicht es mit aktuellen Wettbewerbern wie Sora 2, Alibaba’s W2.7 und Cline 3.0. Es wird diskutiert, ob Omni ein eigenständiges Produkt oder eine Weiterentwicklung von VO4 sein könnte, mit dem Potenzial, die AI-Videolandschaft erheblich zu verändern.
Das Video thematisiert explizit Google’s Gemini Omni und vergleicht es mit anderen Modellen wie Sora 2 und GPT-40, wobei es sich eher an ein Intermediate bis Advanced Publikum richtet.
Theo – t3․gg (5 neues Videos)
- AI Is Hacking Everything Now…
15.5.2026, 20:09:07Das Video diskutiert eine Reihe schwerwiegender Sicherheitslücken und Exploits in verschiedenen Software- und Betriebssystemen, insbesondere Linux. Es werden mehrere kritische Sicherheitsprobleme aufgezeigt, darunter “Copy Fail”, “Dirty Frag”, und ein Angriff auf 84 Tanstack npm-Pakete. Der Sprecher betont, dass die Geschwindigkeit und Häufigkeit dieser Exploits alarmierend ist und dass die traditionellen Sicherheitspraktiken, wie die 90-Tage-Offenlegungsfrist, nicht mehr ausreichen. Er argumentiert, dass die Nutzung von KI die Entdeckung und Ausnutzung von Sicherheitslücken beschleunigt und vereinfacht hat, was zu einer neuen Ära der Software-Sicherheit führt.
Der Sprecher schlägt vor, dass die Branche drastische Änderungen vornehmen muss, um mit diesen neuen Herausforderungen umzugehen. Dazu gehören die Einführung eines neuen Tiers von vertrauenswürdigen Akteuren, die frühzeitig über Sicherheitslücken informiert werden, sowie eine grundlegende Änderung der Open-Source-Kultur, um die Offenlegung von Code zu steuern und zu verzögern. Er betont auch die Notwendigkeit, Software von Grund auf sicherer zu gestalten, indem man beispielsweise sicherere Programmiersprachen wie Rust verwendet und bessere Architekturen entwickelt.
Der Sprecher teilt auch persönliche Maßnahmen, die er ergreift, um sich vor diesen Bedrohungen zu schützen, wie das regelmäßige Erstellen von Backups und das Belehren seiner Familie über Sicherheitsrisiken. Er schließt mit der Hoffnung, dass seine Warnungen ernst genommen werden und dass die Branche gemeinsam Lösungen findet, um die wachsenden Sicherheitsherausforderungen zu bewältigen.
AI-Tools/Modelle/Anbieter: Claude, OpenAI, Gemini, Open-Source (Linux, npm-Pakete, Tanstack), Mythos, OpenAI Daybreak, GPT-4.7, Claude Opus 4.7, Gemini 31 Pro, GPT-5.5
Zielgruppe: Intermediate bis Advanced.
- I’m done.
14.5.2026, 10:08:59Das Video behandelt die Ankündigung von Anthropic, dass ab dem 15. Juni bezahlte Claude-Pläne einen dedizierten monatlichen Guthaben für programmatische Nutzung erhalten. Dieser Guthaben deckt die Nutzung des Agent-SDKs, Claude-P und Drittanbieter-Apps, die auf dem Agent-SDK basieren. Der Sprecher ist enttäuscht, da diese Änderung die Nutzung von Claude in Drittanbieter-Tools wie T3 Code, OpenClaude und anderen stark einschränkt und die Nutzungsgrenzen um das 25- bis 40-fache reduziert. Er kritisiert Anthropic dafür, dass sie trotz monatelanger Nachfragen keine klare Kommunikation geboten haben und nun eine Lösung präsentieren, die mehr wie eine Einschränkung denn wie eine Verbesserung wirkt. Der Sprecher betont, dass dies ein Angriff auf Open-Source-Projekte ist und dass Anthropic offene und programmatische Nutzung stark einschränkt. Er kündigt an, dass T3 Code eine Option einführen wird, um zwischen der verbesserten Benutzeroberfläche und der ursprünglichen, aber eingeschränkten Nutzung zu wählen. Er rät den Zuschauern, alternative Lösungen wie Codex zu nutzen und drückt seine Enttäuschung über das Verhalten von Anthropic aus.
**AI-Tools/Modelle/Anbieter:** Claude (Anthropic), OpenAI, Codex, OpenClaude, T3 Code, Agent SDK, Claude-P, Open Source
**Zielgruppe:** Intermediate bis Advanced - Stop letting your agents write Markdown.
13.5.2026, 06:46:31Das Video diskutiert die Vor- und Nachteile von Markdown im Vergleich zu HTML, insbesondere im Kontext der Nutzung durch KI-Agenten. Der Autor argumentiert, dass Markdown, obwohl es einfach und portabel ist, in vielen Fällen zu einschränkend ist und durch HTML ersetzt werden sollte, das reichere und interaktivere Inhalte ermöglicht. Er verweist auf Artikel von Thoric und Andrej Karpathy, die ähnliche Ansichten vertreten, und zeigt Beispiele dafür, wie HTML für verschiedene Aufgaben wie Planung, Code-Reviews und Designs verwendet werden kann. Der Autor betont, dass HTML eine höhere Informationsdichte bietet, leichter zu lesen und zu teilen ist und interaktive Elemente ermöglicht. Er schließt mit der These, dass die Zukunft der Mensch-Maschine-Interaktion in interaktiven Videos und Simulationen liegen könnte, und ermutigt die Zuschauer, HTML als Ausgangspunkt zu nutzen und weiter zu erforschen.
Das Video thematisiert explizit Claude Code, Anthropic, OpenAI und spezifische Tools wie Copilot Kit. Es ist eher für Intermediate bis Advanced Nutzer gedacht, die sich mit KI-Agenten und deren Output-Formate auseinandersetzen.
- I wish this was clickbait
12.5.2026, 10:52:14Das Video diskutiert die Zukunft von Bun, einem JavaScript-Toolkit, das ursprünglich in der Programmiersprache Zig geschrieben wurde. Der Sprecher, ein langjähriger Unterstützer von Bun, äußert Bedenken hinsichtlich der Stabilität und Zukunft von Bun, insbesondere auf Windows, und erwähnt, dass einige Entwickler wie Dax von Open Code aufgrund dieser Probleme zu Node.js wechseln. Ein zentrales Thema ist die Entscheidung des Bun-Teams, Bun in Rust neu zu schreiben, um Stabilitätsprobleme zu beheben und die Wartbarkeit zu verbessern. Der Sprecher hebt hervor, dass diese Neuimplementierung zwar vielversprechend ist, aber auch neue Herausforderungen mit sich bringt, insbesondere aufgrund der umfangreichen Verwendung von “unsafe”-Code in Rust, was auf potenzielle Sicherheits- und Stabilitätsrisiken hinweist. Er diskutiert auch die Integration von Bun in Claude Code, ein Tool von Anthropic, und die möglichen Auswirkungen der aktuellen Probleme von Claude Code auf die Entwicklung von Bun. Der Sprecher schließt mit der Hoffnung, dass die Neuimplementierung von Bun in Rust erfolgreich sein wird, obwohl er skeptisch gegenüber den kurzfristigen Vorteilen ist.
Das Video thematisiert explizit die AI-Modelle und Tools Claude und Mythos und ist eher für Intermediate bis Advanced Nutzer gedacht.
- We all fell for it…
11.5.2026, 06:45:20Das Video diskutiert die Auswirkungen von AI-Code-Tools auf die Fähigkeiten und Arbeitsweisen von Entwicklern. Der Sprecher teilt seine persönlichen Erfahrungen und reflektiert über die Vor- und Nachteile dieser Tools, insbesondere im Hinblick auf Produktivität, kognitive Atrophie und Abhängigkeit von AI.
Wichtige Punkte des Videos:
1. **Produktivitätsgewinne**: AI-Code-Tools ermöglichen es Entwicklern, schneller und effizienter zu arbeiten, indem sie repetitive Aufgaben automatisieren und komplexe Probleme lösen.
2. **Kognitive Atrophie**: Der übermäßige Einsatz von AI-Tools kann dazu führen, dass Entwickler ihre Fähigkeiten verlieren, da sie sich weniger mit den Details des Codes auseinandersetzen. Dies wird als “kognitive Schuld” bezeichnet.
3. **Abhängigkeit und Vendor Lock-in**: Entwickler können in eine Abhängigkeit von bestimmten AI-Tools geraten, was zu Problemen führen kann, wenn diese Tools nicht verfügbar sind oder sich die Kosten erhöhen.
4. **Qualität der Arbeit**: AI-Tools können die Qualität des Codes verbessern, indem sie Fehler reduzieren und bessere Lösungen vorschlagen. Gleichzeitig können sie jedoch auch zu einer Oberflächlichkeit führen, wenn Entwickler die vorgeschlagenen Lösungen nicht vollständig verstehen.
5. **Arbeitsweise**: Der Sprecher betont die Bedeutung, AI-Tools als Hilfsmittel zu nutzen, um die eigene Arbeit zu verbessern, anstatt sich vollständig auf sie zu verlassen. Er schlägt vor, AI-Tools für Planung, Brainstorming und Forschung zu nutzen, während man die Implementierung selbst übernimmt.
6. **Vendor Lock-in und Zuverlässigkeit**: Der Sprecher argumentiert, dass Entwickler nicht von einem einzigen AI-Tool abhängig sein sollten. Er empfiehlt, verschiedene Tools und Anbieter zu nutzen, um die Zuverlässigkeit und Flexibilität zu erhöhen.
7. **Langfristige Auswirkungen**: Der Sprecher warnt davor, dass der übermäßige Einsatz von AI-Tools langfristig die Karriere von Entwicklern beeinträchtigen kann, wenn sie ihre Fähigkeiten nicht weiterentwickeln.
Das Video thematisiert explizit AI-Tools und Modelle wie Claude, OpenAI, Gemini und spezifische Tools wie Cursor, Browserbase und T3 Code. Es richtet sich an Intermediate und Advanced Entwickler, die sich mit den Auswirkungen von AI auf ihre Arbeit auseinandersetzen möchten.
Tim Carambat
Keine neuen Videos in diesem Zeitraum.
Unsupervised Learning (1 neues Video)
- A Conversation With Brian Vecci
13.5.2026, 15:00:14Das Video ist ein Interview mit Brian, einem Experten für Datensicherheit bei Veronis, das sich auf die Herausforderungen und Lösungen im Zusammenhang mit KI-Sicherheit konzentriert.
Brian erklärt, dass die Gespräche mit Kunden und Sicherheitsteams in den letzten Jahren stark von Unsicherheit über KI zu konkreten Fragen über den sicheren Einsatz von KI-Tools wie ChatGPT, Claude und Microsoft Copilot gewechselt sind. Heute geht es darum, wie Unternehmen KI nutzen können, um effizienter zu arbeiten, während sie gleichzeitig sicherstellen, dass angemessene “Schutzräume” vorhanden sind, um Sicherheitsrisiken zu minimieren.
Er betont, dass die Angriffsfläche durch KI erheblich erweitert wird, da Angreifer KI nutzen können, um Schwachstellen zu identifizieren und auszunutzen. Veronis hat eine umfassende Lösung entwickelt, die auf drei Säulen basiert: Sichtbarkeit (Observability), Automatisierung und Verhaltensüberwachung. Diese Lösung umfasst die Erfassung und Analyse von Daten, die Überwachung von Zugriffsrechten und die Automatisierung von Sicherheitsmaßnahmen.
Brian hebt hervor, dass viele Unternehmen noch nicht die Komplexität und das Risiko der KI-Sicherheit vollständig verstehen. Er warnt davor, dass Angreifer zunehmend KI nutzen, um schnell und effizient in Systeme einzudringen, und betont die Notwendigkeit, die Daten und die zugrunde liegende Infrastruktur zu sichern.
Das Video endet mit einer Diskussion über die Implementierung der Veronis-Lösung, die schnell und effektiv ist, und mit der Ankündigung, dass Veronis auf der Black Hat-Konferenz weitere Neuigkeiten zur KI-Sicherheit vorstellen wird.
Schluss-Kommentar: Das Video thematisiert explizit KI-Modelle wie Claude, ChatGPT und Microsoft Copilot sowie spezifische Tools wie Veronis AI Atlas. Es ist eher für Intermediate und Advanced gedacht, da es tiefgehende Einblicke in die KI-Sicherheit und komplexe Lösungsansätze bietet.
WorldofAI (7 neues Videos)
- Gemini 3.5 Flash + Pro: Powerful, Cheap, & Fast NEW AI Model! (Fully Tested)
16.5.2026, 06:11:06Das Video diskutiert die neuesten Entwicklungen und Leaks zu Googles Gemini-Modellen, insbesondere den Checkpoints für Gemini 3.5, die in Kürze auf der Google IO-Konferenz vorgestellt werden sollen. Zunächst wurden die Gemini 3.2-Varianten (Fanta, Sprite, Cola) und die Pro-Version vorgestellt, die zwar gut, aber nicht revolutionär waren. Die neuesten Checkpoints, intern als “Cappuccino” bezeichnet, zeigen jedoch beeindruckende Fortschritte. Besonders hervorzuheben ist die Fähigkeit des Modells, komplexe Anwendungen wie ein Minecraft-Klon oder ein Mac OS-Klon zu generieren, mit detaillierten und konsistenten Ausgaben. Die Gemini 3.5 Flash-Variante zeigt starke Verbesserungen in der Codegenerierung, ästhetischen Gestaltung und räumlichen Konsistenz, bleibt aber in der UI-Generierung manchmal zu repetitiv und überladen. Es gibt auch Hinweise auf eine geheime Testphase der Gemini 3.1 Pro-Variante, die ebenfalls vielversprechende Ergebnisse liefert.
Das Video thematisiert explizit die Gemini-Modelle von Google und ist eher für Intermediate bis Advanced-Nutzer gedacht, die sich für die neuesten Entwicklungen in der KI-Technologie interessieren.
- Codex + Ollama = Free Unlimited Coding AI
15.5.2026, 06:48:19Das Video erklärt die Integration von Olama in OpenAI’s Codeex, was es ermöglicht, Open-Source-Modelle lokal auf dem eigenen Computer zu nutzen. Codeex ist ein AI-Coding-Agent, der bei der Entwicklung, Bearbeitung, Überprüfung und Bereitstellung von Software hilft. Olama erlaubt das lokale Ausführen von Open-Source-Modellen wie Deepseek, Gemma 4 oder Quen 3.6. Die Kombination beider Tools ermöglicht es, diese Modelle kostenlos in Codeex zu nutzen. Das Video zeigt Schritt für Schritt, wie man Olama installiert, ein Modell wie Gemma 4 lokal hostet und es mit Codeex verbindet. Es wird demonstriert, wie man mit dem lokal gehosteten Modell Aufgaben in Codeex erledigen kann, z.B. das Erstellen einer Landing Page. Es wird auch erklärt, wie man zurück zur ursprünglichen Codeex-Erfahrung wechseln kann.
Das Video thematisiert explizit OpenAI’s Codeex und Olama und ist eher für Intermediate Nutzer geeignet.
- Anthropic’s Downfall? GPT-5.6, Gemini 3.2, Robots Running A Full 8-hr Shift, & Qwen 3.6 Plus FREE!
14.5.2026, 06:39:49Das Video behandelt aktuelle Entwicklungen im Bereich der KI-Technologien, insbesondere von Google, OpenAI und Anthropic.
Google testet intensiv neue Varianten von Gemini 3.2, darunter die Flash- und Pro-Versionen, die jedoch bisher eher enttäuschende Ergebnisse liefern. Die Front-End-Generierung zeigt sich als schwächer im Vergleich zu früheren Versionen, und die Erwartungen an die neuen Modelle sind nicht erfüllt worden. Zudem wurde ein nicht freigegebenes multimodales Video-Modell von Google geleakt, das vielversprechende, aber noch frühe Ergebnisse zeigt.
OpenAI arbeitet intensiv an GPT 5.6, mit internen Tests und potenziellen Veröffentlichungen im Juni. Es gibt Hinweise auf eine verbesserte Sicherheitsüberprüfung und mögliche neue Varianten wie Ember Alpha und Beacon Alpha.
Anthropic hat die wöchentlichen Limits für Cloud Code erhöht, was jedoch auf Kritik stößt, da gleichzeitig dritte Agenten in ein separates, kostenpflichtiges API-Kreditsystem verschoben wurden. Dies führt zu höheren Kosten für Entwickler und wird als mangelnde Transparenz und Lösung der Infrastrukturprobleme kritisiert.
Weitere Updates umfassen die Einführung eines schnellen Modus für Cloud Code, eine bevorstehende große Aktualisierung von Google’s Jewels und kontinuierliche Verbesserungen an Hermes Agent, einem selbstverbessernden Open-Source-KI-Agenten. Zudem präsentierte Figure AI eine beeindruckende Roboterdemo, bei der humanoide Roboter autonom in einem Lager arbeiten.
Das Video thematisiert explizit Google’s Gemini, OpenAI’s GPT, Anthropic’s Cloud Code und Open-Source-Tools wie Hermes Agent. Es richtet sich an Intermediate und Advanced Nutzer, die sich für die neuesten Entwicklungen und technischen Details in der KI-Branche interessieren.
- Hermes Agent v2.0! Huge New Updates: WebUI, Qwen 3.6 Plus FREE, Computer Use, & More!
13.5.2026, 05:08:59Das Video stellt die neuesten Updates von Hermes Agent vor, einem offenen Quellcode-AI-Agenten, der sich kontinuierlich weiterentwickelt und auf der eigenen Infrastruktur betrieben werden kann. Die wichtigsten Neuerungen umfassen:
1. **Computer Use Feature**: Hermes kann nun den Computer im Hintergrund steuern, ohne die Kontrolle über den PC zu übernehmen. Dies funktioniert derzeit nur auf macOS, aber Unterstützung für Windows und Linux ist geplant. Die Funktion ist kompatibel mit verschiedenen AI-Modellen wie Claude, GPT-4, Gemini und lokalen Open-Source-Modellen.
2. **Integration von Alibaba’s Qwen 3.6 6 Plus**: Dieses leistungsstarke Modell ist nun in Hermes integriert und bietet lange Kontextfenster und multimodale Fähigkeiten. Es ist kostenlos für eine begrenzte Zeit verfügbar.
3. **Light Panda Integration**: Ein integrierter, Open-Source-Browser-Backend, der speziell für AI-Workflows entwickelt wurde. Er bietet verbesserte Browser-Automatisierung und Zuverlässigkeit.
4. **Kanban-Board**: Ein neues Kanban-Board ermöglicht die Erstellung unendlicher Boards und Projekte, die Orchestrierung mehrerer Agenten und die Verwaltung von Aufgaben durch ein Dashboard.
5. **/goal Command**: Eine langfristige autonome Zielmodus-Funktion, die kontinuierlich plant, ausführt, überprüft und bei Fehlern neu versucht, bis das Ziel erreicht ist.
Zusätzlich wurden kleinere Updates wie Sprachklonung und mehrsprachige Unterstützung eingeführt. Das Video empfiehlt Tiny Fish für Web-Automatisierungsaufgaben und verweist auf die Open-Source-Natur von Hermes, die es zu einem vielseitigen Werkzeug für AI-Workflows macht.
Das Video thematisiert explizit Hermes Agent, Open-Source-Modelle, Tiny Fish und ist eher für Intermediate bis Advanced Nutzer gedacht.
- Claude Code Agent View IS INSANE! Huge New Update Introduces /goal, sessions, & More!
12.5.2026, 07:03:39Das Video stellt die neuesten Updates von Enthropic Cloud Code vor, einem Tool für agentenbasierte Entwicklung. Die wichtigsten Neuerungen umfassen:
1. **Agent View**: Eine zentrale Oberfläche zur Verwaltung aller Cloud Code-Sessions. Diese ermöglicht das parallele Ausführen und Verwalten mehrerer Coding-Sessions in einem einzigen Dashboard. Nutzer können zwischen Sessions wechseln, ohne den Kontext zu verlieren, und Hintergrundaufgaben ausführen.
2. **/goal-Feature**: Eine Funktion, die es ermöglicht, autonome Ausführungen mit einem definierten Ziel zu starten. Der Agent arbeitet eigenständig, bis das Ziel erreicht ist, und ist in verschiedenen Workflows sowie auf mobilen Geräten nutzbar.
3. **/radio und Claude FM**: Eine integrierte Low-Fi-Radio-Station, die das Nutzererlebnis verbessern soll.
4. **Verbesserte System-Prompt-Compaction**: Die Prompt-Trimmung wurde optimiert, um sensible Anweisungen und Nutzerintentionen besser zu erhalten, ohne explizite Warnungen bei der Kontextverkürzung anzuzeigen.
Das Video diskutiert die Vorteile dieser Updates, insbesondere für komplexe, agentenbasierte Coding-Workflows, und erwähnt die Möglichkeit, mit Depot CI eine schnellere und konsistentere CI/CD-Pipeline zu nutzen. Kritisch angemerkt wird jedoch die begrenzte Token-Nutzung von Cloud Code, die die praktische Anwendbarkeit einschränken könnte.
Schluss-Kommentar: Das Video thematisiert explizit Claude (Enthropic) und Depot CI und richtet sich an Intermediate bis Advanced Nutzer.
- Hermes Agentic OS is The Future
11.5.2026, 07:07:11Das Video stellt Hermes Agent vor, ein Open-Source-Projekt von Mistral AI, das als persistentes autonomes System konzipiert ist und kontinuierlich über die Zeit hinweg lernt und sich weiterentwickelt. Es kann 24/7 auf der eigenen Infrastruktur laufen, langfristige Erinnerungen aufbauen, wiederverwendbare Fähigkeiten entwickeln und ein tieferes Verständnis des Nutzers erlangen. Der Autor zeigt, wie Hermes Agent in Kombination mit ION UI zu einem agentenbasierten Betriebssystem (AIOS) weiterentwickelt werden kann, das in der Lage ist, mehrere autonome KI-Agenten zu verwalten, die komplexe Mehrschrittaufgaben ohne ständige menschliche Überwachung ausführen können. ION UI ist eine kostenlose Open-Source-Co-Work-Plattform, die es ermöglicht, dass KI-Agenten wie Hermes direkt auf dem Computer des Nutzers arbeiten und dabei Dateien lesen und verwalten, Code schreiben und ausführen, im Internet surfen, Workflows automatisieren und direkt neben dem Nutzer als Benutzer arbeiten. Das Video zeigt, wie man Hermes Agent und ION UI installiert und konfiguriert, sowie verschiedene Anwendungsfälle, wie die Erstellung eines Finanzdashboards in Excel, die Organisation von Dateien auf dem Desktop und die Erstellung eines Berichts über ländliche EV-Ladeinfrastruktur. Der Autor betont die Fähigkeit des Systems, verschiedene Aufgaben gleichzeitig auszuführen und sich kontinuierlich zu verbessern, was es zu einem leistungsfähigen Werkzeug für die Automatisierung und Effizienzsteigerung macht.
Das Video thematisiert explizit Hermes Agent, ION UI und ist eher für Intermediate und Advanced Nutzer gedacht.
- Hermes Agent NEW Desktop App – The 24/7 Self-Evolving AI Agent!
10.5.2026, 06:27:40Das Video stellt Hermes Agent vor, ein Open-Source-AI-Projekt, das sich von anderen Tools wie OpenClaw und Claude Code durch seine Fähigkeit zur kontinuierlichen Selbstverbesserung und langfristigen Speicherung von Wissen abhebt. Hermes kann auf eigenen Geräten rund um die Uhr laufen und entwickelt sich durch den Einsatz von Closed-Learning-Loops und persistenten Speichersystemen weiter. Ein Hauptvorteil ist die Fähigkeit, komplexe Aufgaben autonom zu erledigen, wie die Erstellung von Videos mit Hyperframe. Allerdings war die Einrichtung bisher stark CLI-basiert, was die Benutzerfreundlichkeit einschränkte. Das Video stellt die neue Hermes Desktop App vor, die eine benutzerfreundliche Oberfläche bietet und die Verwaltung mehrerer Agenten und Workflows erleichtert. Die App unterstützt verschiedene Betriebssysteme und ermöglicht die Integration von API-Anbietern wie OpenAI sowie die Nutzung lokaler Modelle. Zudem bietet sie Funktionen zur Verwaltung von Skills, Personas, Memory und Tools, sowie die Möglichkeit, Cron-Jobs zu erstellen und mit anderen Plattformen zu verbinden. Die App ermöglicht auch die Migration von OpenClaw-Konfigurationen. Hermes kann für vielfältige Anwendungen eingesetzt werden, von der Erstellung von Inhalten bis hin zur Finanzanalyse. Das Video zeigt die Einrichtung und Nutzung der Desktop App und betont deren Vorteile für die Benutzerfreundlichkeit und Flexibilität.
Das Video thematisiert explizit Hermes Agent, Open-Source-Modelle und spezifische Tools wie OpenAI, Hyperframe und OpenClaw und ist eher für Intermediate und Advanced Nutzer gedacht.
Automatisch generiert aus den letzten YouTube-Videos der kuratierten Kanal-Auswahl. Bei Feedback, Anregungen oder zum Austragen: einfach auf diese Mail antworten.