Tech Blog

Insights on SME automation, production AI, and reliable engineering systems.

AI/ML2026-05-13

Das VLM, das einen zusammenbrechenden Roboter mit 62/100 bewertete

Nachdem Metriken weiterhin degenerierte Gänge übersahen und LLM-iterierte Belohnungen an der Überlebensklippe scheiterten, haben wir ein Vision-Language-Modell als Fitness-Scorer ausprobiert. Das VLM war strenger als Metriken und lieferte umsetzbare Fehlerbeschreibungen — und es bewertete einen zusammenbrechenden Roboter mit 62/100. Eine Fallstudie zur ehrlichen Bewertung, plus dem vierschichtigen Evaluierungsstack, auf den wir uns geeinigt haben.

AI/ML2026-05-06

Wenn LLMs Belohnungen iterieren: Ein Negativergebnis aus der humanoiden Lokomotion

Wir haben die Eureka-Methodik von NVIDIA — ein LLM, das iterativ Belohnungsfunktionen für einen RL-Agenten vorschlägt — auf humanoides Kaltstart-Gehen angewendet. 24 Kandidaten in zwei Runden, alle fielen bis Schritt 70. Das LLM war durchdacht; die Überlebensklippe war Zustandsraumabdeckung, kein Belohnungsdesign.

AI/ML2026-05-02

Fünf Arten, wie ein Humanoid beim Gehen schummelt

Reines RL, physikalische Priors, Single-Image-Posen, adversariale strukturelle Belohnungen, LLM-iterierte Belohnungen — fünf Versuche, einen humanoiden Walker ohne Mocap zu trainieren, fünf verschiedene Arten, wie die Policy geschummelt hat. Mit der v16-'Flamingo-Hüpf'-Retraktion, die der Nutzer entdeckte.

AI/ML2026-04-18

Zwei Posen reichen aus: Wie viele Mocap-Daten braucht ein Humanoid zum Laufen?

Wir haben Mocap-Referenzdaten für einen Humanoid-Walker von 50 Frames auf 2 Posen reduziert. Die Minimalversion lief am schnellsten — und das Ergebnis hat praktische Folgen für jedes Humanoid-Projekt mit begrenztem Mocap-Budget.

AI/ML2026-04-14

Die VecNormalize-Falle: Zwei stille Bugs, die eine funktionierende Geh-Policy versteckten

Derselbe Checkpoint, zwei Auswertungen, 12-fach unterschiedliche Episodenlängen. Zwei stille Bugs in Serie waren verantwortlich. Die Korrektur ersetzt SB3's VecNormalize durch eine feste, physikalisch hergeleitete Normalisierung, die deterministisch reproduziert.

AI/ML2026-04-06

Ich habe Karpathys Autoresearch auf einem MacBook für 1.299 Dollar ausgeführt – das ist dabei herausgekommen

Direkter Vergleich zwischen MLX und PyTorch MPS bei Karpathys Autoresearch auf einem M2 MacBook Pro mit 16 GB RAM. Enthält Stabilitätstests, eine echte autonome Agenten-Schleife, die eine Verbesserung von 5 % erzielte, sowie eine Kostenanalyse zum Vergleich zwischen Mac und Cloud-GPU.

KI/ML2026-04-05

Der Agent-Harness-Wendepunkt: Was wirklich machbar ist, was kommt und wie man sich anpasst

Ehrliche Daten: wo KI-Agenten funktionieren, wo sie scheitern, und warum Engineering-Disziplin wichtiger ist als Modell-Performance. Paperclip, OpenClaw, Autoresearch, EU AI Act und praktische Anpassungsstrategie.

Fallstudie2026-04-03

Fallstudie: Einen autonomen EV-Laderoboter bauen (und was wir gelernt haben, als es nicht klappte)

Ehrliche Lektionen aus der Mitgründung von VoltVogel: Simulation-first-Entwicklung, Prototyp-Scoping unter Druck und der Unterschied zwischen dem, was gebaut und was nur simuliert wurde.

Fallstudie2026-04-01

Fallstudie: Vom CE-Berater zum Engineering Lead bei einem Healthcare-Robotik-Startup

Wie Software-Lösungen für Hardware-Limitierungen einen Healthcare-Roboter von Prototyp zu CE-ready gebracht haben. State Machine Refactor, UWB-Radar, Sensorfusion und der Weg zur Sicherheitszertifizierung.

Productivity2026-03-24

Zwei Wochen, 40 Commits und eine KI, die sich meine Vorlieben merkt

Erfahrungsbericht aus erster Hand über 40+ Commits in mehreren Projekten mit Claude Code. Behandelt das Speichersystem, Sub-Agent-Muster, Testing-Kultur und ehrliche Reflexionen darüber, wo KI-Codierungsassistenten glänzen und wo sie straucheln.

AI/ML2026-03-15

Wie ich ein tooluebergreifendes Speicher- und Kompetenzsystem fuer die KI-gestuetzte Entwicklung aufgebaut habe

Ein praktischer Leitfaden zum Teilen von Wissen, Skills und Regeln ueber mehrere KI-Coding-Tools hinweg mittels MCP Knowledge Graphs, universeller Skill-Templates und tool-spezifischer Konfiguration.

Business2026-03-15

Teilzeit-CTO für Deep-Tech-Startups: Wenn Sie technische Führungskompetenz benötigen, aber keine Vollzeitkraft einstellen möchten

Ein praktischer Leitfaden für Deep-Tech-Gründer, die den Einsatz eines Teilzeit-CTO in Betracht ziehen. Er behandelt die Aufgaben dieser Rolle, warum Deep-Tech-Unternehmen besonders davon profitieren, wann ein Teilzeit-CTO und wann ein Vollzeit-CTO sinnvoll ist, einen Kostenvergleich für den Berliner Markt sowie wichtige Auswahlkriterien.

AI/ML2026-02-22

Claude Code Skills: Wie man sie einrichtet und verwendet

Erfahren Sie, wie Sie Claude Code Skills erstellen und verwenden: Ordnerstruktur, YAML-Frontmatter, progressive Offenlegung und wann Skills besser sind als sich zu wiederholen.

Showing 12 of 52