Tech Blog

Insights on SME automation, production AI, and reliable engineering systems.

AI/ML

Das VLM, das einen zusammenbrechenden Roboter mit 62/100 bewertete

Nachdem Metriken weiterhin degenerierte Gänge übersahen und LLM-iterierte Belohnungen an der Überlebensklippe scheiterten, haben wir ein Vision-Language-Modell als Fitness-Scorer ausprobiert. Das VLM war strenger als Metriken und lieferte umsetzbare Fehlerbeschreibungen — und es bewertete einen zusammenbrechenden Roboter mit 62/100. Eine Fallstudie zur ehrlichen Bewertung, plus dem vierschichtigen Evaluierungsstack, auf den wir uns geeinigt haben.

AI/ML

Wenn LLMs Belohnungen iterieren: Ein Negativergebnis aus der humanoiden Lokomotion

Wir haben die Eureka-Methodik von NVIDIA — ein LLM, das iterativ Belohnungsfunktionen für einen RL-Agenten vorschlägt — auf humanoides Kaltstart-Gehen angewendet. 24 Kandidaten in zwei Runden, alle fielen bis Schritt 70. Das LLM war durchdacht; die Überlebensklippe war Zustandsraumabdeckung, kein Belohnungsdesign.

AI/ML

Fünf Arten, wie ein Humanoid beim Gehen schummelt

Reines RL, physikalische Priors, Single-Image-Posen, adversariale strukturelle Belohnungen, LLM-iterierte Belohnungen — fünf Versuche, einen humanoiden Walker ohne Mocap zu trainieren, fünf verschiedene Arten, wie die Policy geschummelt hat. Mit der v16-'Flamingo-Hüpf'-Retraktion, die der Nutzer entdeckte.

AI/ML

Die VecNormalize-Falle: Zwei stille Bugs, die eine funktionierende Geh-Policy versteckten

Derselbe Checkpoint, zwei Auswertungen, 12-fach unterschiedliche Episodenlängen. Zwei stille Bugs in Serie waren verantwortlich. Die Korrektur ersetzt SB3's VecNormalize durch eine feste, physikalisch hergeleitete Normalisierung, die deterministisch reproduziert.

Productivity

Zwei Wochen, 40 Commits und eine KI, die sich meine Vorlieben merkt

Erfahrungsbericht aus erster Hand über 40+ Commits in mehreren Projekten mit Claude Code. Behandelt das Speichersystem, Sub-Agent-Muster, Testing-Kultur und ehrliche Reflexionen darüber, wo KI-Codierungsassistenten glänzen und wo sie straucheln.

Business

Teilzeit-CTO für Deep-Tech-Startups: Wenn Sie technische Führungskompetenz benötigen, aber keine Vollzeitkraft einstellen möchten

Ein praktischer Leitfaden für Deep-Tech-Gründer, die den Einsatz eines Teilzeit-CTO in Betracht ziehen. Er behandelt die Aufgaben dieser Rolle, warum Deep-Tech-Unternehmen besonders davon profitieren, wann ein Teilzeit-CTO und wann ein Vollzeit-CTO sinnvoll ist, einen Kostenvergleich für den Berliner Markt sowie wichtige Auswahlkriterien.

AI/ML

Claude Code Skills: Wie man sie einrichtet und verwendet

Erfahren Sie, wie Sie Claude Code Skills erstellen und verwenden: Ordnerstruktur, YAML-Frontmatter, progressive Offenlegung und wann Skills besser sind als sich zu wiederholen.

Showing 12 of 52

Follow Me