
Code Factory Reviews
Code Factory Reviews
Schon lange Zeit schaue ich durch die Produktbrille und den Code auf Software. Seit ca. 2024 ist die Umsetzung von Ideen mit KI-Unterstützung für mich zur Selbstverständlichkeit geworden. In den letzten Monaten sind die Tools und die Qualität des generierten Codes sowie die methodische Herangehensweise stetig besser geworden. Nach und nach ist so ein kleines ‘Monkey-Verse’ entstanden :)
Experimente und Projekte
Zu Beginn habe ich Webdesigns (so wie jenes für diese Website hier) oder kleinere Tools umgesetzt. Etwa solche Tools, die ich persönlich gerne nutzen wollte, wie eines für die Generierung von Sprites. Diese Phase umfasst wohl etwa 50-70 Kleinprojekte. Dabei habe ich enorm viel gelernt. Die Experimente haben dazu beigetragen, Limitierungen von Werkzeugen und Modellen auszuloten und die eigenen Prozesse zu optimieren, so dass ich heute viel effizienter und konsistenter zu guten Ergebnissen gelange.

Tool zur Sprite-Generierung
Aus Neugier habe ich diverse Anwendungsfälle durchiteriert (z.B. ob man sich schnell eine Meta-Jobbörse basteln kann) und natürlich auch verrückte Experimente gewagt (z.B. ein Tool, um dystopische Vorhersagen zu Ereignissen und deren Impact auf Wirtschaft, Gesellschaft und Umwelt zu generieren).

Meta-Jobcrawler & dystopische Prediction-Engine
Für mich hat sich herauskristallisiert, dass man eigentlich 100% aller Produktivitätstools direkt für Eigenbedarf umsetzen kann. Das ist nicht immer sinnvoll, aber prinzipiell möglich. Interessant und durchaus nervenaufreibend fand ich etwa die Umsetzung eines Mail-Clients mit KI-Unterstützung, der mir direkt die Aufgaben extrahiert und bewertet, was überhaupt zu lesen sei. Nervenaufreibend war es, weil ich mich im Zuge dessen zwangsläufig mit den vielen Details auseinandersetzen musste, die man bei der Nutzung von Mail-Programmen nicht direkt wahrnimmt.

Tool für alle (Biz) Zwecke inkl. AI-Mailclient
Nach einer Weile KI-Coding wurde mir klar, dass die Limitierung der Code-Factory vor allem im Ansatz des Ideen- und Spezifikationsmanagements zu sehen ist. Wenn schnell abgearbeitet werden kann, muss schnell spezifiziert werden. Z.B. wenn man möglichst sofort etwas in sinnvoller Qualität umsetzen und testen will.
So entstanden die Tools MonkeyIdeas und VibeThis. Tools wie TemplAIte setzen einen anderen Schwerpunkt - sie sollen den Prozess der Entwicklung mit KI unterstützen und methodische Vorgehensweisen etablieren.

MonkeyIdeas, VibeThis & TemplAIte
Ein besonderes Thema ist die Entwicklung und Arbeit mit Agenten. Dies betrifft für mich mindestens zwei Oberthemen: 1. Die Entwicklung guter Agenten selbst und 2. die Integration von Agenten in bestehende (menschenbezogene) Systeme und Workflows. Für den ersten Punkt, also die Entwicklung von Agenten, habe ich verschiedene Ansätze ausprobiert (und dabei CrewAI, Langchain, Mastra etc. verwendet), um zu verstehen, was gut funktioniert und was nicht. Für den zweiten Punkt hat mich auch die Frage der Visualisierung von komplexen Interaktionen interessiert, und wie man das Zusammenwirken von Mensch und Maschine metaphorisch umsetzen kann. Dafür habe ich Agents in Office-Environments ‘gesteckt’ und dem menschlichen User somit die Möglichkeit gegeben, mit diesen Agenten wie in einem Spiel zu interagieren und zu arbeiten.

MonkeySIM (Vorläufer von Habitat)
Monkeytribe ist aktuell in der Entwicklung und fokussiert auf die hybride (menschliche und agentische) Kollaboration, wofür semantische Modelle aus einer menschlichen Umgebung (Ziele, Projekte, Aufgaben etc.) benötigt werden. Habitat untersucht näher die Ebene von spatial interactions und ist als agent-agnostischer Service zu verstehen, in dem Agenten um eine räumliche Erfahrungswelt ergänzt werden. In Habitat können sich beliebige Agenten (z.B. ein Cursor-Agent) connecten und dann z.B. in ein Büro eintreten und mit Objekten interagieren, die dann Tools bereitstellen (z.B. eine Vektor-Datenbank oder Emails). Der Nutzer kann hier definieren, welche Optionen existieren und dann auf räumlicher Ebene dem Treiben der Agenten zusehen oder mit diesen interagieren. Es lässt sich auch hervorragend dazu nutzen, die Performance von Agenten zu benchmarken.

Habitat & Monkeytribe (hybrid Team OS)
Neben einfachen Agents habe ich komplexere Agenten oder Multi-Agenten Ansätze untersucht. OpenMonkey ist sowas wie mein eigener OpenClaw Agent, der aber in einigen Bereichen anderen Design-Prinzipien zugrunde liegt. Meine Test-Instanz heißt Computerklaus und bringt einige interessante Features mit. Z.B. kann ich Modelle für Aufgaben präferieren, habe sowohl eine Admin-Oberfläche mit Kanban-Board als auch gute Observability-Optionen. Via CLI bzw. besser gesagt TUI (Terminal User Interface) kann ich mit Computerklaus interagieren. Dieser arbeitet dann im Hintergrund und kann sich bis zu einem gewissen Grad selbst weiterentwickeln. In einem Obsidian-Vault arbeiten wir an einer gemeinsamen Team-Wissensbasis, was enorm praktisch ist.

Agenten wie OpenMonkey
Insights nach zwei Jahren AI-Entwicklung
Zusammenfassen lassen sich die vielen Eindrücke fast gar nicht. Hier sind einige Punkte, die ich für relevant halte:
- Qualität bekommt man hin, wenn man möchte. Es gibt sehr viele Aspekte, die man kritisch sehen muss und sollte, seitdem KI vermehrt bei der Entwicklung eingesetzt wird. Aber die meisten Probleme entstehen aus meiner Sicht durch fehlende Methode und Fahrlässigkeit.
- Es ist inzwischen sehr einfach geworden, ein gewöhnliches UI Design mit gängigen Layouts und Designparametern umzusetzen. Schwierig ist es immer noch, z.B. eine radikal neue Designsprache zu realisieren. Dies kann man auch auf viele andere Bereiche übertragen - KI ist sehr gut in der Imitation geworden, aber immer noch schlecht in der Lösung von kreativen Aufgaben.
- Die Güte der Spezifikation hat immer noch erheblichen Einfluss auf die Qualität einer Lösung. Auch wenn immer mehr mit Planning-Modes gearbeitet wird, bleibt die Spezifikation von besonderer Bedeutung. Planning Modes helfen defizitäre Planung zu überbrücken, wenn man aber genaue Vorstellungen hat, ersetzen diese nicht die detaillierte Planung.
- Tools und Modelle sind heute universeller einsetzbar. 2024 gab es hier im Vergleich dazu dramatische Unterschiede darin, was funktioniert hat und was nicht. Heute kann man mit vielen Modellen und Tools arbeiten. Eine gute Methode heute macht sich unabhängiger von einem spezifischen Tool (wie etwa Claude Code), und setzt stattdessen auf universellere, wiederholbare Ansätze. Umgekehrt gilt jedoch auch: Die Spezifika jedes Tools und jedes Modells sollte man auszunutzen wissen.
- Firmen können heute schnell in Abhängigkeiten von KI Services oder Infrastrukturen geraten. Dies muss strategisch betrachtet werden. Ich versuche für meine bescheidenen Zwecke immer redundante Möglichkeiten aufzubauen, um Abhängigkeiten zu vermeiden.
- Kontext Management und Token-Verbrauch sind Disziplinen, die Übung erfordern. Ich habe in einigen Experimenten gelernt, wie groß die Unterschiede sein können, wenn man Datengrundlage, Kontext und Memory optimal nutzt.
- Der Gesamtzustand von Agenten-Systemen ist insgesamt schwer zu kontrollieren. Etwas, was für nicht-lineare komplexe Systeme typisch ist.
- Die Arbeit mit und an Ideen ist der wahre Engpass. Denn die Güte von Ideen wird in einem menschlichen Erfahrungsraum definiert. Organisationen müssen heute schnell lernen, innovativ zu denken, zu experimentieren und Relevantes schnell zu erkennen. Dies wird nun zu einer überlebensnotwendigen Fähigkeit, da Code nun jeder produzieren kann.
- Für mich ist noch nicht final beantwortet, wie KI und Menschen eines Tages optimal zusammenarbeiten werden. Viel Hype entsteht dabei, was KI leisten kann. Doch am Ende des Tages wird wichtiger sein, wie Menschen mit KI sinnvoll arbeiten können, ohne sich dabei zu entwerten und um neue Möglichkeiten zu erschließen. Das ist noch nicht ansatzweise gelöst.
- Auf meiner bisherigen Expedition habe ich einige Bereiche entdeckt, die bislang noch völlig unterbelichtet sind. Diese werde ich in den kommenden Monaten vertiefen. Z.B. zählt hierzu, welche Tools und Services Agenten benötigen und wie nachhaltig nutzbare ‘KI-Betriebssysteme’ für Organisationen aussehen werden. Denkmuster und Feature werden heute noch an das Tradierte angeflanscht. Mittelfristig mag das noch klappen, längerfristig geht es aber um neue Denkmuster und Systeme, die kontrolliert erschlossen werden müssen.
