
Schwarmzeit: Brauchen Agenten eine Organisationsform?
Governance von agentischen Belegschaften
Agenten denken wir heute meist als schlauen Workflow oder als hyperaktiven Chatbot — das funktioniert, solange einzelne Aufgaben delegiert werden. Sobald mehrere Agenten parallel an echten Wertschöpfungsprozessen arbeiten, verschiebt sich die Perspektive: es stellt sich die Frage nach der Orchestrierung digitaler Belegschaften. Die Leitfrage lautet dann nicht mehr „welches LLM-Modell?“, sondern wie ein chaotisches, sozio-technisches System aus Menschen, Regeln, Budgets und vielen Interaktionen überhaupt vernünftig gesteuert wird.
Architektur und Token-Budgets reichen nicht mehr für die Betrachtung; Governance rückt in den Fokus.
Am Markt kristallisieren sich verschiedene Dimensionen heraus:
- Assistive Einbettung: KI im bestehenden Stack (ERP, CRM, Vertragsworkflow) mit Human-in-the-Loop am Entscheidungspunkt — der pragmatische Einstieg für die meisten Unternehmen.
- Orchestrierung: Sobald mehrere Agenten zusammenarbeiten, braucht es Koordination — klare Rollen, Aufgabenlisten, Freigaben („darf dieser Schritt wirklich raus?“). Kritisch ist die Trennung der Funktionen: Ein Agent darf nicht gleichzeitig planen, ausführen und seine eigene Arbeit abnehmen — das wäre wie ein Mitarbeiter, der sich selbst einstellt, bezahlt und am Jahresgespräch lobt. In der Forschung heißt das Logic Monopoly; in Unternehmen heißt es schlicht: Strategie, Umsetzung und Kontrolle gehören getrennt — auch bei KI.
- Protokolle: Damit Schwärme nicht in Silos enden, braucht es Standards für Zusammenspiel — nicht zu verwechseln mit Blockchain-DAO-Protokollen weiter unten. MCP (Model Context Protocol) verbindet Agenten mit Tools und Daten; A2A (Agent2Agent, Linux Foundation) standardisiert Agent-zu-Agent-Kommunikation über Framework-Grenzen hinweg (Discovery via Agent Cards, Tasks, Auth). IBMs ACP ist in A2A aufgegangen — ein Hinweis, wie schnell sich die Schicht konsolidiert. Praxisregel: MCP für Werkzeuge, A2A für Delegation zwischen Agenten.
- Maschinenlesbare Leitplanken: Weg vom Freitext-Prompt zu Budget- und Rollen-Verträgen (die Forschung zu Agent Contracts zeigt die Richtung).
- Identität, Credentials und Least Privilege: In der Praxis existiert das längst — nur verstreut. Jeder Modell-Call hängt an API-Keys mit eigenen Limits; jedes MCP-Tool an separaten Zugangsdaten oder OAuth-Tokens (Remote-Server laut MCP-Authorization an IdPs wie Okta oder Entra ID). Der Engpass ist nicht „ob Agenten Konten brauchen“, sondern einheitliche Zuordnung: Welcher Agent, welcher Run, welcher Key, welcher Scope — und wer das im Log nachvollziehen kann. Sonst sind Provider-Budgets nur FinOps, keine organisatorische Kontrolle.
- Kostenkontrolle: Wer Multi-Agenten-Setups baut, kennt die Rechnung — oft erst im Provider-Dashboard (OpenAI, Anthropic, Azure OpenAI, Bedrock). Drei Agenten, die parallel denselben Kontext neu rechnen; Retry-Schleifen nach Fehlern; „nur kurz“ das große Modell für jeden Teilschritt: Token-Kosten skalieren mit Versuchen, nicht mit Ergebnissen (in der Literatur Agentic Speculation). Praxishebel sind banal, aber wirksam: Budget-Alerts und harte Caps pro Key/Projekt, kleinere Modelle für Routinetasks, Prompt-Caching, Abbruch bei Timeout, Kosten-Tracking pro Run (z.B. über Observability-Tools). In Web3-/Infrastruktur-Projekten kommen zusätzlich tokenisierte Compute-Netzwerke ins Spiel — für normale Enterprise-IT reichen API-Limits und FinOps-Disziplin.
Doch neben vielen in erster Linie technokratisch getriebenen Ansätzen ist auch gerade der Blick auf die organisationstheoretische Ebene interessant.

Governance Design
Ansatz 1: Holokratie - Rollen und Zwecke
Holokratie ist in erster Linie ein Kultur- und Organisationsmodell für Menschen — mit Rollen statt Jobtiteln, Kreisen statt Abteilungsmauern und Meetings, die Verantwortung umschreiben dürfen (Wikipedia ). Wer Holokratie in echt eingeführt hat, kennt die emotionale Seite: Machtverschiebung, Reibung, Lernkurve. Das ist keine Software-Story.
Für die Agenten-Organisation leihen wir uns daraus Konzepte, es geht nicht um ein 1:1-Org-Design: Agenten brauchen keine Karrierepfade, aber saubere Zuständigkeitsgrenzen und klare Übergaben. In einem holokratisch inspirierten Setup bekommt ein Agent keine „Position“, sondern einen Verantwortungsraum — festgehalten als Zweck, erlaubte Inputs/Outputs, Tools und Eskalationsregeln, wir verlassen uns nicht auf vage „du bist der Marketing-Agent“-Prompts.
Vorteil: Rollen lassen sich optimieren, ohne das Gebäude abzureißen. Wenn ein Prozess kippt, wird die Rolle angepasst oder gesplittet, statt das gesamte System umzubauen.
Reibungspunkt: Koordinationskosten — und Token-Kosten. Was bei Menschen als Governance-Meeting läuft, kann bei Agenten als endlose Delegations- und Rückfragekette enden. Wenn mehrere Agenten parallel verschiedene Lösungswege ausprobieren (Agentic Speculation), steigt die Rechnung mit jedem Versuch — nicht nur mit dem Ergebnis. Dann hilft die flexibelste Rollenlogik wenig: man benötigt zudem harte Budget-Grenzen (pro Api-Key, Projekt, Run) und bindende Regeln dafür, was ein Agent darf und wann er seine Aktivität abbrechen muss, damit Kosten und Risiken eingegrenzt werden.
Typischer Fit: Hybride Wissensarbeit (Content, Produkt, Forschung), in der Kontextwechsel häufig sind und Rollen laufend nachgeschärft werden müssen.
Was die Forschung dazu sagt: Simulationen wie CareerAgent testen holokratische Mechaniken (Tactical Meetings, Rollenwechsel) an LLM-Agenten — als Labor, nicht als Ersatz für Organisationsentwicklung mit echten Teams (arXiv:2408.11826 ). Das Ergebnis ist lehrreich: Kompetenz-Silos und explodierende Abstimmungskosten sind auch digital real. Praktisch brauchen KI-Rollenfüller dieselbe strukturierte Sync-Oberfläche wie Menschen (z. B. Tactical-Meeting-Rhythmen), sonst ersetzen wir Flurgespräche durch Prompt-Schleifen. Robertson selbst argumentiert für hybride Ansätze: menschliche Rollenautorität, wo Urteil nötig ist; harte Regeln, wo Automatisierung reicht (HolacracyOne ).
Ansatz 2: Agentic DAO - Anreize und Protokolle
DAOs (Dezentrale Autonome Organisationen) organisieren Kooperation nicht primär über Organigramme, sondern über Smart Contracts, Voting, Rechte und Treasury-Regeln (ethereum.org , OpenZeppelin , Aragon ).
Das passt in gewisser Hinsicht sehr gut zu Agenten-Systemen: Agenten reagieren konsistent auf formalisierte Regeln, Schwellenwerte und Berechtigungen. Eine Agentic-DAO-Logik verwandelt Teamsteuerung in ein protokollierbares Regelwerk für Ausführung, Budget und Eskalation.
Vorteil: kausale Klarheit. Wer was darf, wer abstimmt, wann ein Schritt ausführbar ist und wie Mittel freigegeben werden - alles ist explizit modellierbar.
Reibungspunkt: die Folgen von Rigidität. Je härter das Regelwerk, desto teurer werden Richtungswechsel. Was strategisch “eigentlich klar” ist, kann operativ an vielen Governance-Parametern hängen.
Das Prinzipal-Agenten-Problem: In der Ökonomie beschreibt der Prinzipal-Agenten-Konflikt das Dilemma, wenn ein Beauftragter andere Interessen verfolgt als der Auftraggeber. Das gilt für jedes delegierte Multi-Agenten-Setup — in DAOs besonders sichtbar, weil Anreize oft im Vertrag stehen (Smart Contract). Das Problem verschärft sich durch KI-Agenten: Sie haben kein moralisches Pflichtbewusstsein, sondern das, was im Auftrag und in den Metriken als Erfolg gilt (Zielvorgaben, Rewards, KPIs; ökonomisch die Utility Function) — und im DAO-Fall zusätzlich das, was Smart Contracts belohnen oder erlauben. Ist das Anreizsystem unsauber geschnitten, findet der Agenten-Schwarm ökonomische Lücken: Er maximiert seine sichtbare Sub-Metrik (z. B. Token-Verbrauch, Task-Throughput), während das Unternehmen die Kosten trägt — rationales Silo-Verhalten, Compute auf Vorrat, Runaway-Kosten.
Typischer Fit: Kapitalnahe oder risikoexponierte Prozesse (Treasury, automatisierte Budgetierung, tokenisierte Incentives), bei denen Revisionssicherheit und manipulationsarme Regeln wichtiger sind als maximale Improvisation.
Was die Forschung dazu sagt: DAOs kämpfen oft mit Beteiligungsmüdigkeit; Agenten als Governance-Helfer oder Stimm-Delegierte sind deshalb ein attraktives und aktives Experimentierfeld (u.a. DAO-AI ). Architektonisch warnen Arbeiten wie AgentCity vor dem Logic Monopoly — dem Muster, dass ein Agent zugleich Vorgaben macht, Aufgaben ausführt und das Ergebnis selbst für gut befindet. Stattdessen sollen drei Funktionen getrennt bleiben: Regeln und Budget festlegen, ausführen, unabhängig prüfen und eskalieren. Entscheidend ist, dass diese Trennung im laufenden System steckt (Verträge, Policies, Audit-Logs) — sie existieren dann nicht nur als Kästchen im Organigramm.
In der Realität: Drei Betriebslevel
Nach den beiden Ansätzen (DAO/Holokratie-Adaption für agentische Organisation) folgt jetzt die zweite Achse: der KI-Autonomiegrad. Wer nur Holokratie oder DAO liest, versteht evtl. das organisatorische Zielbild — doch wichtig ist die Hinzunahme einer Unterscheidung, wie tief bzw. weitreichend der autonome Einsatz von Agenten organisiert ist:
LEVEL 1) Assistiver Einsatz von KI
Der Mensch bleibt Entscheider, Agenten erledigen die Zuarbeit — der Mainstream in vielen Unternehmen, meist ohne formale Organisation im weiteren Sinne, aber mit Spielregeln, z.B. Freigabe-Workflows (Freigabe vor Senden, Zahlen, Buchen) oder Token-Vorgaben (KPI vs. Budget).
LEVEL 2) Hybride Organisation (Mensch und KI)
Agenten führen zwar Teilprozesse autonom aus, aber Menschen steuern und orchestrieren, setzen Ziele, definieren Eskalationsregeln und Qualitätsgrenzen. Das ist organisatorisch bereits sehr anspruchsvoll, aber aktuell eventuell der produktivste Sweet Spot — und möglicherweise auch der natürliche Nährboden für Holokratie-ähnliche Ansätze: Menschen besetzen Meta-Kreise (Zweck, Prioritäten, Konfliktlösung), Agenten füllen operative Rollen mit klaren Zuständigkeiten aus.
LEVEL 3) Voll-autonome virtuelle Organisation
Agenten koordinieren Agenten — inklusive Delegation, Budgetverbrauch und Priorisierung. Auf dem Papier klingt das nach „Company auf Autopilot“. In der Praxis funktioniert Voll-Autonomie nur mit harten Grenzen, nicht mit lockerer Rollenbeschreibung allein.
Dazu braucht es mindestens drei Dinge: Budget-Obergrenzen (wann stoppt der Schwarm?), klare Agenten-Identitäten (wer hat welche Aktion ausgeführt?) und Audit-Trails (welche Entscheidung, welche Policy?). Im Enterprise-Kontext kommen diese meist aus Policy-Engine und FinOps; in Web3-Setups eher aus Smart Contracts und der DAO-Infrastruktur. Fehlen solche Regelungen und Grenzen, explodieren Kosten und Risiken.
Ohne Behavioral Tracing funktioniert alles nicht
Unabhängig von Blueprint und Modus entscheidet ein Querschnittsthema über Steuerbarkeit: Observability auf Entscheidungsebene. Früher reichten Infrastruktur-Metriken; in Agenten-Units muss der Entscheidungsstrom sichtbar werden:
- Welcher Agent hat entschieden?
- Auf Basis welcher Daten?
- Mit welchem Budget?
- Mit welchem erwarteten und tatsächlichen Effekt?
- Welche Policy hat den Schritt erlaubt oder blockiert?
Wir loggen damit nicht nur Fehler, sondern die Kette aus Ursache und Wirkung — der Unterschied zwischen technischer Demo und Grundlage für echten Betrieb. Dazu passt dieselbe Trennung wie bei AgentCity : Wer Regeln und Budget setzt, darf nicht dieselbe Instanz sein, die ausführt oder unabhängig prüft und eskaliert. Behavioral Tracing muss das im Log belegen — welcher Agent in welcher Rolle handelte — nicht nur auf Folien behaupten.
Einen Schritt weitergedacht geht es nicht nur um mehr Logging-Daten und die Grundlagen für Compliance, sondern auch eventuell um einen predictive Killswitch (~ ein vorsorgliches Not-Aus) — je nach Level der Automatisierung.
Von Tech zur organisatorischen Kernfrage
Viele Teams diskutieren Agenten noch als Effizienz-Addon, als unfairen Wettbewerbsvorteil, der möglichst schnell adaptiert sein müsse — sobald aber mehrere Kernprozesse berührt sind, wird daraus eine harte Frage der Organisationsentwicklung. Die Qualität dieser Entwicklung (und somit der nächsten Jahre) entscheidet sich nicht am Modellnamen, sondern an definierbaren Klarheiten: Rollen (wer darf was), Policies (unter welchen Bedingungen), Zielsetzungen (für welche messbaren Effekte), Budgets (mit welchen Grenzen), Audit (wie ist es belegbar).

Governance-Design als Kernfrage
Wo endet Delegation, wo beginnt Haftung?
Rechtlich bleibt in den allermeisten Setups der Mensch (bzw. das Unternehmen) der Prinzipal — der Agent ist nur Werkzeug und virtueller Beauftragter. Pragmatisch heißt das: Jede autonome Aktion braucht einen benannten Owner, kritische Schritte eine Vier-Augen-Freigabe, und das Tracing / Logging muss transparent machen, wer für Delegation zuständig war und welche Policy gegriffen hat.
On-Chain-DAO-Strukturen verschieben Teile der Verantwortung in Verträge und Token-Halter — das ist ein eigenes Rechts- und Compliance-Feld, kein Standard-ERP-Upgrade. Für den Mittelstand reicht oft: Haftung dort, wo heute schon IT- und Prozessverantwortung sitzt; Agenten erweitern die Fläche und die damit verbundene Komplexität, nicht die Ausnahmen.
Pragmatischer Einstieg
Wer heute meist lediglich ChatGPT im Browser nutzt, startet sicher nicht mit Smart Contracts, sobald die ersten Agenten in Abläufe integriert werden. Sondern eventuell damit Rollenchaos zu beseitigen:
- Eine virtuelle Pilot-Unit, drei bis fünf Rollen: Definiert für jeden Agenten-Zweck den grundlegenden Kontext und Ziele, erlaubte Tools und Skills, Limitierungen / Einschränkungen und Eskalationsregeln bei denen Menschen involviert werden müssen — das ist ein bisschen Holokratie-Light und kein Organisations-Umbau.
- Hybrid erzwingen: Alles mit externer Relevanz (Mail, Zahlung, Deploy, Kundendaten) bleibt ausschließlich assistiv, strikt kontrolliert — nur mit Freigabe; unkritische, interne Zuarbeit (Recherche, Entwürfe, Tests) kann autonom laufen.
- Transparenz vor Skalierung: Erst wenn Entscheidungen nachvollziehbar geloggt sind, sollte man den Grad an Autonomie und den Einsatz von Budget vorsichtig erhöhen — sonst skaliert ihr die Unsicherheit (und damit das Risiko) mit.
Der Sprung von „Chat-Bot“ zu „Agenten-Belegschaft“ ist ein Stufenplan, kein Big Bang. Wichtig ist der Erfahrungsaufbau. Harte, technisch durchsetzbare Regeln — feste Budget-Limits, verifizierbare Agenten-Identitäten, revisionssichere Logs, im Extremfall Smart Contracts — kommen erst, wenn autonome Agenten wirklich zuverlässig funktionieren, transparent und innerhalb ihrer Grenzen agieren. Nicht, weil der Hype es verlangt.
Fazit: Relevanz entsteht im hybriden Kern
Für die Zukunft geht es nicht wirklich um die Frage nach „Holokratie vs DAO“, sondern um die Synthese aus organisatorischen Ansätzen und Governance-Systemen: Rollen- und Zwecklogik als geteilte Konvention, Protokoll- und Budgetlogik für Rahmenbildung — eingebettet in hybride Betriebsmodi, in denen Menschen mehr Meta-Entscheidungen treffen und Agenten zunehmend operative Lasten tragen. Menschen verschwinden dabei nicht; sie wechseln vom Task-Erfüller oder Task-Manager hin zum Architekten von Outcome-Pipelines. Agenten kommen immer weiter zum Einsatz, das Thema ist also nicht Science-Fiction. Die technokratische Opportunität ist hierbei wieder einmal schneller als die disziplinierte Organisationsarbeit und eine gesunde Transformation. Damit bleibt viel Arbeit, die vor uns liegt. Neben aller Technik und Theorie — die echten Herausforderungen entstehen in der menschlichen Realität. Wie genau Menschen und Maschinen in ein paar Jahren kollaborieren werden, welche Organisationsformen und Governance-Modelle für autonome Agentenschwärme etabliert werden, ist aktuell nicht abzusehen. Auseinandersetzen muss man sich mit dem Thema jedoch heute bereits.
Frage an euch: Welche Ansätze zur Zusammenarbeit von Menschen und KI-Agenten habt Ihr umgesetzt und wie sind die Erfahrungen?


