Wie itestra Agentic AI in Enterprise-Software einsetzt : itestra

10. März 2026

Principal Software & AI Engineer

Die Kurve wird senkrecht

Werkzeuge kommen und gehen – der Grundvertrag der Softwareentwicklung blieb jahrzehntelang derselbe: Menschen formulieren die Absicht, Maschinen führen aus. Assembler, COBOL, SQL, Java, IDEs, Open-Source-Ökosysteme, Cloud-APIs – jede Generation hob die Produktivitätsgrenze an, ohne diesen Vertrag anzutasten.

Agentic AI kündigt diesen Vertrag. Nicht schrittweise, sondern abrupt. Werkzeuge wie Claude Code vervollständigen keinen Code – sie planen Features, implementieren sie, schreiben Tests, führen diese aus, beheben Fehler und erstellen Dokumentation. Autonom, über ganze Codebasen hinweg, mit einer Tiefe, die kein früheres Werkzeug auch nur annähernd erreicht hat. Was die Produktivitätskurve in sechs Jahrzehnten aufgebaut hat, hat sich in den letzten 18 Monaten nochmals vervielfacht.

Die Ergebnisse sind messbar und bereits im Produktivbetrieb nachgewiesen. Ein C-Compiler mit 100.000 Zeilen Code – vollständig autonom entwickelt, inklusive detaillierter Tests, in zwei Wochen (Anthropic, Februar 2026). Sicherheits- und Abhängigkeitsupdates automatisch generiert mit einer Akzeptanzrate von 86,5 % (AIDev/GitHub, Januar 2026). Legacy-Systeme, deren Analyse und Migration früher Jahre in Anspruch nahm, in Quartalen abgeschlossen. Das sind keine Laborergebnisse – das sind Projekterfahrungen aus dem echten Betrieb.

Was die Produktivitätsdiagramme nicht zeigen: die Fehlermodi. Ein KI-Agent ohne die richtige menschliche Urteilsschicht arbeitet nicht einfach langsamer – er geht mit hoher Geschwindigkeit selbstsicher in die falsche Richtung. In Enterprise-Umgebungen, wo Geschäftslogik jahrzehntealt ist, regulatorische Anforderungen nicht verhandelbar sind und eine falsche Architekturentscheidung Millionen kosten kann, ist dieses Risiko keine Theorie.

Genau hier setzt die itestra AI Software Factory an: Der Produktivitätssprung ist real. Ihn im Enterprise-Kontext zu nutzen erfordert jedoch Senior-Engineering-Urteilsvermögen an jedem kritischen Entscheidungspunkt. Der Mensch im Loop ist nicht das Sicherheitsnetz – er ist das Produkt.

Sechs Jahrzehnte Produktivitätsfortschritt – und ein echter Wendepunkt

ai-productivity-de

Jede Ära der Entwicklungswerkzeuge hat spürbare Fortschritte gebracht. Der Grundmechanismus war dabei stets derselbe: Entwickler schreiben Code, Werkzeuge helfen ihnen, das schneller oder fehlerfreier zu tun.

Der Übergang von 3GL zu 4GL, von prozeduraler zu objektorientierter Programmierung – jeweils 2–3x Produktivitätszuwachs für die richtigen Problemtypen. IDEs brachten Debugging, Refactoring und Autovervollständigung. Open-Source-Ökosysteme wie GitHub und npm eliminierten ganze Klassen gelöster Probleme. Cloud-Infrastruktur abstrahierte operative Komplexität weg.

Eine auffällige Ausnahme im Aufwärtstrend: verteilte Entwicklung. Offshoring und Nearshoring brachten Koordinationsaufwand mit sich, der die Kostenvorteile in vielen Organisationen teilweise aufzehrte. Die Lehre daraus: Rohes Ressourcendenken ohne Wissensabgleich und Qualitätskontrolle verschlechtert die Ausgabe. Diese Erkenntnis gilt für KI-Agenten in gleicher Weise.

Generative KI – Coding-Assistenten wie GitHub Copilot oder frühe Claude-Versionen – hat ab 2023 erste substanzielle Produktivitätsgewinne geliefert. Schnelleres Boilerplate, bessere Suche, hilfreiche Vorschläge. Entwickler behielten die vollständige Kontrolle über jede Zeile, die in Produktion ging.

Agentic AI, wie sie seit 2025/2026 verfügbar ist, ist kategorial anders. Ein Agent schlägt keine Funktion vor – er implementiert ein Feature, schreibt die Tests, führt sie aus, behebt die Fehler und dokumentiert das Ergebnis. Die Rolle des Menschen verschiebt sich vom Schreiben zum Steuern. Das ist ein fundamental anderes Verhältnis zur Maschine – und es verlangt ein fundamental anderes Liefermodell.

Was „autonom” im Enterprise-Kontext wirklich bedeutet

„Autonom” klingt in einem Greenfield-Startup anders als in einer Enterprise-Umgebung, die auf 30 Jahre alter Geschäftslogik läuft. Enterprise-Software hat Eigenschaften, die unkontrollierte KI-Autonomie zu einem echten Risiko machen.

Geschäftslogik ist unersetzlich – und oft undokumentiert. Jahrzehnte regulatorischer Änderungen, Produktiterationen und Sonderfallbehandlungen sind in Code eingebettet, den niemand mehr vollständig versteht. Ein KI-Agent, der die Absicht einer kritischen Berechnung falsch auslegt und diesen Fehler über eine refaktorierte Codebasis propagiert, erzeugt ein Problem, das um ein Vielfaches schwerer zu diagnostizieren ist als die ursprüngliche technische Schuld.

Architekturentscheidungen wirken lange. Wer Service-Grenzen, Datenmodelle oder Integrationsmuster falsch setzt, schränkt die Weiterentwicklung über Jahre ein. Solche Entscheidungen erfordern nicht nur Verständnis der Codebasis, sondern auch der Geschäftsstrategie, des regulatorischen Umfelds und der operativen Rahmenbedingungen – nichts davon liegt im Repository.

Compliance ist nicht verhandelbar. Finanzinstitute, Versicherungen und Gesundheitsorganisationen operieren unter Regularien – DORA, DSGVO, GxP, Solvency II –, bei denen Datenhandhabung, Nachvollziehbarkeit und Prozessdokumentation rechtliche Anforderungen sind. Ein KI-Agent, der auf öffentlichen Internetdaten trainiert wurde und auf Infrastruktur außerhalb der EU läuft, ist kein konformes Werkzeug – unabhängig von der Qualität seiner Ausgabe.

Autonomie vergrößert die Angriffsfläche. Ein KI-Agent mit weitreichendem Codebase-Zugriff und Ausführungsrechten ist ein erhebliches Sicherheitsrisiko. Ohne Sandboxing, Zugriffskontrollen und Review-Schranken können Effizienzgewinne durch eingeführte Schwachstellen wieder aufgezehrt werden.

Keines dieser Hindernisse bedeutet, dass Agentic AI in Enterprise-Umgebungen nicht einsetzbar wäre. Es bedeutet, dass der verantwortungsvolle Einsatz eine bewusste Architektur erfordert: wie der Agent operiert, wo menschliches Urteil eingreift und wie Compliance durchgehend gewahrt bleibt.

Die itestra AI Software Factory

Die itestra AI Software Factory ist die operative Antwort auf diese Enterprise-Anforderungen. Es geht nicht darum, KI-Werkzeuge auf einen bestehenden Prozess aufzuschrauben – sondern um ein neu gedachtes Liefermodell, in dem die Rollen von Mensch und KI für jede Phase des Software-Lebenszyklus explizit definiert sind.

Der Ablauf führt von High-Level-Anforderungen über Konzeption und Umsetzung bis zu Verifikation und Deployment. An jeder Station ist klar geregelt: Was erledigt der KI-Agent eigenständig? Was geschieht unter menschlicher Aufsicht? Und wo liegt die Entscheidung ausschließlich beim Menschen?

Konzeption und Architektur: Menschliches Urteil, KI-gestützt

Anforderungsanalyse und Architekturentwurf bleiben in menschlicher Hand. Domain-Experten und Senior Engineers übersetzen Geschäftsabsichten in Implementierungspläne, bewerten Architekturvarianten und treffen die Entscheidungen, die alles Nachgelagerte bestimmen. KI-Agenten unterstützen diese Phase – sie analysieren bestehende Systemstrukturen, identifizieren relevante Muster und halten den Ist-Zustand fest – die Entscheidungen selbst verantworten die Menschen.

Das ist kein Zufall. Architektur ist die Phase, in der Fehler am teuersten werden und in der Domain-Wissen – regulatorischer Kontext, Geschäftsstrategie, organisatorische Rahmenbedingungen – am meisten zählt. KI-Agenten, die auf Code-Korrektheit optimieren, ohne diesen Kontext zu kennen, produzieren technisch stimmige, aber strategisch falsche Ergebnisse.

Code, Tests, Dokumentation: KI-Agenten arbeiten eigenständig

Hier schreiben Agenten Code, entwickeln Tests, führen sie aus, prüfen Sicherheitslücken, aktualisieren Abhängigkeiten und halten Ergebnisse schriftlich fest. Das ist die Zone, in der die 3–10x Effizienzgewinne entstehen.

Agenten laufen in Sandbox-Umgebungen mit definierten Zugriffsgrenzen. Sie eskalieren proaktiv, sobald sie auf Mehrdeutigkeiten oder Entscheidungen stoßen, die ihren definierten Scope überschreiten. Senior Engineers prüfen Ergebnisse an strukturierten Checkpoints – eine Verschiebung von manueller Ausführung zur Ergebnisverifikation.

Die Zahlen aus itestras eigenen Projekten sind konkret: Ein neues Feature in einem produktiven ERP-System mit mehr als einer Million Zeilen Code – autonom entwickelt inklusive End-to-End-Tests in unter zwei Stunden. UI-Tests für einen neuen Antragsprozess, generiert aus Screenshots des Altsystems, ebenfalls in unter zwei Stunden. Architektur-Dokumentation für ein Mainframe-System mit über einer Million Zeilen Code in einer Stunde. Diese Ergebnisse stammen aus produktiven Kundenprojekten (Februar 2026) – keine Proof-of-Concepts.

Compliance und Souveränität: Enterprise-taugliche Infrastruktur

Alle KI-Modelle in der Software Factory laufen auf AWS Bedrock mit vollständiger EU-Datenresidenz. No-Training-Policies stellen sicher, dass Kundendaten und -code niemals zur Verbesserung von Foundation-Models verwendet werden. Der Urheberrechtsschutz für KI-generierte Ausgaben ist vertraglich gesichert. Das sind keine nachträglichen Überlegungen – sie sind Designanforderungen, die der Werkzeugauswahl vorangehen.

Der Senior Engineer ist durchgängig präsent: nicht als Zeilenkontrolleur, sondern als derjenige, der Leitplanken setzt, Ergebnisse bewertet und an allen Punkten entscheidet, die Geschäfts- und Regulierungsurteil erfordern. Diese kontinuierliche menschliche Präsenz ist es, die die Autonomie der KI-Agenten im Enterprise-Produktivbetrieb verantwortbar macht.

Ergebnisse aus dem Produktivbetrieb

Das Argument für senior-geführte Agentic AI stützt sich nicht auf Prognosen. Es stützt sich auf Ergebnisse, die 2025/2026 bereits beobachtet wurden – sowohl in itestras Kundenprojekten als auch in der breiteren Industrie:

ERP-System, >1 Mio. LoC: Neues Feature autonom entwickelt inklusive End-to-End-Tests in unter 2 Stunden (itestra, Februar 2026)
Neuer Antragsprozess: UI-Tests autonom generiert aus Screenshots des Altsystems in unter 2 Stunden (itestra, Februar 2026)
Mainframe-System, >1 Mio. LoC: Vollständige Architektur-Dokumentation in 1 Stunde generiert (itestra, Februar 2026)
C-Compiler, 100.000 LoC: Vollständig autonom entwickelt inklusive detaillierter Tests in 2 Wochen (Anthropic, Februar 2026)
Legacy-System-Migration: Komplexe Analyse und Migration in Quartalen statt Jahren (Anthropic, Februar 2026)
Sicherheits- und Abhängigkeitsupdates: Automatisch generiert mit einer Akzeptanzrate von 86,5 % (AIDev/GitHub, Januar 2026)

Der Faktor 3–10x Effizienzsteigerung ist keine Marketingaussage. Er spiegelt die beobachtete Bandbreite über verschiedene Aufgabentypen wider: Analyse- und Dokumentationsaufgaben tendieren zum oberen Ende, komplexe Feature-Entwicklung mit substanziellem Architektururteil eher zum unteren. Diese Varianz ist selbst aufschlussreich – sie zeigt genau, wo menschliches Expertenwissen den Ausschlag gibt.

Wo anfangen

Für Enterprise-Organisationen, die Agentic AI evaluieren, lautet die entscheidende Frage nicht: „Welche Werkzeuge sollen wir einführen?” Sondern: „An welchen Stellen in unserem Entwicklungsprozess zählt menschliches Urteilsvermögen am meisten – und wie lässt sich ein Modell aufbauen, das dieses Urteil bewahrt und gleichzeitig die Effizienzgewinne realisiert?”

Das erfordert eine ehrliche Bestandsaufnahme: Wie ist die bestehende Systemlandschaft beschaffen? Wo klaffen Dokumentationslücken? Welche regulatorischen Anforderungen gelten? Wie ist das Engineering-Team aufgestellt? Und konkret: Welche Entscheidungen können an einen Agenten delegiert werden – und welche nicht?

itestras Einstiegspunkt ist ein gezielter AI Readiness Check – typischerweise in ein bis zwei Wochen abgeschlossen – der die aktuelle Software-Landschaft kartiert, die vielversprechendsten Einsatzfelder für Agentic AI identifiziert und das Governance-Modell für einen verantwortungsvollen Betrieb definiert. Das Ergebnis ist ein konkreter Fahrplan, keine generische Empfehlung.

Wer Agentic AI mit derselben Sorgfalt angeht wie jede andere bedeutende Architekturentscheidung, wird die Produktivitätsgewinne realisieren. Die Werkzeuge sind bereit. Die Frage ist, ob die Urteilsschicht vorhanden ist, um sie gut einzusetzen.

Branchen

Services

Wie itestra Agentic AI in Enterprise-Software einsetzt