Autonome KI-Agenten sind gerade überall. OpenClaw, übrigens von einem Österreicher gebaut, läuft auf zigtausenden Rechnern und zeigt, wie weit so ein selbstständiger Assistent heute kommt. Er liest Mails, durchsucht Dateien, erledigt Aufgaben, ohne dass man ihm jeden einzelnen Schritt vorgibt.
Mich hat daran weniger das fertige Tool interessiert als die Frage dahinter. Muss ich so einen Agenten von der Stange nehmen, oder kann ich mir selbst einen bauen? Einen, der meine eigenen Unterlagen kennt, meine Verträge, meine Angebote, die Notizen aus meinen laufenden Projekten. Und bei dem ich selbst bestimme, was er darf und wer was sieht.
In dieser Serie zeige ich dir Schritt für Schritt, wie du zu deinem persönlichen KI-Assistenten kommst.
Was so ein Assistent im Alltag macht
Im Kern ist es schnell erzählt. Du stellst eine Frage in normaler Sprache, und er antwortet aus deinen Dokumenten statt aus dem halben Internet. Wenn er dort die Antwort nicht findet, sucht er im Web. Wiederkehrende Aufgaben wie das morgendliche Briefing oder das Sortieren von Eingängen nimmt er dir ab. Durch das Merken der erfolgreichen Lösungswege wird er mit der Zeit immer besser. Und erreichbar ist er von überall, zum Beispiel als Chat am Handy.
Die Bausteine dafür sind alle Open Source und längst im Einsatz. Du installierst das Ganze auf einem Gerät bei dir zuhause oder im Büro, der Aufwand hält sich in Grenzen.
Der Punkt, der den Unterschied macht
Ein fertiger Agent ist fast immer für eine Person gedacht. Beim Selbstbau bekommt dagegen jeder seinen eigenen, privaten Wissensraum. Jede Person im Haushalt oder im Team hat ihre eigenen Dokumente, und keiner sieht die der anderen, obwohl alle über dieselbe Oberfläche und dasselbe Modell im Hintergrund arbeiten. Und weil sich jeder Assistent die Vorlieben und Eigenheiten seines Nutzers merkt, entwickelt er sich mit der Zeit für jede Person in eine etwas andere Richtung. So zumindest die Idee, an der ich das im Alltag messen werde.
Privat ist das angenehm. In einer Firma ist es der eigentliche Hebel. Die Buchhaltung fragt ihre Belege ab, der Vertrieb seine Angebote, die Technik ihre Handbücher. Sauber getrennt, statt ein gemeinsamer Topf, in den jeder hineinschauen kann. Diesen Teil schauen wir uns besonders genau an, weil daran am Ende hängt, ob so ein Setup für ein Team taugt oder peinlich wird.
Woraus es besteht, und was mit der Cloud ist
Drei Komponenten reichen für den Einstieg: Open WebUI als Oberfläche mit Nutzerkonten und den getrennten Wissensräumen, Hermes Agent als Schicht, die entscheidet welche Werkzeuge eine Aufgabe braucht und sich Fähigkeiten merkt, und OpenRouter als Zugang zu über 200 Modellen, bei dem du nur zahlst, was du nutzt.
Ein Punkt, der oft zu blumig verkauft wird: Über OpenRouter geht die eigentliche Anfrage an ein Modell in der Cloud. Es wäre also gelogen zu behaupten, deine Daten verlassen nie dein Gerät. Was stimmt, ist etwas anderes. Deine Dokumente liegen auf deinem eigenen Rechner und nicht im Account eines Anbieters, du kontrollierst die Plattform, und du entscheidest pro Aufgabe, welches Modell antwortet. Wer wirklich nichts nach außen geben will, stellt im letzten Schritt auf ein lokales Modell um, dann läuft alles offline auf eigener Hardware. Das ist die Ausbaustufe für sensible Fälle, kein Pflichtprogramm für den Anfang.
Highend-Technik brauchst du dafür nicht. Ich baue das Ganze auf einem Mac mini M4 mit 16 GB nach, ein kleiner Server oder ein günstiger VPS macht es genauso.
Und wer den Weg konsequent zu Ende geht, also ein lokales Modell laufen lässt und gar nichts mehr nach außen gibt, muss dafür nicht in teure Server-Hardware investieren. Eine gebrauchte Grafikkarte aus dem Gaming-Bereich reicht schon für brauchbare lokale Modelle, und die bekommt man heute zu moderaten Preisen. Damit läuft die KI vollständig in den eigenen vier Wänden, ohne Cloud, ohne API, ohne laufende Kosten pro Anfrage. Welche Karte sich lohnt, was sie leistet und wo die Grenzen liegen, schauen wir uns in Teil 5 im Detail an.
Wie die Serie aufgebaut ist
Wir gehen es Schritt für Schritt durch, jeder Teil ist eine konkrete Anleitung zum Mitmachen:
- Teil 1: Den Agenten als Docker-Container starten und per Telegram aufs Handy holen.
- Teil 2: Open WebUI als Oberfläche anbinden und eigene Dokumente einbringen, private Wissensräume, mehrere Nutzer trennen.
- Teil 3: Hermes als echter Agent, Fähigkeiten, Mail und automatisierte Aufgaben.
- Teil 4: Erweiterungen wie Websuche, Sprache und Bilder, dazu lokale Modelle für den Betrieb ohne Cloud.
- Teil 5: Produktionsbetrieb, sicherer Fernzugriff per HTTPS, Datenbank und Backups.
Am Ende hast du einen Assistenten, den du wirklich täglich nutzen kannst.
Den ersten Teil findest du hier: Den Agenten als Docker-Container mit Telegram aufsetzen. Wenn du so ein Setup für deine Firma aufsetzen oder die Mehrbenutzer-Trennung sauber aufziehen willst, kannst du mich bei Fragen jederzeit kontaktieren.
Kein Teil der Serie verpassen?
Newsletter abonnieren