Verstehen
Prozesse, Daten, IT-Vorgaben und wirtschaftlichen Nutzen klären.
Corporate AI · lokale KI · Umsetzung
Ich bin Germar Schlegel und ich baue KI-Systeme, die mit Ihren internen Daten arbeiten, ohne dass diese das Haus verlassen: On-Prem-RAG, Assistenten und Agenten — von der Use-Case-Analyse über den Prototyp bis zum Betrieb auf Ihrer Hardware.
Angebote
Jedes Format endet mit einem konkreten Ergebnis: einer Entscheidungsgrundlage, einem Prototyp oder einem laufenden System. Der Ablauf ist immer derselbe:
Prozesse, Daten, IT-Vorgaben und wirtschaftlichen Nutzen klären.
Prototyp mit echten Daten und klaren Abbruchkriterien.
RAG, Agenten, Tool-Anbindung, On-Prem- oder Edge-Deployment.
Dokumentation, Monitoring und Übergabe an Ihr Team. Keine Blackbox.
Wenn klar ist, dass KI relevant ist — aber nicht, welcher Prozess zuerst dran ist.
Wenn ein Use Case existiert und Sie sehen wollen, ob KI mit Ihren Daten zuverlässig arbeitet.
Wenn sensible Daten, Compliance oder Kosten gegen reine Cloud-Lösungen sprechen.
Wenn KI auf begrenzter Hardware laufen muss oder Standard-Runtimes nicht reichen.
Use Cases
Die besten Kandidaten sind Prozesse mit wiederkehrenden Fragen, vielen internen Dokumenten oder strukturierten Outputs — dort lässt sich schnell messen, ob ein Assistent oder Agent fachlich belastbar ist.
Handbücher, Richtlinien, Tickets und Projektwissen werden durchsuchbar und zitierbar — etwa für Support, interne IT oder Qualitätsmanagement.
Fehlercodes, Wartungsanleitungen und Ersatzteildaten werden zu konkreten Handlungsvorschlägen — für Field-Service, Helpdesk oder Maschinenwartung.
Ein Agent liest Daten, ruft Tools auf und erzeugt strukturierte, nachvollziehbare Ergebnisse — etwa Angebotsvorbereitung, Ticket-Triage oder Berichte.
Kleine Modelle und lokale Agenten für Industrie-PCs, ARM-Geräte und Offline-Szenarien — wenn Daten nicht zentral verarbeitet werden können.
Technik
Viele AI-Projekte bleiben bei Tool-Auswahl und Prompting stehen. Ich gehe tiefer: Ich entwickle eine eigene Inference Engine für kleine CPU-Systeme — ~10.000 Zeilen C23, handgeschriebene NEON-Kernels, statisch linkbar unter 1 MB. Code, Benchmarks und Messmethodik sind öffentlich: github.com/geisten/geisten.
Das braucht nicht jedes Projekt. Aber es heißt: Wenn Datenschutz, Offline-Betrieb, Latenz oder begrenzte Hardware zum Problem werden, endet meine Arbeit nicht an der Konfigurationsoberfläche.
Performance-Messungen — Raspberry Pi 5 und Apple M1 Max
Messbasis: identische GGUF-Gewichte auf beiden Engines, CPU-only. Vollständige Messreihen und Methodik im Repository.
Über mich
Ich habe in experimenteller physikalischer Chemie promoviert — schlecht gestellte inverse Probleme: aus verrauschten Messdaten das Maximum an belastbarer Information holen. Genau dieses Prinzip treibt geisten an: aus begrenzten Ressourcen — gewöhnliche CPUs, kompakte Open-Weight-Modelle, lokale Infrastruktur — maximale Leistung herausholen.
Dahinter stehen über 20 Jahre Software- und C-Engineering, mehrere Jahre Embedded- und Audio-Processing und die aktuelle Arbeit an eigener Inferenz und autonomen Agenten. Ich arbeite umsetzungsnah: klare Use Cases, messbare Prototypen, nachvollziehbare Entscheidungen. Sitz: Neuss, NRW.
Kontakt
Prozess, Datenlage, Vorgaben — mehr braucht es nicht für eine erste Einschätzung. Antwort innerhalb von 24 Stunden, direkt von mir.