Der schnelle Überblick: Ein Tool für direkte Fragen an PDFs und andere Dateien#

Ein Tool, das mehrere Dokumente gleichzeitig lädt und direkt Fragen dazu beantwortet. Ohne externe Server, lokal auf dem eigenen Rechner.

Das Interessante daran: Nicht das Tool selbst, sondern was beim Entwickeln mit KI-Unterstützung funktioniert hat – und was nicht.

Was war das Ziel?#

Testen, wie gut KI-Modelle (Large Language Models) mit vielen Dokumenten gleichzeitig arbeiten können.

Wir wollten herausfinden: Bleiben die Antworten präzise, wenn man sehr viele Informationen auf einmal reingibt? Wie viele Dokumente kann man gleichzeitig verarbeiten?

Was kann das Tool?#

Mehrere Dateiformate verarbeiten (PDF, Word, Excel, PowerPoint, Text und mehr)
Bis zu 10 Dokumente gleichzeitig laden – ohne aufwändige Datenbank-Technik
Fragen in natürlicher Sprache stellen (z. B. “Was steht in den Verträgen über Kündigungsfristen?”)
Quellenangaben automatisch erstellen – mit einfachen Markierungen wie [P1], [P2] für die Herkunft der Informationen
Lokal arbeiten – alle Daten bleiben auf dem eigenen Rechner

Wie wurde es entwickelt?#

Der Entwicklungsprozess lief in klaren Schritten:

Spezifikation erstellen (90 Minuten): Detaillierte Beschreibung aller Funktionen im Dialog mit der KI entwickelt
Code generieren (60 Minuten): Die KI hat daraus den Programmcode erstellt
Dokumentation und Bereitstellung (Rest der Zeit): Anleitung schreiben und Tool nutzbar machen
Gesamtaufwand: 3 Tage über 3 Iterationen verteilt
Ergebnis: 3.100 Zeilen Code in 16 Dateien

Die meisten Module liefen direkt beim ersten Durchlauf. Erste Tests durch verschiedene Nutzende verliefen positiv.

Warum lief es so gut?#

Weil wir viel Zeit in eine klare Spezifikation gesteckt haben.

Eine gute Spezifikation beschreibt nicht nur “Was soll das Tool können?”, sondern auch “Wie hängen die Teile zusammen?” und “Welche technischen Entscheidungen sind warum sinnvoll?”.

Diese Klarheit vor dem Programmieren hat später viele Fehler verhindert.

Wichtige Erkenntnisse#

1. Spezifikation vor Code spart Zeit#

Zeit für eine gute Spezifikation ist keine Verzögerung – sie beschleunigt die Entwicklung.

Je klarer die Anforderungen formuliert sind, desto weniger muss später korrigiert werden. In diesem Projekt hat sich die Qualität der Spezifikation direkt in weniger Fehlern gezeigt.

2. KI-Modelle neigen zu kompliziert#

KI-Modelle schlagen oft aufwändige Lösungen vor, die in ihren Trainingsdaten vorkommen. Das ist nicht immer die beste Wahl.

Wir mussten aktiv gegensteuern: Statt komplexer Metadaten-Strukturen haben wir ein simples Referenzsystem mit [P1], [P2] gewählt. Statt aufwändiger Datenbank-Technik arbeiten wir mit direkter Verarbeitung.

Die Frage “Brauchen wir das wirklich?” war ständiger Begleiter.

3. Kleine Module halten Code wartbar#

Wir haben eine klare Regel befolgt: Keine Datei über 1.000 Zeilen Code.

Die größte Datei (Hauptprogramm) hat 800 Zeilen, gefolgt vom Word-Export mit 400 Zeilen und der KI-Anbindung mit 300 Zeilen.

Warum diese Grenze? KI-Modelle können große Codemengen noch nicht zuverlässig überblicken. Kleinere Module lassen sich einzeln bearbeiten und verstehen.

Was können andere davon lernen?#

Investiere Zeit in eine detaillierte Spezifikation, bevor der Code entsteht
Hinterfrage komplizierte Lösungsvorschläge der KI aktiv (einfach ist oft besser)
Teile Code in Module unter 1.000 Zeilen auf (das hilft bei der Wartung)
Nutze Token-Zählung zur Visualisierung (damit du siehst, wie viel Platz noch ist)
Teste früh mit echten Nutzenden (nicht erst am Ende)

Fazit#

✔ Gute Vorbereitung schlägt schnelles Losprogrammieren

✔ Einfache Lösungen funktionieren mit KI-Unterstützung besser als komplexe

✔ Klare Struktur macht Code wartbar und erweiterbar

Dies ist Teil einer Serie über Erfahrungen mit KI-gestützter Softwareentwicklung. Der Fokus liegt darauf, was man aus solchen Projekten lernen kann – nicht nur auf den Ergebnissen.