Von hundert-seitigen Papers zu klaren Zusammenfassungen: Ein erstes LLM-Coding-Experiment#

280 Zeilen Code. Einige hundert Nutzungen täglich.

Ein einfaches Tool, das Dokumente automatisch zusammenfasst – entwickelt in nur 5-6 Stunden als erstes systematisches Experiment mit KI-gestützter Programmierung.


Was war das Ziel?#

Schnelle Zusammenfassungen von Papers erstellen.

Auch wenn das Dokument 50 oder 100 Seiten lang ist. Und mit flexiblen Fragestellungen – mal eine Kurzversion, mal eine kritische Reflexion.

Gleichzeitig wollten wir verstehen: Wie funktioniert Programmieren mit KI-Unterstützung wirklich? Was sind die Grenzen, was die Möglichkeiten?


Was kann das Tool?#

Es verarbeitet Dokumente und erstellt sechs verschiedene Zusammenfassungs-Arten:

  • Standard-Zusammenfassungen (z. B. Kurzversion, detaillierte Version, Fokus auf Methodik)
  • Strukturierte Analysen (Hauptargumente, zentrale Daten, offene Fragen)
  • Kritische Reflexionen (Stärken und Schwächen der Studie)

Das Tool akzeptiert gängige Formate wie PDF, Word und OpenDocument. Die Verarbeitung dauert je nach Dokumentgröße zwischen 30 Sekunden und einigen Minuten.


Wie wurde es entwickelt?#

Wir haben in mehreren Schritten gearbeitet:

  • Spezifikation (30 Minuten): Anforderungen klar definiert
  • Erste Version (2 Stunden): Grundfunktionen mit KI-Unterstützung umgesetzt
  • Optimierung (3-4 Stunden): 4-5 Iterationen zur Verbesserung der Verarbeitungsstrategie
  • Gesamtaufwand: 5-6 Stunden über mehrere Wochen verteilt
  • Ergebnis: 280 Zeilen Python-Code, 10 Funktionen, 7 Kern-Bibliotheken

Die Entwicklung erfolgte mit verschiedenen KI-Modellen in kleinen, klar definierten Schritten.


Warum lief es so gut?#

Weil wir bewusst einfach geblieben sind.

Statt einer komplexen Gesamtarchitektur haben wir jede Funktion einzeln hinzugefügt. Erst die Basis, dann Schritt für Schritt erweitert. Diese schrittweise Herangehensweise hat verhindert, dass wir uns in Komplexität verlieren.

Ein weiterer Erfolgsfaktor: Die Wahl der richtigen Werkzeuge. Bibliotheken wie pymupdf4llm konvertieren PDF-Inhalte direkt in ein KI-freundliches Format (mit Überschriften, Tabellen, Bildunterschriften als Tags). Das hat die Qualität der Zusammenfassungen deutlich verbessert.


Wichtige Erkenntnisse#

1. Architektur-Planung bleibt menschlich

Die KI-Modelle waren hervorragend für die Umsetzung einzelner Funktionen. Aber Entscheidungen zur Gesamtarchitektur? Die waren deutlich besser, wenn wir sie selbst getroffen haben.

Die KI-Vorschläge für die Systemarchitektur waren oft unpraktisch oder zu komplex. Wir haben gelernt: Mehr Zeit in die eigene Vorab-Planung investieren, dann die KI für eng umrissene Implementierungs-Schritte nutzen.

2. Prompt-Engineering ist Systemarchitektur

Die Anweisungen an das KI-Modell sind nicht nur nette Texte – sie sind ein kritischer Teil der Lösung.

Zwei Techniken haben ebenso gut funktioniert: Kritische Anweisungen in GROSSBUCHSTABEN schreiben verstärkt ihre Wirkung erheblich. Und explizite Negativ-Anweisungen mit doppelter Betonung (“Wenn nicht genügend Informationen vorliegen, schreibe auch nichts und füge nichts hinzu”) verhindern Fantasie-Inhalte.

3. Einfache Strategien funktionieren überraschend gut

Die zweistufige Verarbeitung war simpel: Dokument in Abschnitte teilen, jeden zusammenfassen, dann eine Gesamt-Zusammenfassung erstellen.

Trotz dieser Einfachheit liefert das Tool hochwertige Ergebnisse. Die Größe der Abschnitte erwies sich als wichtigster Parameter – kleinere Abschnitte verbessern die Qualität, erhöhen aber die Verarbeitungszeit.


Was können andere davon lernen?#

  • Die eigene Architektur planen und KI-Modelle für definierte Implementierungs-Aufgaben nutzen
  • Bibliotheken wählen, die bereits auf KI-Integration ausgelegt sind (spart enorm Zeit)
  • Prompt-Formulierung als Teil der technischen Lösung verstehen, nicht als Nebensache
  • Einfachheit vor vorzeitiger Optimierung priorisieren
  • In kleinen Schritten arbeiten und jede Funktion einzeln hinzufügen

Fazit#

280 Zeilen Code reichen für ein produktiv genutztes Werkzeug – Einfachheit schlägt Komplexität

✔ Strategische Planung bleibt menschlich, KI-Modelle unterstützen bei der Umsetzung

✔ Prompt-Engineering ist kein Detail, sondern Kern der Lösung


Dies ist Teil einer Serie über KI-gestütztes Programmieren. Der Fokus liegt darauf, was man aus solchen Experimenten lernen kann – nicht nur auf den Ergebnissen.

Hinweis: Dieses Tool entstand vor fast einem Jahr. Die Technologien haben sich seitdem weiterentwickelt, aber die methodischen Grundprinzipien bleiben relevant.