11.02.2026, 18:00 - 19:30 Uhr

AI xpress NET: Smarte Informationsextraktion aus Scans und Fotos

Techtalk rund um KI-Themen im Böblinger Startup- und Innovationszentrum AI xpress

AI xpress NET ist der Techtalk rund um KI-Themen im Böblinger Startup- und Innovationszentrum AI xpress. Er richtet sich an Entwickler*innen oder KI-Expert*innen mit Interesse an einem Austausch auf hohem technischen Niveau.

Thema der Veranstaltung am 11.02.2026:

In vielen Unternehmen gibt es auch heute noch Prozesse die auf nicht nativ-digitalen Dokumenten basieren. Das heißt die Inhalte, egal ob Texte, ausgefüllte Formulare oder auch technische Zeichnungen müssen aus Scans oder von Fotos extrahiert und dann strukturiert und weiterverarbeitet werden.

Vision-Language Modelle (VLM) ermöglichen Informationsextraktion aus Dokumenten, bei denen die klassische OCR (optischer Zeichenerkennung) an ihre Grenzen stößt. Nicht nur was die Erkennbarkeit einzelner Zeichen angeht, sondern auch die Erfassung und Aufbereitung komplexer Strukturen beispielsweise in Form von Tabellen. Neben allgemeinen VLMs gibt es auf Texterkennung oder auch die Erkennung technischer Symbole spezialisierte VLMs, mit erstaunlichen Erkennungsraten.

In dieser Ausgabe von AI xpress NET wird es zwei Vorträge geben:

  1. KI in der Digitalisierung von Bauplänen
    Baupläne sind visuell komplexe und heterogene Dokumente, die sich weder mit klassischer OCR noch mit reinen Sprachmodellen vollständig erfassen lassen. Zentrale Informationen liegen in Geometrie, Symbolik und im Zusammenspiel von Bild und Text.
    Im Vortrag gehen wir darauf ein, wie aktuelle KI-Ansätze zur Bauplandigitalisierung eingesetzt werden, von Computer Vision über Vision-Language-Modelle bis hin zu menschlicher Qualitätssicherung. Außerdem beleuchten wir typische Fehlerquellen, Datenherausforderungen und Grenzen produktiver Systeme.
  2. Stand der Technik bei OpenSource VLMs zur Extraktion von Informationen aus Texten
    Der Stand der Technik bei Open-Source Vision-Language-Modellen zeigt, dass moderne Informations­extraktion längst über reine Textverarbeitung hinausgeht.
    Aktuelle VLMs kombinieren Sprachverständnis mit visueller Struktur­erkennung und ermöglichen so die Analyse komplexer Dokumente mit Layout, Tabellen und eingebetteten Grafiken.
    Der Vortrag gibt einen Überblick über verfügbare Open-Source-Modelle, deren Architekturen und Trainingsansätze.
    Beleuchtet werden typische Einsatzszenarien, Stärken gegenüber klassischen NLP-Methoden sowie Grenzen bei Skalierung, Datenqualität und Genauigkeit.

Im Anschluss besteht die Möglichkeit, bei Pizza und Getränken Fragen zu klären, Kontakte zu knüpfen und sich auszutauschen.

Nutzen für die Besucher*innen:

  • Information zum Stand der Technik in dem Bereich.
  • Diskutieren Sie mit anderen Teilnehmern über die Herausforderungen bei der vollständigen Automatisierung von Prozessen und entdecken Sie neue Lösungsansätze.
  • Plattform sowie Vernetzungs- und Austauschmöglichkeit für alle, die an ähnlichen Themen arbeiten.

Speaker: Dr. Dominik Rether, Florian Kopp

AI xpress NET ist eine gemeinsame Veranstaltung des AI xpress, der Qnovi GmbH und der Wirtschaftsförderung Region Stuttgart GmbH, finanziert durch CARS 2.0

Veranstaltungsort
AI xpress
Röhrer Weg 8
71032 Böblingen
Anmeldung
Für Kalender speichern (ICS)

Weitere Termine

  15.12.2026, 18:00 - 20:00 Uhr

Hybrides Event | Nachhaltige Industrie 4.0 und IoT Community | 2026.12

  02.12.2026, 19:00 - 21:00 Uhr

WordPress meetup Stuttgart | 2026.12

  01.12.2026, 17:30 - 20:30 Uhr

Hackergarten Stuttgart 2026.12

  17.11.2026, 18:00 - 20:00 Uhr

Hybrides Event | Nachhaltige Industrie 4.0 und IoT Community | 2026.11

  04.11.2026, 19:00 - 21:00 Uhr

WordPress meetup Stuttgart | 2026.11

→ Alle Termine