Skip to main content

Intelligenter KI-Chatbot mit Bildverarbeitung & Unternehmensintegration

Intelligenter KI-Chatbot mit Bildverarbeitung & Unternehmensintegration

Ausgangssituation

  • Teams nutzten zunehmend sowohl Textdokumente als auch visuelle Materialien, um Informationen zu finden
  • Herkömmliche Chatbot-Lösungen konnten jedoch nur Text verarbeiten, wodurch wertvolle Informationen aus Bildern nicht zugänglich waren
  • Zudem mussten Nutzer das Tool wechseln, um mit dem Chatbot zu interagieren, was den Kommunikationsfluss im Arbeitsalltag unterbrach

Lösung

  • Multimodaler Chatbot mit einer Bildverarbeitungs-Pipeline, die visuelle Informationen extrahiert und in die Wissensbasis integriert
  • Outlook- und Microsoft-Teams-Connectoren, die eine direkte Interaktion mit dem Chatbot innerhalb der bestehenden Kommunikationstools ermöglichen
  • Explainable-AI-Mechanismen, die nachvollziehbar machen, wie visuelle Informationen verarbeitet und genutzt werden

Technologien

Python OpenSearch Docker CI Prompt Engineering LLM RAG NLP GenAI XAI

In der heutigen schnelllebigen Geschäftswelt basieren Kommunikationsprozesse oft auf einer Mischung aus Text- und Bilddaten. Um diese Herausforderung zu meistern, habe ich eine Chatbot-Lösung um eine Bildverarbeitungs-Pipeline erweitert, die es dem Chatbot ermöglicht, visuelle Daten zu analysieren und in seine Wissensbasis zu integrieren. Diese Innovation machte es erstmals möglich, nicht nur zu Texten, sondern auch zu Bildern Fragen zu stellen – ein echter Fortschritt in der multimodalen Fragebeantwortung.

Neben der Verarbeitung und dem Abruf visueller Daten habe ich Outlook- und Microsoft-Teams-Connectoren entwickelt, die eine nahtlose Integration in Unternehmenskommunikationsprozesse ermöglichten. Dadurch wurde der Chatbot direkt in bestehende Tools eingebunden, was die Benutzerfreundlichkeit erhöhte, Workflows optimierte und den Abruf von Informationen vereinfachte. Unternehmen konnten so die Antworten und Fähigkeiten des Chatbots flexibel an ihre spezifischen Bedürfnisse anpassen.

Um Transparenz und Vertrauen in das System sicherzustellen, habe ich Explainable AI (XAI)-Techniken eingesetzt. Diese gaben Nutzern Einblick in die Funktionsweise der Bildverarbeitung und der Abrufmechanismen, sodass jede auf visuellen Daten basierende Antwort nachvollziehbar und überprüfbar war – ein wichtiger Schritt zur Steigerung der Zuverlässigkeit des Chatbots.