SASI
Sichere und Akzentrobuste Sprachassistenz für Intensivstationen
Projektlaufzeit: 12/2025 - 01/2028
Mitarbeitende: M.Sc. Mihamad Abdulkader, Dr. Sohel Kalim Tamboli , Dr. Falko Schmid, Dr. Hug Aubin
Partner: Aimino Tech GmbH, KENBUN IT AG
Motivation
Moderne Intensivstationen sind hochdynamische, internationale Arbeitsumgebungen. Das medizinische Personal spricht viele Sprachen, kommt aus unterschiedlichen Regionen und bringt eine Vielfalt an Ausdrucksweisen und Aussprachemustern mit. Diese sprachliche Diversität ist eine Bereicherung, und gleichzeitig eine Herausforderung für digitale Systeme, die bisher überwiegend auf Standardaussprachen trainiert wurden.
Sprachassistenz bietet enormes Potenzial für die Intensivmedizin: sterile Hände bei der Gerätebedienung, schnellere Dokumentation und direkter Zugriff auf Patientendaten - ohne den Blickkontakt zum Patienten zu verlieren. Doch aktuelle Systeme stoßen bei Akzenten, Dialekten und medizinischem Fachvokabular schnell an ihre Grenzen. Was bei einer Smarthome-Steuerung lediglich unbequem ist, kann im klinischen Kontext zu Fehlerkennungen bei Medikamentennamen oder Dosierungsangaben führen - mit potenziell ernsthaften Folgen für die Patientensicherheit.
Projekt
Ziel von SASI ist die Entwicklung eines robusten, akzentunabhängigen Sprachassistenzsystems, das speziell für den Einsatz auf Intensivstationen konzipiert ist. Das System soll medizinisches Fachvokabular zuverlässig erkennen - unabhängig von Aussprache, Sprachhintergrund oder lauten klinischen Umgebungen wie Alarmgeräuschen oder Beatmungsgeräten.
Kernstück des Projekts ist ein mehrstufiger Ansatz: Aimino Tech entwickelt synthetische Sprachtrainingsdaten, die gezielt akzent- und dialektbehaftete Aussprachen medizinischer Fachbegriffe abbilden. KENBUN IT trainiert darauf aufbauend ein robustes Spracherkennungsmodell mit Informationsextraktionskomponente. Das Digital Health Lab Düsseldorf erweitert das bestehende klinische KI-Dashboard um zwei neue Module: ein KI-gestütztes Diagnosewerkzeug zur Beurteilung der Herzfunktion sowie eine KI-Safety-Komponente, die Spracheingaben kontinuierlich auf medizinische Plausibilität prüft. Bei Unsicherheiten stellt das System proaktiv Rückfragen, bevor eine Aktion ausgeführt wird - die Entscheidungshoheit bleibt dabei stets beim medizinischen Personal.