Neuro- und Bioinformatik: Mittels Künstlicher Intelligenz Bilder in 3D-Oberflächen umwandeln und für Blinde ertastbar machen
Der Lübecker Doktorand Christoph Linse aus dem Institut für Neuro- und Bioinformatik erarbeitet zusammen mit Taktilesdesign GmbH und dem Mittelstand 4.0-Kompetenzzentrum Kiel die Einsatzmöglichkeiten und Konzeption einer KI für dieses Szenario.
Unser Tastsinn ist ein wichtiges Wahrnehmungssystem, um Informationen über unsere Umwelt zu erhalten. Dabei nehmen wir über die Haut die unterschiedlichsten Reize wie Temperatur, Druck, Vibration oder Oberflächenstrukturen wahr. Und genau hier setzt das Team von Taktilesdesign an: Bildinformationen sollen durch das bloße Ertasten von Oberflächenstrukturen vermittelt werden. So können beispielsweise Bildinhalte für blinde oder sehbehinderte Personen erfahrbar gemacht werden. Dafür werden Oberflächentexturen direkt in 3D gedruckt.
Damit das funktioniert, müssen die Bildinhalte reduziert werden, denn natürliche Farbbilder enthalten einfach zu viele Informationen. Die Detaildichte ist zu hoch oder Details sind für das Gesamtbild nicht wichtig. Das können Kanten, Farbwechsel oder überschneidende Bildinhalte sein. Diese Bildinhalte manuell zu abstrahieren, ist zeitaufwändig, schwer zu skalieren und somit ein hoher Kostenfaktor. Daher soll ein KI-Algorithmus die Bilder automatisiert verarbeiten und abstrahieren, damit die sie schnell und zuverlässig in ertastbare 3D-Oberflächenstrukturen übersetzt werden können.
Für die automatisierte Abstraktion der Bilder wurden drei mögliche Ansätze identifiziert. Relevante Objekte können zuerst durch Segmentierung aus dem Bild isoliert werden. Bei der Segmentierung eines Bildes wird jedem Bildpixel genau eine Kategorie zugeordnet. Das Ergebnis ist eine farbige Maske, bei der unterschiedliche Objekte mit unterschiedlichen Farben dargestellt werden können. Das Bildbeispiel zeigt eine solche Segmentierung. Der Reiter und das Pferd werden erfolgreich voneinander getrennt. Ein weiterer Ansatz besteht in dem Einsatz sogenannter Generative Adversarial Networks, die in der Lage sind, Bilddaten zu generieren. Außerdem soll untersucht werden, inwieweit Neural Style Transfer in der Lage ist, die Abstraktion der Bilder durchzuführen.
Als nächster Schritt sollen die möglichen Lösungsansätze zu einer machbaren Lösungsstrategie kombiniert werden. Um diese Strategie zu finden und auch um den Aufwand dieser Strategie abzuschätzen, plant das Lübecker Team des Kompetenzzentrums, ein Transferprojekt mit Taktilesdesign durchzuführen.
für die Ukraine