NEWS.

Mehr Durchblick: Prof. Marc Pollefeys über HoloLens 2 und Computer Vision.

Marc Pollefeys ist ein Visionär. Der Informatik-Professor an der renommierten ETH Zürich forscht intensiv darüber, wie computergestützte Systeme besser „sehen“ lernen. Fachbegriff: Computer Vision. Gleichzeitig legt er großen Wert auf den Wissenstransfer in die Praxis. Zwei Jahre arbeitete Marc Pollefeys am Hauptsitz von Microsoft im US-amerikanischen Redmond an der Entwicklung der HoloLens 2 mit. Bei der Eröffnung des von ihm geleiteten, neuen „Mixed Reality & AI Lab“ in Zürich trafen wir den Spitzenforscher zum Interview.

Was verbirgt sich hinter dem Begriff Computer Vision?

 

Prof. Marc Pollefeys: Wir nutzen unsere Augen, um die Welt zu verstehen und in ihr zu handeln. Deshalb entwickeln wir Algorithmen, mit denen Computer ähnlich „sehen“ können. Mein Team arbeitet an der Erkennung von Geometrien und der Verbindung mit semantischen Informationen, damit Roboter und Geräte die Welt verstehen.

 

Was war der größte Fortschritt in den vergangenen Jahren?

In den letzten Jahren betraf das vor allem zwei Teilgebiete der Computer Vision. Zum einen die geometrische Computer Vision. Darauf liegt unser Fokus. Hier gibt es seit Jahren große Fortschritte. Aber erst in den letzten Jahren entstanden daraus wirklich robuste Lösungen, die sinnvoll eingesetzt werden. Ergebnisse sehen wir beim autonomen Fahren, bei Mixed Reality, in der Robotik.

 

Ein Gebiet, das es lange Zeit schwerer hatte, ist das Verstehen von Bilddaten. Hier gab es in den letzten Jahren eine Revolution, dank neuronaler Netzwerke, KI und konvolutioneller Netzwerke, die besonders geeignet sind für Bilddaten. In diesen Bereichen gab es enorme Fortschritte.

 

Durch die Kombination der beiden sind wir jetzt imstande, Computer Vision in vielen realen Szenarien anzuwenden. Deshalb wird Computer Vision auch für die Wirtschaft immer interessanter. Unsere Konferenzen werden heute von fünfmal mehr Menschen besucht. Das Interesse ist enorm und es wird viel investiert, da Computer Vision jetzt in der Lage ist, echte Probleme zu lösen.

 

Was macht HoloLens 2 besser als ihren Vorgänger?

Zum einen ist die HoloLens-2-Brille deutlich bequemer. Man kann sie einfach aufsetzen und Mixed Reality vor- und wegklappen. Aber sie versteht auch viel besser, was um sie herum passiert. Mithilfe der Tiefenkamera kann man nicht mehr nur „klicken“. Sie verfolgt jetzt detailliert alle Fingerbewegungen. So kann man digitale Informationen ganz intuitiv nutzen, wie physische Objekte.

 

Was man hier sieht, sind zwei Kameras, die auf die Augen gerichtet sind. Das ermöglicht die Identifizierung des Trägers mit biometrischen Daten und den sicheren Zugriff auf eigene Informationen. Wir können den Augenbewegungen folgen und so das Bild optimieren. Die optimierten Mikrofone sind perfekt für Sprachanwendungen. Ich habe hier Umgebungsmikrofone, aber auch Mikrofone nah am Mund. Selbst in einer lauten Fabrik versteht die Brille ein leises Flüstern.

 

Einer der größten Vorteile: Das neue Modell ist viel immersiver. Der Sichtbereich, in den Informationen eingeblendet werden, ist doppelt so groß. Die Interaktion mit der Umgebung ist immersiver und natürlicher, denn mehr von ihr ist „augmented“.

 

Was müssen Augmented-Reality-Geräte in Zukunft leisten können, um für den Massenmarkt attraktiv zu sein?

Da gibt es zwei Dinge. Ich denke, diese Brille ist schon bereit für viele Bereiche. Allerdings nur für spezielle Szenarien: Man setzt sie auf, erledigt eine bestimmte Aufgabe, und nimmt sie wieder ab. So sieht es heute aus. In der Zukunft wird sie noch kleiner und immersiver. Es wird sich ganz natürlich anfühlen, die Brille immer zu tragen. Wenn sie erst einmal so klein ist, werden wir sie ständig tragen.

 

Heute können wir uns kein Leben ohne Handys vorstellen. In fünf, zehn Jahren tragen wir alle Brillen, die Informationen intuitiv einblenden. Wir haben immer alle Informationen parat, die wir gerade benötigen. Ganz natürlich und intuitiv. Jeder wird so ein Gerät haben.

 

Was wir wirklich wollen, ist weg von Lösungen für Einzelpersonen hin zu einer gemeinsamen Mixed Reality in unserer Umgebung. Um das zu schaffen, benötigen wir nicht ein Gerät, sondern viele Geräte, die alle mit der Cloud verbunden sind. Die Cloud ist hier extrem wichtig. Intelligente Geräte und die intelligente Cloud zusammen ermöglichen diese neue Art der Erfahrung.