Veranstaltungen

28.07.2021

Mittwoch, 11:00

online

ELLIS Life/NCT Data Science Seminar: Discovering actionable interpretations from raw visual data: from 2D clustering to 3D reconstruction

Michael Schmitz für Helmholtz/HIDA

In diesem Vortrag wird Andrea Vedaldi (Professor für Computer Vision und maschinelles Lernen und Co-Leiter der VGG-Gruppe an der Fakultät für Ingenieurwissenschaften der University of Oxford) das Problem der Entdeckung interpretierbarer und umsetzbarer Repräsentationen von visuellen Daten ohne Überwachung diskutieren. Er beginnt mit einem Blick auf aktuelle Ansätze wie Deep Clustering, die qualitativ hochwertige Bild- und Videorepräsentationen ohne Beschriftungen lernen können. Er wird jedoch zeigen, dass die resultierenden Repräsentationen nur begrenzt interpretierbar sind: Sie lassen sich oft nicht direkt auf nützliche Konzepte oder Verhaltensweisen abbilden. Es ist auch nicht vernünftig zu erwarten, dass ein nuanciertes und informatives Verständnis von Bildern aus einfachen High-Level-Aufgaben wie dem Clustering hervorgeht. Der Vortragende wird dann vorschlagen, dass das Erreichen eines tieferen Verständnisses, das in der 2D- und 3D-Geometrie verwurzelt ist, propädeutisch sein kann, um eine abstraktere Interpretation von visuellen Daten zu entwickeln, ohne auf externe Überwachung zurückgreifen zu müssen. Er wird einige seiner jüngsten Arbeiten zum Erlernen der 3D-Form von Objektkategorien und ihrer Entsprechungen aus Standbildern, Videos und 3D-Scans besprechen und einige der Prinzipien erörtern, die zum Entwurf solcher Algorithmen verwendet werden können. Er wird auch CO3D vorstellen, einen neuen "in-the-wild"-Datensatz mit Videos von 3D-Objekten, der die Forschung in diesem Bereich unterstützen kann.

 

Bitte registrieren Sie sich hier für diesen Vortrag. 

Weitere Informationen finden Sie auf der Website

 

download