Veranstaltungen

16.06.2021

Mittwoch, 11:00

online

ELLIS Life/Data Science Seminar: Neighbour embeddings for scientific visualization

Michael Schmitz für Helmholtz/HIDA

 

Wie unterscheiden sich die vorhandenen Algorithmen und was sind die Trade-Offs?

Dr. Dmitry Kobak wird die jüngste Arbeit über vielfältiges Lernen und niedrigdimensionale Visualisierungen von Einzelzell-Transkriptomik vorstellen. Die Einzelzell-Transkriptomik liefert ständig wachsende Datensätze mit RNA-Expressionsniveaus für Tausende von Genen aus bis zu Millionen von Zellen, die oft eine reiche hierarchische Struktur aufweisen, sowohl kontinuierlich als auch diskret. Gängige Datenanalyse-Pipelines beinhalten eine Dimensionalitätsreduktion zur Visualisierung der Daten in zwei Dimensionen, die am häufigsten mit Methoden wie t-SNE, UMAP und ForceAtlas2 durchgeführt wird. Diese Methoden sind Beispiele für "neighbor embedding": Ziel ist es, ähnliche Zellen als Nachbarn in der Einbettung zu behalten. 

Der etablierteste Algorithmus, t-SNE, zeichnet sich durch die Aufdeckung lokaler Strukturen in hochdimensionalen Daten aus, hat aber oft Probleme, die globale Struktur genau darzustellen. Dr. Dmitry Kobak wird diskutieren, inwieweit dies auch für andere Algorithmen zum "neighbor embedding" gilt. Er wird zeigen, dass die Veränderung des Gleichgewichts zwischen den anziehenden und den abstoßenden Kräften ein Spektrum von Einbettungen ergibt, das durch einen einfachen Trade-Off gekennzeichnet ist: stärkere Anziehung kann kontinuierliche, vielfältige Strukturen besser darstellen, während stärkere Abstoßung diskrete Clusterstrukturen besser darstellen kann. Außerdem wird er darstellen, dass prominente Algorithmen zum "neighbor embedding" alle auf dieses Anziehungs-/Abstoßungsspektrum gesetzt werden können. Es werden weitere Trade-Offs aufgezeigt, wie z.B. das Aufdecken gröberer oder feinerer Clusterstrukturen in Abhängigkeit von der Form des Ähnlichkeitskerns. Außerdem wird der Einfluss von Optimierungsparametern wie der Lernrate und der Initialisierung auf die resultierenden Einbettungen demonstriert. Er wird auch diskutieren, wie man zweidimensionale Einbettungen von anderen Arten von Daten konstruiert, einschließlich Bibliotheksdaten und Bilddaten.

 

Bitte melden Sie sich hier für diese Veranstaltung an. 

Weitere Informationen finden Sie auf der Website.

 

download