Veranstaltungen

03.06.2020

Mittwoch, 16:00

Online for now

Applying Data Science: Example-driven Data Cleaning

Die Datenbereinigung ist eine der zeitaufwändigsten und mühsamsten Aufgaben bei datengesteuerten Aufgaben. Typischerweise umfasst sie die Identifizierung von fehlerhaften Werten und deren Korrektur. Eine effektive Fehlererkennung kann die anschließender Korrekturschritt. Die Forschung auf dem Gebiet der Fehlererkennung hat eine Vielzahl von Ansätzen geliefert, von denen die meisten Folgendes erfordern ein gewisses Vorwissen über den Datensatz, um den Ansatz mit Regeln und Empfindlichkeitsschwellen einzurichten und zu konfigurieren, oder andere Parameter.

Häufig decken diese Ansätze nur eine bestimmte Art von Fehlern ab. Kürzlich wurde das neuartige maschinelle Lernen
Es wurden Techniken vorgeschlagen, um die Fehlererkennung als Klassifizierungsaufgabe zu behandeln. Diese Ansätze erfordern immer noch große Mengen von Trainingsdaten, die mit der Größe des Datensatzes skaliert werden, um die Vielfalt der residenten Fehlertypen innerhalb eines Datensatzes abzudecken.

In diesem Vortrag wird Ziawasch Abedjanunsere work in progress an einem ganzheitlichen Fehlererkennungssystem vorstellen, das die Menge der erforderlichen Labels durch den Einsatz von Label-Propagation-Techniques und Meta-Learning reduziert.

Am Meeting teilnehmen >>

Nächste Vorlesung: Mittwoch, 1. Juli

download