Workshop “Datenreinigung”

Datenintegration spielt in der Informationsverwaltung eine große Rolle. Dabei müssen u. a. auch Dubletten erkannt werden und unterschiedliche Datenstrukturen gehändelt werden. Prof. Naumann vom Lehrstuhl Informationsintegration hält dazu auch eine Vorlesung. Im Sommer bietet er die Möglichkeit, an einem dreitägigen Workshop in Zusammenarbeit mit der FUZZY! Informatik AG teilzunehmen. Die Teilnehmeranzahl ist begrenzt und es werden Kenntnisse in SQL und einer Programmiersprache vorausgesetzt.

25. Juli – 27. Juli 2006
(1 Woche nach Ende des Sommersemesters)

Beschreibung

Innerhalb eines Unternehmens werden Kundendaten häufig in unterschiedlichen Systemen gehalten. Die Gründe dafür können in der Struktur des Unternehmens (getrennte Sparten), in unterschiedlichen Vertriebskanälen oder in einer Unternehmensfusion liegen. Um eine einheitliche Sicht auf den Kunden zu bekommen, müssen die Daten aus diesen Systemen zusammengeführt werden. Ein wichtiges Ziel ist dabei die Erkennung von Dubletten, d.h. die Tatsache, dass ein Kunde in mehreren Systemen vorkommt, also in mehreren Beziehungen zum Unternehmen steht.
Ihre Aufgabe während des Workshops ist es, mehrere Kundendatenbestände zusammenzuführen und Dubletten zu erkennen und zu entfernen. Dabei gilt es zu berücksichtigen, dass die Bestände eine unterschiedliche Datenstruktur haben und dass die Daten nicht standardisiert vorliegen.
Sie sollen erkennen, welche Arten von Problemen beim Zusammenführen von Datenbeständen auftreten, welche Probleme sich mit einfachen Mitteln (SQL, Scripte, Text-Editor, etc.) lösen lassen und welche nicht. Die in den beiden ersten Tagen gewonnenen Erkenntnisse und Lösungen sollen am Abschlusstag präsentiert werden.

Die Aufgaben werden in 3er-Teams bearbeitet.

Informationen zur Anmeldung

Anmeldung per Email bis zum 25. Juni an Felix Naumann. Die Anmeldung ist verbindlich.
Wir setzen Datenbankkenntnisse (SQL) und Kenntnisse in mindestens einer Programmiersprache (Java, Perl, …) voraus.
Es können maximal 24 Teilnehmer mitmachen.
Der Workshop richtet sich sowohl an Studenten als auch an Doktoranden.

2 Responses to “Workshop “Datenreinigung””


  1. 1stephan

    Weiss jemand, ob eine Teilnahme daran als Nicht-Informatikstudent Sinn macht/möglich ist?

  2. 2Alexander Struck

    Herr Naumann hat die Nachricht an die Hörer der VL “XML und Datenbanken” gerichtet aber ausdrücklich darum gebeten, auch den Kommilitonen Bescheid zu sagen. Also wenn du die Voraussetzungen erfüllst, sollte deine Teilnahme möglich sein und auch Sinn machen.
    (Keine Ahnung wie ich auf eine Woche gekommen bin, aber der Workshop dauert natürlich nur 3 Tage wie angekündigt)

Leave a Reply