Konzeption und Umsetzung eines ETL-Prozesses für Datensätze des TED-Beschaffungsportals

Im Rahmen dieser Abschlussarbeit soll ein ETL-Prozess entwickelt werden, welcher den ted-Datensatz [1] entgegennimmt und in optimierter Form in einem Data Warehouse (idealerweise nach dem Generischen DWH-Schema) ablegt. Für die Arbeit können u.a. folgende Aspekte berücksichtigt werden: 

  • Parametrisierung des Extraktions-Prozesses (etwa wie mit fehlenden Werten oder Fehlern verfahren werden soll -> Verwerfen vs. Korrigieren)

Hierbei ist zunächst basierend auf einer Analyse und Auswertung der gegebenen Datenstruktur ein konzeptioneller Prozess abzuleiten, welcher im Anschluss prototypisch implementiert werden soll. 


Sprachen

Deutsch

Englisch


Literatur

[1] https://data.europa.eu/euodp/data/dataset/ted-csv