Conceptualization and Implementation of an ETL Process for TED procurement datasets
Im Rahmen dieser Abschlussarbeit soll ein ETL-Prozess entwickelt werden, welcher den ted-Datensatz [1] entgegennimmt und in optimierter Form in einem Data Warehouse (idealerweise nach dem Generischen DWH-Schema) ablegt. Für die Arbeit können u.a. folgende Aspekte berücksichtigt werden:
- Parametrisierung des Extraktions-Prozesses (etwa wie mit fehlenden Werten oder Fehlern verfahren werden soll -> Verwerfen vs. Korrigieren)
Hierbei ist zunächst basierend auf einer Analyse und Auswertung der gegebenen Datenstruktur ein konzeptioneller Prozess abzuleiten, welcher im Anschluss prototypisch implementiert werden soll.
Sprachen
Deutsch
Englisch