Suchen und Finden
Data Profiling mit Eclipse Von den Grundlagen zum Prototypen
1
Inhaltsverzeichnis
3
Begleitmaterial
5
Abkürzungsverzeichnis
6
1 Einleitung
7
2 Datenqualität
9
2.1 Definition
9
2.2 Dimensionen der Datenqualität
10
2.2.1 Fehlerfreiheit
11
2.2.2 Vollständigkeit
12
2.2.3 Zeitabhängige Dimensionen
13
2.2.4 Konsistenzdimension
14
2.2.5 Weitere Dimensionen
15
2.3 Gründe und Folgen schlechter Datenqualität
15
2.4 Ökonomische Betrachtung der Datenqualität
17
2.5 Umfassendes Datenqualitätsmanagement
18
2.6 ETL-Prozess
20
2.7 Metadatenmanagement
22
3 Data-Profiling
24
3.1 Definition und Abgrenzung
24
3.2 Vorgehensmodell
25
3.3 Analysemethoden
29
3.3.1 Syntaktische Analyse
29
3.3.2 Strukturanalyse
31
3.3.3 Semantische Analyse
33
3.3.4 Statistische Analyse
34
4 Werkzeugumgebung
36
4.1 Eclipse Architektur
36
4.2 Modellierung mit Eclipse
39
4.2.1 Modellgetriebene Softwareentwicklung
39
4.2.2 Eclipse Modeling Framework
41
4.2.3 Graphical Modeling Framework
44
4.2.4 Zukunft der Modellierung in Eclipse
46
5 Konzept
48
5.1 Ausgewählte Funktionalität existierender Werkzeuge
48
5.1.1 DATRAS ADO-Profiler
49
5.1.2 dfPower® Profile
51
5.1.3 BDQ Analysis
54
5.1.4 InfoZoom
55
5.2 Anforderungsdefinition
57
5.2.1 Funktionale Anforderungen
58
5.2.2 Nicht-funktionale Anforderungen
61
6 Systementwurf und -modellierung
63
6.1 Modellgetriebene Entwicklung des Diagrammeditors
63
6.1.1 Domänenmodell
64
6.1.2 Grafische Definition
66
6.1.3 Mapping-Definition
68
6.1.4 Codegenerierung
69
6.2 Komponentenmodell
71
7 Implementierung
74
7.1 Reverse Engineering
74
7.2 Data Profiling Implementierung
79
7.2.1 Analyse des Tabellenprofils
79
7.2.2 Präsentation des Tabellenprofils in einer View
82
7.2.3 Kontextsensitive Musteranalyse
85
8 Zusammenfassung der Ergebnisse
88
Literaturverzeichnis
90
Anhang
93
Alle Preise verstehen sich inklusive der gesetzlichen MwSt.