Otte / Wippermann | Von Data Mining bis Big Data | E-Book | sack.de
E-Book

E-Book, Deutsch, 495 Seiten

Otte / Wippermann Von Data Mining bis Big Data

Handbuch für die industrielle Praxis

E-Book, Deutsch, 495 Seiten

ISBN: 978-3-446-45717-1
Verlag: Carl Hanser
Format: PDF
Kopierschutz: 1 - PDF Watermark



Von Datensalat zu Datenschatz


Eine wichtige Säule von Industrie 4.0 ist Big Data. Hierbei geht es um die intelligente Verwertung riesiger Datenmengen mit dem Ziel Prozesse besser zu beherrschen oder neue Geschäftsfelder zu finden. Big Data für sich zu erschließen bedeutet nichts anderes als einen Schatz zu heben, der in der Fülle von Informationen, die Sie in Ihrem Unternehmen anhäufen, verborgen liegt. Dieses Buch enthält die Schatzkarte. Hier erfahren Sie


- wie mit Hilfe von Data Mining-Techniken unbekannte Zusammenhänge und Strukturen über den datenliefernden Prozess entdeckt werden können
- wie mit den gewonnenen Erkenntnissen detaillierte Vorhersagen über das zukünftige Prozessverhalten und Strategien zur Optimierung ganzer Fabriken abgeleitet werden
- welche Tools und Plattformen es gibt, um Big Data wirtschaftlich sinnvoll in Ihr Unternehmen einzuführen
- wie andere Firmen aus verschiedensten Branchen mit Big Data erfolgreiche Effizienzsteigerungen erreicht haben


Wenn Sie sich im Rahmen der aktuell laufenden Digitalisierungswelle fragen, welche der modernen Techniken wofür genutzt werden können oder müssen, um den Anschluss nicht zu verpassen, dann ist dieses Buch genau das richtige für Sie.
Otte / Wippermann Von Data Mining bis Big Data jetzt bestellen!

Weitere Infos & Material


1;Vorwort;6
2;Inhalt;12
3;1 Einführung;18
4;2 Warum Data Mining? Wozu Big Data?;20
4.1;2.1 Definition und Einordnung der Begriffe;23
4.1.1;2.1.1 Was ist Data Mining?;23
4.1.2;2.1.2 Was ist Big Data?;31
4.1.3;2.1.3 Data Mining im Kontext anderer Datenanalyseverfahren;32
4.2;2.2 Spezielle Anforderungen der Industrie an die Datenanalyse;39
4.3;2.3 Gibt es einen Handlungsbedarf für die Industrie?;46
5;3 Das theoretische und mathematische Konzept der technischen Datenauswertung;50
5.1;3.1 Einführung;50
5.2;3.2 Datenselektion und Datenzusammenführung;52
5.2.1;3.2.1 Aufbau einer Datentabelle;52
5.2.2;3.2.2 Denormalisierung von Datentabellen;53
5.2.3;3.2.3 Synchronisierung von Datentabellen;54
5.3;3.3 Datenvorverarbeitung;56
5.3.1;3.3.1 Festlegung der Datentypen;56
5.3.2;3.3.2 Diskretisierung von metrischen Daten;58
5.3.3;3.3.3 Statistiken und Tests für metrische Daten;60
5.3.4;3.3.4 Das Problem ungenauer Messungen;65
5.3.5;3.3.5 Behandlung von Datenlücken;68
5.3.6;3.3.6 Behandlung von Ausreißern;70
5.3.7;3.3.7 Behandlung von Mehrdeutigkeiten;72
5.4;3.4 Datentransformation;77
5.5;3.5 Datenanalyse;81
5.5.1;3.5.1 Visuelle explorative Analysen;81
5.5.2;3.5.2 Überblick über multivariate Verfahren zur Datenanalyse;84
5.5.2.1;3.5.2.1 Regressionsanalysen;84
5.5.2.2;3.5.2.2 Varianzanalyse;90
5.5.2.3;3.5.2.3 Diskriminanzanalyse;93
5.5.2.4;3.5.2.4 Korrelationsanalyse;96
5.5.2.5;3.5.2.5 Faktoranalyse;100
5.5.2.6;3.5.2.6 Clusteranalyse;103
5.5.3;3.5.3 Einführung in Data-Mining-Methoden;110
5.5.4;3.5.4 Data Mining zum Auffinden von Zusammenhängen;114
5.5.4.1;3.5.4.1 Neuronale Netze;116
5.5.4.2;3.5.4.2 Support-Vektor-Maschinen;131
5.5.4.3;3.5.4.3 Gütemaße für Modelle und Klassifikatoren;136
5.5.5;3.5.5 Data Mining zum Auffinden von Strukturen;144
5.5.5.1;3.5.5.1 Fuzzy-Clusterverfahren;145
5.5.5.2;3.5.5.2 Demographisches Clustern;147
5.5.5.3;3.5.5.3 Selbstorganisierende Merkmalskarten;148
5.5.5.4;3.5.5.4 Gütemaße für Clusterverfahren;160
5.5.6;3.5.6 Data Mining zum Generieren von Regeln;162
5.5.6.1;3.5.6.1 Bayessche Netze;163
5.5.6.2;3.5.6.2 Entscheidungsbäume;169
5.5.6.3;3.5.6.3 Assoziationsregeln;179
5.5.6.4;3.5.6.4 Gütemaße für Regeln;182
5.5.7;3.5.7 Data Mining zum Visualisieren hochdimensionaler Datenräume;183
5.5.7.1;3.5.7.1 Selbstorganisierende Merkmalskarten für topologieerhaltende Projektionen;183
5.5.7.2;3.5.7.2 Gütemaße für Projektionen;190
5.5.8;3.5.8 Zusammenfassung der Data-Mining-Verfahren;194
5.6;3.6 Interpretation der Ergebnisse;197
5.6.1;3.6.1 Fehlinterpretationen;198
5.6.2;3.6.2 Strittige Interpretationen;204
5.6.3;3.6.3 Konsequenzen;206
6;4 Hilfreiche Auswertemöglichkeiten für praktische Anwendungsfälle;208
6.1;4.1 Text Mining – das Auswerten unstrukturierter Daten;208
6.2;4.2 Versuchsplanungen zur Erzeugung von Prozessdaten;214
6.3;4.3 Automatische Diskretisierungen;219
6.4;4.4 Güte und Sicherheit von Regressionsschätzungen;221
6.5;4.5 Auffinden der sensitiven Einflussgrößen;225
6.6;4.6 Ausschluss von zufälligen Zusammenhängen;229
6.7;4.7 Datenbasierte Optimierungen;233
7;5 Big Data – die Datenhaltungs- und Verarbeitungskonzepte der Gegenwart;246
7.1;5.1 Digitale Transformation und Big Data;247
7.2;5.2 Grundprinzipien eines Paradigmenwandels;249
7.2.1;5.2.1 Die drei Vs – und der Wert;249
7.2.2;5.2.2 Scale-up und Scale-out;249
7.2.3;5.2.3 Unabhängige Verarbeitung direkt auf den Daten;250
7.2.4;5.2.4 Schema on Read versus Schema on Write;251
7.2.5;5.2.5 Hardwarevirtualisierung und Containermanagement;251
7.2.6;5.2.6 Datenvirtualisierung;252
7.2.7;5.2.7 Entkoppelte Systeme;253
8;6 Technische Big-Data-Lösungen zur industriellen und kommerziellen Datenanalyse;254
8.1;6.1 Datenmanagement im Big-Data-Umfeld;254
8.1.1;6.1.1 Hadoop machte den Anfang;254
8.1.2;6.1.2 Apache Spark – die nächste Evolutionsstufe;257
8.1.3;6.1.3 Abstrahierte Datenverarbeitung und -speicherung;258
8.1.4;6.1.4 Komplexe Eventverarbeitung mit Kafka & Co.;262
8.1.5;6.1.5 Das beste beider Welten – von Lambda und Kappa;263
8.1.6;6.1.6 Big-Data-Plattformen;264
8.1.7;6.1.7 NoSQL-Datenbanken;265
8.1.8;6.1.8 Anwendungsfälle für NoSQL-Datenbanken;266
8.1.9;6.1.9 Technologiestacks;267
8.2;6.2 Datenzentrische Architekturen;268
8.2.1;6.2.1 AI-basierte Systeme brauchen IA-basierte Plattformen;268
8.2.2;6.2.2 Die logische Architektur;269
8.2.3;6.2.3 Die Softwarearchitektur;269
8.2.4;6.2.4 Die technische Architektur;269
8.3;6.3 Der Supervised Data Lake (SDL);270
8.3.1;6.3.1 Ein Data Lake braucht ein Konzept, damit der See nicht zum Sumpf wird;270
8.3.2;6.3.2 Die unterschiedlichen Bereiche eines SDL;272
8.3.3;6.3.3 Quellen und Ladearten;272
8.3.4;6.3.4 Raw Zone;273
8.3.5;6.3.5 Ingestion Zone;273
8.3.6;6.3.6 Discovery und Sandbox;273
8.3.7;6.3.7 Integration;274
8.3.8;6.3.8 Serving;275
8.3.9;6.3.9 Associated Processes;275
8.3.10;6.3.10 Access und Application;276
8.4;6.4 Aufbau eines Data Lakes;276
8.4.1;6.4.1 Think Big – Start Small – Act Now;276
8.4.2;6.4.2 Vision, Ziele und Standortbestimmung;277
8.4.3;6.4.3 Konzeption des Data Lakes;277
8.4.4;6.4.4 Implementierung der Basisumgebung;278
8.4.5;6.4.5 Data Lake Ramp-up – Use Case Driven;278
8.4.6;6.4.6 Industrialisierung – die betriebsfokussierte Datenfabrik;279
8.5;6.5 Cloud-Computing und Services;280
8.5.1;6.5.1 Die Cloud-Ausbaustufen – Everything as a Service;281
8.5.2;6.5.2 Offene Ökosysteme;282
8.5.3;6.5.3 Der Data Lake in der Cloud;283
8.6;6.6 Big Data, Data Mining und Artificial Intelligence;285
8.6.1;6.6.1 Analytic Data Hub;286
8.6.2;6.6.2 Data-Science- und Data-Mining-Plattformen;287
9;7 Die Anwendersicht – Systematik für industrielle Anwendungen;296
9.1;7.1 Aufgabenstellung und Zielsetzung;296
9.1.1;7.1.1 Datengetriebene Identifikation von Aufgabenstellungen;296
9.1.2;7.1.2 „Produktgetriebene“ Identifikation;297
9.1.3;7.1.3 Geschäftsorientierte Identifikation von Aufgabenstellungen;297
9.1.3.1;7.1.3.1 Reduktion von Kosten, Verlusten, Verschwendungen;300
9.1.3.2;7.1.3.2 Erhöhung operativer Performance;301
9.1.3.3;7.1.3.3 Ergebnisverbesserung funktionaler Prozesse;302
9.2;7.2 Vorgehensmethodik;303
9.2.1;7.2.1 Workshop zur Ideenfindung und Datenanalyse;306
9.2.1.1;7.2.1.1 Design-Thinking-Workshop;306
9.2.1.2;7.2.1.2 Wertschöpfungsschritte;307
9.2.1.3;7.2.1.3 Perspektiven;308
9.2.1.4;7.2.1.4 Schmerzpunkte und Mehrwerte;309
9.2.1.5;7.2.1.5 Erzeugen des Mehrwertes;309
9.2.1.6;7.2.1.6 Geschäftsmodell;311
9.2.1.7;7.2.1.7 Anwendungen und Lösungsansätze identifizieren;313
9.2.2;7.2.2 Hackathons als alternative Möglichkeit der Lösungsfindung und Pilotierung;314
9.2.3;7.2.3 Aufsetzen konkreter Aufgabenstellungen;316
9.2.3.1;7.2.3.1 Definition der Aufgabenstellung;316
9.2.3.2;7.2.3.2 Modellauswahl;317
9.2.3.3;7.2.3.3 Beauftragung von Dienstleistern;318
9.2.4;7.2.4 Explorations- und Umsetzungsphase eines Use Case;319
9.2.4.1;7.2.4.1 Sichtung der Daten;319
9.2.4.2;7.2.4.2 Bestimmung der sensitiven Eingangsgrößen;325
9.2.4.3;7.2.4.3 Modellierung und Ergebnisbewertung;332
9.2.4.4;7.2.4.4 Die Königsklasse: Vektorielle Optimierung eines Use Case;333
9.2.5;7.2.5 Auswertung und Detailkonzept, Applikationserstellung und Implementierung;338
10;8 Die Anwendersicht – typische Anwendungsfelder am konkreten Beispiel;344
10.1;8.1 Anwendungen in den Geschäftsfunktionen;347
10.1.1;8.1.1 Forschung und Entwicklung;347
10.1.2;8.1.2 Engineering;350
10.1.3;8.1.3 Produktmanagement;351
10.1.4;8.1.4 Einkauf, Supply Chain Management, Logistik;353
10.1.5;8.1.5 Fertigung und Produktion;355
10.1.6;8.1.6 Qualitätsmanagement;357
10.1.7;8.1.7 Service und Instandhaltung;359
10.1.8;8.1.8 Service und After Market;361
10.1.9;8.1.9 Marketing und Vertrieb;364
10.2;8.2 Ausgewählte Data-Mining- und Big-Data-Beispiele;367
10.2.1;8.2.1 Forschung, Entwicklung und Engineering;368
10.2.1.1;8.2.1.1 Beschleunigung einer Produktentwicklung;368
10.2.2;8.2.2 Einkauf;375
10.2.2.1;8.2.2.1 Spend Cube;377
10.2.2.2;8.2.2.2 Bündelung;380
10.2.2.3;8.2.2.3 Spezifikations- und Kostenhebel;383
10.2.3;8.2.3 Produktion, Fertigung und Service;387
10.2.3.1;8.2.3.1 Störungsanalysen;387
10.2.3.2;8.2.3.2 Instabilitätsanalysen in einem Klärwerk;389
10.2.3.3;8.2.3.3 Fehlerdetektion in einem Kraftwerk;398
10.2.3.4;8.2.3.4 Analyse der Dynamik von chemischen Batchprozessen;407
10.2.4;8.2.4 Instandhaltung und Service;411
10.2.4.1;8.2.4.1 Aufbau einer Datenbasis für erweiterte Analysen und Monitoring von Industrieanlagen;411
10.2.4.2;8.2.4.2 Erweiterung eines digitalen Zwillings um Maschinendaten und Strompreisdaten im Bereich Windenergie;413
10.2.5;8.2.5 Marketing und Vertrieb;415
10.2.5.1;8.2.5.1 Cross-Selling-Effekte mit Data Mining finden;415
10.2.5.2;8.2.5.2 Cross-Selling-Analysen mit Big-Data-Technologien beschleunigen;422
10.2.5.3;8.2.5.3 Optimale Preisschwellen mit Data Mining aufspüren;424
10.2.6;8.2.6 Data Mining für die strategische Unternehmensführung;429
11;9 Small Data gehört die Zukunft;438
11.1;9.1 Einführung in die Thematik;438
11.2;9.2 Charakteristik von Small Data;440
11.3;9.3 Machine Learning versus menschlicher Geist – die Mind-Data-Hypothese;445
11.4;9.4 Bewusstsein als übergeordnete Ordnungsstruktur neuronaler Systeme;448
11.5;9.5 Mind-Data-Auswertungen mit maschinellem Bewusstsein;459
12;10 Ausblick und mögliche Weiterentwicklungen von Data Mining und Big Data;468
13;11 Liste der häufig verwendeten Formelzeichen und Symbole;474
14;12 Literaturverzeichnis;478
15;13 Autoren;488
16;Index;490


Otte, Viktor
Prof. Dr. Viktor Otte ist ehemaliger Inhaber des Lehrstuhls Konstruktion an der Universität Wuppertal und begleitete eine Vielzahl von Industrieprojekten als Data-Mining-Berater.

Otte, Ralf
Prof. Dr. Ralf Otte leitet die Lehre im Bereich Künstliche Intelligenz im Masterstudium an der Hochschule Ulm.

Wippermann, Boris
Boris Wippermann ist bei der h&z Unternehmensberatung AG in München tätig.

Der Autor hat über 20 JahreErfahrung bei der Entwicklung von Data Mining-Technologien und bei ihrem Einsatz in der Industrie. Prof. Dr. Otte leitet die Lehre im Bereich Künstliche Intelligenz im Masterstudium an der Hochschule Ulm


Ihre Fragen, Wünsche oder Anmerkungen
Vorname*
Nachname*
Ihre E-Mail-Adresse*
Kundennr.
Ihre Nachricht*
Lediglich mit * gekennzeichnete Felder sind Pflichtfelder.
Wenn Sie die im Kontaktformular eingegebenen Daten durch Klick auf den nachfolgenden Button übersenden, erklären Sie sich damit einverstanden, dass wir Ihr Angaben für die Beantwortung Ihrer Anfrage verwenden. Selbstverständlich werden Ihre Daten vertraulich behandelt und nicht an Dritte weitergegeben. Sie können der Verwendung Ihrer Daten jederzeit widersprechen. Das Datenhandling bei Sack Fachmedien erklären wir Ihnen in unserer Datenschutzerklärung.