Ausbildungsprogramm: Data Mining (2 Tage)

Ausbildungsziele:

Verständnis Die Schlüsselkonzepte der Daten Bergbau und seine Anwendung in der realen Welt.

Verwendung Data Mining-Techniken zur Erkundung und Analyse großer Datenmengen.

Beantragen Data Mining klassische Methoden: Klassifizierung, Regression, Clustering, Assoziation.

Mastering praktische Tools zur Implementierung von Data Mining Algorithmen in Python.

Interpretieren die Ergebnisse der Analysen und deren Verwendung für die Entscheidungsfindung.

INTERPRETATION

- Anwesend in unseren Räumlichkeiten oder bei Ihnen

Distanciel Online

Finden Sie uns auf:

Straßburg, Lille, Lyon, Reims, Genf, Brüssel, Luxemburg, Frankfurt, Karlsruhe, Berlin, Metz

Preis: 1521 € H.T.
INTRA

(Rufen Sie uns an, um ein Angebot zu erhalten)

Tag 1: Einführung in Data Mining und Data Exploration

Morgens: Data Mining Grundlagen und Datenaufbereitung

• Einführung in Data Mining

  • Was ist Data Mining?
  • Data Mining Anwendungen: Marketing, Finanzen, Gesundheit, etc.
  • Data Mining Lebenszyklus: Datenaufbereitung, Modellierung, Auswertung der Ergebnisse.

• Datenerhebung und -aufbereitung

  • Datenquellen: relationale Datenbanken, CSV-Dateien, JSON, APIs.
  • Datenreinigung: Verwaltung fehlender Werte, Duplikate und Fehler.
  • Datentransformation: Normung, Normung, Reduktion der Dimensionalität (PCA).


Post-Midi: Data Exploration und Data Mining Methoden

• Data Exploration mit Python und Pandas

  • Import und Exploration von Daten mit Pandas : Laden, Anzeige und Zusammenfassung von Datensätzen.
  • Datenvisualisierungstechniken: Histogramme, Boxplots, Scatter Pads (mit Matplotlib und Seaborn).
  • Untersuchungsdatenanalyse (EDA), um Muster oder Anomalien zu identifizieren.

• Einführung in Data Mining Methoden

  • Einreihung Definition der Klassifizierung und ihrer Anwendungen.
  • Regression kontinuierliche Werte vorhersagen.
  • Clustern : Datensegmentierung in Gruppen (k-Mittel, DBSCAN).
  • Verein : Entdecken Sie Assoziationsregeln in Datensätzen (z.B. Einkaufskorbregeln).

• Praktische Übung :

  • Laden und Erkunden eines Datensatzes (z.B. Verkaufs- oder Kundendaten).
  • Verwenden Sie eine erste Datenreinigung (Duplikate entfernen, fehlende Werte verwalten) und führen Sie eine explorative Analyse durch.


Tag 2: Data Mining Algorithm Anwendungen und Ergebnisse Interpretation

Morgen : Sicherheit und Optimierung

• Klassifizierungs- und Regressionsalgorithmen

  • Einreihung : Implementierung eines logistischen Regressionsmodells oder Entscheidungsbaums mit Scikit-learn.
  • Regression : Verwenden Sie ein lineares Regressionsmodell, um kontinuierliche Werte vorherzusagen.
  • Modellbewertung: Verwirrungsmatrix, Präzision, Rückruf, F1-Punkt zur Klassifizierung.

• Clustering

  • Einleitung K-Mittel-Clusterung und DBSCAN um Daten in Gruppen zu segmentieren.
  • Anwendung von K-Mittelalgorithmus zur Identifizierung von Segmenten in einem Datensatz (z.B. Clientsegmentierung).
  • Messen Sie die Qualität der Clustering mit der Trägheitsmethode oder anderen Metriken wie dem Figurenscore.

• Satzung

  • Einführung in den Algorithmus Priori die Assoziationsregeln in Transaktionsdatensätzen zu entdecken (z.B. Einkaufswagenregeln).
  • Verwendung mlxtend Umsetzung der Assoziierungsregeln und Interpretation der Ergebnisse (z.B. Identifizierung häufig zusammen gekaufter Produkte).


Nach Midi: Rahmenbedingungen und moderne Entwicklung

• Interpretation von Ergebnissen und Anwendung von Modellen

  • Interpretation der Modellergebnisse: Koeffizienten, wichtige Variablen und Wahl der Schwellenwerte.
  • Visualisierung der Modellergebnisse: ROC-Kurven, Verstärkungskurven, Verwirrungsmatrizen.
  • Wie man Modelle für die unternehmerische Entscheidungsfindung verwendet: Verhaltensvorhersage, Produktempfehlung, Kundensegmentierung.

• Modellbewertung und Leistungsverbesserung

  • Cross-Assessment-Techniken (Crossvalidation) und Cross-Checking.
  • Verbesserung der Modellleistung: Überpassen, Parametereinstellung.

• Praktische Übung :

  • Verwenden Sie ein Klassifizierungs- oder Regressionsmodell auf einen realen Datensatz (z.B. die Wahrscheinlichkeit eines Kunden, der ein Produkt kauft).
  • Implementierung eines Cluster-Algorithmus, um Daten in homogene Gruppen zu segmentieren.
  • Analyse und Interpretation der Ergebnisse im Hinblick auf das Geschäft (welche Segmente die interessantesten sind, etc.).


Methodik

Interaktives Training mit praktischen Übungen und Fallstudien.

Einsatz professioneller Werkzeuge und Manipulation realer Datenbanken.

Kursunterstützung mit Zugang zu Online-Ressourcen und Codebeispielen.

Coached von einem erfahrenen Trainer für personalisierte Unterstützung.