Ausbildungsprogramm:
Datenanalyse mit Python (5 Tage)

Ausbildungsziele:

• Griff und sauber Datensätze mit Python.

• Daten analysieren mit beliebten Python-Bibliotheken.

• Visualisierungen erstellen und klare Berichte aus den Daten.

• Anwendungstechniken grundlegende statistische Analyse.

• Verwenden Sie Python Sondierungsdatenanalysen und einfache Modellierung durchzuführen.


Voraussetzungen für die Ausbildung:

Dieses Training richtet sich an Fachleute und Studenten, die Datenanalysefähigkeiten mit Python erwerben möchten. Ideal für:

  • Datenanalysten Anfänger oder Intermediate.
  • Python-Entwickler Sie wollen sich auf Datenanalyse spezialisieren.
  • Marketing-, Finanz- und Betriebsleiter Interesse an Datenanalyse.
INTERPRETATION

- Anwesend in unseren Räumlichkeiten oder bei Ihnen

Distanciel Online

Finden Sie uns auf:

Straßburg, Lille, Lyon, Reims, Genf, Brüssel, Luxemburg, Frankfurt, Karlsruhe, Berlin, Metz

Preis: 3984 € H.T.
INTRA

(Rufen Sie uns an, um ein Angebot zu erhalten)

Tag 1: Einführung in Python und Data Handling Bibliotheken

Ziele des Tages:

  • Entdecken Sie Python und die für die Datenanalyse benötigten Bibliotheken.
  • Lernen, Daten mit Pandas und führen grundlegende Manipulationen auf DataFrames durch.

Inhalt:

• Einführung in Python

  • Installation von Python und notwendigen Bibliotheken (Anaconda, Jupyter Notebooks).
  • Grundlegende Python-Syntax: Variablen, Datentypen, Kontrollstrukturen (Loops, Bedingungen).
  • Einleitung Notizbücher Jupyter effektiv mit Daten zu arbeiten.

• Präsentation von Pandas

  • Einleitung Pandas und seine Rolle in der Datenanalyse.
  • Erstellung von DataFrames und Series aus verschiedenen Datenquellen (CSV, Excel, Datenbanken).
  • Zugriff, Manipulation und Filterdaten in einem DataFrame.
  • Verwenden Sie grundlegende Datenoperationen: Sortieren, Gruppierung, Löschen von Duplikaten, Verwaltung fehlender Werte.

• Datenmanipulation mit Pandas

  • Wählen, filtern und Indexdaten in einem DataFrame.
  • Datenaggregate (Durchschnitt, Summe, Zählung usw.).
  • Datenreinigung: Nullwertmanagement, Datenaustausch und Transformation.

• Praktische Übung :

  • Importieren Sie einen Datensatz (z.B. den Verkauf eines Unternehmens) und führen Sie Reinigungsvorgänge (Ersetzung fehlender Werte, Entfernung von Duplikaten) und Filtern (Filterdaten nach Datum, nach Produkt).

Tag 2: Exploration und Datenvorbereitung für die Analyse

Ziele des Tages:

  • Lernen Sie die Daten zu reinigen und für eine gründliche Analyse vorzubereiten.
  • Verwenden Sie Data Mining Techniken, um wichtige Informationen zu extrahieren.

Inhalt:

• Fortgeschrittene Datenreinigung

  • Erkennen und Verwalten fehlender Werte (Füllung und Imputationsmethoden).
  • Identifizierung und Verarbeitung von Ausreißern.
  • Konvertierung von Datentypen: Datenformat ändern, mit Daten und Zeiten arbeiten.

• Datenerhebung

  • Statistische Zusammenfassung der Daten: Verwendung der description()-Methode, um globale Informationen über die Daten zu erhalten.
  • Visualisierung von Datenverteilungen: Histogramme, Boxcharts.
  • Einleitung Korrelation und Analyse von Beziehungen zwischen Variablen.

• Vorbereitung der Daten für die Analyse

  • Normung und Standardisierung von Daten.
  • Erstellen neuer Variablen (Feature Engineering).
  • Behandlung von Kategorievariablen (Codierung mit get_dummies() und LabelEncoder).

• Praktische Übung :

  • Reinigung und Vorbereitung eines Datensatzes (z. B. Kundendaten und Einkäufe) für die Analyse des Kaufverhaltens.
  • Berechnen Sie beschreibende Statistiken und visualisieren Sie die Datenverteilung.

Tag 3: exploratorische Datenanalyse (EDA) und Visualisierung mit Matplotlib und Seaborn

Ziele des Tages:

  • Conduct Exploratory Data Analysis (EDA) und Visualisierung der Ergebnisse mit Matplotlib und Seaborn.
  • Erstellen Sie fortschrittliche Visualisierungen, um Daten besser zu verstehen.

Inhalt:

• Explorative Datenanalyse (EDA)

  • Identifizieren Sie Trends, Muster und Anomalien in den Daten.
  • Wählen Sie anhand der analytischen Ziele geeignete Visualisierungen aus.

• Visualisierung mit Matplotlib

  • Einleitung Matplotlib : Erstellung von Basisdiagrammen (Barn, Linien, Sektoren).
  • Personalisierung von Grafiken: Titel, Legenden, Achsen, Farben.

• Erweiterte Visualisierung mit Seaborn

  • Erstellen komplexer Grafiken mit Seaborn Boxplots, Heatmaps, Paarplots usw.
  • Visualisierung der Beziehung zwischen mehreren Variablen.
  • Anpassen von Grafiken und Anpassungen für klarere Visualisierungen.

• Praktische Übung :

  • Erstellen von Sondierungsdiagrammen für einen Verkaufsdatensatz (z. B. Verkäufe nach Produkten, Vertrieb nach Regionen, Korrelation zwischen Preis und verkauften Mengen).
  • Verwenden Sie Seaborn, um Heatmaps und Paarplots anzuzeigen.

Tag 4: Einführung in die Grundzahlen und Vorhersagemodelle

Ziele des Tages:

  • Lernen Sie grundlegende statistische Analyse mit Python.
  • Implementierung einfacher vorausschauender Modelle mit scikit-learn.

Inhalt:

• Deskriptive und Inferenzstatistiken

  • Durchschnittliche Berechnungen, Mediane, Abweichungen, Standardabweichungen.
  • Einführung in statistische Tests: t Test, ANOVA, Korrelationstests.
  • Verstehen Wahrscheinlichkeitsverteilungen und normales Recht.

• Grundlegende Vorhersagemodelle mit Scikit-Learn

  • Einleitung Scikit-Learn für die Erstellung von Machine Learning Modellen.
  • Implementierung eines linearen Regressionsmodells zur Vorhersage einer kontinuierlichen Variable (z.B. Umsatzprognose).
  • Modellbewertung: Leistungsmetriken (MSE, RMSE, R2).

• Einfache Klassifizierung Modelle

  • Einführung in Klassifikationsmodelle: logistische Regression und Entscheidungsbäume.
  • Mit einem Modell zur Vorhersage einer Klasse (z.B. vorhersagen, ob ein Kunde ein Produkt kaufen wird oder nicht).
  • Bewertung von Klassifikationsmodellen: Verwirrungsmatrix, Präzision, Rückruf, F1-Punkt.

• Praktische Übung :

  • Erstellen Sie ein lineares Regressionsmodell, um zukünftige Verkäufe anhand von Produktmerkmalen vorherzusagen.
  • Verwenden Sie ein Klassifizierungsmodell, um vorherzusagen, ob ein Kunde einen Kauf macht oder nicht.

Tag 5: Umsetzung: Datenanalyse und Schlussfolgerungsprojekte

Ziele des Tages:

  • Nutzen Sie alle erworbenen Fähigkeiten durch ein umfassendes Datenanalyseprojekt.
  • Zusammenfassung der wichtigsten Konzepte und bewährten Verfahren.

Inhalt:

• Umfassendes Datenanalyseprojekt

  • Die Teilnehmer wenden die erworbenen Fähigkeiten auf ein komplettes Projekt an.
  • Auswahl des Datensatzes: Die Teilnehmer können zwischen mehreren Datensätzen wählen (z.B. Verkaufsanalyse, Kundenzufriedenheitsanalyse, Marketingleistungsanalyse).
  • Schritte: Reinigung, Exploration, Visualisierung, statistische Analyse und Modellierung.

• Darstellung der Ergebnisse

  • Vorbereitung einer Präsentation der erzielten Ergebnisse (Analyse und Vorhersagemodelle).
  • Erstellung eines klaren und prägnanten Datenberichts mit relevanten Visualisierungen.

• Schlussfolgerungen und bewährte Verfahren

  • Diskussion über bewährte Verfahren zur Datenanalyse mit Python.
  • Weitere Ressourcen: Dokumentation, Bücher, Gemeinschaften.
  • Lieferung von Zertifikaten und Abschluss der Ausbildung.

• Praktische Übung :

  • Führen Sie aus einem ausgewählten Datensatz ein umfassendes Datenanalyseprojekt durch und präsentieren Sie die Ergebnisse in Form von Berichten und Visualisierungen.

bereitgestellte Mittel

  • Detailliertes Schulungsmaterial.
  • Links zu Online-Ressourcen zur Vertiefung des Wissens (Tutorien, Videos, Artikel).
  • Zugang zu Datensätzen, die während des Trainings verwendet werden.