Ausbildungsprogramm:
Datenanalyse mit Python (5 Tage)
Ausbildungsziele:
• Griff und sauber Datensätze mit Python.
• Daten analysieren mit beliebten Python-Bibliotheken.
• Visualisierungen erstellen und klare Berichte aus den Daten.
• Anwendungstechniken grundlegende statistische Analyse.
• Verwenden Sie Python Sondierungsdatenanalysen und einfache Modellierung durchzuführen.
Voraussetzungen für die Ausbildung:
Dieses Training richtet sich an Fachleute und Studenten, die Datenanalysefähigkeiten mit Python erwerben möchten. Ideal für:
- Datenanalysten Anfänger oder Intermediate.
- Python-Entwickler Sie wollen sich auf Datenanalyse spezialisieren.
- Marketing-, Finanz- und Betriebsleiter Interesse an Datenanalyse.
INTERPRETATION
- Anwesend in unseren Räumlichkeiten oder bei Ihnen
Distanciel Online
Finden Sie uns auf:
Straßburg, Lille, Lyon, Reims, Genf, Brüssel, Luxemburg, Frankfurt, Karlsruhe, Berlin, Metz
Preis: 3984 € H.T.
INTRA
(Rufen Sie uns an, um ein Angebot zu erhalten)
Tag 1: Einführung in Python und Data Handling Bibliotheken
Ziele des Tages:
- Entdecken Sie Python und die für die Datenanalyse benötigten Bibliotheken.
- Lernen, Daten mit Pandas und führen grundlegende Manipulationen auf DataFrames durch.
Inhalt:
• Einführung in Python
- Installation von Python und notwendigen Bibliotheken (Anaconda, Jupyter Notebooks).
- Grundlegende Python-Syntax: Variablen, Datentypen, Kontrollstrukturen (Loops, Bedingungen).
- Einleitung Notizbücher Jupyter effektiv mit Daten zu arbeiten.
• Präsentation von Pandas
- Einleitung Pandas und seine Rolle in der Datenanalyse.
- Erstellung von DataFrames und Series aus verschiedenen Datenquellen (CSV, Excel, Datenbanken).
- Zugriff, Manipulation und Filterdaten in einem DataFrame.
- Verwenden Sie grundlegende Datenoperationen: Sortieren, Gruppierung, Löschen von Duplikaten, Verwaltung fehlender Werte.
• Datenmanipulation mit Pandas
- Wählen, filtern und Indexdaten in einem DataFrame.
- Datenaggregate (Durchschnitt, Summe, Zählung usw.).
- Datenreinigung: Nullwertmanagement, Datenaustausch und Transformation.
• Praktische Übung :
- Importieren Sie einen Datensatz (z.B. den Verkauf eines Unternehmens) und führen Sie Reinigungsvorgänge (Ersetzung fehlender Werte, Entfernung von Duplikaten) und Filtern (Filterdaten nach Datum, nach Produkt).
Tag 2: Exploration und Datenvorbereitung für die Analyse
Ziele des Tages:
- Lernen Sie die Daten zu reinigen und für eine gründliche Analyse vorzubereiten.
- Verwenden Sie Data Mining Techniken, um wichtige Informationen zu extrahieren.
Inhalt:
• Fortgeschrittene Datenreinigung
- Erkennen und Verwalten fehlender Werte (Füllung und Imputationsmethoden).
- Identifizierung und Verarbeitung von Ausreißern.
- Konvertierung von Datentypen: Datenformat ändern, mit Daten und Zeiten arbeiten.
• Datenerhebung
- Statistische Zusammenfassung der Daten: Verwendung der description()-Methode, um globale Informationen über die Daten zu erhalten.
- Visualisierung von Datenverteilungen: Histogramme, Boxcharts.
- Einleitung Korrelation und Analyse von Beziehungen zwischen Variablen.
• Vorbereitung der Daten für die Analyse
- Normung und Standardisierung von Daten.
- Erstellen neuer Variablen (Feature Engineering).
- Behandlung von Kategorievariablen (Codierung mit get_dummies() und LabelEncoder).
• Praktische Übung :
- Reinigung und Vorbereitung eines Datensatzes (z. B. Kundendaten und Einkäufe) für die Analyse des Kaufverhaltens.
- Berechnen Sie beschreibende Statistiken und visualisieren Sie die Datenverteilung.
Tag 3: exploratorische Datenanalyse (EDA) und Visualisierung mit Matplotlib und Seaborn
Ziele des Tages:
- Conduct Exploratory Data Analysis (EDA) und Visualisierung der Ergebnisse mit Matplotlib und Seaborn.
- Erstellen Sie fortschrittliche Visualisierungen, um Daten besser zu verstehen.
Inhalt:
• Explorative Datenanalyse (EDA)
- Identifizieren Sie Trends, Muster und Anomalien in den Daten.
- Wählen Sie anhand der analytischen Ziele geeignete Visualisierungen aus.
• Visualisierung mit Matplotlib
- Einleitung Matplotlib : Erstellung von Basisdiagrammen (Barn, Linien, Sektoren).
- Personalisierung von Grafiken: Titel, Legenden, Achsen, Farben.
• Erweiterte Visualisierung mit Seaborn
- Erstellen komplexer Grafiken mit Seaborn Boxplots, Heatmaps, Paarplots usw.
- Visualisierung der Beziehung zwischen mehreren Variablen.
- Anpassen von Grafiken und Anpassungen für klarere Visualisierungen.
• Praktische Übung :
- Erstellen von Sondierungsdiagrammen für einen Verkaufsdatensatz (z. B. Verkäufe nach Produkten, Vertrieb nach Regionen, Korrelation zwischen Preis und verkauften Mengen).
- Verwenden Sie Seaborn, um Heatmaps und Paarplots anzuzeigen.
Tag 4: Einführung in die Grundzahlen und Vorhersagemodelle
Ziele des Tages:
- Lernen Sie grundlegende statistische Analyse mit Python.
- Implementierung einfacher vorausschauender Modelle mit scikit-learn.
Inhalt:
• Deskriptive und Inferenzstatistiken
- Durchschnittliche Berechnungen, Mediane, Abweichungen, Standardabweichungen.
- Einführung in statistische Tests: t Test, ANOVA, Korrelationstests.
- Verstehen Wahrscheinlichkeitsverteilungen und normales Recht.
• Grundlegende Vorhersagemodelle mit Scikit-Learn
- Einleitung Scikit-Learn für die Erstellung von Machine Learning Modellen.
- Implementierung eines linearen Regressionsmodells zur Vorhersage einer kontinuierlichen Variable (z.B. Umsatzprognose).
- Modellbewertung: Leistungsmetriken (MSE, RMSE, R2).
• Einfache Klassifizierung Modelle
- Einführung in Klassifikationsmodelle: logistische Regression und Entscheidungsbäume.
- Mit einem Modell zur Vorhersage einer Klasse (z.B. vorhersagen, ob ein Kunde ein Produkt kaufen wird oder nicht).
- Bewertung von Klassifikationsmodellen: Verwirrungsmatrix, Präzision, Rückruf, F1-Punkt.
• Praktische Übung :
- Erstellen Sie ein lineares Regressionsmodell, um zukünftige Verkäufe anhand von Produktmerkmalen vorherzusagen.
- Verwenden Sie ein Klassifizierungsmodell, um vorherzusagen, ob ein Kunde einen Kauf macht oder nicht.
Tag 5: Umsetzung: Datenanalyse und Schlussfolgerungsprojekte
Ziele des Tages:
- Nutzen Sie alle erworbenen Fähigkeiten durch ein umfassendes Datenanalyseprojekt.
- Zusammenfassung der wichtigsten Konzepte und bewährten Verfahren.
Inhalt:
• Umfassendes Datenanalyseprojekt
- Die Teilnehmer wenden die erworbenen Fähigkeiten auf ein komplettes Projekt an.
- Auswahl des Datensatzes: Die Teilnehmer können zwischen mehreren Datensätzen wählen (z.B. Verkaufsanalyse, Kundenzufriedenheitsanalyse, Marketingleistungsanalyse).
- Schritte: Reinigung, Exploration, Visualisierung, statistische Analyse und Modellierung.
• Darstellung der Ergebnisse
- Vorbereitung einer Präsentation der erzielten Ergebnisse (Analyse und Vorhersagemodelle).
- Erstellung eines klaren und prägnanten Datenberichts mit relevanten Visualisierungen.
• Schlussfolgerungen und bewährte Verfahren
- Diskussion über bewährte Verfahren zur Datenanalyse mit Python.
- Weitere Ressourcen: Dokumentation, Bücher, Gemeinschaften.
- Lieferung von Zertifikaten und Abschluss der Ausbildung.
• Praktische Übung :
- Führen Sie aus einem ausgewählten Datensatz ein umfassendes Datenanalyseprojekt durch und präsentieren Sie die Ergebnisse in Form von Berichten und Visualisierungen.
bereitgestellte Mittel
- Detailliertes Schulungsmaterial.
- Links zu Online-Ressourcen zur Vertiefung des Wissens (Tutorien, Videos, Artikel).
- Zugang zu Datensätzen, die während des Trainings verwendet werden.