Skip to content

ArminVarmaz/DE_DA

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

56 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

DE_DA

Data Engineering: Grundlagen der Datenanalyse

Ein Kurs an der Professional School der Hochschule Bremen

Kursbeschreibung

Dieser Kurs bietet eine Einführung in die Datenanalyse. Die Teilnehmenden lernen, wie man Daten mit verschiedenen Tools und Techniken erfasst, verarbeitet und analysiert. Zu den behandelten Themen gehören Datenbereinigung, explorative Datenanalyse, Visualisierung und statistische Inferenz.

Ziele des Kurses:

  • Einführung in Python
  • Entwicklung eines Verständnisses der Datenanalyse und ihrer Bedeutung
  • Lernen, wie man Daten für die Analyse sammelt, verarbeitet und bereinigt
  • Entwicklung von Fähigkeiten in der explorativen Datenanalyse und Datenvisualisierung
  • Verstehen der Grundlagen der statistischen Inferenz und der Hypothesentests
  • Lernen, wie man Python und verschiedene Datenanalysebibliotheken für Data Engineering-Aufgaben verwendet
  • Verstehen, wie man Datenanalysetechniken auf reale Szenarien anwendet

Voraussetzungen

  • Vertrautheit mit Daten, ggf. mit Datenbanken und SQL
  • Grundverständnis von Programmierung (z.B. Nutzung von WENN-Funktion von Excel)
  • Verstehen von Datenstrukturen und Algorithmen

Kursthemen

  • Einführung in Python
  • Einführung in die Datenanalyse
  • Überblick über die Datenanalyse und ihre Bedeutung für Data Engineering und Data Science
  • Verschiedene Datentypen und ihre Eigenschaften
  • Datenerfassung und -bereinigung
  • Techniken zur Datenerfassung und -bereinigung
  • Datenvorverarbeitung und Feature Engineering
  • Explorative Datenanalyse
  • Techniken zur Datenvisualisierung
  • Deskriptive Statistik und Datenzusammenfassung
  • Merkmalsauswahl und Korrelationsanalyse
  • Statistische Inferenz
  • Wahrscheinlichkeitsverteilungen und Hypothesentests
  • Konfidenzintervalle und p-Werte
  • Stichprobenverfahren und statistische Aussagekraft
  • Datenanalyse-Bibliotheken in Python
  • Überblick über beliebte Python-Bibliotheken zur Datenanalyse
  • Pandas-Bibliothek für die Datenmanipulation
  • NumPy-Bibliothek für numerische Berechnungen
  • Matplotlib- und Seaborn-Bibliotheken für die Datenvisualisierung

Fallstudie

Die erfolgreiche Teilnahme am Kurs setzt die Bearbeitung einer Fallstudie voraus

  • Anwendungen der Datenanalyse in der realen Welt
  • Fallstudien zur Datenanalyse in verschiedenen Branchen
  • Datenanalyse für die Entscheidungsfindung in Unternehmen
  • Techniken für datengesteuerte Erkenntnisse und Empfehlungen

Lehrbücher: "Python für Datenanalyse", 2. Auflage, Wes McKinney "Data Science from Scratch", 2. Auflage, Joel Grus

About

Data Engineering: Grundlagen der Datenanalyse

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published