Zum Inhalt

AWS Academy Data Engineering

Module 1:

Voraussetzungen

Voraussetzung Beschreibung
Vorwissen AWS Abschluss des AWS Cloud Foundations-Kurses oder gleichwertige Erfahrung
SQL Erfahrung mit Structured Query Language
Datenbanken Allgemeine Erfahrung im Umgang mit Datenbanken
Netzwerke Einführung in grundlegende Netzwerkkonzepte
Mathe / Statistik Grundlagen in Mathematik, Wahrscheinlichkeit und Statistik

Ziel-Berufe

Rolle Relevanz
Data Engineer Hauptzielgruppe
Data Analyst Passend
Data Scientist Passend
ETL-Entwickler Passend
ML Practitioner Passend

Kursziele

Teil 1: Grundlagen

Ziel Inhalt
Data Science verstehen Rolle und Wert in einer datengetriebenen Organisation erklären
Pipeline-Infrastruktur Einfluss von Daten auf Designentscheidungen erkennen
AWS-Datenpipeline Visualisierung eines generischen Szenarios
Datensicherheit Risiken und Governance je Pipeline-Schritt
Skalierung Best Practices für grosse Datenmengen
Datenerfassung Design mit Fokus auf Skalierbarkeit, Kosten, Fehlertoleranz, Latenz

Teil 2: Umsetzung

Ziel Inhalt
Speicherung Passende Datenhaltung je Use Case auswählen
Datenformate Strukturierte, semi- und unstrukturierte Daten verarbeiten
MapReduce & EMR Grundlagen und Anwendung in Big Data Pipelines
ML-Pipelines Merkmale und Schritte verstehen
Datenanalyse Passende AWS-Tools einsetzen
Visualisierung Darstellung abhängig von Zielgruppe und Datentyp

Modulübersicht

Modul Titel
1 Einführung
2 Datengetriebene Organisationen
3 Elemente von Daten
4 Designprinzipien und Muster
5 Sicherheit und Skalierung
6 Datenaufnahme und -vorbereitung
7 Batch- vs. Stream-Verarbeitung
8 Speicherung und Organisation
9 Big Data Verarbeitung
10 ML-Datenverarbeitung
11 Analyse und Visualisierung
12 Pipeline-Automatisierung
13 Zertifizierungsbrücke
Zusatz IoT Use Case Slides

Wichtige Bilder rund um Pipeline

alt text


alt text


Moudule 2:

5 Vs of data:

V Deutsch Erklärung
Volume Datenmenge Die Menge an Daten, die täglich entsteht – z. B. durch Webseiten, Sensoren, Apps usw.
Velocity Geschwindigkeit Wie schnell Daten erzeugt, übertragen und verarbeitet werden müssen. Realtime-Analyse ist oft wichtig.
Variety Vielfalt Unterschiedliche Datenarten: Text, Bilder, Videos, Audio, strukturierte und unstrukturierte Daten.
Veracity Wahrhaftigkeit Die Zuverlässigkeit der Daten – sind sie korrekt, vollständig, vertrauenswürdig?
Value Wert Der Nutzen, den Unternehmen

alt text