Der Kurs "Big Data on AWS" stellt Ihnen cloudbasierte Big-Data-Lösungen wie Amazon Elastic MapReduce (EMR), Amazon Redshift, Amazon Kinesis und die anderen Lösungen der AWS-Big-Data-Plattform vor. In diesem Kurs zeigen wir Ihnen, wie Sie mit Amazon EMR Daten mithilfe des umfassenden Portfolios an Hadoop-Tools wie Hive und Hue verarbeiten. Außerdem zeigen wir Ihnen, wie man Big-Data-Umgebungen erstellt, mit Amazon DynamoDB, Amazon Redshift und Amazon Kinesis arbeitet und wie man mithilfe von Best Practices Big-Data-Umgebungen entwirft, die sicher und kostengünstig sind.
In diesem Kurs lernen Sie Folgendes:
Integrieren von AWS-Lösungen innerhalb eines Big-Data-Ökosystems
Nutzen von Apache Hadoop im Kontext von Amazon EMR
Ermitteln der Komponenten eines Amazon EMR-Clusters
Erstellen und Konfigurieren eines Amazon EMR-Clusters
Nutzen gängiger Programmierungs-Frameworks für Amazon EMR einschließlich Hive, Pig und Streaming
Verwenden von Hue zur Verbesserung der Benutzerfreundlichkeit von Amazon EMR
Verwenden von Analysen im Speicher mit Spark und Spark SQL auf Amazon EMR
Auswählen der entsprechenden AWS-Datenspeicheroptionen
Ermitteln der Vorteile der Verwendung von Amazon Kinesis für nahezu Echtzeit-Verarbeitung von Big Data
Definieren von Data Warehouse und einspaltigen Datenbankkonzepten
Nutzen von Amazon Redshift zum effizienten Speichern und Analysieren von Daten
Überblick über und Managen von Kosten und Sicherheit für Amazon EMR und Amazon Redshift-Bereitstellungen
Ermitteln von Optionen für Erfassung, Übertragung und Komprimierung von Daten
Verwenden von Visualisierungssoftware zum Darstellen von Daten und Abfragen
Orchestrieren von Big-Data-Workflows mithilfe von AWS Data Pipeline
ACHTUNG: Dieses Seminar wird ggf. in englischer Sprache durchgeführt
Zielgruppe
Mitarbeiter, die für das Entwerfen und Implementieren von Big-Data-Lösungen verantwortlich sind, insbesondere Lösungsarchitekten und SysOps-Administratoren
Data Scientists und Datenanalysten, die mehr über Big-Data-Lösungen auf AWS erfahren möchten
Inhalt
Tag 1
Überblick über Big Data
Erfassung, Übertragung und Komprimierung
Speicherlösungen
Speichern und Abfragen von Daten auf DynamoDB
Big Data-Verarbeitung und Amazon Kinesis
Einführung in Apache Hadoop und Amazon EMR
Verwenden von Elastic MapReduce
Tag 2
Hadoop-Programmierungs-Frameworks
Verarbeitung von Serverprotokollen mit Hive auf Amazon EMR
Verarbeitung von Chemistry-Daten mit Hadoop-Streaming auf Amazon EMR
Optimierung Ihrer Amazon EMR-Erfahrung mit Hue
Ausführen von Pig-Skripten in Hue auf Amazon EMR
Spark auf Amazon EMR
Interaktives Erstellen und Abfragen von Tabellen mit Spark und Spark SQL auf Amazon EMR
Verwalten von Amazon EMR-Kosten
Sichern Ihrer Amazon EMR-Bereitstellungen
Tag 3
Data Warehouses und einspaltige Datenspeicher
Amazon Redshift und Big Data
Optimierung Ihrer Amazon Redshift-Umgebung
Big Data-Designmuster
Visualisierung und Orchestrierung von Big Data
Verwendung von Tibco Spotfire zur Visualisierung von Big Data
Unsere Website platziert Cookies auf Ihrem Gerät, um Ihre Erfahrung zu verbessern und unsere Website zu verbessern. Lesen Sie mehr über die von uns verwendeten Cookies und wie Sie sie hier deaktivieren können. Cookies und Tracking-Technologien können für Marketingzwecke verwendet werden. Durch Klicken auf "Ich stimme zu" stimmen Sie der Platzierung von Cookies auf Ihrem Gerät und der Verwendung von Tracking-Technologien zu. Klicken Sie auf die Datenschutzrichtlinie unten, um weitere Informationen und Anweisungen zum Deaktivieren von Cookies und Tracking-Technologien zu erhalten. Obwohl die Annahme von Cookies und Tracking-Technologien freiwillig ist, kann die Deaktivierung der Cookies dazu führen, dass die Website nicht ordnungsgemäß funktioniert und bestimmte Werbung für Sie möglicherweise weniger relevant ist. Wir respektieren Ihre Privatsphäre. Lesen Sie unsere Datenschutzerklärung hier.