Course Outline
Εισαγωγή
- Επισκόπηση των χαρακτηριστικών και της αρχιτεκτονικής του Spark και του Hadoop Κατανόηση των βασικών αρχών προγραμματισμού μεγάλων δεδομένων Python
Ξεκινώντας
- Ρύθμιση δομών δεδομένων Python, Spark και Hadoop Understanding στο Python Κατανόηση PySpark API Κατανόηση HDFS και MapReduce
Ενσωμάτωση Spark και Hadoop με Python
- Εφαρμογή Spark RDD στο Python Επεξεργασία δεδομένων με χρήση MapReduce Δημιουργία κατανεμημένων συνόλων δεδομένων σε HDFS
Machine Learning με το Spark MLlib
Επεξεργασία μεγάλων δεδομένων με Spark Streaming
Εργασία με Συστήματα Recommender
Δουλεύοντας με τους Kafka, Sqoop, Kafka και Flume
Apache Mahout με Spark και Hadoop
Αντιμετώπιση προβλημάτων
Περίληψη και Επόμενα Βήματα
Requirements
- Εμπειρία με το Spark και το Hadoop
- Python εμπειρία προγραμματισμού
Ακροατήριο
- Επιστήμονες δεδομένων
- προγραμματιστές
Testimonials (3)
The fact that we were able to take with us most of the information/course/presentation/exercises done, so that we can look over them and perhaps redo what we didint understand first time or improve what we already did.
Raul Mihail Rat - Accenture Industrial SS
Course - Python, Spark, and Hadoop for Big Data
I liked that it managed to lay the foundations of the topic and go to some quite advanced exercises. Also provided easy ways to write/test the code.
Ionut Goga - Accenture Industrial SS
Course - Python, Spark, and Hadoop for Big Data
The live examples