Course Outline

Εισαγωγή

    Επισκόπηση των χαρακτηριστικών και της αρχιτεκτονικής του Spark και του Hadoop Κατανόηση των βασικών αρχών προγραμματισμού μεγάλων δεδομένων Python

Ξεκινώντας

    Ρύθμιση δομών δεδομένων Python, Spark και Hadoop Understanding στο Python Κατανόηση PySpark API Κατανόηση HDFS και MapReduce

Ενσωμάτωση Spark και Hadoop με Python

    Εφαρμογή Spark RDD στο Python Επεξεργασία δεδομένων με χρήση MapReduce Δημιουργία κατανεμημένων συνόλων δεδομένων σε HDFS

Machine Learning με το Spark MLlib

Επεξεργασία μεγάλων δεδομένων με Spark Streaming

Εργασία με Συστήματα Recommender

Δουλεύοντας με τους Kafka, Sqoop, Kafka και Flume

Apache Mahout με Spark και Hadoop

Αντιμετώπιση προβλημάτων

Περίληψη και Επόμενα Βήματα

Requirements

  • Εμπειρία με το Spark και το Hadoop
  • Python εμπειρία προγραμματισμού

Ακροατήριο

  • Επιστήμονες δεδομένων
  • προγραμματιστές
 21 Hours

Number of participants



Price per participant

Testimonials (3)

Related Courses

Introduction to Graph Computing

28 Hours

Scaling Data Analysis with Python and Dask

14 Hours

Developing APIs with Python and FastAPI

14 Hours

Related Categories