Course Outline

Εισαγωγή στο Data Analysis και Big Data

    Τι κάνει το Big Data "μεγάλο"; Ταχύτητα, Όγκος, Ποικιλία, Αλήθεια (VVVV)
Όρια στην παραδοσιακή επεξεργασία δεδομένων
  • Κατανεμημένη Επεξεργασία
  • Στατιστική ανάλυση
  • Τύποι Machine Learning Ανάλυσης
  • Data Visualization
  • Big Data Ρόλοι και Ευθύνες
  • Διαχειριστές Προγραμματιστές Αναλυτές δεδομένων

      Languages Χρησιμοποιείται για την ανάλυση δεδομένων

    R Language Γιατί R για Ανάλυση Δεδομένων; Χειρισμός δεδομένων, υπολογισμός και γραφική απεικόνιση

      Python Γιατί Python για την ανάλυση δεδομένων;
    Χειρισμός, επεξεργασία, καθαρισμός και σύνθλιψη δεδομένων
  • Προσεγγίσεις στο Data Analysis
  • Στατιστική Ανάλυση Ανάλυση χρονικών σειρών Πρόβλεψη με μοντέλα συσχέτισης και παλινδρόμησης Συμπερασματική Statistics (εκτίμηση) Περιγραφική Statistics σε σύνολα Μεγάλων Δεδομένων (π.χ. υπολογισμός μέσου όρου)
  • Machine Learning Εποπτευόμενη έναντι μη εποπτευόμενης μάθησης

      Ταξινόμηση και ομαδοποίηση
    Εκτίμηση κόστους συγκεκριμένων μεθόδων
  • Φιλτράρισμα
  • Επεξεργασία Φυσικής Γλώσσας Επεξεργασία κειμένου
  • Κατανόηση του νοήματος του κειμένου
  • Αυτόματη δημιουργία κειμένου
  • Ανάλυση συναισθήματος / ανάλυση θέματος
  • Computer Vision Απόκτηση, επεξεργασία, ανάλυση και κατανόηση εικόνων
  • Ανακατασκευή, ερμηνεία και κατανόηση τρισδιάστατων σκηνών
  • Χρήση δεδομένων εικόνας για λήψη αποφάσεων
  • Big Data Υποδομή
  • Αποθήκευση δεδομένων Σχεσιακές βάσεις δεδομένων (SQL) MySQL Postgres Oracle
  • Μη σχεσιακές βάσεις δεδομένων (NoSQL) Cassandra
  • MongoDB
  • Neo4js
  • Κατανόηση των αποχρώσεων Ιεραρχικές βάσεις δεδομένων

      Αντικειμενοστρεφείς βάσεις δεδομένων
    Βάσεις δεδομένων προσανατολισμένες στα έγγραφα
  • Βάσεις δεδομένων προσανατολισμένες σε γραφήματα
  • Αλλα
  • Κατανεμημένη επεξεργασία Hadoop Το HDFS ως κατανεμημένο σύστημα αρχείων
  • MapReduce για κατανεμημένη επεξεργασία
  • Spark All-in-one υπολογιστικό πλαίσιο συμπλέγματος μνήμης για επεξεργασία δεδομένων μεγάλης κλίμακας
  • Δομημένη ροή
  • Spark SQL
  • Machine Learning βιβλιοθήκες: MLlib
  • Επεξεργασία γραφήματος με GraphX
  • Scalaδυνατότητα Public cloud AWS, Google, Aliyun, κ.λπ.Ιδιωτικό cloud OpenStack, Cloud Foundry κ.λπ.
  • Αυτόματη επεκτασιμότητα
  • Επιλέγοντας τη σωστή λύση για το πρόβλημα
  • Το μέλλον του Big Data
  • Περίληψη και Συμπέρασμα
  • Requirements

    • Μια γενική κατανόηση των μαθηματικών.
    • Μια γενική κατανόηση του προγραμματισμού.
    • Μια γενική κατανόηση των βάσεων δεδομένων.

    Ακροατήριο

    • Προγραμματιστές / προγραμματιστές
    • σύμβουλοι πληροφορικής
     35 Hours

    Number of participants



    Price per participant

    Testimonials (2)

    Related Courses

    QGIS for Geographic Information System

    21 Hours

    Fluentd for Log Data Unification

    14 Hours

    Related Categories