Εξέλιξη Κομματιού

Εισαγωγή στην Ανάλυση Δεδομένων και τα Big Data

  • Τι κρίνει τα Big Data "Μεγάλα";
    • Ταχύτητα, Όγκος, Ποικιλομέρεια, Αξιοπιστία (VVVV)
  • Περιορισμοί της Συνήθους Επεξεργασίας Δεδομένων
  • Κατανεμημένη Επεξεργασία
  • Στατιστική Ανάλυση
  • Τύποι Μηχανικής Μάθησης
  • Οπτικοποίηση Δεδομένων

Ρόλοι και Ευθύνες στα Big Data

  • Διαχειριστές
  • Προγραμματιστές
  • Αναλυτές Δεδομένων

Γλώσσες που Χρησιμοποιούνται για την Ανάλυση Δεδομένων

  • Γλώσσα R
    • Γιατί η R για την ανάλυση δεδομένων;
    • Επεξεργασία, υπολογισμός και γραφική παρουσίαση δεδομένων
  • Python
    • Γιατί το Python για την ανάλυση δεδομένων;
    • Επεξεργασία, προετοιμασία, καθαρισμός και ανάλυση δεδομένων

Μεθόδους Ανάλυσης Δεδομένων

  • Στατιστική Ανάλυση
    • Ανάλυση χρονολογικών σειρών
    • Πρόβλεψη με καινοτόμους μοντέλα επισυναφής και παλινδρόμησης
    • Στατιστική συμπερασματολογία (εκτίμηση)
    • Περιγραφική Στατιστική σε μεγάλους σύνολους δεδομένων (π.χ., υπολογισμός του μέσου)
  • Μηχανική Μάθηση
    • Επιβλεπτές ανεπίβλεπτες μεθόδους
    • Κατηγοριοποίηση και συστήματα συσχετισμού
    • Εκτίμηση του κόστους συγκεκριμένων μεθόδων
    • Φίλτρα
  • Επεξεργασία Φυσικής Γλώσσας
    • Επεξεργασία κειμένου
    • Κατανόηση της σημασίας του κειμένου
    • Αυτόματη γενέση κειμένου
    • Σχολιασμός / ανάλυση θεμάτων
  • Επεξεργασία Εικόνας
    • Απόκτηση, επεξεργασία, ανάλυση και κατανόηση εικόνων
    • Αποκατάσταση, ερμήνευση και κατανόηση 3D σκηνών
    • Χρήση δεδομένων εικόνας για λήψη αποφάσεων

Υποδομή Big Data

  • Αποθήκευση Δεδομένων
    • Σχετικές βάσεις δεδομένων (SQL)
      • MySQL
      • Postgres
      • Oracle
    • Μη σχετικές βάσεις δεδομένων (NoSQL)
      • Cassandra
      • MongoDB
      • Neo4js
    • Κατανόηση των νευρίων
      • Ιεραρχικές βάσεις δεδομένων
      • Ομαδικές βάσεις δεδομένων
      • Βάσεις δεδομένων προς τη μεταφορά
      • Γραφικές βάσεις δεδομένων
      • Άλλες
  • Κατανεμημένη Επεξεργασία
    • Hadoop
      • HDFS ως κατανεμημένο αρχειακό σύστημα
      • MapReduce για κατανεμημένη επεξεργασία
    • Spark
      • Συνολική μεθοδολογία κατανεμημένων υπολογισμών σε αρχεία υπομνηματίου για την εξονυχιστική επεξεργασία δεδομένων
      • Επεξεργασία χρονολογικών σειρών
      • Spark SQL
      • Βιβλιοθήκες Μηχανικής Μάθησης: MLlib
      • Επεξεργασία γράφων με GraphX
  • Ευελιξία
    • Δημόσιοι ημιουργικοί χώροι
      • AWS, Google, Aliyun κλπ.
    • Ιδιωτικοί ημιουργικοί χώροι
      • OpenStack, Cloud Foundry κλπ.
    • Αυτόματη εξέλιξη

Επιλογή του Σωστού Λύσης για το Πρόβλημα

Το Μέλλον των Big Data

Συνοψίς και Επόμενες Βήματα

Απαιτήσεις

  • Συνολική κατανόηση των μαθηματικών
  • Συνολική κατανόηση του προγραμματισμού
  • Συνολική κατανόηση των βάσεων δεδομένων

Ακροατήριο

  • Προγραμματιστές / προγραμματιστές
  • Συμβούλοι ΤΕΧ
 35 Ώρες

Αριθμός συμμετέχοντων


Τιμή ανά συμμετοχαστή

Σχόλια (7)

Εφεξής Μαθήματα

Σχετικές Κατηγορίες