Εξέλιξη Κομματιού

Γρήγορη Επισκόπηση

  • Πηγές Δεδομένων
  • Ζήτημα Δεδομένων
  • Συστήματα Συστάσεων
  • Στόχος Καταστολής

Τύποι Δεδομένων

  • Δομημένα vs μη δομημένα
  • Στατικά vs ροή
  • Ατυχηματικά, συμπεριφορικά και δημογραφικά δεδομένα
  • Ανάλυση βασισμένη σε δεδομένα vs χρήστη
  • Η εγκυρότητα των δεδομένων
  • Τόμος, ταχύτητα και ποικιλία των δεδομένων

Μοντέλα

  • Δημιουργία μοντέλων
  • Στατιστικά Μοντέλα
  • Μηχανική μάθηση

Κατηγοριοποίηση Δεδομένων

  • Κλουστερ
  • kΟμάδες, k-μέσα, τα πλησιέστερα γείτονες
  • Σφαιρικές συνομοσπονδίες, αλόγια ορθούν

Προβλητικά Μοντέλα

  • Δέντρα απόφασης
  • Υποστήριξη μηχανής vector (Support Vector Machine)
  • Ναιϊβ Bayes κλάση
  • Νευρωνικά δίκτυα
  • Μοντέλο Markov
  • Παλινδρόμηση (Regression)
  • Ομαδικές μεθόδους

Απόδοση Επένδυσης (ROI)

  • Αναλογία Οφέλους/Κόστους
  • Κόστος λογισμικού
  • Κόστος ανάπτυξης
  • Θεωρητικά οφέλη

Δημιουργία Μοντέλων

  • Προσαρμογή Δεδομένων (MapReduce)
  • Καθαρισμός δεδομένων
  • Επιλογή μεθόδων
  • Ανάπτυξη μοντέλου
  • Δοκιμασία Μοντέλου
  • Αξιολόγηση Μοντέλου
  • Εφαρμογή και ενσωμάτωση μοντέλου

Επισκόπηση Πηγές Open Source και εμπορικού λογισμικού

  • Επιλογή πακέτου R-project
  • Βιβλιοθήκες Python
  • Hadoop και Mahout
  • Επιλεγμένα Apache έργα σχετικά με Big Data και Analytics
  • Επιλεγμένη εμπορική λύση
  • Ενσωμάτωση με υφιστάμενο λογισμικό και πηγές δεδομένων

Απαιτήσεις

Κατανόηση των παραδοσιακών μεθόδων διαχείρισης και ανάλυσης δεδομένων όπως SQL, αποθήκες δεδομένων, επιχειρηματική ευφυΐα, OLAP, κ.λπ... Κατανόηση βασικών στατιστικών και πιθανοτήτων (μέσος όρος, διακύμανση, πιθανότητα, πιθανότητα υπό όρους, κ.λπ...)

 21 Ώρες

Αριθμός συμμετέχοντων


Τιμή ανά συμμετοχαστή

Σχόλια (2)

Εφεξής Μαθήματα

Σχετικές Κατηγορίες