Course Outline

γρήγορη επισκόπηση

    Πηγές δεδομένων Minding Data Recommender Systems Target Marketing

Τύποι δεδομένων

    Δομημένα έναντι μη δομημένων Στατικά έναντι ροής Δεδομένα συμπεριφοράς, συμπεριφοράς και δημογραφικά δεδομένα Εγκυρότητα δεδομένων αναλυτικών στοιχείων βάσει δεδομένων έναντι χρήστη Όγκος, ταχύτητα και ποικιλία δεδομένων

Μοντέλα

    Κατασκευή μοντέλων Στατιστικά μοντέλα Μηχανική μάθηση

Ταξινόμηση Δεδομένων

    Ομαδοποίηση kGroups, k-means, οι πλησιέστεροι γείτονες Αποικίες μυρμηγκιών, πουλιά που συρρέουν

Προγνωστικά μοντέλα

    Δέντρα αποφάσεων Υποστήριξη διανυσματική μηχανή Naive Bayes ταξινόμηση Νευρωνικά δίκτυα Markov Model Regression Ensemble μέθοδοι

ROI

    Αναλογία οφέλους/κόστους Κόστος λογισμικού Κόστος ανάπτυξης Πιθανά οφέλη

Μοντέλα Κτιρίων

    Προετοιμασία δεδομένων (MapReduce) Καθαρισμός δεδομένων Επιλογή μεθόδων Ανάπτυξη μοντέλου Δοκιμή μοντέλου Αξιολόγηση μοντέλου Ανάπτυξη και ενοποίηση μοντέλου

Επισκόπηση λογισμικού ανοιχτού κώδικα και εμπορικού λογισμικού

    Επιλογή πακέτου R-project Python βιβλιοθηκών Hadoop και Mahout Επιλεγμένα έργα Apache που σχετίζονται με Big Data και Analytics Επιλεγμένη εμπορική λύση Ενσωμάτωση με υπάρχον λογισμικό και πηγές δεδομένων

Requirements

Κατανόηση των παραδοσιακών μεθόδων διαχείρισης και ανάλυσης δεδομένων όπως SQL, αποθήκες δεδομένων, επιχειρηματική ευφυΐα, OLAP, κ.λπ... Κατανόηση βασικών στατιστικών και πιθανοτήτων (μέσος όρος, διακύμανση, πιθανότητα, πιθανότητα υπό όρους, κ.λπ...)

 21 Hours

Number of participants



Price per participant

Testimonials (1)

Related Categories