Course Outline

Εισαγωγή

Αυτή η ενότητα παρέχει μια γενική εισαγωγή για το πότε πρέπει να χρησιμοποιείται η «μηχανική εκμάθηση», τι πρέπει να λαμβάνεται υπόψη και τι σημαίνει όλα, συμπεριλαμβανομένων των πλεονεκτημάτων και των μειονεκτημάτων. Τύποι δεδομένων (δομημένος/μη δομημένος/στατικός/ροή), εγκυρότητα/όγκος δεδομένων, αναλύσεις βάσει δεδομένων έναντι αναλύσεων βάσει χρήστη, στατιστικά μοντέλα έναντι μοντέλων μηχανικής μάθησης/ προκλήσεις μη εποπτευόμενης μάθησης, αντιστάθμιση μεροληψίας-διακύμανσης, επανάληψη/αξιολόγηση, προσεγγίσεις διασταυρούμενης επικύρωσης , εποπτευόμενος/ανεπιτήρητος/ενίσχυση.

ΚΥΡΙΑ ΘΕΜΑΤΑ

1. Κατανόηση του αφελούς Bayes

  • Βασικά εργαλεία των μεθόδων Bayesian
  • Πιθανότητα
  • Συνολική πιθανότητα
  • Συνθετική πιθανότητα με το θεώρημα Bayes
  • O αλγόριθμος naive Bayes
  • Η κλάση naive Bayes
  • O εκτιμητής Laplace
  • Χρήση αριθμητικών χαρακτηριστικών με naive Bayes

2. Κατανόηση των δέντρων αποφάσεων

  • Χωρίζε και νικά
  • O αλγόριθμος C5.0 decision tree
  • Επιλογή της καλύτερης διαχωριστικής γραμμής
  • Σφυρίζειν το δέντρο απόφασης

3. Κατανόηση των νευρωνικών δικτύων

  • Από βιολογικά σε ψευδονευρωνικά κύτταρα
  • Ενεργοποιητικές λειτουργίες
  • Τοπολογία των δικτύων
  • Ο αριθμός των επιπέδων
  • Η κατεύθυνση της πληροφορίας
  • Ο αριθμός των νόδων σε κάθε επίπεδο
  • Εκπαίδευση νευρωνικών δικτύων με backpropagation
  • Deep Learning

4. Κατανόηση των Μηχανών Διανυσμάτων Υποστήριξης

  • Ταξινόμηση με υπερεπίπεδα
  • Βρες το μέγιστο ακρωτήριο
  • Η περίπτωση δεδομένων που είναι γραμμικά άλυτα
  • Η περίπτωση δεδομένων που δεν είναι γραμμικά άλυτα
  • Χρήση κυλίνδρων για χώρους μη γραμμικού τύπου

5. Κατανόηση της ομαδοποίησης

  • Ομαδοποίηση ως εργαλείο μηχανικής μάθησης
  • O αλγόριθμος k-means για ομαδοποίηση
  • Χρήση αποστάσεων για την προσωρινή και ενημέρωση των ομάδων
  • Επιλογή του σωστού αριθμού ομάδων

6. Μέτρηση απόδοσης για ταξινόμηση

  • Εργασία με δεδομένα πρόβλεψης ταξινόμησης
  • Πιο κοντινή μετάθεση στις συχνότητες παραπλανητικών μητρώων
  • Χρήση συχνότητες παραπλανητικών για τη μέτρηση απόδοσης
  • Πέρα από την ακρίβεια – άλλες μέτρησες απόδοσης
  • Η καταστατιστική kappa
  • Ευαισθητότητα και ειδικότητα
  • Προσεγγιστικότητα και αναζήτηση
  • Η μέτρηση F-measure
  • Βιβλίωση επιλογών απόδοσης
  • ROC γραμμές
  • Εκτεταμένη μελέτη μελλοντικής απόδοσης
  • Η μέθοδος holdout
  • Cross-validation
  • Bootstrap δείγματα

7. Συντονισμός μοντέλων στοκ για καλύτερη απόδοση

  • Χρήση caret για την ευθεία παραμετροποίηση
  • Δημιουργία μιας απλής κατευθυνόμενης μοντέλων
  • Προσαρμογή της διαδικασίας παραμετροποίησης
  • Βελτίωση απόδοσης μοντέλου με meta-learning
  • Συνειδητοποίηση συνθετικών
  • Bagging
  • Boosting
  • Random forests
  • Εκπαίδευση random forests
  • Αξιολόγηση της απόδοσης random forest

ΜΙΚΡΑ ΘΕΜΑΤΑ

8. Κατανόηση της ταξινόμησης με χρήση των πλησιέστερων γειτόνων

  • Ο αλγόριθμος kNN
  • Υπολογισμός απόστασης
  • Επιλογή ενός κατάλληλου k
  • Προετοιμασία δεδομένων για χρήση με το kNN
  • Γιατί είναι ο αλγόριθμος kNN περιποιητικός;

9. Κατανόηση των κανόνων ταξινόμησης

  • Χωρίζε και νικά
  • O αλγόριθμος One Rule
  • O αλγόριθμος RIPPER
  • Κανόνες από δέντρα απόφασης

10. Κατανόηση της παλινδρόμησης

  • Απλή γραμμική παλινδρόμηση
  • Τυπική εκτίμηση των μικρότερων τετραγώνων
  • Συσχέτιση
  • Πολλαπλή γραμμική παλινδρόμηση

11. Κατανόηση των δέντρων παλινδρόμησης και των δέντρων μοντέλων

  • Προσθήκη παλινδρόμησης σε δέντρα

12. Κατανόηση των κανόνων σύνδεσης

  • O αλγόριθμος Apriori για μάθηση κανόνων συνδέσης
  • Μέτρηση ενδιαφέροντος του κανόνα – υποστήριξη και πίστη
  • Σχεδιασμός μιας συνολικής ομάδας κανόνων με την αρχή Apriori

Πρόσθετα

  • Spark/PySpark/MLlib και Multi-armed bandits

Requirements

Python Γνώση

 21 Hours

Number of participants


Price per participant

Testimonials (7)

Upcoming Courses

Related Categories