Course Outline
- Εισαγωγή στη μηχανική μάθηση Τύποι μηχανικής μάθησης – εποπτευόμενη έναντι μη εποπτευόμενης μάθησης Από τη στατιστική μάθηση στη μηχανική μάθηση Η ροή εργασιών εξόρυξης δεδομένων: Κατανόηση δεδομένων Κατανόηση δεδομένων Προετοιμασία δεδομένων Μοντελοποίηση Αξιολόγηση Ανάπτυξη Αλγόριθμοι μηχανικής μάθησης Επιλογή κατάλληλου αλγορίθμου για το πρόβλημα Υπερπροσαρμογή και αντιστάθμιση μεροληψίας-διακύμανσης στο ML ML βιβλιοθήκες και γλώσσες προγραμματισμού Γιατί να χρησιμοποιήσετε μια γλώσσα προγραμματισμού Επιλογή μεταξύ R και Python Πόροι Python Python Βιβλιοθήκες για μηχανική εκμάθηση Σημειωματάρια Jupyter και διαδραστική κωδικοποίηση Δοκιμή αλγόριθμων ML Γενίκευση και υπερπροσαρμογή Αποφυγή υπερπροσαρμογής Μέθοδος Holdout Cross-Validation Bootstrapping Accuracy of Evaluating numerasical: ME, MSE, RMSE, MAPE Παράμετρος και σταθερότητα πρόβλεψης Αξιολόγηση αλγορίθμων ταξινόμησης Ακρίβεια και προβλήματα Η μήτρα σύγχυσης Πρόβλημα αστάθμητων κλάσεων Οπτικοποίηση απόδοσης μοντέλου Καμπύλη κέρδους ROC Καμπύλη ανύψωσης Επιλογή μοντέλου Συντονισμός μοντέλου – Στρατηγικές αναζήτησης πλέγματος Παραδείγματα στην Python Προετοιμασία δεδομένων Εισαγωγή και αποθήκευση δεδομένων Κατανόηση των δεδομένων – βασικές εξερευνήσεις Χειρισμοί δεδομένων με βιβλιοθήκη panda Μετασχηματισμοί δεδομένων – σύγχυση δεδομένων Διερευνητική ανάλυση Παρατηρήσεις που λείπουν – ανίχνευση και λύσεις Outliers – ανίχνευση και στρατηγικές Τυποποίηση, κανονικοποίηση, δυαδοποίηση Ποιοτική επανακωδικοποίηση δεδομένων Παραδείγματα σε ταξινόμηση Python Ταξινόμηση Δυαδική έναντι πολλαπλών κλάσεων Ταξινόμηση Συνάρτηση Λιθολογική ταξινόμηση μέσω mane διακριτικές συναρτήσεις Τετραγωνική διακριτική συναρτήσεις Λογιστική παλινδρόμηση και προσέγγιση πιθανότητας k-πλησιέστεροι γείτονες Naïve Bayes Δέντρα απόφασης ΚΑΛΑΘΙ Bagging Random Forests Ενίσχυση Xgboost Υποστήριξη Vector Μηχανές και πυρήνες Μέγιστο περιθώριο Classifier Υποστήριξη Vector Machine Ensemble Learning Παραδείγματα σε Python Variable Regression Τετράγωνη διάσταση και Τεχνικές επιλογής Τακτοποίηση και σταθερότητα- L1, L2 Μη γραμμικότητες και γενικευμένα ελάχιστα τετράγωνα Πολυωνυμική παλινδρόμηση Πλαίσιες παλινδρόμησης Δέντρα παλινδρόμησης Παραδείγματα σε Python Unsupervised learning Clustering Centroid-based clustering – k-means, k-medoids, PAM, CLARA Hierarchical – Dicluster βασισμένη ομαδοποίηση - EM Αυτο-οργανωτικοί χάρτες Αξιολόγηση και αξιολόγηση συστάδων Μείωση διαστάσεων Ανάλυση βασικών συνιστωσών και ανάλυση παραγόντων Αποσύνθεση μονής τιμής Πολυδιάστατη κλιμάκωση Παραδείγματα στην εξόρυξη κειμένου Python Προεπεξεργασία δεδομένων The bag-of-word model Stemming και lemmization Ανάλυση συχνοτήτων λέξεων σύννεφα Ανάλυση συναισθημάτων Creatings σε μηχανές και συνεργατικό φιλτράρισμα συστάσεων Python Δεδομένα προτάσεων Συνεργατικό φιλτράρισμα βάσει στοιχείων Συνεργατικό φιλτράρισμα βάσει στοιχείων Παραδείγματα εξόρυξης μοτίβων συσχέτισης Python Αλγόριθμος συχνών συνόλων στοιχείων Ανάλυση καλαθιού αγοράς Παραδείγματα ανάλυση ακραίων τιμών στην Python Ανάλυση ακραίων τιμών Μέθοδοι ανίχνευσης ακραίων στοιχείων με βάση την απόσταση D ανίχνευση ακραίων διαστάσεων Παραδείγματα στη μελέτη περίπτωσης Python Machine Learning Κατανόηση επιχειρηματικού προβλήματος Προεπεξεργασία δεδομένων Επιλογή αλγορίθμου και συντονισμός Αξιολόγηση ευρημάτων Ανάπτυξη
Requirements
Γνώση και επίγνωση των Machine Learning βασικών
Testimonials (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Course - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Course - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback