Course Outline
Machine Learning Εισαγωγή
- Είδη μηχανικής μάθησης - εποπτευόμενο απέναντι σε χωρίς εποπτεύσεις
- Από τη στατιστική μάθηση προς τη μηχανική μάθηση
- Η διαδικασία εξόρυξης δεδομένων: κατανόηση επιχειρηματικών ανάγκων, έτοιμο πλάτωμα δεδομένων, μοντελοποίηση, εφαρμογή
- Επιλογή του σωστού αλγόριθμου για το έργο
- Overfitting και η διεκδίκηση bias-variance
Python και επισκόπηση βιβλιοθηκών ML
- Γιατί να χρησιμοποιήσουμε προγραμματιστικές γλώσσες για τη ML
- Επιλογή μεταξύ R και Python
- Python crash course και Jupyter Notebooks
- Python βιβλιοθήκες: pandas, NumPy, scikit-learn, matplotlib, seaborn
Ελέγχος και Εκτίμηση ML Αλγόριθμων
- Γενικοποίηση, overfitting, και επαλήθευση μοντέλου
- Στρατηγικές αξιολόγησης: holdout, cross-validation, bootstrapping
- Μέτρα για πρόβλεψη: ME, MSE, RMSE, MAPE
- Μέτρα για κλάση: ακρίβεια, σύχνος μήτρα, άνευ ισορροπίας τάξεων
- Εμφάνιση περιγραφής μοντέλου: καμπύλη κέρδους, ROC curve, lift curve
- Επιλογή μοντέλου και grid search για τυλίχα
Προετοιμασία Δεδομένων
- Εισαγωγή και αποθήκευση δεδομένων στο Python
- Αναζήτηση εξερεύνησης και περιορισμός στατιστικών
- Χειρισμός απουσίας τιμών και ανωμαλιών
- Στανδαρδοποίηση, πυθαγόρεια μετατροπή, και μετατροπή
- Εκ νέου κωδικοποίηση των ποικιλών δεδομένων και data wrangling με pandas
Αλγόριθμοι Κατάταξης
- Δυαδική απέναντι πολλαπλή κατάταξη
- Λογιστική εγρεφυσμό και διακριτικές συναρτήσεις
- Naïve Bayes, k-nearest neighbors
- Δεδομένων πολλαπλών: CART, Random Forests, Bagging, Boosting, XGBoost
- Υποστηρικτές μηχανής και kernels
- Τεχνικές ensemble learning
Πρόβλεψη Και Αριθμητικά
- Ελάχιστων τετραγώνων και επιλογή μεταβλητών
- Ρυθμίσεις: L1, L2
- Πολυωνυμική πρόβλεψη και non-linear models
- Πρόβλεψη δέντρα και splines
Unsupervised Learning
- Τεχνικές συγκέντρωσης: k-means, k-medoids, ιεραρχική συγκέντρωση, SOMs
- Ελαφρύ απόδοση διάστασης: PCA, παράγοντα ανάλυση, SVD
- Multidimensional scaling
Μετεώρικα Δεδομένων Μίνινγκ
- Προεπεξεργασία κειμένου και tokenization
- Bag-of-words, stemming, και lemmatization
- Ανάλυση συναισθήματος και συχνότητα λέξεων
- Εμφάνιση κειμένου με word clouds
Συστημάτα Συστάσεων
- User-based και item-based collaborative filtering
- Σχεδιασμός και αξιολόγηση συστημάτων συστάσεων
Αναζήτηση Μορφών Συνδέσεων
- Συχνές itemsets και Apriori algorithm
- Market basket analysis και lift ratio
Εντοπισμός Ανωμαλιών
- Ανάλυση εκτεταμένων τιμών
- Τρόποι βάσει απόστασης και πυκνότητας
- Εντοπισμός Ανωμαλιών σε δεδομένα υψηλής διάστασης
Machine Learning Περίπτωση Συμβουλευτική
- Κατανόηση του επιχειρηματικού προβλήματος
- Προετοιμασία δεδομένων και feature engineering
- Επιλογή μοντέλου και τυλίχα παραμέτρων
- Αξιολόγηση και παρουσίαση ανακαλύψεων
- Εφαρμογή
Συνοπτική Περίληψη και Επόμενα Βήματα
Requirements
- Βασική κατανόηση των πολιτικών και της γραμμικής άλγεβρας
- Εξάρτηση από συνδέσεις δεδομένων ή εννοιών βιομηχανικής επιστήμης των δεδομένων
- Κάποια εμφάνιση στη πρόγραμμα (επιθυμητά Python ή R) είναι συμβουλευτική
- Ενδιαφέρον για τη μάθηση εφαρμοσμένων μηχανικών μάθησης για προγράμματα βασισμένα σε δεδομένα
Αудитόριо
- Αναλυτές και επιστήμονες δεδομένων
- Στατιστικοί και επαγγελματίες έρευνας
- Λογισμικούς ανάπτυξης και IT επαγγελματίες που διερευνούν εργαλεία μηχανικής μάθησης
- Οποιοσδήποτε που συμμετέχει σε έργα επιστήμης δεδομένων ή πρόβλεψης ανάλυσης
Testimonials (3)
Αν και έχασα μια μέρα λόγω συνεδριάσεων πελατών, αισθάνομαι ότι έχω πολύ καλύτερη επίγνωση των διαδικασιών και τεχνικών που χρησιμοποιούνται στο Machine Learning και όταν θα επέλεξα μία προσέγγιση αντί της άλλης. Τώρα, η πρόκλησή μας είναι να πράξουμε ό,τι έμαθαμε και να ξεκινήσουμε να το εφαρμόζουμε στον πεδίο προβλημάτων μας.
Richard Blewett - Rock Solid Knowledge Ltd
Course - Machine Learning – Data science
Machine Translated
Μου αρέσει ότι το εκπαιδευτικό πρόγραμμα συντελεstε οικονομία κλείστηκε με παραδείγmατα και προγραmmατισμό. Πίστευα ότι είναι αδύνατo να συμπεριληφθούν τόσα περιεχόmενα σε τρεις μέρες εκπαίδευσης, αλλά έκeιχα λάθo. Το εκπαιδευτικό πρόγραμμα καλύφθηκαν πολλά θέματα και όλα γίνονταν με εξαιρετική λεπτομέρeια (ειδικά το tuning των παραμέτρων του μοντέλου - δεν έχτηκα ότι θα υπήρξε χρόνος γι' αυτό και είμαι πολύ εκπληκτικός).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Course - Machine Learning – Data science
Machine Translated
Επιστρέφει πολλούς μεθόδους με προετοιμασμένα σκρίπτ- εξcellent υλικά προετοιμασμένα και εύκολα για αναποδοχή
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Course - Machine Learning – Data science
Machine Translated