Εξέλιξη Κομματιού
Machine Learning Εισαγωγή
- Είδη μηχανικής μάθησης - εποπτευόμενο απέναντι σε χωρίς εποπτεύσεις
- Από τη στατιστική μάθηση προς τη μηχανική μάθηση
- Η διαδικασία εξόρυξης δεδομένων: κατανόηση επιχειρηματικών ανάγκων, έτοιμο πλάτωμα δεδομένων, μοντελοποίηση, εφαρμογή
- Επιλογή του σωστού αλγόριθμου για το έργο
- Overfitting και η διεκδίκηση bias-variance
Python και επισκόπηση βιβλιοθηκών ML
- Γιατί να χρησιμοποιήσουμε προγραμματιστικές γλώσσες για τη ML
- Επιλογή μεταξύ R και Python
- Python crash course και Jupyter Notebooks
- Python βιβλιοθήκες: pandas, NumPy, scikit-learn, matplotlib, seaborn
Ελέγχος και Εκτίμηση ML Αλγόριθμων
- Γενικοποίηση, overfitting, και επαλήθευση μοντέλου
- Στρατηγικές αξιολόγησης: holdout, cross-validation, bootstrapping
- Μέτρα για πρόβλεψη: ME, MSE, RMSE, MAPE
- Μέτρα για κλάση: ακρίβεια, σύχνος μήτρα, άνευ ισορροπίας τάξεων
- Εμφάνιση περιγραφής μοντέλου: καμπύλη κέρδους, ROC curve, lift curve
- Επιλογή μοντέλου και grid search για τυλίχα
Προετοιμασία Δεδομένων
- Εισαγωγή και αποθήκευση δεδομένων στο Python
- Αναζήτηση εξερεύνησης και περιορισμός στατιστικών
- Χειρισμός απουσίας τιμών και ανωμαλιών
- Στανδαρδοποίηση, πυθαγόρεια μετατροπή, και μετατροπή
- Εκ νέου κωδικοποίηση των ποικιλών δεδομένων και data wrangling με pandas
Αλγόριθμοι Κατάταξης
- Δυαδική απέναντι πολλαπλή κατάταξη
- Λογιστική εγρεφυσμό και διακριτικές συναρτήσεις
- Naïve Bayes, k-nearest neighbors
- Δεδομένων πολλαπλών: CART, Random Forests, Bagging, Boosting, XGBoost
- Υποστηρικτές μηχανής και kernels
- Τεχνικές ensemble learning
Πρόβλεψη Και Αριθμητικά
- Ελάχιστων τετραγώνων και επιλογή μεταβλητών
- Ρυθμίσεις: L1, L2
- Πολυωνυμική πρόβλεψη και non-linear models
- Πρόβλεψη δέντρα και splines
Unsupervised Learning
- Τεχνικές συγκέντρωσης: k-means, k-medoids, ιεραρχική συγκέντρωση, SOMs
- Ελαφρύ απόδοση διάστασης: PCA, παράγοντα ανάλυση, SVD
- Multidimensional scaling
Μετεώρικα Δεδομένων Μίνινγκ
- Προεπεξεργασία κειμένου και tokenization
- Bag-of-words, stemming, και lemmatization
- Ανάλυση συναισθήματος και συχνότητα λέξεων
- Εμφάνιση κειμένου με word clouds
Συστημάτα Συστάσεων
- User-based και item-based collaborative filtering
- Σχεδιασμός και αξιολόγηση συστημάτων συστάσεων
Αναζήτηση Μορφών Συνδέσεων
- Συχνές itemsets και Apriori algorithm
- Market basket analysis και lift ratio
Εντοπισμός Ανωμαλιών
- Ανάλυση εκτεταμένων τιμών
- Τρόποι βάσει απόστασης και πυκνότητας
- Εντοπισμός Ανωμαλιών σε δεδομένα υψηλής διάστασης
Machine Learning Περίπτωση Συμβουλευτική
- Κατανόηση του επιχειρηματικού προβλήματος
- Προετοιμασία δεδομένων και feature engineering
- Επιλογή μοντέλου και τυλίχα παραμέτρων
- Αξιολόγηση και παρουσίαση ανακαλύψεων
- Εφαρμογή
Συνοπτική Περίληψη και Επόμενα Βήματα
Απαιτήσεις
- Βασική κατανόηση των πολιτικών και της γραμμικής άλγεβρας
- Εξάρτηση από συνδέσεις δεδομένων ή εννοιών βιομηχανικής επιστήμης των δεδομένων
- Κάποια εμφάνιση στη πρόγραμμα (επιθυμητά Python ή R) είναι συμβουλευτική
- Ενδιαφέρον για τη μάθηση εφαρμοσμένων μηχανικών μάθησης για προγράμματα βασισμένα σε δεδομένα
Αудитόριо
- Αναλυτές και επιστήμονες δεδομένων
- Στατιστικοί και επαγγελματίες έρευνας
- Λογισμικούς ανάπτυξης και IT επαγγελματίες που διερευνούν εργαλεία μηχανικής μάθησης
- Οποιοσδήποτε που συμμετέχει σε έργα επιστήμης δεδομένων ή πρόβλεψης ανάλυσης
Σχόλια (3)
Ακόμη και με το χρέωμα ενός ημερή συναντήσεων πελατών, νιώθω πως έχω αποκτήσει αρκετά πιο ξεκάθαρη κατανόηση των διαδικασιών και τεχνικών που χρησιμοποιούνται στη μηχανική μάθηση και όταν θα εφαρμόζω μία προσέγγιση αντί για μία άλλη. Το έργο μας τώρα είναι να ασκηθούμε στα ό,τι έχουμε μάθει και να ξεκινήσουμε να τα εφαρμόζουμε στο πεδίο προβλημάτων μας.
Richard Blewett - Rock Solid Knowledge Ltd
Κομμάτι - Machine Learning – Data science
Μηχανική Μετάφραση
Μου άρεσε πως το εκπαιδευτικό πρόγραμμα εστίασε σε παραδείγματα και κώδικα. Νόμιζα ότι δεν ήταν δυνατό να περιέχεται τόσος περιεχόμενος σε τρία μέρη εκπαίδευσης, αλλά έφτασα σε λάθος. Το εκπαιδευτικό πρόγραμμα κάλυψε πολλά θέματα και τα όλα ολοκληρώθηκαν με μεγάλη λεπτομέρεια (ειδικά η ρύθμιση των παραμέτρων του μοντέλου - δεν περίμενα να υπάρχει χρόνος γι' αυτό και ήμουν εντελώς έκπληκτος).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Κομμάτι - Machine Learning – Data science
Μηχανική Μετάφραση
Εμφανίζει πολλές μεθόδους με προετοιμασμένα σcenάρια - πολύ καλά επεξεργασμένα υλικά και εύκολα για αναμόνηση των βήματων.
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Κομμάτι - Machine Learning – Data science
Μηχανική Μετάφραση