Course Outline
Machine Learning Εισαγωγή
- Τύποι μηχανικής μάθησης – επίβλεψη vs χωρίς επίβλεψη
- Από τη στατιστική μάθηση προς τη μηχανική μάθηση
- Η διαδικασία εξόρυξης δεδομένων: κατανόηση επιχειρηματικών ανάγκων, έτοιμο πλήρους δεδομένων, μοντελοποίηση, εφαρμογή
- Επιλογή του σωστού αλγόριθμου για το έργο
- Overfitting και ο διαλογισμός bias-variance
Python και επισκόπηση βιβλιοθηκών ML
- Γιατί χρησιμοποιούμε προγραμματιστικές γλώσσες για τη ML
- Επιλογή μεταξύ R και Python
- Python crash course και Jupyter Notebooks
- Python βιβλιοθήκες: pandas, NumPy, scikit-learn, matplotlib, seaborn
Δοκιμή και Αξιολόγηση ML Αλγορίθμων
- Γενικέυση, overfitting, και αποδοχή του μοντέλου
- Στρατηγικές αξιολόγησης: holdout, cross-validation, bootstrapping
- Μέτρα για παραμετρική πρόβλεψη: ME, MSE, RMSE, MAPE
- Μέτρα για ταξινομική ανάλυση: ακρίβεια, σύχνος μήτρα, άσωμα κλάσεις
- Επιδιάτυπη παρουσίαση του μοντέλου: profit curve, ROC curve, lift curve
- Επιλογή μοντέλων και grid search για ανακόλληση
Προετοιμασία Δεδομένων
- Εισαγωγή και αποθήκευση δεδομένων στο Python
- Αναζήτηση εξερεύνησης και συνοπτικών πληροφοριών
- Χειρισμός αδιάθεσης των δεδομένων και outliers
- Στανδαρδικοποίηση, προσαρμογή και μετατροπή
- Αλλαγή τύπου δεδομένων και εξόρυξη δεδομένων με pandas
Ταξινομικά Αλγόριθμα
- Δίτομη vs πολύτομη ταξινόμηση
- Λογιστική παραγωγικότητα και διακριτικές συνάρτησες
- Naïve Bayes, k-nearest neighbors
- Δεδομένα που αφορούν δείκτες: CART, Random Forests, Bagging, Boosting, XGBoost
- Υποστηρικτικά μηχανή και kernels
- Τεχνικές συνολικής μάθησης
Παραμετρική Πρόβλεψη και Αριθμητική Εκτίμηση
- Χαμηλότερο τετράγωνο και επιλογή μεταβλητών
- Μέθοδοι προσαρμογής: L1, L2
- Πολυωνυμική παραμετρική πρόβλεψη και μοντέλα χωρίς γραμμικότητα
- Παραμετρικά δέντρα και splines
Neural Networks
- Εισαγωγή στους νευρωνικούς υπολογιστές και τη βαθιά μάθηση
- Συνακτικές συναρτήσεις, επίπεδα, και backpropagation
- Multilayer perceptrons (MLP)
- Χρήση TensorFlow ή PyTorch για βασική μοντέλωση νευρωνικών υπολογιστών
- Νευρωνικοί υπολογιστές για ταξινόμηση και παραμετρική πρόβλεψη
Πώληση Forecasting και Predictive Analytics
- Χρονικές σειρές vs πρόβλεψη βασισμένη στην παραμετρική ανάλυση
- Χειρισμός σεζονάλων και τάση δεδομένων
- Κατασκευή μοντέλου πρόβλεψης πώλησης χρησιμοποιώντας τεχνικές ML
- Αξιολόγηση ακρίβειας και άσταθη πρόβλεψη
- Business ερμηνεία και μετάδοση των αποτελεσμάτων
Unsupervised Learning
- Τεχνικές συγκέντρωσης: k-means, k-medoids, ιεραρχική συγκέντρωση, SOMs
- Ελαφρύ αποδοχή διάστασης: PCA, παραγωγικότητα, SVD
- Multidimensional scaling
Εξόρυξη Κειμένου
- Προετοιμασία κειμένου και tokenization
- Bag-of-words, stemming, και lemmatization
- Ανάλυση των απόψεων και συχνότητα λέξεων
- Πινακογραφία δεδομένων κειμένου με word clouds
Συστημάτα Συστάσεων
- User-based και item-based collaborative filtering
- Προγραμματισμός και αξιολόγηση συστημάτων συστάσεων
Εξόρυξη Αποδείξεων Συνδέσεων
- Συχνές αντικειμενολογικές συναλλαγές και Apriori algorithm
- Ανάλυση market basket και lift ratio
Εντοπισμός Εξωτερικών Τιμών
- Ανάλυση εξαιρετικών τιμών
- Τεχνικές με βάση απόσταση και πυκνότητα
- Εντοπισμός εξωτερικών τιμών σε δεδομένα υψηλής διάστασης
Machine Learning Περίπτωση περίπτωσης μελέτης
- Κατανόηση του επιχειρηματικού προβλήματος
- Προετοιμασία δεδομένων και feature engineering
- Επιλογή μοντέλου και ανακόλληση παραμέτρων
- Αξιολόγηση και παρουσίαση των ευρημάτων
- Εφαρμογή
Σύνοψη και Επόμενα Βήματα
Requirements
- Βασική γνώση των κονцепτών του μηχανικού μάθησης, όπως το επίβλεπτο και άνευ επιβλέψεως μάθηση
- Εξοικείωση με την προγραμματισμό Python (μεταβλητές, επαναλήψεις, λειτουργίες)
- Κάποια εμπειρία στον χειρισμό δεδομένων με βιβλιοθήκες όπως τη pandas ή το NumPy είναι χρήσιμη αλλά όχι απαραίτητη
- Δεν προσδίδεται προηγούμενη εμπειρία με προβληματικά μοντέλα ή νευρωνικά δίκτυα
Πúblico
- Επιστήμονες δεδομένων
- Αναλυτές Business
- Ιντιγράφους λογισμικού και τεχνικού προσωπικού που εργάζεται με δεδομένα
Testimonials (2)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Course - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.