Course Outline

Machine Learning Εισαγωγή

  • Τύποι μηχανικής μάθησης – επίβλεψη vs χωρίς επίβλεψη
  • Από τη στατιστική μάθηση προς τη μηχανική μάθηση
  • Η διαδικασία εξόρυξης δεδομένων: κατανόηση επιχειρηματικών ανάγκων, έτοιμο πλήρους δεδομένων, μοντελοποίηση, εφαρμογή
  • Επιλογή του σωστού αλγόριθμου για το έργο
  • Overfitting και ο διαλογισμός bias-variance

Python και επισκόπηση βιβλιοθηκών ML

  • Γιατί χρησιμοποιούμε προγραμματιστικές γλώσσες για τη ML
  • Επιλογή μεταξύ R και Python
  • Python crash course και Jupyter Notebooks
  • Python βιβλιοθήκες: pandas, NumPy, scikit-learn, matplotlib, seaborn

Δοκιμή και Αξιολόγηση ML Αλγορίθμων

  • Γενικέυση, overfitting, και αποδοχή του μοντέλου
  • Στρατηγικές αξιολόγησης: holdout, cross-validation, bootstrapping
  • Μέτρα για παραμετρική πρόβλεψη: ME, MSE, RMSE, MAPE
  • Μέτρα για ταξινομική ανάλυση: ακρίβεια, σύχνος μήτρα, άσωμα κλάσεις
  • Επιδιάτυπη παρουσίαση του μοντέλου: profit curve, ROC curve, lift curve
  • Επιλογή μοντέλων και grid search για ανακόλληση

Προετοιμασία Δεδομένων

  • Εισαγωγή και αποθήκευση δεδομένων στο Python
  • Αναζήτηση εξερεύνησης και συνοπτικών πληροφοριών
  • Χειρισμός αδιάθεσης των δεδομένων και outliers
  • Στανδαρδικοποίηση, προσαρμογή και μετατροπή
  • Αλλαγή τύπου δεδομένων και εξόρυξη δεδομένων με pandas

Ταξινομικά Αλγόριθμα

  • Δίτομη vs πολύτομη ταξινόμηση
  • Λογιστική παραγωγικότητα και διακριτικές συνάρτησες
  • Naïve Bayes, k-nearest neighbors
  • Δεδομένα που αφορούν δείκτες: CART, Random Forests, Bagging, Boosting, XGBoost
  • Υποστηρικτικά μηχανή και kernels
  • Τεχνικές συνολικής μάθησης

Παραμετρική Πρόβλεψη και Αριθμητική Εκτίμηση

  • Χαμηλότερο τετράγωνο και επιλογή μεταβλητών
  • Μέθοδοι προσαρμογής: L1, L2
  • Πολυωνυμική παραμετρική πρόβλεψη και μοντέλα χωρίς γραμμικότητα
  • Παραμετρικά δέντρα και splines

Neural Networks

  • Εισαγωγή στους νευρωνικούς υπολογιστές και τη βαθιά μάθηση
  • Συνακτικές συναρτήσεις, επίπεδα, και backpropagation
  • Multilayer perceptrons (MLP)
  • Χρήση TensorFlow ή PyTorch για βασική μοντέλωση νευρωνικών υπολογιστών
  • Νευρωνικοί υπολογιστές για ταξινόμηση και παραμετρική πρόβλεψη

Πώληση Forecasting και Predictive Analytics

  • Χρονικές σειρές vs πρόβλεψη βασισμένη στην παραμετρική ανάλυση
  • Χειρισμός σεζονάλων και τάση δεδομένων
  • Κατασκευή μοντέλου πρόβλεψης πώλησης χρησιμοποιώντας τεχνικές ML
  • Αξιολόγηση ακρίβειας και άσταθη πρόβλεψη
  • Business ερμηνεία και μετάδοση των αποτελεσμάτων

Unsupervised Learning

  • Τεχνικές συγκέντρωσης: k-means, k-medoids, ιεραρχική συγκέντρωση, SOMs
  • Ελαφρύ αποδοχή διάστασης: PCA, παραγωγικότητα, SVD
  • Multidimensional scaling

Εξόρυξη Κειμένου

  • Προετοιμασία κειμένου και tokenization
  • Bag-of-words, stemming, και lemmatization
  • Ανάλυση των απόψεων και συχνότητα λέξεων
  • Πινακογραφία δεδομένων κειμένου με word clouds

Συστημάτα Συστάσεων

  • User-based και item-based collaborative filtering
  • Προγραμματισμός και αξιολόγηση συστημάτων συστάσεων

Εξόρυξη Αποδείξεων Συνδέσεων

  • Συχνές αντικειμενολογικές συναλλαγές και Apriori algorithm
  • Ανάλυση market basket και lift ratio

Εντοπισμός Εξωτερικών Τιμών

  • Ανάλυση εξαιρετικών τιμών
  • Τεχνικές με βάση απόσταση και πυκνότητα
  • Εντοπισμός εξωτερικών τιμών σε δεδομένα υψηλής διάστασης

Machine Learning Περίπτωση περίπτωσης μελέτης

  • Κατανόηση του επιχειρηματικού προβλήματος
  • Προετοιμασία δεδομένων και feature engineering
  • Επιλογή μοντέλου και ανακόλληση παραμέτρων
  • Αξιολόγηση και παρουσίαση των ευρημάτων
  • Εφαρμογή

Σύνοψη και Επόμενα Βήματα

Requirements

  • Βασική γνώση των κονцепτών του μηχανικού μάθησης, όπως το επίβλεπτο και άνευ επιβλέψεως μάθηση
  • Εξοικείωση με την προγραμματισμό Python (μεταβλητές, επαναλήψεις, λειτουργίες)
  • Κάποια εμπειρία στον χειρισμό δεδομένων με βιβλιοθήκες όπως τη pandas ή το NumPy είναι χρήσιμη αλλά όχι απαραίτητη
  • Δεν προσδίδεται προηγούμενη εμπειρία με προβληματικά μοντέλα ή νευρωνικά δίκτυα

Πúblico

  • Επιστήμονες δεδομένων
  • Αναλυτές Business
  • Ιντιγράφους λογισμικού και τεχνικού προσωπικού που εργάζεται με δεδομένα
 28 Hours

Number of participants


Price per participant

Testimonials (2)

Upcoming Courses

Related Categories