Εξέλιξη Κομματιού
Μόνιμο 1: Στρωτό Python για Εργασιακές Συντελεστές ML
• Έναρξη μαθήματος και κατάρτιση περιβάλλοντος
Σύμφωνη ορισμοί στόχων και κατάρτιση επαναδημιουργήσιμου χώρου εργασίας ML του Python
• Βασικά στοιχεία της γλώσσας Python (ταχεία προσέγγιση)
Επιμέλεια συντακτικών κανόνων, ροής ελέγχου, συναρτήσεων και μοτίβων που χρησιμοποιούνται συνηθώς σε βάσεις κώδικα ML
• Δομές δεδομένων για ML
Λίστες, λεξικά, σύνολα και τετράδες για χαρακτηριστικά, ετικέτες και μεταδεδομένα
• Αντικειμενοστροφές κατανοητικές και λειτουργικά εργαλεία
Εκφράσεις μετασχηματισμών χρησιμοποιώντας κατανοητικές και υψηλότερες συναρτήσεις
• Αντικειμενοστροφές Python για αναπτυξιώτες ML
Τάξεις, μεθόδους, σύνθεση και πρακτικές αποφάσεις σχεδιασμού
• dataclasses και ελαφρά μοντέλα
Τυποποιημένες εγκυρές για διαμόρφωση, παραδείγματα και αποτελέσματα
• Επισκευαστικά και διαχειριστικά κωδικές
Ταξινόμηση, caching, καταγραφή και πρακτικές εκτέλεσης που εξασφαλίζουν ασφάλεια πόρων
• Εργασία με αρχεία και μονοπάτια
Αξιόπιστη χειρισμός συνόλων δεδομένων και προτυπωμένα διαμορφωτικά μεταφόρματα
• Εξαιρέσεις και αποφασιστική προγραμματισμός
Σύγγραφος ML scripts που αποτυγχάνουν ασφαλώς και διαφανώς
• Μονάδες, πακέτα και δομή έργου
Οργάνωση αξιοποιώντας επαναχρησιμοποιήσιμες βάσεις κώδικα ML
• Τύπος και ποιότητα κώδικα
Προειδοποιήσεις τύπου, καταγραφή και δομημένη δομή που ευνοεί την προσοχή τους
Μόνιμο 2: Αριθμητικό Python, SciPy και Διαχείριση Δεδομένων
• Θεμελιώσεις NumPy για vectorised computing
Αποδοτικές επιχειρηματολογίες πίνακα και κωδικός που έχει συνειδητοποιήσει την απόδοση
• Ευρετηριοποίηση, κομμάτια, broadcasting και εικόνες
Αξιόπιστη μεταχείριση τάνυγματος και απόδοση λόγω εικόνας
• Βασικά στοιχεία γραμμικής αλγεβρής με NumPy και SciPy
Σταθερές επιχειρηματολογίες πίνακα και αναλύσεις που χρησιμοποιούνται στο ML
• Εμβαθύνοντας στο SciPy
Στατιστική, βελτιστοποίηση, παραμέτρωση καμπών και σπάνια πίνακες
• Pandas για tabular ML data
Καθαρισμός, συνδυασμός, άθροιση και προετοιμασία συνόλων δεδομένων
• Εμβαθύνοντας στο scikit-learn
Επιφάνεια estimator, pipelines και επαναδημιουργήσιμες εργασιακές διαδικασίες
• Βασικές εργαλεία οπτικοποίησης
Σχεδιαστικά σχέδια για εξερεύνηση δεδομένων και συμπεριφορά του μοντέλου
Μόνιμο 3: Προγραμματιστικές πρακτικές για την κατασκευή εφαρμογών ML
• Από notebook σε διαχειρίσιμο έργο
Αναθεώρηση εξερευνητικού κώδικα σε δομημένα πακέτα
• Διαχείριση διαμόρφωσης
Εξωτερικοποιημένες παραμέτρους και επικύρωση κατάρχεσης
• Καταγραφή, προειδοποιήσεις και παρατηρητικότητα
Συμπεριφορά καταγραφής για συστήματα ML που εξασφαλίζουν την αποδότηση
• Επαναχρησιμοποιήσιμα συστατικά με OOP και σύνθεση
Σχεδιασμός εκτελεσιμότητας transformers και predictors
• Πρακτικές σχεδιαστικές πρακτικές
Pipeline, Factory ή Registry, Strategy και Adapter patterns
• Επαλήθευση δεδομένων και συναρτήσεις δομής
Πρόληψη ασαφών προβλημάτων δεδομένων
• Απόδοση και profiling
Αναγνώριση κρίσιμων σημείων και εφαρμογή τεχνικών βελτιστοποίησης
• I/O μοντέλου και διεπαφές πρόβλεψης
Αξιόπιστη διατήρηση και καθαρές διεπαφές πρόβλεψης
• Από ξεκαθάριση έως ολοκληρωμένη μικρή κατασκευή
Ολοκληρωμένο pipeline ML σε παραγωγή με διαμόρφωση και καταγραφή
Μόνιμο 4: Στατιστική Μάθηση για Tabular, Text και Image
• Θεμελιώσεις αξιολόγησης
Αποδεικτικά και επικεφαλίδες, ειλικρινής cross-validation και στοιχεία μετρήσεων που συμφωνούν με την επιχείρηση
• Προηγμένη tabular ML
Regularised GLMs, δέντρα συμπλοκής και preprocessing χωρίς διαδοχικό λάθος
• Εξισορρόπηση και αβεβαιότητα
Platt scaling, isotonic regression, bootstrap και conformal prediction
• Κλασικές μέθοδοι NLP
Συμβιβαστικές εντύπωσης, TF-IDF, γραμμικά μοντέλα και Naive Bayes
• Μοντέλα θεματολογίας
Βασικές ιδέες LDA και πρακτικές περιορισμοί
• Κλασική υπολογιστική οπτική
HOG, PCA και pipelines με βάση χαρακτηριστικά
• Ανάλυση λάθους
Εντοπισμός κατατόμησης, θόρυβος ετικέτας και επιφανειακές σχέσεις
• Εργαστήρια χειρισμού
Απόδειξη tabular pipeline χωρίς διαδοχικό λάθος
Σύγκριση και ερμηνεία text baseline
Κλασική vision baseline με δομημένη ανάλυση αποτυχιών
Μόνιμο 5: Νευρωνικά Δίκτυα για Tabular, Text και Image
• Μάθηση κατάληξης εκπαίδευσης
Καθαρές PyTorch loops με AMP, clipping και αναπαραγωγικότητα
• Βελτιστοποίηση και κατάργηση
Αρχικοποίηση, εντυπωσιακότητα, optimisers και schedulers
• Αναμειξη πάθους και κλίμακα
Συσσώρευση gradient και στρατηγικές checkpointing
• Νευρωνικά δίκτυα tabular
Κατηγορικές ενσωμάτωσεις, feature crosses και ablation studies
• Νευρωνικά δίκτυα text
Ενσωμάτωσεις, CNNs, BiLSTM ή GRU και sequence handling
• Νευρωνικά δίκτυα vision
Βασικές επιχειρηματολογίες CNN και αρχιτεκτονικές ResNet-style
• Εργαστήρια χειρισμού
Επαναχρησιμοποιήσιμη πλατφόρμα εκπαίδευσης
Σύγκριση tabular NN με boosting
CNN με augmentation και scheduling experiments
Μόνιμο 6: Προηγμένες Νευρωνικές Αρχιτεκτονικές
• Στρατηγικές μεταφοράς μάθησης
Freeze και unfreeze patterns, διακριτικά ρυθμοί μάθησης
• Αρχιτεκτονικές transformer για text
Βαθιά εσωτερικά self-attention και προσεγγίσεις fine-tuning
• Αρχιτεκτονικές vision και dense prediction
ResNet, EfficientNet, Vision Transformers και έννοιες U-Net
• Προηγμένες tabular αρχιτεκτονικές
TabTransformer, FT-Transformer και Deep and Cross networks
• Σκέψεις για χρονολογικά στοιχεία
Χρονικά κλάσματα και εντοπισμός covariate shift
• PEFT και τεχνικές αποδοτικότητας
LoRA, distillation και εμπορικές αντιδράσεις quantisation
• Εργαστήρια χειρισμού
Fine-tuning pretrained text transformer
Fine-tuning pretrained vision model
Σύγκριση tabular transformer με GBDT
Μόνιμο 7: Συστήματα Τεχνητής Παραγωγής
• Θεμελιώσεις prompting
Στρωτή prompting και ελεγχόμενη γενέση
• Θεμελιώσεις LLM
Εντύπωση, εξαρμόνιση οδηγιών και μείωση ψευδών εντυπώσεων
• Retrieval-Augmented Generation
Τμήματα, ενσωμάτωσεις, hybrid search και στοιχεία μετρήσεων
• Στρατηγικές fine-tuning
LoRA και QLoRA με ελέγχους ποιότητας δεδομένων
• Μοντέλα diffusion
Λογική latent diffusion και πρακτική προσαρμογή
• Συνθετικά tabular data
CTGAN και παράγοντες απόρρητου
• Εργαστήρια χειρισμού
Παραγωγή υποδοχής RAG με παραγωγή
Εξαλείφηση ορθότητας output με ενforcement συντακτικής δομής
Προαιρετική πειραματισμός diffusion
Μόνιμο 8: AI Agents και MCP
• Σχεδιασμός agent loop
Παρατήρηση, προγραμματισμός, δράση, ανασκόπηση και συνέχεια
• Αρχιτεκτονικές agent
ReAct, plan-and-execute και συντονισμός πολλαπλών agents
• Διαχείριση μνήμης
Επεισόδια, σημαντική και scratchpad προσεγγίσεις
• Ολοκλήρωση εργαλείων και ασφάλεια
Συνθήκες εργαλείων, sandboxing και άμυνα από ένσημα κώδικα
• Πλαίσια αξιολόγησης
Αναπαραγωγικές τράξεις, πακέτα εργασιών και εξέταση αναπαραγωγικότητας
• MCP και συμβατότητα με βάση πρωτόκολλα
Σχεδιασμός MCP servers με ασφαλή εξωτερικοποίηση εργαλείων
• Εργαστήρια χειρισμού
Κατασκευή agent από την αρχή
Εξωτερικοποίηση εργαλείων μέσω MCP-style server
Δημιουργία evaluation harness με περιορισμούς ασφαλείας
Απαιτήσεις
Οι συμμετέχοντες θα πρέπει να έχουν γνώση λειτουργικής προγραμματισμού στο Python.
Αυτό το πρόγραμμα απευθύνεται σε επαγγελματίες τεχνικού τομέα με διαδρομή από μεταξύ επίπεδου έως προηγμένου.
Σχόλια (2)
το οικοσύστημα ML δεν περιορίζεται μόνο στο MLFlow αλλά περιλαμβάνει επίσης το Optuna, hyperops, docker και docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Κομμάτι - MLflow
Μηχανική Μετάφραση
Καπνίστηκα συμμετέχοντας στην εκπαίδευση Kubeflow, η οποία διεξήχθη απόδεσμα. Αυτή η εκπαίδευση μου παρέσχε τη δυνατότητα να συγκεντρύνω γνώσεις για υπηρεσίες AWS, K8s και όλα τα εργαλεία devOps που αφορούν το Kubeflow, τα οποία αποτελούν τις απαραίτητες βάσεις για να κατανοήσω επαρκώς το θέμα. Θέλω να ευχαριστήσω τον Malawski Marcin για την υπομονή και την επιγνωμοσύνη του στην εκπαίδευση και τη συμβουλή πάνω σε αρχές καλών πρακτικών. Ο Malawski προσεγγίζει το θέμα από διάφορες γωνίες, χρησιμοποιώντας διάφορα εργαλεία διανομής όπως το Ansible, EKS kubectl, Terraform. Τώρα είμαι σίγουρος πως κινούμαι στη σωστή κατεύθυνση.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Κομμάτι - Kubeflow
Μηχανική Μετάφραση