Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
Εισαγωγή
- Μάθηση μέσω θετικής ενίσχυσης
Στοιχεία του Reinforcement Learning
Σημαντικοί όροι (Ενέργειες, καταστάσεις, ανταμοιβές, πολιτική, αξία, Q-Value, κ.λπ.)
Επισκόπηση μεθόδων λύσεων σε πίνακα
Δημιουργία αντιπροσώπου λογισμικού
Κατανόηση προσεγγίσεων που βασίζονται σε αξία, βασισμένες σε πολιτικές και προσεγγίσεις βάσει μοντέλου
Εργασία με τη Διαδικασία Αποφάσεων Markov (MDP)
Πώς οι πολιτικές καθορίζουν τον τρόπο συμπεριφοράς ενός πράκτορα
Χρήση μεθόδων Monte Carlo
Χρονική-Διαφορική Μάθηση
n-βήμα Bootstrapping
Κατά προσέγγιση Μέθοδοι Λύσης
Πρόβλεψη επί της πολιτικής με προσέγγιση
Έλεγχος εντός πολιτικής με προσέγγιση
Μέθοδοι εκτός πολιτικής με προσέγγιση
Κατανόηση των ιχνών επιλεξιμότητας
Χρήση μεθόδων κλίσης πολιτικής
Περίληψη και Συμπέρασμα
Requirements
- Εμπειρία στη μηχανική μάθηση
- Programming εμπειρία
Ακροατήριο
- Επιστήμονες δεδομένων
21 Hours