Ευχαριστούμε που στάλθηκε η αποσαφήνισή σας! Ένα μέλος της ομάδου μας θα επικοινωνήσει μαζί σας σύντομα.
Ευχαριστούμε για την εκδήλωση κράτησης! Ένας από τους συνεργάτες μας θα επικοινωνήσει μαζί σας σύντομα.
Εξέλιξη Κομματιού
Εισαγωγή
- Μάθηση μέσω θετικής ενίσχυσης
Elementδ από Reinforcement Learning
Σημαντικοί όροι (ενέργειες, καταστάσεις, ανταμοιβές, πολιτική, αξία, Q-value, κ.λπ.)
Επισκόπηση μεθόδων λύσεων σε πίνακα
Δημιουργία αντιπροσώπου λογισμικού
Κατανόηση προσεγγίσεων που βασίζονται σε αξία, βασισμένες σε πολιτικές και προσεγγίσεις βάσει μοντέλου
Εργασία με τη Διαδικασία Απόφασης Markov (MDP)
Πώς οι πολιτικές καθορίζουν τον τρόπο συμπεριφοράς ενός πράκτορα
Χρήση μεθόδων Monte Carlo
Χρονική-Διαφορική Μάθηση
n-βήμα Bootstrapping
Κατά προσέγγιση Μέθοδοι Λύσης
Πρόβλεψη επί της πολιτικής με προσέγγιση
Έλεγχος εντός πολιτικής με προσέγγιση
Μέθοδοι εκτός πολιτικής με προσέγγιση
Κατανόηση των ιχνών επιλεξιμότητας
Χρήση μεθόδων κλίσης πολιτικής
Περίληψη και Συμπέρασμα
Απαιτήσεις
- Εμπειρία στη μηχανική μάθηση
- Programming εμπειρία
Ακροατήριο
- Επιστήμονες δεδομένων
21 Ώρες