Εξέλιξη Κομματιού

Εισαγωγή

  • Μάθηση μέσω θετικής ενίσχυσης

Elementδ από Reinforcement Learning

Σημαντικοί όροι (ενέργειες, καταστάσεις, ανταμοιβές, πολιτική, αξία, Q-value, κ.λπ.)

Επισκόπηση μεθόδων λύσεων σε πίνακα

Δημιουργία αντιπροσώπου λογισμικού

Κατανόηση προσεγγίσεων που βασίζονται σε αξία, βασισμένες σε πολιτικές και προσεγγίσεις βάσει μοντέλου

Εργασία με τη Διαδικασία Απόφασης Markov (MDP)

Πώς οι πολιτικές καθορίζουν τον τρόπο συμπεριφοράς ενός πράκτορα

Χρήση μεθόδων Monte Carlo

Χρονική-Διαφορική Μάθηση

n-βήμα Bootstrapping

Κατά προσέγγιση Μέθοδοι Λύσης

Πρόβλεψη επί της πολιτικής με προσέγγιση

Έλεγχος εντός πολιτικής με προσέγγιση

Μέθοδοι εκτός πολιτικής με προσέγγιση

Κατανόηση των ιχνών επιλεξιμότητας

Χρήση μεθόδων κλίσης πολιτικής

Περίληψη και Συμπέρασμα

Απαιτήσεις

  • Εμπειρία στη μηχανική μάθηση
  • Programming εμπειρία

Ακροατήριο

  • Επιστήμονες δεδομένων
 21 Ώρες

Αριθμός συμμετέχοντων


Τιμή ανά συμμετοχαστή

Εφεξής Μαθήματα

Σχετικές Κατηγορίες