Course Outline

Εισαγωγή

  • Μάθηση μέσω θετικής ενίσχυσης

Elementδ από Reinforcement Learning

Σημαντικοί όροι (ενέργειες, καταστάσεις, ανταμοιβές, πολιτική, αξία, Q-value, κ.λπ.)

Επισκόπηση μεθόδων λύσεων σε πίνακα

Δημιουργία αντιπροσώπου λογισμικού

Κατανόηση προσεγγίσεων που βασίζονται σε αξία, βασισμένες σε πολιτικές και προσεγγίσεις βάσει μοντέλου

Εργασία με τη Διαδικασία Απόφασης Markov (MDP)

Πώς οι πολιτικές καθορίζουν τον τρόπο συμπεριφοράς ενός πράκτορα

Χρήση μεθόδων Monte Carlo

Χρονική-Διαφορική Μάθηση

n-βήμα Bootstrapping

Κατά προσέγγιση Μέθοδοι Λύσης

Πρόβλεψη επί της πολιτικής με προσέγγιση

Έλεγχος εντός πολιτικής με προσέγγιση

Μέθοδοι εκτός πολιτικής με προσέγγιση

Κατανόηση των ιχνών επιλεξιμότητας

Χρήση μεθόδων κλίσης πολιτικής

Περίληψη και Συμπέρασμα

Requirements

  • Εμπειρία στη μηχανική μάθηση
  • Programming εμπειρία

Ακροατήριο

  • Επιστήμονες δεδομένων
 21 Hours

Number of participants


Price per participant

Upcoming Courses

Related Categories