Course Outline

Εισαγωγή

    Μάθηση μέσω θετικής ενίσχυσης

Στοιχεία του Reinforcement Learning

Σημαντικοί όροι (Ενέργειες, καταστάσεις, ανταμοιβές, πολιτική, αξία, Q-Value, κ.λπ.)

Επισκόπηση μεθόδων λύσεων σε πίνακα

Δημιουργία αντιπροσώπου λογισμικού

Κατανόηση προσεγγίσεων που βασίζονται σε αξία, βασισμένες σε πολιτικές και προσεγγίσεις βάσει μοντέλου

Εργασία με τη Διαδικασία Αποφάσεων Markov (MDP)

Πώς οι πολιτικές καθορίζουν τον τρόπο συμπεριφοράς ενός πράκτορα

Χρήση μεθόδων Monte Carlo

Χρονική-Διαφορική Μάθηση

n-βήμα Bootstrapping

Κατά προσέγγιση Μέθοδοι Λύσης

Πρόβλεψη επί της πολιτικής με προσέγγιση

Έλεγχος εντός πολιτικής με προσέγγιση

Μέθοδοι εκτός πολιτικής με προσέγγιση

Κατανόηση των ιχνών επιλεξιμότητας

Χρήση μεθόδων κλίσης πολιτικής

Περίληψη και Συμπέρασμα

Requirements

  • Εμπειρία στη μηχανική μάθηση
  • Programming εμπειρία

Ακροατήριο

  • Επιστήμονες δεδομένων
  21 Hours

Number of participants


Starts

Ends


Dates are subject to availability and take place between 09:30 and 16:30.

Price per participant

Related Courses

Reinforcement Learning with Java

  21 Hours

AI and Robotics for Nuclear - Extended

  120 Hours

AI and Robotics for Nuclear

  80 Hours

Introduction to Bing AI: Enhancing Search with Artificial Intelligence

  14 Hours

Fundamentals of Intelligent Driving

  21 Hours

Related Categories