Course Outline

Εισαγωγή στον Διδακτικός Αποδοτικός Μηχανισμός (Reinforcement Learning)

  • Γενικές πληροφορίες για το Διδακτικός Αποδοτικός Μηχανισμός και τις εφαρμογές του
  • Τα διαφορετικά στοιχεία μεταξύ του παρακολουθημένου, ανεπίσημου και του διδακτικού ορόθυτρου
  • Κλειδιά συνδέσεις: η πράξη, το περιβάλλον, οι αποδόσεις και η πολιτική

Διαδικασίες Παρακολούθησης Markov (MDPs)

  • Κατανόηση των καταστάσεων, ενέργειών, αποδοσιών και μεταβάσεων καταστάσεων
  • Πινακίδες τιμών και την εξίσωση Bellman
  • Δυναμική προγραμματισμός για τη λύση MDPs

Κεντρικά Αλγόριθμα RL

  • Μέθοδοι πίνακα: Q-Learning και SARSA
  • Πολιτική βασημένες μεθόδους: το REINFORCE εφηφερμογράμα
  • Συστήματα Actor-Critic και οι εφαρμογές τους

Δικτύωση με βάση την αποδοτικότητα (Deep Reinforcement Learning)

  • Εισαγωγή στα Deep Q-Networks (DQN)
  • Experience replay και target networks
  • Policy gradients και προχωρημένες μέθοδες αποδοτικότητα (deep RL)

Πλαίσια και εργαλεία RL

  • Εισαγωγή στο OpenAI Gym και άλλα περιβάλλοντα RL
  • Χρησιμοποίηση PyTorch ή TensorFlow για την ανάπτυξη μοντέλων RL
  • Καθοδήγηση, δοκιμή και benchmarking RL agents

Αντιμετώπιση προβλημάτων στο RL

  • Ισορροπία εξερεύνησης και αξιοποίησης κατά την πρόσβαση
  • Διαχείριση των ρητών αποδοσιών και προβλήματα ανακέφαλης επιπέδου
  • Ευελιξία και υπολογιστικά προβλήματα στο RL

Κανονικές εργασίες

  • Ανάπτυξη Q-Learning και SARSA αλγόριθμων από την άνω
  • Καθοδήγηση ενός ασχολητή DQN σε ένα πράγματος παιχνιδί OpenAI Gym
  • Διατυπωτική ρύθμιση RL μοντέλων για τη βελτίωση συνδρομών σε δικτυακά περιβάλλοντα

Σύνοψη και επόμενα βήματα

Requirements

  • Ισχυρός κατανοητικός ρόλος των αρχών και των αλγορίθμων του μηχανικού μάθησης
  • Δεξιότητα στο προγραμματισμό Python
  • Εμπειρία με νευρωνικές δικτύα και πλαίσια βαθύ μάθησης

Πολιτικό Προσβάσιμο

  • Τεχνικοί μηχανικού μάθησης
  • Ειδικοί AI
 14 Hours

Number of participants


Price per participant

Testimonials (1)

Upcoming Courses

Related Categories