Course Outline

Προηγμένες Reinforcement Learning Τεχνικές

Κατασκευή Reinforcement Learning Μο델ων

Αναζήτηση και Χρήση

Εισαγωγή στο Reinforcement Learning

Μέθοδοι Πολιτικής

Q-Μάθηση και βαθύτατες δίκτυα Q (DQNs)

Σύνοψη και Προχωρημένα Βήματα

Εργασία με OpenAI Gym

  • Ισορροπία ανάμεσα στην αναζήτηση και τη χρήση σε μοντέλα RL
  • Στρατηγικές αναζήτησης: εψίλων-χρήση, softmax και περισσότερα
  • Εισαγωγή στη Q-μάθηση
  • Προσδιορισμός DQNs χρησιμοποιώντας TensorFlow
  • Βελτίωση της Q-μάθησης με αναπαραγωγή εμπειρίας και στόχο δικτύων
  • Πληθυντικά ανταγωνισμένα μάθηση πληροφορίας
  • Βαθύτατες καθοριστικές πολιτικές (DDPG)
  • Πρόσφατη βελτίωση της πολιτικής επεξεργασίας (PPO)
  • Αλγόριθμοι πολιτικής κάθεδρας
  • Τύπος REINFORCE αλγόριθμου και εφαρμογή του
  • Μεθόδοι actor-critic
  • Πρακτικά εφαρμογές του μηχανισμού μάθησης
  • Ενσωμάτωση RL μοντέλων σε πρακτικά περιβάλλοντα
  • Ορισμός περιβαλλόντων στο OpenAI Gym
  • Αποκάλυψη αντιπροσώπων σε δυναμικά περιβάλλοντα
  • Εκτίμηση της απόδοσης του αντιπροσώπου
  • Τι είναι το μηχανικό μάθηση;
  • Κλειδαρχίτες αρχές: πράξη, περιβάλλον, κατάσταση, ενέργειες και βόνυ
  • Αποθεματικότητες στο μηχανικό μάθηση

Requirements

Δημόσιο

  • Δεδομένων επιστήμονες
  • Εφαρμοστές μηχανικής μάθησης
  • Έρευνη στην τεχνητή νοημοσύνη
  • Δεξιότητα προγραμματισμού Python
  • Βασική κατανόηση των ψηφιακών μάθησης και βελτιστοποίησης αλγορίθμων
  • Γνώση των ευρεσιτεχνικών και μαθηματικών προτύπων χρησιμοποιούμενων στη βελτιστοποίηση εξόδων
 28 Hours

Number of participants


Price per participant

Upcoming Courses

Related Categories