Course Outline

Εισαγωγή στο Reinforcement Learning

  • Τι είναι το αυξητικό μάθηση;
  • Κλείδινα προτύπωμα: αγγελός, περιβάλλον, καταστάσεις, ενέργειες και βραβεία
  • Αποθema του αυξητικού μάθηση

Εξερεύνηση και Κλήρωση

  • Βαθμός εξερεύνησης και κλήρωσης στους μοντέλους RL
  • Στρατηγικές εξερεύνησης: epsilon-greedy, softmax και περισσότερα

Q-Μάθηση και βαθύ Q-Networks (DQNs)

  • Εισαγωγή στο Q-μάθηση
  • Προσδιορισμός DQNs χρησιμοποιώντας TensorFlow
  • Βελτίωση της Q-μάθηση με εξέλιξη πείρας και στόχου networks

Στοιχεία βάσει πολιτικής

  • Αλγόριθμοι gradient πολιτικής
  • Συνδέσιμος algorithm και τη διεξαγωγή
  • Actor-critic μέθοδοι

Εργασία στο OpenAI Gym

  • Κατασκευή περιβάλλων στο OpenAI Gym
  • Εμπίρευση αγγέλων σε δυναμικά περιβάλλοντα
  • Αξιολόγηση της εκτέλεσης αγγέλου

Προχωρημένες Reinforcement Learning Τεχνικές

  • Πολυ-αγγελός αυξητικό μάθηση
  • Deep deterministic πολιτική gradient (DDPG)
  • Proximal πολιτική επιτάχυνση (PPO)

Καθιέρωση Reinforcement Learning Models

  • Πραγματικά προβλήματα του αυξητικό μάθηση
  • Ενσωμάτωση RL models σε παραγωγικά περιβάλλοντα

Περίληψη και Συνέχεια

Requirements

  • Εμπειρία με την προγραμματισμό Python
  • Βασική κατανόηση των αλγορίθμων σχετικά με τη βελτιστοποίηση και τη μηχανική μάθηση
  • Γνώση για αλγόριθμους και μαθηματικά εννοιολογικά στοιχεία που χρησιμοποιούνται στη βελτιστοποίηση μάθησης

Πυξίδα

  • Δατά σκάντεντς
  • Εφαρμογέατες μηχανικής μάθησης
  • Έρευνες AI
 28 Hours

Number of participants


Price per participant

Upcoming Courses

Related Categories