Επικοινωνήστε μαζί μας

Εξέλιξη Κομματιού

Εισαγωγή στην Ενισχυτική Μάθηση

  • Τι είναι η ενισχυτική μάθηση;
  • Βασικές έννοιες: πράκτορας, περιβάλλον, καταστάσεις, ενέργειες και ανταμοιβές
  • Προκλήσεις στην ενισχυτική μάθηση

Εξερεύνηση και Εκμετάλλευση

  • Εξισορρόπηση εξερεύνησης και εκμετάλλευσης σε μοντέλα RL
  • Στρατηγικές εξερεύνησης: epsilon-greedy, softmax και άλλες

Q-Learning και Βαθιά Δίκτυα Q (DQNs)

  • Εισαγωγή στο Q-learning
  • Υλοποίηση DQNs με χρήση TensorFlow
  • Βελτιστοποίηση της Q-learning με χρήση επανάληψης εμπειριών (experience replay) και δικτύων στόχου (target networks)

Μέθοδοι Βασισμένες σε Πολιτικές (Policy-Based Methods)

  • Αλγόριθμοι πολιτικής κλίσης (policy gradient)
  • Ο αλγόριθμος REINFORCE και η υλοποίησή του
  • Μέθοδοι actor-critic

Εργασία με το OpenAI Gym

  • Ρύθμιση περιβαλλόντων στο OpenAI Gym
  • Προσομοίωση πρακτόρων σε δυναμικά περιβάλλοντα
  • Αξιολόγηση της απόδοσης των πρακτόρων

Προηγμένες Τεχνικές Ενισχυτικής Μάθησης

  • Ενισχυτική μάθηση πολλαπλών πρακτόρων (multi-agent reinforcement learning)
  • Βαθύ ντετερμινιστικό gradient πολιτικής (DDPG)
  • Βελτιστοποίηση εγγύς πολιτικής (PPO)

Ανάπτυξη Μοντέλων Ενισχυτικής Μάθησης

  • Πραγματικές εφαρμογές της ενισχυτικής μάθησης
  • Ενσωμάτωση μοντέλων RL σε περιβάλλοντα παραγωγής

Περίληψη και Επόμενα Βήματα

Απαιτήσεις

  • Εμπειρία στον προγραμματισμό με Python
  • Βασική κατανόηση των εννοιών της βαθιάς μάθησης και της μηχανικής μάθησης
  • Γνώση αλγορίθμων και μαθηματικών εννοιών που χρησιμοποιούνται στην ενισχυτική μάθηση

Κοινό-στόχος

  • Επιστήμονες δεδομένων
  • Επαγγελματίες μηχανικής μάθησης
  • Ερευνητές τεχνητής νοημοσύνης
 28 Ώρες

Αριθμός συμμετέχοντων


Τιμή ανά συμμετέχοντα

Εφεξής Μαθήματα

Σχετικές Κατηγορίες