Εξέλιξη Κομματιού

Εισαγωγή στην Συνδυαστική Μάθηση

  • Γενική περίληψη της συνδυαστικής μάθησης και των εφαρμογών της
  • Διαφορές μεταξύ προϊόντων, αμυδρών και συνδυαστικών εκπαιδεύσεων
  • Κλειδί προσανατολισμοί: αυτόματος, περιβάλλον, μερικά και πολιτική

Διεργασίες Απόφασης Markov (MDPs)

  • Κατανόηση καταστάσεων, ενεργειών, μερίδων και μεταβάσεων καταστάσεων
  • Συναρτήσεις αξίας και το Τύπος Bellman
  • Δυναμική προγραμματισμός για τη λύση MDPs

Κεντρικοί αλγόριθμοι RL

  • Ταβλοϊδές μέθοδοι: Q-Learning και SARSA
  • Μέθοδοι βάσης πολιτικής: αλγόριθμος REINFORCE
  • Frameworks Actor-Critic και οι εφαρμογές τους

Βάθυ Συνδυαστικό Μάθηση

  • Εισαγωγή σε Deep Q-Networks (DQN)
  • Αναπαραγωγή εμπειρίας και target networks
  • Μέθοδοι πολιτικών βάσης και προχωρημένες μέθοδοι deep RL

Frameworks και Εργαλεία RL

  • Εισαγωγή στο OpenAI Gym και άλλες περιβάλλοντα RL
  • Χρησιμοποίηση PyTorch ή TensorFlow για τη διδασκαλία μοντέλων RL
  • Διαδίδουν, δοκιμάζουν και βαθμολογούν αυτόματες επιχειρήσεις RL

Προκλήσεις στην RL

  • Καταμετρήσεις εξερεύνησης και εκμετάλλευσης κατά τη διδασκαλία
  • Πως να αντιμετωπίζουν σπάνιες μερίδες και προβλήματα υποθέτησης credit
  • Μακρυόχορη κλίμακα και υπολογιστικές προκλήσεις στην RL

Εργασίες Χειρονομήτης

  • Σχεδιασμός και εφαρμογή αλγορίθμων Q-Learning και SARSA από τη σκέψη
  • Διδασκαλία ενός DQN-based αυτοματισμού για να παίξει ένα απλό παιχνίδι στο OpenAI Gym
  • Καλλιέργεια RL μοντέλων για βελτιστοποίηση του επιδόσματος σε προσαρμογμένα περιβάλλοντα

Περίληψη και επόμενα βήματα

Απαιτήσεις

  • Ισχυρή κατανόηση των αρχών και των αλγορίθμων μηχανικής μάθησης
  • Δεξιότητα στην προγραμματισμό Python
  • Γνώση νευρωνικών δικτών και βιβλιοθηκών πρωτόγονου μάθηματος

Ακροατήριο

  • Μηχανικοί μηχανικής μάθησης
  • Εξειδικευμένοι στο ΤΕΧ
 14 Ώρες

Αριθμός συμμετέχοντων


Τιμή ανά συμμετοχαστή

Σχόλια (1)

Εφεξής Μαθήματα

Σχετικές Κατηγορίες