Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
Εισαγωγή στο Reinforcement Learning
- Επισκόπηση της ενισχυτικής μάθησης και των εφαρμογών της
- Διαφορές μεταξύ εποπτευόμενης, χωρίς επίβλεψη και ενισχυτικής μάθησης
- Βασικές έννοιες: πράκτορας, περιβάλλον, ανταμοιβές και πολιτική
Markov Decision Processes (MDPs)
- Κατανόηση καταστάσεων, ενεργειών, ανταμοιβών και μεταβάσεων καταστάσεων
- Συναρτήσεις τιμής και η εξίσωση Bellman
- Δυναμικός προγραμματισμός για την επίλυση MDP
Αλγόριθμοι πυρήνα RL
- Πίνακες μέθοδοι: Q-Learning και SARSA
- Μέθοδοι που βασίζονται σε πολιτικές: Αλγόριθμος REINFORCE
- Τα πλαίσια ηθοποιών-κριτικών και οι εφαρμογές τους
Βαθύ Reinforcement Learning
- Εισαγωγή στα Deep Q-Networks (DQN)
- Ζήστε την εμπειρία αναπαραγωγής και στόχευσης δικτύων
- Διαβαθμίσεις πολιτικής και προηγμένες μέθοδοι βαθιάς RL
RL Frameworks and Tools
- Εισαγωγή στο OpenAI Γυμναστήριο και άλλα περιβάλλοντα RL
- Χρήση PyTorch ή TensorFlow για ανάπτυξη μοντέλων RL
- Εκπαίδευση, δοκιμή και συγκριτική αξιολόγηση πρακτόρων RL
Προκλήσεις στο RL
- Εξισορρόπηση εξερεύνησης και εκμετάλλευσης στην εκπαίδευση
- Αντιμετώπιση αραιών ανταμοιβών και προβλημάτων ανάθεσης πιστώσεων
- Scalaικανότητα και υπολογιστικές προκλήσεις στο RL
Hands-On Activities
- Εφαρμογή των αλγορίθμων Q-Learning και SARSA από την αρχή
- Εκπαίδευση ενός πράκτορα που βασίζεται στο DQN για να παίξει ένα απλό παιχνίδι στο OpenAI Gym
- Βελτιστοποιήστε τα μοντέλα RL για βελτιωμένη απόδοση σε προσαρμοσμένα περιβάλλοντα
Περίληψη και Επόμενα Βήματα
Requirements
- Ισχυρή κατανόηση των αρχών και των αλγορίθμων μηχανικής μάθησης
- Ικανότητα στον προγραμματισμό Python
- Εξοικείωση με τα νευρωνικά δίκτυα και τα πλαίσια βαθιάς μάθησης
Ακροατήριο
- Μηχανικοί μηχανικής εκμάθησης
- Ειδικοί τεχνητής νοημοσύνης
14 Hours
Testimonials (1)
Εκπαιδευτής απάντησης σε ερωτήσεις μαζί με το πρόγραμμα.
Adrian
Course - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Machine Translated