Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
Εισαγωγή στο Speech Recognition και Σύνθεση
- Βασικές αρχές τεχνολογιών ομιλίας
- Βασικά συστήματα αναγνώρισης ομιλίας
- Επισκόπηση της σύνθεσης του λόγου
Ο ρόλος των LLMs στις τεχνολογίες του λόγου
- Κατανόηση LLM στην αναγνώριση ομιλίας
- LLM στη σύνθεση ομιλίας
- Πλεονεκτήματα των LLM έναντι των παραδοσιακών μοντέλων
Δεδομένα για Speech Recognition και Σύνθεση
- Συλλογή και επεξεργασία δεδομένων για τεχνολογίες ομιλίας
- Σύνολα δεδομένων κατάρτισης για LLMs
- Δεοντολογικά ζητήματα στη διαχείριση δεδομένων
Εκπαίδευση LLM για Εφαρμογές Λόγου
- Τεχνικές βαθιάς μάθησης στην αναγνώριση ομιλίας
- Αρχιτεκτονικές νευρωνικών δικτύων για σύνθεση ομιλίας
- Βελτιστοποίηση LLM για συγκεκριμένες εργασίες ομιλίας
Εφαρμογή LLM στα Συστήματα Ομιλίας
- Ενσωμάτωση LLM με μηχανές αναγνώρισης ομιλίας
- Ανάπτυξη συνθεσάιζερ ομιλίας με φυσικό ήχο
- Σχεδιασμός διεπαφής χρήστη για εφαρμογές ομιλίας
Δοκιμή και αξιολόγηση συστημάτων ομιλίας
- Μέθοδοι για τον έλεγχο της ακρίβειας αναγνώρισης ομιλίας
- Αξιολόγηση της φυσικότητας του συνθετικού λόγου
- Μελέτες χρηστών και συλλογή σχολίων
Προκλήσεις και λύσεις στις τεχνολογίες του λόγου
- Αντιμετώπιση κοινών προβλημάτων στην αναγνώριση ομιλίας
- Ξεπερνώντας τα εμπόδια στη σύνθεση ομιλίας
- Μελέτες περίπτωσης: επιτυχημένες υλοποιήσεις LLM
Μελλοντικές κατευθύνσεις στις τεχνολογίες του λόγου
- Αναδυόμενες τάσεις στην αναγνώριση και σύνθεση ομιλίας
- Ο ρόλος των LLM στα πολυγλωσσικά συστήματα ομιλίας
- Καινοτομίες και ερευνητικές ευκαιρίες
Έργο και Αξιολόγηση
- Σχεδιασμός και εφαρμογή συστήματος αναγνώρισης ή σύνθεσης ομιλίας με χρήση LLM
- Κριτικές από ομοτίμους και ομαδικές συζητήσεις
- Τελική αξιολόγηση και ανατροφοδότηση
Περίληψη και Επόμενα Βήματα
Requirements
- Κατανόηση βασικών εννοιών προγραμματισμού
- Συνιστάται η εμπειρία στον προγραμματισμό Python αλλά δεν απαιτείται
- Η εξοικείωση με τις βασικές έννοιες μηχανικής μάθησης και νευρωνικών δικτύων είναι επωφελής
Ακροατήριο
- προγραμματιστές λογισμικού
- Επιστήμονες δεδομένων
- διαχειριστές προϊόντων
14 Hours