Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
Περιγραφή των Speech Recognition Τεχνολογιών
- Ιστορία και εξέλιξη της αναγνώρισης λόγου
- Ακουστικά μοντέλα, γλωσσικά μοντέλα και διάσχιση
- Σύγχρονες αρχιτεκτονικές: RNNs, transformers και Whisper
Προεπεξεργασία Ίχνους και Βασικά της Συντήρησης Κειμένου
- Διαχείριση μορφών ήχου και ρυθμών εγγραφής
- Καθαρισμός, κοπέλαδο και τμήματα ήχου
- Δημιουργία κειμένου από ήχο: πραγματικός χρόνος vs batch
Εφαρμογή με Whisper και άλλες APIs
- Εγκατάσταση και χρήση του OpenAI Whisper
- Αποκαλώνοντας cloud APIs (Google, Azure) για συντήρηση κειμένου
- Σύγκριση επίδοσης, λατενσίας και αξίας
Γλώσσες, Διάλεκτοι και Προσαρμογή του Τομέα
- Έρευνα με πολλαπλές γλώσσες και διάλεκτους
- Προσωπικοποιημένες λέξεις και υπογοήτευση τρόμου
- Διαχείριση γλώσσας για νομικά, ιατρικά ή επιστημονικά θέματα
Διεύθυνση Εξόδου και Περιβλήσιμο
- Πρόσθεση χρονικών σημάδιων, διαστάσεων και επισημάνσεων λέξεων
- Εξαγωγή σε μορφές κειμένου, SRT ή JSON
- Περιβλήσιμο συντάξεων σε εφαρμογές ή βάσεις δεδομένων
Use Case Εφαρμογή Λάβρα
- Συντήρηση συναντήσεων, επιστολών ή πόδκαστ
- Συστήματα κειμένου από τον λόγο
- Πραγματικά υπηρεσίες για βίντεο/ήχους περιβλήσιμο
Εξέταση, Οριοθέτηση και Ηθικό
- Μέτρηση ακρίβειας και βανκάρκινγκ των μοντέλων
- Ευθύτητα και δίκαιο στα μόντελα λόγου
- Προστασία προσωπικών στοιχείων και ευθύτητες
Συμπέρασμα και Επόμενα Μέτρα
Requirements
- Υπόσχεση γενικών κοντέντα τεχνητής νοημοσύνης και μηχανικής μάθησης
- Υποσχέση με εγγραφές ή πόρτες μουσικών τροφοδοσίας και εργαλεία
Αудитόριо
- Δεδομένων επιστήμονες και μηχανής για το AI του προσώπου δράσης
- Λογισμικόν των υλοποιητών βουτείζοντας τύπου εφαρμογές
- Διοργανώσεις που έχουν γίνει αυτόματο στην κάλυψη της φωνής
14 Hours