Course Outline

Περιγραφή των Speech Recognition Τεχνολογιών

  • Ιστορία και εξέλιξη της αναγνώρισης λόγου
  • Ακουστικά μοντέλα, γλωσσικά μοντέλα και διάσχιση
  • Σύγχρονες αρχιτεκτονικές: RNNs, transformers και Whisper

Προεπεξεργασία Ίχνους και Βασικά της Συντήρησης Κειμένου

  • Διαχείριση μορφών ήχου και ρυθμών εγγραφής
  • Καθαρισμός, κοπέλαδο και τμήματα ήχου
  • Δημιουργία κειμένου από ήχο: πραγματικός χρόνος vs batch

Εφαρμογή με Whisper και άλλες APIs

  • Εγκατάσταση και χρήση του OpenAI Whisper
  • Αποκαλώνοντας cloud APIs (Google, Azure) για συντήρηση κειμένου
  • Σύγκριση επίδοσης, λατενσίας και αξίας

Γλώσσες, Διάλεκτοι και Προσαρμογή του Τομέα

  • Έρευνα με πολλαπλές γλώσσες και διάλεκτους
  • Προσωπικοποιημένες λέξεις και υπογοήτευση τρόμου
  • Διαχείριση γλώσσας για νομικά, ιατρικά ή επιστημονικά θέματα

Διεύθυνση Εξόδου και Περιβλήσιμο

  • Πρόσθεση χρονικών σημάδιων, διαστάσεων και επισημάνσεων λέξεων
  • Εξαγωγή σε μορφές κειμένου, SRT ή JSON
  • Περιβλήσιμο συντάξεων σε εφαρμογές ή βάσεις δεδομένων

Use Case Εφαρμογή Λάβρα

  • Συντήρηση συναντήσεων, επιστολών ή πόδκαστ
  • Συστήματα κειμένου από τον λόγο
  • Πραγματικά υπηρεσίες για βίντεο/ήχους περιβλήσιμο

Εξέταση, Οριοθέτηση και Ηθικό

  • Μέτρηση ακρίβειας και βανκάρκινγκ των μοντέλων
  • Ευθύτητα και δίκαιο στα μόντελα λόγου
  • Προστασία προσωπικών στοιχείων και ευθύτητες

Συμπέρασμα και Επόμενα Μέτρα

Requirements

  • Υπόσχεση γενικών κοντέντα τεχνητής νοημοσύνης και μηχανικής μάθησης
  • Υποσχέση με εγγραφές ή πόρτες μουσικών τροφοδοσίας και εργαλεία

Αудитόριо

  • Δεδομένων επιστήμονες και μηχανής για το AI του προσώπου δράσης
  • Λογισμικόν των υλοποιητών βουτείζοντας τύπου εφαρμογές
  • Διοργανώσεις που έχουν γίνει αυτόματο στην κάλυψη της φωνής
 14 Hours

Number of participants


Price per participant

Upcoming Courses

Related Categories