Εξέλιξη Κομματιού

Βάσεις της Κλάσης Ήχου

  • Τύποι γεγονότων ήχου: περιβαλλοντικοί, μηχανικοί, δημιουργούμενοι από ανθρώπους
  • Εξάμηνη εφαρμογή: παρακολούθηση, μονίτορινγκ, αυτομάτωση
  • Κλάση ήχου vs εντοπισμός vs τμηματοποίηση

Δεδομένα Ήχου και Εξόδου χαρακτηριστικών

  • Τύποι αρχείων ήχου και διαμορφώσεις
  • Ρυθμός δειγματοληψίας, παράθυρο, μέγεθος φράμου
  • Εξοχή MFCCs, χρωματικές χαρακτηριστικές, mel-spectrograms

Προετοιμασία Δεδομένων και Σήμανση

  • UrbanSound8K, ESC-50, και προσαρμογμένες βάσεις δεδομένων
  • Ετικετοποίηση γεγονότων ήχου και χρονικών συνόρων
  • Ζυγισμός βάσει δεδομένων και εναυξυνση του ήχου

Δημιουργία Μοντέλων Κλάσης Ήχου

  • Χρήση σύντονων νευρωνικών δικτών (CNNs) για ήχους
  • Είσοδος μοντέλου: αυθόματο waveform vs χαρακτηριστικά
  • Συναρτήσεις παραβάσεων, μέτρα εκτίμησης και ανάλογη σφάλματα (overfitting)

Εντοπισμός Συμβάντριων και Χρονική Τοποθέτηση

  • Στρατηγικές εντοπισμού πλαίσιου και τμήματος
  • Εξυφαίνουσε των ανακαλύψεων χρησιμοποιώντας διαθέσεις και ομαδοποίηση
  • Εξόδου προβλήψεων σε χρονικές γραμμές ήχου

Προχωρημένα Θέματα και Εξεργασία πραγματικού χρόνου

  • Μεταφορά μάθησης σε low-data σενάρια
  • Εφαρμογή μοντέλων με TensorFlow Lite ή ONNX
  • Streaming εξεργασία ήχου και χρόνια αναμονής (latency) σημειώσεις

Ανάπτυξη Έργων και Εφαρμοστικά Σενάρια

  • Σχεδίαση μιας πλήρους φύλλου εργασίας: απορρόφηση ως κατηγοριοποίηση
  • Ανάπτυξη μιας δείγματος αναλυτική (proof-of-concept) για παρακολούθηση, ελέγχου ποιότητας ή μονίτορινγκ
  • Καταγραφή, κερδιμένο και ενσωμάτωση σε πλατφόρμες ή API

Σύνοψη και Επόμενα Βήματα

Απαιτήσεις

  • Κατανόηση των εννοιών και της εκπαίδευσης μοντέλων μηχανικής μάθησης
  • Εμπειρία στην προγραμματισμό Python και την προεξέργαση δεδομένων
  • Γνώση των βασικών αρχών ψηφιακού ήχου

Ακροατήριο

  • Data scientists
  • Υπεύθυνοι μηχανικής μάθησης
  • Ερευνητές και πρόγραμματιστές σε εξεργασία ήχων
 21 Ώρες

Αριθμός συμμετέχοντων


Τιμή ανά συμμετοχαστή

Εφεξής Μαθήματα

Σχετικές Κατηγορίες