Εξέλιξη Κομματιού

Βάσεις Ασφαλούς και Είρηνικής Τεχνητής Νοημοσύνης

  • Κεντρικές εννοιές: ασφάλεια, προκατάληψη, δικαιοσύνη, διαφάνεια
  • Τύποι προκατάληψης: συστήματος δεδομένων, αναπαράστασης, αλγορίθμου
  • Επισκόπηση ρυθμιστικών πλαισίων (Νομοθεσία ΤΝ της ΕΕ, GDPR κ.ά.)

Προκατάληψη σε εξατμισμένα μοντέλα

  • Το πώς η εξατμίση μπορεί να εισάγει ή να αυξήσει την προκατάληψη
  • Σπουδές και πρακτικές αποτυχίες στον πραγματικό κόσμο
  • Εξαγωγή προκατάληψης από τα δεδομένα και τις προβλέψεις του μοντέλου

Τεχνικές για την Εξαγωγή της Προκατάληψης

  • Στρатегικές επίπεδου δεδομένων (αναζυγότηση, επέκταση)
  • Στρατηγικές κατά την εκπαίδευση (ρυθμισμός, αντιπροσωπευτική διαφοροποίηση)
  • Στρατηγικές μετά την εκπαίδευση (φιλτράρισμα, κατάταξη)

Ασφάλεια και Σταθερότητα των Μοντέλων

  • Εντοπισμός ασφαλών ή επικίνδυνων εξόδων
  • Χειρισμός εχθρικών εισόδων
  • Εργάστηρια και δοκιμαστική προσέγγιση για τα εξατμισμένα μοντέλα

Έλεγχος και Παρακολούθηση Συστημάτων ΤΕΧΝ

  • Μετρικές προκατάληψης και δικαιοσύνης (π.χ., ανάλογη ανάληψη)
  • Εργαλεία εξήγησης και πλαίσια διαφάνειας
  • Συνεχής παρακολούθηση και τακτικές οικοδόμησης

Εργαλειών και Πρακτική Εφαρμογή

  • Χρήση open-source βιβλιοθηκών (π.χ., Fairlearn, Transformers, CheckList)
  • Πρακτική: Εντοπισμός και εξαγωγή προκατάληψης σε εξατμισμένο μοντέλο
  • Δημιουργία ασφαλών εξόδων μέσω του διαμόρφωσης προκαλύψεων και περιορισμών

Επιχειρηματικά Περιπτώματα και Ετοιμότητα για Συμμόρφωση

  • Καλές πρακτικές για την ενσωμάτωση ασφαλείας σε workflows LLM
  • Εγγραφή και model cards για συμμόρφωση
  • Προετοιμασία για έλεγχους και εξωτερικές αναθεώρησες

Επίσυνοψη και Επόμενα Βήματα

Απαιτήσεις

  • Κατανόηση των μο델ών μηχανικής μάθησης και των διεργασιών εκπαίδευσης
  • Εμπειρία στην παρακολούθηση και βελτιστοποίηση των μοντέλων γλωσσικής μάθησης (LLMs)
  • Γνώρισμα στο Python και συγκεκριμένα εννοίες της NLP

Απευθύνεται σε

  • Ομάδες πλήρωσης απαιτήσεων ΤΝ
  • Μηχανικοί ML
 14 Ώρες

Αριθμός συμμετέχοντων


Τιμή ανά συμμετοχαστή

Εφεξής Μαθήματα

Σχετικές Κατηγορίες