Course Outline

Εισαγωγή

    Τι είναι τα Large Language Models (LLMs); LLMs εναντίον παραδοσιακών μοντέλων NLP Επισκόπηση των χαρακτηριστικών και της αρχιτεκτονικής του LLM Προκλήσεις και περιορισμοί του LLM

Κατανόηση LLM

    Ο κύκλος ζωής ενός LLM Πώς λειτουργούν τα LLM Τα κύρια συστατικά ενός LLM: κωδικοποιητής, αποκωδικοποιητής, προσοχή, ενσωματώσεις κ.λπ.

Ξεκινώντας

    Ρύθμιση του περιβάλλοντος ανάπτυξης Εγκατάσταση ενός LLM ως εργαλείου ανάπτυξης, π.χ. Google Colab, Hugging Face

Συνεργασία με LLMs

    Διερεύνηση διαθέσιμων επιλογών LLM Δημιουργία και χρήση ενός LLM Βελτιστοποίηση ενός LLM σε ένα προσαρμοσμένο σύνολο δεδομένων

Σύνοψη κειμένου

    Κατανόηση του έργου της σύνοψης κειμένου και των εφαρμογών του Χρήση ενός LLM για εξαγωγή και αφηρημένη σύνοψη κειμένου Αξιολόγηση της ποιότητας των συνόψεων που δημιουργούνται χρησιμοποιώντας μετρήσεις όπως ROUGE, BLEU κ.λπ.

Ερώτηση Απάντηση

    Κατανόηση της εργασίας της απάντησης ερωτήσεων και των εφαρμογών της Χρήση ενός LLM για απάντηση ερωτήσεων ανοιχτού και κλειστού τομέα Αξιολόγηση της ακρίβειας των απαντήσεων που δημιουργούνται χρησιμοποιώντας μετρήσεις όπως F1, EM κ.λπ.

Δημιουργία κειμένου

    Κατανόηση του έργου της δημιουργίας κειμένου και των εφαρμογών του Χρήση ενός LLM για δημιουργία κειμένου υπό όρους και χωρίς όρους Έλεγχος του στυλ, του τόνου και του περιεχομένου των δημιουργούμενων κειμένων χρησιμοποιώντας παραμέτρους όπως θερμοκρασία, top-k, top-p κ.λπ.

Ενσωμάτωση LLM με άλλα πλαίσια και πλατφόρμες

    Χρήση LLM με PyTorch ή TensorFlow Χρήση LLM με Flask ή Streamlit Χρήση LLM με Google Cloud ή AWS

Αντιμετώπιση προβλημάτων

    Κατανόηση των κοινών σφαλμάτων και σφαλμάτων στα LLM Χρησιμοποιώντας το TensorBoard για παρακολούθηση και οπτικοποίηση της εκπαιδευτικής διαδικασίας Χρήση PyTorch Lightning για απλοποίηση του κώδικα εκπαίδευσης και βελτίωση της απόδοσης Χρήση συνόλων δεδομένων Hugging Face για φόρτωση και προεπεξεργασία των δεδομένων

Περίληψη και Επόμενα Βήματα

Requirements

    Κατανόηση της επεξεργασίας φυσικής γλώσσας και της βαθιάς μάθησης Εμπειρία με Python και PyTorch ή εμπειρία προγραμματισμού Basic TensorFlow

Ακροατήριο

    Προγραμματιστές λάτρεις του NLP Επιστήμονες δεδομένων
 14 Hours

Number of participants



Price per participant

Related Courses

Advanced Stable Diffusion: Deep Learning for Text-to-Image Generation

21 Hours

Related Categories