Επικοινωνήστε μαζί μας

Εξέλιξη Κομματιού

Υποδομή EXO ως Κώδικας

  • Επισκόπηση προτύπων εγκατάστασης EXO: μονό-κόμβος, πολυ-κόμβος και συστοιχίες RDMA
  • Αυτοματοποίηση εγκατάστασης εξαρτήσεων (Xcode, uv, Node.js, Rust) με διαχείριση διαμορφώσεων
  • Χρήση Nix flakes για αναπαραγώμενες κατασκευές EXO και περιβάλλοντα προγραμματιστών
  • Σύνταξη playbooks Ansible ή σενάρια shell για ανεπίβλεπτη προμήθεια συστοιχιών

Αναπαραγώμενες Κατασκευές και Ενσωμάτωση CI

  • Καθορισμός εξαρτήσεων και κατασκευή του dashboard σε ροές εργασιών CI
  • Εκτέλεση δοκιμών καπνού EXO σε εκτελεστές GitHub Actions ή GitLab CI
  • Δημιουργία χρυσών εικόνων και ροών εργασίας ανάκλησης βασισμένων σε στιγμιότυπα για εικονικές μηχανές macOS και Linux
  • Έκδοση προσαρμοσμένων καρτών μοντέλων alongside τον κώδικα εφαρμογής

Ανακάλυψη Συστοιχιών και Αυτοματοποίηση Δικτύου

  • Διαμόρφωση mDNS και στατικού DNS για αξιόπιστη ανακάλυψη κόμβων libp2p
  • Αυτοματοποίηση δημιουργίας προφίλ δικτύου και διαχείρισης γεφυρών Thunderbolt στο macOS
  • Χρήση προσαρμοσμένων ονοματοχωρίων (EXO_LIBP2P_NAMESPACE) για διαχωρισμό συστοιχιών dev, staging και prod
  • Κανόνες τείχους προστασίας και τμηματοποίηση δικτύου για περιβάλλοντα πολλών πελατών

Διαχείριση Αποθήκευσης και Κύκλου Ζωής Μοντέλου

  • Σχεδιασμός στρατηγικών για EXO_MODELS_DIRS και EXO_MODELS_READ_ONLY_DIRS
  • Σύνδεση κοινοχρησμένων χώρων NFS ή SAN ως μη μεταγλώττισης αποθήκες μοντέλων για γρήγορη προμήθεια
  • Εκκαθάριση παρωχημένων cache και πολιτικές διατήρησης εκδοχών βάρους
  • Αυτοματοποίηση προκαταρκτικών λήψεων μοντέλων και ελέγχων υγείας πριν από κύλιες ενημερώσεις

Παρακολούθηση και Ειδοποιήσεις

  • Αποστολή καταγραφών EXO σε κεντρικοποιημένο αρχείο καταγραφής (ELK, Loki ή Splunk)
  • Κατασκευή dashboard Grafana από την έξοδο EXO_TRACING_ENABLED
  • Ειδοποιήσεις για αλλαγές στη σύνδεση συστοιχίας, γεγονότα OOM και αυξήσεις καθυστέρησης συμπέρασης
  • Συσχέτιση τηλεμετρίας υλικού macmon με υποβαθμίσεις απόδοσης μοντέλου

Ενημέρωση, Ανάκληση και Ανάκαμψη από Καταστροφές

  • Προετοιμασία ενημερώσεων δυαδικών αρχείων EXO σε έναν κόμβο canary πριν από παγκόσμια rollout
  • Ανάκληση σε επίπεδο μοντέλου: εναλλαγή μεταξύ κβαντισμένων εκδοχών χωρίς ξανα-λήψη
  • Αντίγραφα ασφαλείας και αποκατάσταση κατάστασης συστοιχίας, προσαρμοσμένων ονοματοχωρίων και cache βαρών
  • Τεκμηρίωση εγχειριδίων ανάκαμψης για σενάρια πλήρους επαναπρομήθειας συστοιχίας

Ενίσχυση Ασφάλειας και Συμμόρφωση

  • Εφαρμογή TLS στο στρώμα αντιδρώμενου προξενίου (nginx, traefik) για το dashboard και το API
  • Εφαρμογή περιορισμού ρυθμού API και λευκής λίστας IP για endpoints EXO
  • Απομόνωση συστοιχιών με VLANs και πολιτικές δικτύου μηδενικής εμπιστοσύνης
  • Έλεγχος πρόσβασης και διατήρηση απογραφής εγκατεστημένων μοντέλων και εκδοχών

Απαιτήσεις

  • Εμπειρία με πρακτικές DevOps (CI/CD, IaC, container orchestration)
  • Γνώση της διαχείρισης συστήματος και πακέτων σε macOS ή Linux
  • Κατανόηση εννοιών δικτύου, DNS και αποθήκευσης

Κοινό

  • Μηχανικοί DevOps
  • Αρχιτέκτονες υποδομής
  • SREs υπεύθυνοι για φορτία εργασίας AI σε τοπικές εγκαταστάσεις
 21 Ώρες

Αριθμός συμμετέχοντων


Τιμή ανά συμμετέχοντα

Σχόλια (2)

Εφεξής Μαθήματα

Σχετικές Κατηγορίες