GPU NVIDIA Programming - Εκτεταμένη Training Course
Αυτό το εκπαιδευτικό μάθημα βασίζεται στο πώς να προγραμματίσετε GPU για παράλληλους υπολογιστές, πώς να χρησιμοποιήσετε διάφορες πλατφόρμες, πώς να εργαστείτε με την πλατφόρμα CUDA και τα χαρακτηριστικά της και πώς να εκτελέσετε διάφορες τεχνικές βελτιστοποίησης χρησιμοποιώντας το CUDA. Ορισμένες από τις εφαρμογές περιλαμβάνουν εφαρμογές βαθιάς μάθησης, ανάλυσης, επεξεργασίας εικόνας και μηχανικής.
Course Outline
Εισαγωγή
Κατανόηση των Βασικών Αρχών της Ετερογενούς Υπολογιστικής Μεθοδολογίας
Γιατί Παράλληλος Υπολογισμός; Κατανόηση της ανάγκης για παράλληλους υπολογιστές
Πολυπύρηνες Επεξεργαστές - Αρχιτεκτονική και Σχεδιασμός
Εισαγωγή στα νήματα, τα βασικά νήματα και τις βασικές έννοιες του παράλληλου Programming
Κατανόηση των Βασικών Αρχών των GPU Διαδικασιών Βελτιστοποίησης Λογισμικού
OpenMP - Πρότυπο για παράλληλη βάση οδηγιών Programming
Hands on / Επίδειξη Διάφορων Προγραμμάτων σε Πολυπύρηνες Μηχανές
Εισαγωγή στην GPU Υπολογιστική
GPUs για Παράλληλους Υπολογιστές
Μοντέλο GPU Programming
Hands on / Επίδειξη Διάφορων Προγραμμάτων στο GPU
SDK, Εργαλειοθήκη και Εγκατάσταση Περιβάλλοντος για GPU
Εργασία με διάφορες βιβλιοθήκες
Επίδειξη GPU και Εργαλεία με δείγματα προγραμμάτων και OpenACC
Κατανόηση του μοντέλου CUDA Programming
Εκμάθηση της Αρχιτεκτονικής CUDA
Εξερεύνηση και ρύθμιση των περιβαλλόντων ανάπτυξης CUDA
Εργασία με το CUDA Runtime API
Κατανόηση του μοντέλου μνήμης CUDA
Εξερεύνηση πρόσθετων δυνατοτήτων API CUDA
AccessΚαθολική μνήμη αποτελεσματικά στο CUDA: Βελτιστοποίηση παγκόσμιας μνήμης
Βελτιστοποίηση μεταφορών δεδομένων στο CUDA με χρήση ροών CUDA
Χρήση κοινής μνήμης στο CUDA
Κατανόηση και χρήση Ατομικών Λειτουργιών και Οδηγιών στο CUDA
Μελέτη περίπτωσης: Βασική ψηφιακή επεξεργασία εικόνας με CUDA
Εργασία με Multi-GPU Programming
Προηγμένο προφίλ υλικού και δειγματοληψία σε NVIDIA / CUDA
Χρήση του CUDA Dynamic Parallelism API για εκκίνηση Dynamic Kernel
Περίληψη και Συμπέρασμα
Requirements
- Γ Programming
- Linux GCC
Open Training Courses require 5+ participants.
GPU NVIDIA Programming - Εκτεταμένη Training Course - Booking
GPU NVIDIA Programming - Εκτεταμένη Training Course - Enquiry
GPU NVIDIA Programming - Εκτεταμένη - Consultancy Enquiry
Consultancy Enquiry
Testimonials (1)
Ενέργεια και χιούμορ των εκπαιδευτών.
Tadeusz Kaluba - Nokia Solutions and Networks Sp. z o.o.
Course - NVIDIA GPU Programming - Extended
Machine Translated
Upcoming Courses
Related Courses
Κατάρτιση Ανθρώπινης Δυνάμεως (AI) με το Huawei Ascend και CANN
21 HoursΤο Huawei Ascend είναι μια συσκευή AI προecessors που σχεδιάστηκε για απόψεις υψηλής επέπεδο και εξ ομορφωτικό.
Αυτή η διαμορφωτική, ζωντανή εκπαίδευση (παρουσία ή μέσω του διαδικτύου) προσβάλλει κεντρικά AI μηχανικούς και επιστήμονες δεδομένων που θέλουν να αναπτύξουν και να βελτιώσουν τυπικά μοντέλα μετρητή χρησιμοποιώντας την πίνακα Ascend της Huawei και την CANN ιεροσυλία.
Ατέλεστο αυτή η εκπαίδευση, οι συμμετέχοντες θα μπορούν να:
- Καθιέρωση και διαμόρφωση του περιβάλλοντος ανάπτυξης CANN.
- Ανάπτυξη AI εφαρμογών χρησιμοποιώντας το MindSpore και τους CloudMatrix διεργασίες.
- Βελτίωση εκπαιδευτικής παραγωγότητας στον Ascend NPU χρησιμοποιώντας δικές του μεθοδολογίες και tiling.
- Κατάθεση μοντέλων σε περιβάλλον edge ή cloud.
Μορφή του Δίδασκαλου
- Διαπιστωτικός διάλογος και συζήτηση.
- Πρακτική χρήση Huawei Ascend και περίφημα CANN toolkit σε δείγματα εφαρμογών.
- Εξειδίκευσης ασκήσεις με κέντρο την κατασκευή, εξ ομορφωτικό και παράδοση.
Πλάστες Προσαρμογής του Δίδασκαλου
- Για να απαιτήσετε μια προσωποθετική εκπαίδευση για αυτό το δίδασκαλο βασισμένο στην υποδοχή ή δεδομένα, παρακαλώ επικοινωνήστε μαζί μας για να αρχίσετε.
Αποθήκευση Μοντέλων AI με CANN και Procesσoρs Ascend AI
14 HoursCANN (Compute Architecture for Neural Networks) είναι η πύρα για την υπολογιστική κατάρτιση της Huawei για τη διάθεση και την βελτίωση AI μοντέλων σε επεξεργαστές Ascend AI.
Αυτή η εκμάθηση υπό καθοδήγηση (διαδικτύου ή αποκλειστικά) στοχεύει σε μέσο επίπεδο AI ανάπτυξης και μηχανικού που θέλει να διαθέσει τρέχοντα AI μοντέλα αποτελεσματικά στο υλικό Huawei Ascend χρησιμοποιώντας το πακέτο εργαλείων και εργαλεία CANN, όπως το MindSpore, TensorFlow ή PyTorch.
Από το τέλος αυτής της διδασκαλίας, οι συμμετέχοντες θα μπορούν να:
- Συνειδητοποιήσουν την αρχιτεκτονική CANN και το ρόλο της στη διαδικασία διάθεσης AI.
- Μετατρέψουν και προσαρμογή μοντέλων από φιλόξενους πλαίσιο τεχνητής νοημοσύνης σε μορφές που είναι συμβατές με το Ascend.
- Χρησιμοποιήσουν εργαλεία όπως ATC, OM μετατροπή μοντέλων και το MindSpore για πρόληψη στο edge και στο cloud.
- Διαγνώσουν προβλήματα διάθεσης και βελτιώσουν τη λειτουργία σε υλικό Ascend.
Σχέδιο της Μαθήσης
- Δυναμική διάλεξη και παρουσίαση.
- Εργασία με χέρι το πάνω χρησιμοποιώντας εργαλεία CANN και simulators δικτύου Ascend.
- Εφαρμοστικά σενάρια διάθεσης βασισμένα σε AI μοντέλα πραγματικής κατάστασης.
Προτυπώνονται τις Μαθήσεις σύμφωνα με τις ανάγκες
- Για να πρότυπωσετε μια εκμάθηση γι' αυτή τη διάλεξη, η καταλήψτε επικοινωνία μαζί μας.
GPU Programming στους Biren AI Accelerators
21 HoursΟι Biren AI Accelerators είναι υψηλής απόδοσης GPUs που σχεδιάστηκαν για εργαλεία AI και HPC με υποστήριξη για μεγάλη κλίμακα εκπαίδευσης και δεξιότητας.
Αυτή η εκπαίδευση υπό χρονοδιάγραμμα (online ή σε χώρο) προσβάλλει ανάπτυξη αναπόσπαστων επιπέδου έως προχωρημένων αναπτυκτών που θέλουν να κωδικοποιήσουν και να τελειώσουν εφαρμογές χρησιμοποιώντας το δίκτυο GPU περιουσίας Biren, με πρακτικές συγκρίσεις σε περιβάλλοντα βασισμένα στο CUDA.
Από το τέλος αυτής της εκπαίδευσης, οι μετέχοντες θα μπορούν να:
- Διαθέσουν κατανόηση στην αρχιτεκτονική Biren GPU και την ιεραρχία των μνημών.
- Διαβεβαιώστε το περιβάλλον ανάπτυξης και χρησιμοποιήστε το μοντέλο προγραμματισμού Biren.
- Μετάφραση και βελτίωση CUDA-styled κώδικα για πλατφόρμες Biren.
- Εφαρμογή μεθόδου ανίχνευσης σφαλμάτων και τεχνικών επεξεργασίας.
Μορφή της Εκπαίδευσης
- Διερχόμενη διάλεξη και συζήτηση.
- Χειροποίητη χρήση του Biren SDK σε παραδειγματικές GPU εργασίες.
- Λειτουργούν εξόρυξη επικεφαλής που συγκεντρώνονται στη μετάφραση και τη βελτίωση.
Επιλογές Προσαρμογής της Εκπαίδευσης
- Για να απαιτήσετε μια προσωποθετημένη εκπαίδευση για αυτό το κουρσό βάσει του πακέτου λειτουργικού σας διασυνδεδεμένου ή χρειών ενσωμάτωσης, παρακαλώ επικοινωνήστε μαζί μας για να σχολιάσετε.
Cambricon MLU Development with BANGPy and Neuware
21 HoursΟι Cambricon MLUs (Machine Learning Units) είναι ειδικοποιημένα AI χιπ που οργανωθήκανε για συμπεράσματα και εκπαίδευση σε περιπτώσεις edge και datacenter.
Αυτό το ζωντανό διδασκαλικό μάθημα (online ή live) είναι προσανατολισμένο σε μεσαίου επίπεδου αναπτυξτές που θέλουν να κατασκευάσουν και να εγκαταστήσουν AI μοντέλα χρησιμοποιώντας το πλαίσιο BANGPy και Neuware SDK στο Cambricon MLU hardware.
Στο τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορέσουν να:
- Εγκαταστήσουν και ρυθμίσουν τα περιβάλλοντα ανάπτυξης BANGPy και Neuware.
- Αναπτύξουν και βελτιώσουν μοντέλα βασισμένα στο Python και C++ για Cambricon MLUs.
- Εγκαταστήσουν τα μοντέλα σε edge και data center εξόδια που λειτουργούν με Neuware runtime.
- Συμβάλλουν στην ολοκλήρωση ML workflows με χαρακτηριστικά επιτάχυνσης που είναι κυριότερα για το MLU.
Μορφή του μαθήματος
- Επικοινωνητική ομιλία και συζήτηση.
- Πρακτική χρήση του BANGPy και Neuware για ανάπτυξη και εγκατάσταση.
- Οδηγούμενες ασκήσεις που συγκεντρώνονται στη βελτίωση, ολοκλήρωση και δοκιμή.
Προεπιλεγμένες επιλογές μαθήματος
- Για να ζητήσετε προσαρμοσμένη εκπαίδευση για αυτό το μάθημα βασισμένη στο Cambricon device model ή χρήση, καταλάβετε παρακαλώ να επικοινωνήσετε μαζί μας για τη διάρθρωση.
Εισαγωγή στο CANN για Επικοινωνητές AI Framework Developers
7 HoursCANN (Compute Architecture for Neural Networks) είναι η AI πλατφόρμα υπολογισμών της Huawei που χρησιμοποιείται για την εκτύπωση, αποτελεσματικότερη λειτουργία και εγκατάσταση AI πολλαπλών μοντέλων στους Ascend AI διευθυντές.
Αυτή η εκπαίδευση από εξειδικευμένο ιδρυτή (διαδικτύου ή σωστών τόπων) προσβάλλει νέους AI προγραμματιστές που επιθυμούν να καταλάβουν πώς CANN αποτελεί μέρος του ζωντανού σχηματισμού, από τη διδασκαλία ως την εγκατάσταση, και πώς λειτουργεί με πλατφόρμες όπως η MindSpore, TensorFlow και PyTorch.
Ακούντας την εξάμηνη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν να:
- Καταλάβουν τον στόχο και τη δομή του πακέτου CANN.
- Αρχιστεί ανάπτυξη περιβάλλον με CANN και MindSpore.
- Μετατρέψετε και εγκατάσταση απλών AI μοντέλων στο Ascend υλικό.
- Αποκτήστε βασικά γνώση για μέλλον CANN τεχνική αξίωση και εγκατάσταση έργων.
Μορφή του Κύκλου
- Διεξοδικός διάλογος και συζήτηση.
- Αναπτυξιακές εργασίες με απλή ηχή διάθεση.
- Τυπικό περιβάλλον του CANN και συνδυασμών σημεία.
Προσαρμογή Κύκλου
- Για να αιτηθεί μια προσαρμοσμένη εξατμισμός για αυτό το κύκλο, παρακαλώ συνδεθείτε μαζί μας για να διοργανώσετε.
CANN για Edge AI Εγκατάσταση
14 HoursΟ πακέτος Huawei's Ascend CANN επιτρέπει την ισχυρή αποδοχή AI σε όρια συσκευών, όπως το Ascend 310. Το CANN παρέχει επιβεβαιωμένα εργαλεία για την κάθετη μετάφραση, βελτίωση και εγκατάσταση μοντέλων όπου η υπολογιστική δύναμη και το μνήμη είναι περιορισμένες.
Αυτός ο εκπαιδευτικός διδάσκων, ζωντανός τρέινινγ (διαδικτύου ή σε χώρο) προσβλέπει σε εξειδίκευτες αναπτυκτές AI και μεταγωγείς που θέλουν να εγκαταστήσουν και βελτιώσουν μοντέλα σε όρια συσκευών Ascend χρησιμοποιώντας το εργαλείο CANN.
Τέλος αυτής της μάθησης, οι συμμετέχοντες θα είναι σε θέση να:
- Προετοιμάσουν και μεταφέρουν μοντέλα AI για το Ascend 310 χρησιμοποιώντας τα εργαλεία CANN.
- Σχεδιάζουν πινακίδες παραδόσεως με MindSpore Lite και AscendCL.
- Βελτιώσουν την επίδοση των μοντέλων σε περιβάλλοντα υπολογιστικής δύναμης και μνήμης.
- Εγκαταστήσουν και ελέγχουν εφαρμογές AI σε πραγματικά χώρο edge αποτελεσματικότητα.
Μορφή του κύκλου μαθημάτων
- Δυναμικός λόγος και παρουσίαση.
- Πρακτική εργασία με πινακίδες συσκευών edge και σενάρια.
- Ζωντανά παραδείγματα εγκατάστασης σε υπολογιστική hardware edge.
Προεπιλεγμένες Επιλογές του Κύκλου Μαθημάτων
- Για μια προσαρμοσμένη εκπαιδευτική διαδικασία για αυτό το κύκλο μαθημάτων, σας παρακαλούμε να επικοινωνήσετε μαζί μας για να ορίσετε.
Σύνειlesh του πυρήνα AI εταιρείας Huawei: Από το CANN στο MindSpore
14 HoursΤο AI stack της Huawei — από το χαμηλό επίπεδο CANN SDK μέχρι το υψηλό επίπεδο πλατφόρμα MindSpore — προσφέρει ένα συμβαδίστρα AI development και deployment environment που είναι εκπληρωμένο για το hardware Ascend.
Αυτή η διδασκαλία με υπόχρηση (online ή σε προσωπικό περιβάλλον) είναι κατευθυνόμενη σε τεχνικούς επαγγελματίες μεξές επίπεδου αρχής ως εξειδίκευσης που θέλουν να κατανοήσουν πώς τα σύμβολα CANN και MindSpore λειτουργούν μαζί για να υποστηρίξουν AI lifecycle management και απόφασες infrastructure.
Από το τέλος της διάταξης, οι συμμετέχοντες θα μπορούν να:
- Κατανοήσουν την ακτίνα architecture του AI compute stack της Huawei.
- Αναγνωρίσουν πώς CANN υποστηρίζει μοντέλων optimisation και deployment σε hardware level.
- Εκτιμήσουν το framework και toolchain MindSpore σε αναφορά προς επιχειρηματικές εναλλαγές.
- Θέσουν το AI stack της Huawei μέσα σε enterprise ή cloud/on-prem environments.
Σχήμα της Διάταξης
- Διακριτική διάλεξη και συζήτηση.
- Live system demos και case-based walkthroughs.
- Επιλογικές γενικευμένες πράξεις για model flow από το MindSpore στο CANN.
Επιλογές Προσαρμογής Διάταξης
- Για να αίτησε προσαρμοσμένη διδασκαλία για την διάταξη, καταθέστε μια ζήτηση συνεχώς.
Optimizing Neural Network Performance with CANN SDK
14 HoursCANN SDK (Compute Architecture for Neural Networks) είναι η AI υποστήριξη υπολογιστών της Huawei που επιτρέπει στους αναπτυκτές να γίνουν βελτισμοποιήσεις και να εκτοξεύσουν τη δύναμη των εγκατεστημένων neuronικών δικτύων στους προεπεξεργασμένους αυτοματισμού AI της Ascend.
Αυτή η εκπαιδευτική είναι για εξωτικό επίπεδο αναπτυκτές AI και μηχανικοί συστημάτων που θέλουν να βελτιώσουν τη δύναμη επιστροφής χρησιμοποιώντας τη προηγμένη πληροφορία αξιοποίηση CANN, συμπεριλαμβανόμενη του Graph Engine, TIK και τη δημιουργία εγχώριων λειτουργιών.
Στο τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν να:
- Συνιέσουν CANN's runtime αρχιτεκτονική και performance lifecycle.
- Χρησιμοποιούν προφανώς δουλείες εργαλεία και Graph Engine για ανάλυση και βελτισμό της performance.
- Δημιουργούν και βελτιώνουν εγχώριες λειτουργίες χρησιμοποιώντας TIK και TVM.
- Λύνουν memory bottlenecks και βελτιώνουν το throughput του μοντέλου.
Σχήμα Κατασκευής
- Επαγγελματικό διάλογο και συζήτηση.
- Πρακτικές πρωτοβουλίες με πραγματικό χρόνο profiling και operator tuning.
- Βελτιώσεις άσκηση χρησιμοποιώντας edge-case παράδειγμα deployment.
Προσαρμογή της εκπαίδευσης Προαιρετικά
- Για να αιτηθεί μια προσαρμοσμένη εκπαίδευση για αυτό το κουρσέ, καλέστε μας για συζήτηση.
Ακριβές βελτιώσεις πίνακα διανύσματος με CANN SDK
- Τη φυσική κατάληψη των αρχιτεκτονιών με σωστό είδους παιδικά έγκεφα και workflows training
- Εμπειρία στο deployment model χρησιμοποιώντας CANN, TensorFlow, ή PyTorch
- Συναίσθημα με Linux CLI, shell scripting, και Python πρόγραμμα
Ζητήματα Πολιτών
- Ai επίπεδο μηχανικού
- Inference βελτισμός προνομιουχοί
- Αναπτυκτές των edge Ai ή και συστημάτων ρεαλ-τайμ
Παράγγειλμα CANN βελτιώσεις Ικανότητες
- Το πώς επιχειρήσει performance inference στο CANN
- Beta και embedded Ai συστημάτων optimization στόχοι
- Συνιέσουν Ai το κύριο πρότυπα αλλαγής και memory allocation
Χρησιμοποίηση Graph Engine για ανάλυση
- Εισαγωγή στο Graph Engine και execution pipeline
- Σχεδιασμός operator graphs και runtime metrics
- Μεταρρύθμιση calculation graphs για βελτίωση της ποιότητας
Εργαλεία μετρήσεων performance και δημιουργίας εκθέσεων
- Χρησιμοποίηση CANN Profiling Tool (profiler) για analysis workload
- Ανάλυση execution χρόνο kernel και bottlenecks
- Memory access profiling και στρατηγικές tiling
Custom operator development με TIK
- Τίποτα πάνω από το TIK και model programming λειτουργία
- Implementing custom operator χρησιμοποιώντας TIK DSL
- Εξέταση και benchmarking performance operator
Advanced operator βελτίωση με TVM
- TVM εισαγωγή για το CANN ομάδας
- Auto-tuning στρατηγικές για calculation graphs
- Όταν και πώς να switch μεταξύ TVM και TIK
Συστήματος βελτίωση τεχνικές
- Διαχείριση layout memory και buffer placement
- Τεχνικές για περιορισμό consumption on-chip memory
- Άξιες τα ορισμένα πράγματα με asynchronous execution και επαναλήψη
Πρακτικές εφαρμογές και περιπτώσεις
- Περίπτωση: tuning performance για smart city camera pipeline
- Περίπτωση: βελτίωση inference αυτόνομου vehicle stack
- Εγχειρίδιο προς iterative profiling και συνεχής βελτίωση
Σύνοψη και επόμενα βήματα
CANN SDK για Computer Vision και Προσεγγίσεις NLP
14 HoursΤο CANN SDK (Compute Architecture for Neural Networks) παρέχει δυνατά εργαλεία χορήγησης και τεκμηρίωσης για εφαρμογές AI σε πραγματικό χρόνο στον κόσμο της υπολογιστικής οπτικής και του NLP, ειδικά για αρχιτεκτονικές Huawei Ascend.
Αυτός ο διεξαγόμενος εξ άλλων τυπού εκπαιδευτικό προγράμμα (σε υπερθέαμα ή σημείο) προσανατολίζεται σε διαστασιοχωρικούς πράξεις AI του προσωπικού που επιθυμούν να κατασκευάσουν, χορηγήσουν και οριοθετήσουν μοντέλα οπτικής και γλώσσας χρησιμοποιώντας το CANN SDK για παραγωγικά περιστατικά.
Μέχρι το τέλος αυτής της εκπαιδευτικής διαδικασίας, οι συμμετέχοντες θα μπορούν να:
- χορηγήσουν και τεκμηριώσουν μοντέλα CV και NLP χρησιμοποιώντας CANN και AscendCL.
- χρησιμοποιήσει εργαλεία του CANN για μεταφορά πρωτότυπων και ολοκλήρωση σε υπαρξιακές αναθεώρηση.
- τεχνικά βελτιώσει τη πίεση ορισμός, κατηγοροποίηση, και ανάλυση συναισθήματος.
- σχεδιάσει πραγματικό-χρονου CV/NLP αναθεώρηση για θέαμα τόξων διάθεσης είναι ή σε υπερθέαμα.
Σχήμα του προγράμματος
- Διακριτικό διδασκαλία και δείγμα.
- Εργασία μέσω πολιτικής χορηγών εκπαιδευτικά και αξιολόγηση τεχνική.
- Πραγματική σχεδιασμός παραθέσεων χρησιμοποιώντας αληθινά CV και NLP περιστατικά.
Επιλογές Προσαρμογής του Εκπαιδευτικού
- Για να αίτησε μια προσαρμοσμένη εκπαίδευση για αυτό το πρόγραμμα, παρακαλώ επικοινωνήστε μαζί μας.
Δημιουργία Προσαρμοσμένων Τεχνητής Νοημοσύνης (AI) Λειτουργών με CANN TIK και TVM
14 HoursCANN TIK (Tensor Instruction Kernel) και Apache TVM επιτρέπουν προηγμένες παραμετροποιήσεις και τυποποίηση των λειτουργιών μοντέλων AI για Huawei Ascend υπολογιστικό εξοπλισμό.
Αυτή η διδασκαλία από εξειδικευμένους καθηγητές (διαδικτύου ή σε υποψήφια περιοχή) στοχεύει σε προηγμένους λογισμικούς ανάπτυξης συστημάτων οι οποίοι επιθυμούν να κατασκευάσουν, εφαρμόσουν και παραμετροποιήσουν τυποποιημένες λειτουργίες για μοντέλα AI χρησιμοποιώντας το πρότυπο προγράμματος TIK της CANN και τη συνδυασμό με τον εξελίστηκα TVM.
Από το τέλος αυτής της διάθεσης, οι μετέχοντες θα μπορέσουν να:
- Γράψουν και δοκιμάσουν τυποποιημένες λειτουργίες AI χρησιμοποιώντας το TIK DSL για περιστατικό στοιχείο Ascend.
- Συνδυάζουν τις εγγενές λειτουργίες με το runtime και το γραφικό πραγματοποίησης της CANN.
- Χρησιμοποιήσουν TVM για προγράμματα λειτουργιών, αυτόματη παραμέτρωση και μετρήσεις.
- Λύνουν επισκοπείς και τροποποιούν το υψηλό επίπεδο παραγωγικότητας για αρχικές συμβουλές λογισμικού.
Μορφή της διάθεσης
- Δεικτικό μάθημα και παρουσίαση.
- Προσωπική κώδικα λειτουργιών χρησιμοποιώντας τα pipeline TIK και TVM.
- Δοκιμές και παραμέτρωση σε Ascend hardware ή εικονικά υλή.
Προθεσμίες τυποποιημένης διδασκαλίας
- Με παραίτηση για μια τυποποιημένη εξάσκηση για αυτή τη διάθεση, καλεστε μας για σχεδιασμό.
Μεταφορά CUDA Αpplikasi σε κινέζικα GPU Άχρωμα
21 HoursΧινέζικες GPU αρχιτεκτονικές όπως Huawei Ascend, Biren και Cambricon MLUs παρέχουν εναλλακτικές λύσεις για το CUDA, τυγχάνοντας ιδιαίτερης συμπλήρωσης για την αυτόματη εξελίξη (AI) και τους τομείς υψηλών πERFORMANCE computing (HPC) στην οικογένεια.
Αυτή η διδασκαλία, με επικοινωνία του εκπαιδεύτη (δια παραλλαγής ή σε υπερθέση), είναι απευθείας διευθετημάτων του GPU προγραμματιστών και ειδικών υπολογιστικών πόρων με ανάγκη να μεταφέρουν και βελτιώσουν τα οντικά CUDA εφαρμογές για τη δημοσίευση σε χινέζικους πίνακες hardware.
Με τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν να:
- Αξιολογήσουν την παραθέση των ακόμα CUDA εργαζομένων με χινέζικα αντικείμενα άλλων.
- Μετάφερουν κώδικα CUDA πλατφόρμες στο Huawei CANN, Biren SDK και την περιβάλλον Cambricon BANGPy.
- Ελέγχουν τη δύναμη και εντοπίζουν βελτιστοποίηση σημεία μεταξύ πλατφόρμων.
- Αντιμετωπίζουν πρακτικά προβλήματα και υποστήριξη cross-architecture και έγκριση.
Εργασιακό σχεδιασμός του δίδασκαλ
- Δυναμική εξήγηση και συζήτηση.
- Προσωπικά μεταφοράς κώδικα και αντίθεση δυναμικό που εργασία labs.
- Οδηγούμενες άσκησης συγκεντρωμένη για τη χρήση πολλών GPU αποδοχή στρατηγικές.
Επιλογές Προσωπικοποίησης του δίδασκαλ
- Για να απαιτήσετε μια προσωπικοποιημένη εξυπηρέτηση για το δίδασκαλ βάσεις στην ηχεία σας ή CUDA project, παρακαλώ αποφασίστε μας να εγκαθιδρύσετε.
Performance Optimization on Ascend, Biren, and Cambricon
21 HoursAscend, Biren και Cambricon είναι οι προηγμένες πλατφόρμες υλικού για τα μηχανικά νοημοσύνης στην Κίνα, κάθε μία επιφέροντας υπερβολική αcceleration και εργαλεία προφιλαρχικής για παραγωγικά μηχανικά νοημοσύνης λειτουργίες.
Αυτό το επανδρωμένο κλάση (διαμαρτυρία ή γνωστή) στόχο είναι ανώτερο επίπεδο AI υφιστάμενος και δημιουργία μηχανικά μηχανικές που θέλουν να βελτιωθούν επιπέδου model inference και training workflows σε πολλαπλά Chinese AI χιπ πλατφόρμες.
Στο τέλος αυτής της εκπαίδευση, οι συμμετέχοντες θα μπορούν να:
- Benchmark models σε Ascend, Biren και Cambricon πλατφόρμες.
- Αναγνωρίζουν τις συστήματος bottlenecks και memory/compute αδυνάμειες.
- Εφαρμόζει graph-level, kernel-level, και operator-level βελτιώσεις.
- Tune εγκατάσταση pipelines για να βελτιωθούν throughput και latency.
Δομή του Κλάση
- Επικοινωνητικός διάλογος και συζήτηση.
- Χερσαία χρήση του προφιλαρχικών και βελτιωτικών εργαλείων σε κάθε πλατφόρμα.
- Οδηγημένες ασκήσεις με κέντρο του πρακτική tuning περιστάσεις.
Προσαρμοστικό Διδακτικό Υλικό
- Για να απαιτήσετε μια προσαρμοστική εκπαίδευση για αυτή την ομάδα βασισμένη στο performance περιβάλλον και μοντέλου type, παρακαλώ επικοινωνήστε μαζί μας για να το διατάξετε.