SMACK Stack for Data Science Training Course
Το SMACK είναι μια συλλογή λογισμικού πλατφόρμας δεδομένων, δηλαδή Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra, και Apache Kafka. Χρησιμοποιώντας το SMACK stack, οι χρήστες μπορούν να δημιουργήσουν και να κλιμακώσουν πλατφόρμες επεξεργασίας δεδομένων.
Αυτή η εκπαιδευτική, ζωντανή εκπαίδευση (online ή on-site) απευθύνεται σε επιστήμονες δεδομένων που επιθυμούν να χρησιμοποιήσουν το SMACK stack για να δημιουργήσουν πλατφόρμες επεξεργασίας δεδομένων για μεγάλες λύσεις δεδομένων.
Μετά το τέλος της προπόνησης, οι συμμετέχοντες θα είναι σε θέση να:
- Εφαρμογή μιας αρχιτεκτονικής σωλήνων δεδομένων για την επεξεργασία των μεγάλων δεδομένων.
- Αναπτύξτε μια υποδομή κλάσματος με Apache Mesos και Docker.
- Ανάλυση δεδομένων με το Spark και Scala.
- Διαχείριση μη δομημένων δεδομένων με το Apache Cassandra.
Η μορφή του μαθήματος
- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πρακτικές.
- Hands-on εφαρμογή σε ένα ζωντανό εργαστήριο περιβάλλον.
Επιλογές προσαρμογής μαθημάτων
- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, παρακαλούμε επικοινωνήστε μαζί μας για να οργανώσετε.
Course Outline
Εισαγωγή
Επισκόπηση στοίβας SMACK
- Τι είναι το Apache Spark; Χαρακτηριστικά του Apache Spark Τι είναι το Apache Mesos; Χαρακτηριστικά του Apache Mesos Τι είναι το Apache Akka; Χαρακτηριστικά του Apache Akka Τι είναι το Apache Cassandra; Χαρακτηριστικά του Apache Cassandra Τι είναι το Apache Kafka; Χαρακτηριστικά του Απάτσι Κάφκα
Scala Γλώσσα
- Scala σύνταξη και δομή Scala ελέγχου της ροής
Προετοιμασία Αναπτυξιακού Περιβάλλοντος
- Εγκατάσταση και διαμόρφωση της στοίβας SMACK Εγκατάσταση και διαμόρφωση Docker
Απάτσι Akka
- Χρησιμοποιώντας ηθοποιούς
Απάτσι Cassandra
- Δημιουργία βάσης δεδομένων για λειτουργίες ανάγνωσης Εργασία με αντίγραφα ασφαλείας και ανάκτηση
Συνδέσεις
- Δημιουργία ροής Δημιουργία εφαρμογής Akka Αποθήκευση δεδομένων με Cassandra Αναθεώρηση συνδέσεων
Apache Kafka
- Εργασία με συμπλέγματα Δημιουργία, δημοσίευση και κατανάλωση μηνυμάτων
Apache Mesos
- Κατανομή πόρων Εκτέλεση συμπλεγμάτων Εργασία με Apache Aurora και Docker Εκτέλεση υπηρεσιών και εργασιών Ανάπτυξη Spark, Cassandra και Kafka στο Mesos
Apache Spark
- Διαχείριση ροών δεδομένων Εργασία με RDD και πλαίσια δεδομένων Εκτέλεση ανάλυσης δεδομένων
Αντιμετώπιση προβλημάτων
- Αντιμετώπιση αστοχιών υπηρεσιών και σφαλμάτων
Περίληψη και Συμπέρασμα
Requirements
- Κατανόηση συστημάτων επεξεργασίας δεδομένων
Ακροατήριο
- Επιστήμονες Δεδομένων
Open Training Courses require 5+ participants.
SMACK Stack for Data Science Training Course - Booking
SMACK Stack for Data Science Training Course - Enquiry
SMACK Stack for Data Science - Consultancy Enquiry
Consultancy Enquiry
Testimonials (1)
εξαιρετικά επικοινωνητικό...
Richard Langford
Course - SMACK Stack for Data Science
Machine Translated
Upcoming Courses
Related Courses
Big Data Business Intelligence for Telecom and Communication Service Providers
35 HoursΣυνοπτική
Οι πάροχοι υπηρεσιών (CSP) αντιμετωπίζουν πίεση για να μειώσουν το κόστος και να μεγιστοποιήσουν το μέσο εισόδημα ανά χρήστη (ARPU), διασφαλίζοντας παράλληλα μια εξαιρετική εμπειρία πελατών, αλλά οι όγκοι δεδομένων συνεχίζουν να αυξάνονται. Η παγκόσμια κυκλοφορία κινητών δεδομένων θα αυξηθεί με συνδεδεμένο ετήσιο ρυθμό ανάπτυξης (CAGR) 78 τοις εκατό έως το 2016, φτάνοντας τα 10,8 exabytes το μήνα.
Εν τω μεταξύ, οι CSPs παράγουν μεγάλους όγκους δεδομένων, συμπεριλαμβανομένων των αρχείων λεπτομέρειων κλήσης (CDR), των δεδομένων δικτύου και των δεδομένων πελατών. Οι εταιρείες που εκμεταλλεύονται πλήρως αυτά τα δεδομένα κερδίζουν ένα ανταγωνιστικό όριο. Σύμφωνα με πρόσφατη έρευνα της Economist Intelligence Unit, οι εταιρείες που χρησιμοποιούν την λήψη αποφάσεων με βάση τα δεδομένα απολαμβάνουν αύξηση της παραγωγικότητας κατά 5-6%. Εντούτοις, το 53% των εταιρειών χρησιμοποιεί μόνο το ήμισυ των πολύτιμων δεδομένων τους και το ένα τέταρτο των ερωτηθέντων παρατήρησε ότι τεράστιες ποσότητες χρήσιμων δεδομένων δεν καταγράφονται. Οι όγκοι δεδομένων είναι τόσο υψηλοί που η χειροκίνητη ανάλυση είναι αδύνατη, και τα περισσότερα συστήματα λογισμικού κληρονομιάς δεν μπορούν να διατηρηθούν, οδηγώντας σε πολύτιμα δεδομένα που απορρίπτονται ή αγνοούνται.
Με το Big Data & Analytics’ υψηλής ταχύτητας, κλιμακούμενο λογισμικό μεγάλων δεδομένων, οι CSPs μπορούν να εξορύξουν όλα τα δεδομένα τους για καλύτερη λήψη αποφάσεων σε μικρότερο χρονικό διάστημα. Διαφορετικά προϊόντα και τεχνικές παρέχουν μια τελική πλατφόρμα λογισμικού για τη συλλογή, την προετοιμασία, την ανάλυση και την παρουσίαση εντύπων από τα μεγάλα δεδομένα. Οι τομείς εφαρμογής περιλαμβάνουν παρακολούθηση της απόδοσης δικτύου, ανίχνευση απάτης, ανίχνευση πελατών και ανάλυση πιστωτικού κινδύνου. Big Data & Η κλίμακα των προϊόντων αναλύσεων για την επεξεργασία terabytes δεδομένων, αλλά η εφαρμογή τέτοιων εργαλείων απαιτεί ένα νέο είδος συστήματος βάσης δεδομένων σε σύννεφο, όπως Hadoop ή μαζική κλίμακα παράλληλος επεξεργαστής υπολογιστών (KPU κλπ.)
Αυτό το μάθημα λειτουργεί στο Big Data BI για Telco καλύπτει όλες τις αναδυόμενες νέες περιοχές στις οποίες οι CSP επενδύουν για την αύξηση της παραγωγικότητας και το άνοιγμα νέων ροών εσόδων των επιχειρήσεων. Το μάθημα θα παρέχει μια πλήρη 360 βαθμούς όρασης Big Data BI στο Telco έτσι ώστε οι υπεύθυνοι λήψης αποφάσεων και οι διαχειριστές μπορούν να έχουν μια πολύ ευρεία και ολοκληρωμένη επισκόπηση των δυνατοτήτων Big Data BI στο Telco για την παραγωγικότητα και την απόκτηση εσόδων.
Στόχοι διαδρομής
Ο κύριος στόχος του μαθήματος είναι να εισαγάγει νέες Big Data τεχνικές επιχειρηματικής νοημοσύνης σε 4 τομείς Telecom Business (Marketing / πωλήσεις, λειτουργία δικτύου, χρηματοοικονομική λειτουργία και σχέσεις πελατών Management). Οι μαθητές θα εισαχθούν στο εξής:
- Εισαγωγή στο Big Data-τι είναι 4Vs (υπολογισμός, ταχύτητα, ποικιλία και βεβαιότητα) στο Big Data- Γενιά, εξόρυξη και διαχείριση από την προοπτική Telco
- Πώς Big Data η ανάλυση διαφέρει από την ανάλυση δεδομένων κληρονομιάς
- Εσωτερική αιτιολόγηση Big Data -Telco προοπτική
- Εισαγωγή στο Hadoop οικοσύστημα- εξοικειωμένοι με όλα τα Hadoop εργαλεία όπως Hive, Pig, SPARC – πότε και πώς χρησιμοποιούνται για την επίλυση Big Data προβλήματος
- Πώς Big Data εξάγεται για την ανάλυση για το εργαλείο ανάλυσης-όπως Business Analysis’s μπορεί να μειώσει τα σημεία πόνου τους από τη συλλογή και την ανάλυση των δεδομένων μέσω της ολοκληρωμένης Hadoop προσέγγισης dashboard
- Βασική εισαγωγή της ανάλυσης Insight, της ανάλυσης απεικόνισης και της προβλέψιμης ανάλυσης για το Telco
- Η ανάλυση πελατών και η Big Data-how Big Data ανάλυση μπορούν να μειώσουν την αμηχανία πελατών και την δυσαρέσκεια πελατών σε μελέτες Telco-case
- Ανάλυση αποτυχίας δικτύου και αποτυχίας υπηρεσιών από τα μετα-δεδομένα δικτύου και το IPDR
- Χρηματοοικονομική ανάλυση - απάτη, πλοήγηση και εκτίμηση ROI από πωλήσεις και επιχειρησιακά δεδομένα
- Προβλήματα αγοράς πελατών - Στόχος μάρκετινγκ, κατακερματισμός πελατών και διαμεσολάβηση από τα δεδομένα πωλήσεων
- Εισαγωγή και σύνοψη όλων των Big Data αναλυτικών προϊόντων και πού ταιριάζουν στον αναλυτικό χώρο Telco
- Συμπέρασμα-όπως να λάβετε βήμα προς βήμα προσέγγιση για να εισαγάγετε Big Data Business Intelligence στην οργάνωση σας
Στόχος κοινό
- Δραστηριότητες δικτύου, χρηματοοικονομικοί διευθυντές, διευθυντές CRM και κορυφαίοι διευθυντές IT στο γραφείο του Telco CIO.
- Business Αναλυτές στο Telco
- Διευθυντές γραφείων / αναλυτές CFO
- Οι επιχειρησιακοί διευθυντές
- ΔΗΜΟΣΙΟΓΡΑΦΟΙ
Apache Spark MLlib
35 HoursΤο MLlib είναι η βιβλιοθήκη εκμάθησης μηχανών Spark (ML). Σκοπός του είναι να κάνει την πρακτική εκμάθηση μηχανών κλιμακωτή και εύκολη. Αποτελείται από κοινούς αλγόριθμους και βοηθητικά προγράμματα μάθησης, συμπεριλαμβανομένης της ταξινόμησης, της παλινδρόμησης, της ομαδοποίησης, του συνεργατικού φιλτραρίσματος, της μείωσης των διαστάσεων, καθώς και των πρωτόγονων βελτιστοποίησης χαμηλότερου επιπέδου και των API αγωγών υψηλότερου επιπέδου.
Διαχωρίζεται σε δύο πακέτα:
Το spark.mllib περιέχει το αρχικό API που είναι ενσωματωμένο στο RDD.
Το spark.ml παρέχει API υψηλότερου επιπέδου που είναι ενσωματωμένο στο DataFrames για την κατασκευή αγωγών ML.
Κοινό
Αυτό το μάθημα απευθύνεται σε μηχανικούς και προγραμματιστές που επιδιώκουν να χρησιμοποιήσουν μια ενσωματωμένη βιβλιοθήκη μηχανών για Apache Spark
Data Science for Big Data Analytics
35 HoursΤα μεγάλα δεδομένα είναι σύνολα δεδομένων που είναι τόσο ογκώδη και περίπλοκα που το παραδοσιακό λογισμικό εφαρμογών επεξεργασίας δεδομένων είναι ανεπαρκές για την αντιμετώπισή τους. Οι μεγάλες προκλήσεις δεδομένων περιλαμβάνουν τη συλλογή δεδομένων, την αποθήκευση δεδομένων, την ανάλυση δεδομένων, την αναζήτηση, την κοινή χρήση, τη μεταφορά, την οπτικοποίηση, την αναζήτηση, την ενημέρωση και την προστασία της ιδιωτικής ζωής των πληροφοριών.
Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
21 HoursΑυτό το μάθημα απευθύνεται σε προγραμματιστές και επιστήμονες δεδομένων που θέλουν να κατανοήσουν και να εφαρμόσουν την τεχνητή νοημοσύνη στις εφαρμογές τους. Ιδιαίτερη έμφαση δίνεται στην ανάλυση δεδομένων, την κατανεμημένη τεχνητή νοημοσύνη και την επεξεργασία φυσικής γλώσσας.
Data Science Programme
245 HoursΗ έκρηξη πληροφοριών και δεδομένων στον σημερινό κόσμο είναι απαράμιλλη, η ικανότητά μας να καινοτομούμε και να ξεπερνάμε τα όρια του δυνατού αυξάνεται ταχύτερα από ποτέ. Ο ρόλος του Επιστήμονα Δεδομένων είναι μία από τις δεξιότητες με τη μεγαλύτερη ζήτηση στον κλάδο σήμερα.
Προσφέρουμε πολύ περισσότερα από τη μάθηση μέσω της θεωρίας. παρέχουμε πρακτικές, εμπορεύσιμες δεξιότητες που γεφυρώνουν το χάσμα μεταξύ του ακαδημαϊκού κόσμου και των απαιτήσεων της βιομηχανίας.
Αυτό το πρόγραμμα σπουδών 7 εβδομάδων μπορεί να προσαρμοστεί στις συγκεκριμένες απαιτήσεις του κλάδου σας, επικοινωνήστε μαζί μας για περισσότερες πληροφορίες ή επισκεφθείτε τον ιστότοπο του Ινστιτούτου Nobleprog
Ακροατήριο:
Αυτό το πρόγραμμα απευθύνεται σε πτυχιούχους μεταπτυχιακού επιπέδου καθώς και σε οποιονδήποτε έχει τις απαιτούμενες προαπαιτούμενες δεξιότητες που θα καθοριστούν με αξιολόγηση και συνέντευξη.
Διανομή:
Η παράδοση του μαθήματος θα είναι ένας συνδυασμός Instructor Led Classroom και Instructor Led Online. Συνήθως η 1η εβδομάδα θα είναι «οδηγούμενη στην τάξη», η εβδομάδα 2 - 6 «εικονική τάξη» και η εβδομάδα 7 πίσω στην «οδηγούμενη στην τάξη».
MATLAB Fundamentals, Data Science & Report Generation
35 HoursΣτο πρώτο μέρος αυτής της εκπαίδευσης, καλύπτουμε τις βασικές αρχές του MATLAB και τη λειτουργία του τόσο ως γλώσσας όσο και ως πλατφόρμας. Σε αυτή τη συζήτηση περιλαμβάνεται μια εισαγωγή στη σύνταξη MATLAB, τους πίνακες και τους πίνακες, την οπτικοποίηση δεδομένων, την ανάπτυξη σεναρίων και τις αντικειμενοστρεφείς αρχές.
Στο δεύτερο μέρος, δείχνουμε πώς να χρησιμοποιήσετε το MATLAB για εξόρυξη δεδομένων, μηχανική μάθηση και προγνωστική ανάλυση. Για να παρέχουμε στους συμμετέχοντες μια σαφή και πρακτική προοπτική της προσέγγισης και της ισχύος του MATLAB, κάνουμε συγκρίσεις μεταξύ της χρήσης του MATLAB και της χρήσης άλλων εργαλείων όπως υπολογιστικά φύλλα, C, C++ και Visual Basic.
Στο τρίτο μέρος της εκπαίδευσης, οι συμμετέχοντες μαθαίνουν πώς να εξορθολογίζουν την εργασία τους αυτοματοποιώντας την επεξεργασία των δεδομένων τους και τη δημιουργία αναφορών.
Καθ' όλη τη διάρκεια του μαθήματος, οι συμμετέχοντες θα εφαρμόσουν τις ιδέες που έμαθαν μέσα από πρακτικές ασκήσεις σε εργαστηριακό περιβάλλον. Μέχρι το τέλος της εκπαίδευσης, οι συμμετέχοντες θα έχουν πλήρη αντίληψη των δυνατοτήτων του MATLAB και θα μπορούν να το χρησιμοποιήσουν για την επίλυση προβλημάτων της επιστήμης δεδομένων του πραγματικού κόσμου καθώς και για τον εξορθολογισμό της εργασίας τους μέσω αυτοματοποίησης.
Θα πραγματοποιούνται αξιολογήσεις καθ' όλη τη διάρκεια του μαθήματος για τη μέτρηση της προόδου.
Μορφή του μαθήματος
- Το μάθημα περιλαμβάνει θεωρητικές και πρακτικές ασκήσεις, συμπεριλαμβανομένων συζητήσεων περιπτώσεων, επιθεώρησης δειγμάτων κώδικα και πρακτικής εφαρμογής.
Σημείωση
- Οι συνεδρίες πρακτικής θα βασίζονται σε προκαθορισμένα δείγματα προτύπων αναφορών δεδομένων. Εάν έχετε συγκεκριμένες απαιτήσεις, επικοινωνήστε μαζί μας για να κανονίσουμε.
Jupyter for Data Science Teams
7 HoursΑυτός ο διαλογικός δίδασκος (επίδομης ή πραγματική σцη) εισάγει την ιδέα του συνεργατικού αναπτύξεως στις επιστήμες δεδομένων και δείχνει πώς να χρησιμοποιήσετε το Jupyter για να ακολουθήσετε και να συμμετέχετε με έναν ομάδα στο "ζωγραφικό κύκλο ενός υπολογιστικής ιδέας". Πηγαίνει τους μαθητές πάνω από τη δημιουργία ενός δείγματος έργου επιστήμης δεδομένων βασιζόμενο στο εκοσύστημα Jupyter.
Στο τέλος αυτής της εκπαίδευσης, οι μαθητές θα μπορούν να:
- Εγκαταστήσουν και συμβάλλουν το Jupyter, περιλαμβανομένης δημιουργίας και αναποδοχής μιας ομάδας αποθετηρίων Git.
- Χρησιμοποιήσετε χαρακτηριστικά του Jupyter, όπως επέκταση, δυναμικά παράθυρα, πολλαπλά οικήτορα και περισσότερα για να εγκαταλείψετε τη συνεργασία.
- Δημιουργήσετε, μοιράζεστε και οργανώσετε Jupyter Notebook με τους συναδέλφους σας.
- Επιλέξετε Scala, Python, R για να γράψετε και εκτελέσετε κώδικα ανά τα μεγάλα δεδομένα συστήματα όπως Apache Spark, όλα μέσα από τη διεργασία Jupyter.
Introduction to Graph Computing
28 HoursΣε αυτή τη ζωντανή εκπαίδευση στο Ελλάδα από εκπαιδευτές, οι συμμετέχοντες θα μάθουν για τις προσφορές τεχνολογίας και τις προσεγγίσεις υλοποίησης για την επεξεργασία δεδομένων γραφήματος. Ο στόχος είναι να προσδιοριστούν τα αντικείμενα του πραγματικού κόσμου, τα χαρακτηριστικά και οι σχέσεις τους, στη συνέχεια να μοντελοποιηθούν αυτές οι σχέσεις και να επεξεργαστούν ως δεδομένα χρησιμοποιώντας μια προσέγγιση Graph Computing (γνωστή και ως Graph Analytics). Ξεκινάμε με μια ευρεία επισκόπηση και περιορίζουμε τα συγκεκριμένα εργαλεία καθώς προχωράμε σε μια σειρά περιπτωσιολογικών μελετών, πρακτικών ασκήσεων και ζωντανών αναπτύξεων.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Κατανοήστε πώς διατηρούνται και διασχίζονται τα δεδομένα γραφήματος.
- Επιλέξτε το καλύτερο πλαίσιο για μια δεδομένη εργασία (από βάσεις δεδομένων γραφημάτων έως πλαίσια επεξεργασίας παρτίδας.)
- Εφαρμόστε τα Hadoop, Spark, GraphX και Pregel για να πραγματοποιήσετε υπολογισμούς γραφημάτων σε πολλές μηχανές παράλληλα.
- Δείτε τα προβλήματα μεγάλων δεδομένων του πραγματικού κόσμου όσον αφορά τα γραφήματα, τις διεργασίες και τις διαβάσεις.
Python Programming for Finance
35 HoursPython είναι μια γλώσσα προγραμματισμού που έχει αποκτήσει μεγάλη δημοτικότητα στον χρηματοπιστωτικό κλάδο. Εγκρίθηκε από τις μεγαλύτερες επενδυτικές τράπεζες και τα αμοιβαία κεφάλαια αντιστάθμισης κινδύνου, χρησιμοποιείται για την οικοδόμηση ενός ευρέος φάσματος χρηματοοικονομικών εφαρμογών που κυμαίνονται από βασικά προγράμματα συναλλαγών έως συστήματα διαχείρισης κινδύνου.
Σε αυτήν την καθοδηγούμενη από εκπαιδευτές, ζωντανή εκπαίδευση, οι συμμετέχοντες θα μάθουν πώς να χρησιμοποιήσουν την Python για να αναπτύξουν πρακτικές εφαρμογές για την επίλυση ορισμένων ειδικών προβλημάτων χρηματοδότησης.
Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:
- Να κατανοήσουν τις βασικές αρχές της γλώσσας προγραμματισμού Python
- Να κατεβάσουν, να εγκαταστήσουν και να συντηρήσουν τα καλύτερα εργαλεία ανάπτυξης για τη δημιουργία χρηματοοικονομικών εφαρμογών στην Python
- Να επιλέξουν και να χρησιμοποιήσουν τα καταλληλότερα πακέτα και τεχνικές προγραμματισμού Python για να οργανώσουν, να απεικονίσουν και να αναλύσουν χρηματοοικονομικά δεδομένα από διάφορες πηγές (CSV, Excel, βάσεις δεδομένων, διαδίκτυο, κ.λπ.)
- Να δημιουργήσουν εφαρμογές που επιλύουν προβλήματα σχετικά με την κατανομή περιουσιακών στοιχείων, την ανάλυση κινδύνου, την επενδυτική απόδοση και πολλά άλλα
- Να εντοπίσουν και να διορθώσουν σφάλματα, να ενσωματώσουν, να αναπτύξουν και να βελτιστοποιήσουν μια εφαρμογή Python
Κοινό
- Προγραμματιστές
- Αναλυτές
- Ειδικοί ποσοτικής ανάλυσης
Μορφή του μαθήματος
- Μέρος διάλεξη, μέρος συζήτηση, ασκήσεις και εκτενής πρακτική εξάσκηση
Σημείωση
- Αυτή η εκπαίδευση στοχεύει στην παροχή λύσεων για ορισμένα από τα κύρια προβλήματα που αντιμετωπίζουν οι επαγγελματίες του χρηματοπιστωτικού κλάδου. Ωστόσο, εάν έχετε ένα συγκεκριμένο θέμα, εργαλείο ή τεχνική που επιθυμείτε να προσθέσετε ή να επεξεργαστείτε περαιτέρω, παρακαλούμε επικοινωνήστε μαζί μας για να το κανονίσουμε.
Python and Spark for Big Data (PySpark)
21 HoursΣε αυτήν τη ζωντανή εκπαίδευση στο Ελλάδα, καθοδηγούμενη από εκπαιδευτές, οι συμμετέχοντες θα μάθουν πώς να χρησιμοποιούν το Python και το Spark μαζί για να αναλύουν μεγάλα δεδομένα καθώς εργάζονται σε πρακτικές ασκήσεις.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Μάθετε πώς να χρησιμοποιείτε το Spark με το Python για την ανάλυση του Big Data.
- Εργαστείτε σε ασκήσεις που μιμούνται πραγματικές περιπτώσεις.
- Χρησιμοποιήστε διαφορετικά εργαλεία και τεχνικές για την ανάλυση μεγάλων δεδομένων χρησιμοποιώντας το PySpark.
Anaconda Ecosystem for Data Scientists
14 HoursΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε επιστήμονες δεδομένων που επιθυμούν να χρησιμοποιήσουν το οικοσύστημα Anaconda για να συλλάβουν, να διαχειριστούν και να αναπτύξουν πακέτα και ροές εργασίας ανάλυσης δεδομένων σε μια ενιαία πλατφόρμα.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Εγκαταστήστε και διαμορφώστε στοιχεία και βιβλιοθήκες Anaconda.
- Κατανοήστε τις βασικές έννοιες, τα χαρακτηριστικά και τα οφέλη του Anaconda.
- Διαχειριστείτε πακέτα, περιβάλλοντα και κανάλια χρησιμοποιώντας το Anaconda Navigator.
- Χρησιμοποιήστε πακέτα Conda, R και Python για επιστήμη δεδομένων και μηχανική εκμάθηση.
- Γνωρίστε ορισμένες περιπτώσεις πρακτικής χρήσης και τεχνικές για τη διαχείριση πολλαπλών περιβαλλόντων δεδομένων.
GPU Data Science with NVIDIA RAPIDS
14 HoursΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε επιστήμονες δεδομένων και προγραμματιστές που επιθυμούν να χρησιμοποιήσουν το RAPIDS για να δημιουργήσουν επιταχυνόμενες αγωγούς δεδομένων, ροές εργασίας και οπτικοποιήσεις, εφαρμόζοντας αλγόριθμους μηχανικής μάθησης, όπως XGBoost, cuML κ.λπ.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Ρυθμίστε το απαραίτητο περιβάλλον ανάπτυξης για τη δημιουργία μοντέλων δεδομένων με τη NVIDIA RAPIDS.
- Κατανοήστε τα χαρακτηριστικά, τα στοιχεία και τα πλεονεκτήματα του RAPIDS.
- Αξιοποιήστε GPU για να επιταχύνετε αγωγούς δεδομένων και αναλυτικών στοιχείων από άκρο σε άκρο.
- Εφαρμόστε GPU-επιταχυνόμενη προετοιμασία δεδομένων και ETL με cuDF και Apache Arrow.
- Μάθετε πώς να εκτελείτε εργασίες μηχανικής εκμάθησης με αλγόριθμους XGBoost και cuML.
- Δημιουργήστε οπτικοποιήσεις δεδομένων και εκτελέστε ανάλυση γραφημάτων με το cuXfilter και το cuGraph.
Accelerating Python Pandas Workflows with Modin
14 HoursΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε επιστήμονες δεδομένων και προγραμματιστές που επιθυμούν να χρησιμοποιήσουν το Modin για να δημιουργήσουν και να εφαρμόσουν παράλληλους υπολογισμούς με το Pandas για ταχύτερη ανάλυση δεδομένων.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Ρυθμίστε το απαραίτητο περιβάλλον για να ξεκινήσετε την ανάπτυξη Pandas ροών εργασίας σε κλίμακα με Modin.
- Κατανοήστε τα χαρακτηριστικά, την αρχιτεκτονική και τα πλεονεκτήματα του Modin.
- Γνωρίστε τις διαφορές μεταξύ Modin, Dask και Ray.
- Εκτελέστε τις λειτουργίες Pandas πιο γρήγορα με το Modin.
- Εφαρμόστε ολόκληρο το Pandas API και τις λειτουργίες.
Kaggle
14 HoursΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε επιστήμονες δεδομένων και προγραμματιστές που επιθυμούν να μάθουν και να χτίσουν τη σταδιοδρομία τους στο Data Science χρησιμοποιώντας το Kaggle.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Μάθετε για την επιστήμη των δεδομένων και τη μηχανική μάθηση.
- Εξερευνήστε την ανάλυση δεδομένων.
- Μάθετε για το Kaggle και πώς λειτουργεί.
Stratio: Rocket and Intelligence Modules with PySpark
14 HoursStratio είναι μια πλατφόρμα αξιοθέτησης δεδομένων που ενσωματώνει τα big data, την AI και την governance σε μία έντελη λύση. Οι modula Rocket και Intelligence επιτρέπουν γρήγορη αναζήτηση, μετάφραση δεδομένων και προβληματική ανάλυση σε εντελειώδη περιβάλλοντα.
Αυτό το δίδασκτρο με οργανωμένη καθοδήγηση (πολύχρωμος ή live) στόχο ενισχύει τους μεσαίου επιπέδου δεδομένων επαγγελματίες που επιθυμούν να χρησιμοποιήσουν τα modula Rocket και Intelligence στο Stratio αποτελεσματικά με PySpark, εστίαζόντας σε περιβάλλοντα διαδηλώσεων, χρήστες-ορισμένες λειτουργίες και προβληματικά δεδομένα.
Στο τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν να:
- Να περιφέρονται και να εργάζονται στην Stratio platform χρησιμοποιώντας τους modula Rocket και Intelligence.
- Να εφαρμόζουν PySpark σε περιβάλλοντα δεδομένων ingestion, transformation, και analysis.
- Να χρησιμοποιούν loops και συνθηκική λογική για τον έλεγχο δεδομένων workflows και feature engineering tasks.
- Να δημιουργούν και να διαχειρίζονται χρήστες-ορισμένες λειτουργίες (UDFs) για μεταχειριστό data operations στο PySpark.
Μορφή της Εκπαίδευσης
- Διεξοδική εισαγωγή και συζήτηση.
- Πολλά ασκήσεις και πρακτική.
- Αλληλεπίδραση σε μια live-lab περιβάλλον.
Επιλογές Διεξαγωγής Προσαρμοστικών
- Για να αιτηθεί μια προσαρμοσμένη εκπαίδευση για αυτό το δίδασκο, παρακαλώ συνεχίζετε μας.