SMACK Stack για Δείγματα Δεδομένων Κομμάτι εκπαίδευσης
Το SMACK είναι μια συλλογή λογισμικών πλατφόρμων δεδομένων, ονομαστικά του Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra και Apache Kafka. Χρησιμοποιώντας το στακ SMACK, οι χρήστες μπορούν να δημιουργήσουν και να επεκτείνουν πλατφόρμες επεξεργασίας δεδομένων.
Αυτή η καθοδήγηση με εκπαιδευτικό (online ή on-site) απευθύνεται σε επιστήμονες δεδομένων που επιθυμούν να χρησιμοποιήσουν το SMACK stack για την κατασκευή πλατφόρμων επεξεργασίας δεδομένων για λύσεις μεγάλων δεδομένων.
Στο τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν να:
- Υλοποιήσουν αρχιτεκτονική διαδίκτυου πληροφόρων για την επεξεργασία μεγάλων δεδομένων.
- Αναπτύξουν υποδομή συστήματος κλαστών με Apache Mesos και Docker.
- Αναλύσουν δεδομένα με το Spark και τη Scala.
- Διαχειρίσουν μη δομημένα δεδομένα με το Apache Cassandra.
Μορφή Κωδίκου
- Διαδραστικός διάλογος και συζήτηση.
- Πολλές ασκήσεις και πρακτική εξάσκηση.
- Εφαρμογή χειρονομίας σε ζωντανό περιβάλλον εργαστηρίου.
Επιλογές Προσαρμογής Κωδίκου
- Για να απαιτήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το κωδικό, παρακαλώ επικοινωνήστε μαζί μας για διαθεσιμότητα.
Εξέλιξη Κομματιού
Εισαγωγή
Περίληψη SMACK Stack
- Τι είναι το Apache Spark; Χαρακτηριστικά του Apache Spark
- Τι είναι το Apache Mesos; Χαρακτηριστικά του Apache Mesos
- Τι είναι το Apache Akka; Χαρακτηριστικά του Apache Akka
- Τι είναι το Apache Cassandra; Χαρακτηριστικά του Apache Cassandra
- Τι είναι το Apache Kafka; Χαρακτηριστικά του Apache Kafka
Γλώσσα Scala
- Γραμματοσειρά και δομή της Scala
- Έλεγχος ροής στη Scala
Εφαρμογή του περιβάλλοντος ανάπτυξης
- Εγκατάσταση και ρύθμιση του SMACK stack
- Εγκατάσταση και ρύθμιση του Docker
Apache Akka
- Χρήση ακτέρων (actors)
Apache Cassandra
- Δημιουργία βάσης δεδομένων για πράξεις κατά την ανάγνωση
- Εργασία με αντιγράφη ασφαλείας και αποκατάσταση
Συνδέσεις (Connectors)
- Δημιουργία ροής δεδομένων
- Κατάσκευη εφαρμογής Akka
- Αποθήκευση δεδομένων με Cassandra
- Εξέταση συνδέσεων (connectors)
Apache Kafka
- Εργασία με clusters
- Δημιουργία, δημοσίευση και χρήση μηνυμάτων
Apache Mesos
- Κατανομή πόρων
- Εκτέλεση clusters
- Εργασία με Apache Aurora και Docker
- Εκτέλεση υπηρεσιών και χωρίς αυτό (jobs)
- Παρουσίαση του Spark, Cassandra και Kafka στο Mesos
Apache Spark
- Διαχείριση ροών δεδομένων
- Εργασία με RDDs και πλαίσια δεδομένων (dataframes)
- Ανάλυση δεδομένων
Διαπίστωση προβλημάτων (Troubleshooting)
- Επεξεργασία αποτυχιών υπηρεσιών και σφαλμάτων (errors)
Περίληψη και Συμπέρασμα
Απαιτήσεις
- Κατανόηση των συστημάτων επεξεργασίας δεδομένων
Ακροατήριο
- Επιστήμονες Δεδομένων
Κομμάτια Εκπαίδευσης χρειάζονται 5+ συμμετέχοντες.
SMACK Stack για Δείγματα Δεδομένων Κομμάτι εκπαίδευσης - Κράτηση
SMACK Stack για Δείγματα Δεδομένων Κομμάτι εκπαίδευσης - Ζήτημα Συμβουλευτικής
SMACK Stack για Δείγματα Δεδομένων - Συμβουλευτική Αίτημα
Συμβουλευτική Αίτημα
Σχόλια (1)
εξαιρετικά επικοινωνητικό...
Richard Langford
Κομμάτι - SMACK Stack for Data Science
Μηχανική Μετάφραση
Εφεξής Μαθήματα
Σχετικά Μαθήματα
Anaconda Εκοσυστήμα για Δεδομένων Επιστήμονες
14 ΏρεςΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε επιστήμονες δεδομένων που επιθυμούν να χρησιμοποιήσουν το οικοσύστημα Anaconda για να συλλάβουν, να διαχειριστούν και να αναπτύξουν πακέτα και ροές εργασίας ανάλυσης δεδομένων σε μια ενιαία πλατφόρμα.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Εγκαταστήστε και διαμορφώστε στοιχεία και βιβλιοθήκες Anaconda.
- Κατανοήστε τις βασικές έννοιες, τα χαρακτηριστικά και τα οφέλη του Anaconda.
- Διαχειριστείτε πακέτα, περιβάλλοντα και κανάλια χρησιμοποιώντας το Anaconda Navigator.
- Χρησιμοποιήστε πακέτα Conda, R και Python για επιστήμη δεδομένων και μηχανική εκμάθηση.
- Γνωρίστε ορισμένες περιπτώσεις πρακτικής χρήσης και τεχνικές για τη διαχείριση πολλαπλών περιβαλλόντων δεδομένων.
Big Data Business Intelligence για Telecom και Υπηρεσίες προμήθειας
35 ΏρεςΣυνοπτική
Οι πάροχοι υπηρεσιών (CSP) αντιμετωπίζουν πίεση για να μειώσουν το κόστος και να μεγιστοποιήσουν το μέσο εισόδημα ανά χρήστη (ARPU), διασφαλίζοντας παράλληλα μια εξαιρετική εμπειρία πελατών, αλλά οι όγκοι δεδομένων συνεχίζουν να αυξάνονται. Η παγκόσμια κυκλοφορία κινητών δεδομένων θα αυξηθεί με συνδεδεμένο ετήσιο ρυθμό ανάπτυξης (CAGR) 78 τοις εκατό έως το 2016, φτάνοντας τα 10,8 exabytes το μήνα.
Εν τω μεταξύ, οι CSPs παράγουν μεγάλους όγκους δεδομένων, συμπεριλαμβανομένων των αρχείων λεπτομέρειων κλήσης (CDR), των δεδομένων δικτύου και των δεδομένων πελατών. Οι εταιρείες που εκμεταλλεύονται πλήρως αυτά τα δεδομένα κερδίζουν ένα ανταγωνιστικό όριο. Σύμφωνα με πρόσφατη έρευνα της Economist Intelligence Unit, οι εταιρείες που χρησιμοποιούν την λήψη αποφάσεων με βάση τα δεδομένα απολαμβάνουν αύξηση της παραγωγικότητας κατά 5-6%. Εντούτοις, το 53% των εταιρειών χρησιμοποιεί μόνο το ήμισυ των πολύτιμων δεδομένων τους και το ένα τέταρτο των ερωτηθέντων παρατήρησε ότι τεράστιες ποσότητες χρήσιμων δεδομένων δεν καταγράφονται. Οι όγκοι δεδομένων είναι τόσο υψηλοί που η χειροκίνητη ανάλυση είναι αδύνατη, και τα περισσότερα συστήματα λογισμικού κληρονομιάς δεν μπορούν να διατηρηθούν, οδηγώντας σε πολύτιμα δεδομένα που απορρίπτονται ή αγνοούνται.
Με το Big Data & Analytics’ υψηλής ταχύτητας, κλιμακούμενο λογισμικό μεγάλων δεδομένων, οι CSPs μπορούν να εξορύξουν όλα τα δεδομένα τους για καλύτερη λήψη αποφάσεων σε μικρότερο χρονικό διάστημα. Διαφορετικά προϊόντα και τεχνικές παρέχουν μια τελική πλατφόρμα λογισμικού για τη συλλογή, την προετοιμασία, την ανάλυση και την παρουσίαση εντύπων από τα μεγάλα δεδομένα. Οι τομείς εφαρμογής περιλαμβάνουν παρακολούθηση της απόδοσης δικτύου, ανίχνευση απάτης, ανίχνευση πελατών και ανάλυση πιστωτικού κινδύνου. Big Data & Η κλίμακα των προϊόντων αναλύσεων για την επεξεργασία terabytes δεδομένων, αλλά η εφαρμογή τέτοιων εργαλείων απαιτεί ένα νέο είδος συστήματος βάσης δεδομένων σε σύννεφο, όπως Hadoop ή μαζική κλίμακα παράλληλος επεξεργαστής υπολογιστών (KPU κλπ.)
Αυτό το μάθημα λειτουργεί στο Big Data BI για Telco καλύπτει όλες τις αναδυόμενες νέες περιοχές στις οποίες οι CSP επενδύουν για την αύξηση της παραγωγικότητας και το άνοιγμα νέων ροών εσόδων των επιχειρήσεων. Το μάθημα θα παρέχει μια πλήρη 360 βαθμούς όρασης Big Data BI στο Telco έτσι ώστε οι υπεύθυνοι λήψης αποφάσεων και οι διαχειριστές μπορούν να έχουν μια πολύ ευρεία και ολοκληρωμένη επισκόπηση των δυνατοτήτων Big Data BI στο Telco για την παραγωγικότητα και την απόκτηση εσόδων.
Στόχοι διαδρομής
Ο κύριος στόχος του μαθήματος είναι να εισαγάγει νέες Big Data τεχνικές επιχειρηματικής νοημοσύνης σε 4 τομείς Telecom Business (Marketing / πωλήσεις, λειτουργία δικτύου, χρηματοοικονομική λειτουργία και σχέσεις πελατών Management). Οι μαθητές θα εισαχθούν στο εξής:
- Εισαγωγή στο Big Data-τι είναι 4Vs (υπολογισμός, ταχύτητα, ποικιλία και βεβαιότητα) στο Big Data- Γενιά, εξόρυξη και διαχείριση από την προοπτική Telco
- Πώς Big Data η ανάλυση διαφέρει από την ανάλυση δεδομένων κληρονομιάς
- Εσωτερική αιτιολόγηση Big Data -Telco προοπτική
- Εισαγωγή στο Hadoop οικοσύστημα- εξοικειωμένοι με όλα τα Hadoop εργαλεία όπως Hive, Pig, SPARC – πότε και πώς χρησιμοποιούνται για την επίλυση Big Data προβλήματος
- Πώς Big Data εξάγεται για την ανάλυση για το εργαλείο ανάλυσης-όπως Business Analysis’s μπορεί να μειώσει τα σημεία πόνου τους από τη συλλογή και την ανάλυση των δεδομένων μέσω της ολοκληρωμένης Hadoop προσέγγισης dashboard
- Βασική εισαγωγή της ανάλυσης Insight, της ανάλυσης απεικόνισης και της προβλέψιμης ανάλυσης για το Telco
- Η ανάλυση πελατών και η Big Data-how Big Data ανάλυση μπορούν να μειώσουν την αμηχανία πελατών και την δυσαρέσκεια πελατών σε μελέτες Telco-case
- Ανάλυση αποτυχίας δικτύου και αποτυχίας υπηρεσιών από τα μετα-δεδομένα δικτύου και το IPDR
- Χρηματοοικονομική ανάλυση - απάτη, πλοήγηση και εκτίμηση ROI από πωλήσεις και επιχειρησιακά δεδομένα
- Προβλήματα αγοράς πελατών - Στόχος μάρκετινγκ, κατακερματισμός πελατών και διαμεσολάβηση από τα δεδομένα πωλήσεων
- Εισαγωγή και σύνοψη όλων των Big Data αναλυτικών προϊόντων και πού ταιριάζουν στον αναλυτικό χώρο Telco
- Συμπέρασμα-όπως να λάβετε βήμα προς βήμα προσέγγιση για να εισαγάγετε Big Data Business Intelligence στην οργάνωση σας
Στόχος κοινό
- Δραστηριότητες δικτύου, χρηματοοικονομικοί διευθυντές, διευθυντές CRM και κορυφαίοι διευθυντές IT στο γραφείο του Telco CIO.
- Business Αναλυτές στο Telco
- Διευθυντές γραφείων / αναλυτές CFO
- Οι επιχειρησιακοί διευθυντές
- ΔΗΜΟΣΙΟΓΡΑΦΟΙ
Μια Πρακτική Εισαγωγή στη Δεδομένων Επιστήμη
35 ΏρεςΟι συμμετέχοντες που ολοκληρώσουν αυτή την κατάρτιση θα εξοπλιστούν με πρακτική, ρεαλιστική κατανόηση της Επιστήμης των Δεδομένων (Data Science) και των σχετικών τεχνολογιών, μεθόδων και εργαλείων.
Οι συμμετέχοντες θα έχουν την ευκαιρία να εφαρμόσουν αυτή τη γνώση μέσω χειροντικών εξάσκησεων. Η διαδικασία και η παρακολούθηση του εκπαιδευτή αποτελούν μια σημαντική συστατική τομέα της τάξης.
Το μάθημα ξεκινά με μια εισαγωγή στα βασικά σύνθετα στοιχεία της Επιστήμης των Δεδομένων, και στη συνέχεια προχωρά στα εργαλεία και μεθόδους που χρησιμοποιούνται στην Επιστήμη των Δεδομένων.
Ακροατήριο
- Προγραμματιστές
- Τεχνικοί αναλυτές
- Σύμβουλοι IT
Μορφή του Μαθήματος
- Τμήμα παράσταση, τμήμα συζήτηση, εξάσκηση και αυτόνομη πρακτική άσκηση
Σημείωση
- Για να ζητήσετε μια προσαρμοσμένη κατάρτιση γι' αυτό το μάθημα, επικοινωνήστε μαζί μας για διοργάνωση.
Πρόγραμμα Δεδομένων Επιστήμης
245 ΏρεςΗ έκρηξη πληροφοριών και δεδομένων στον σημερινό κόσμο είναι απαράμιλλη, η ικανότητά μας να καινοτομούμε και να ξεπερνάμε τα όρια του δυνατού αυξάνεται ταχύτερα από ποτέ. Ο ρόλος του Επιστήμονα Δεδομένων είναι μία από τις δεξιότητες με τη μεγαλύτερη ζήτηση στον κλάδο σήμερα.
Προσφέρουμε πολύ περισσότερα από τη μάθηση μέσω της θεωρίας. παρέχουμε πρακτικές, εμπορεύσιμες δεξιότητες που γεφυρώνουν το χάσμα μεταξύ του ακαδημαϊκού κόσμου και των απαιτήσεων της βιομηχανίας.
Αυτό το πρόγραμμα σπουδών 7 εβδομάδων μπορεί να προσαρμοστεί στις συγκεκριμένες απαιτήσεις του κλάδου σας, επικοινωνήστε μαζί μας για περισσότερες πληροφορίες ή επισκεφθείτε τον ιστότοπο του Ινστιτούτου Nobleprog
Ακροατήριο:
Αυτό το πρόγραμμα απευθύνεται σε πτυχιούχους μεταπτυχιακού επιπέδου καθώς και σε οποιονδήποτε έχει τις απαιτούμενες προαπαιτούμενες δεξιότητες που θα καθοριστούν με αξιολόγηση και συνέντευξη.
Διανομή:
Η παράδοση του μαθήματος θα είναι ένας συνδυασμός Instructor Led Classroom και Instructor Led Online. Συνήθως η 1η εβδομάδα θα είναι «οδηγούμενη στην τάξη», η εβδομάδα 2 - 6 «εικονική τάξη» και η εβδομάδα 7 πίσω στην «οδηγούμενη στην τάξη».
Δεικτική Επιστήμη για την Ανάλυση μεγάλων Δεδομένων
35 ΏρεςΤα μεγάλα δεδομένα είναι σύνολα δεδομένων που είναι τόσο ογκώδη και περίπλοκα που το παραδοσιακό λογισμικό εφαρμογών επεξεργασίας δεδομένων είναι ανεπαρκές για την αντιμετώπισή τους. Οι μεγάλες προκλήσεις δεδομένων περιλαμβάνουν τη συλλογή δεδομένων, την αποθήκευση δεδομένων, την ανάλυση δεδομένων, την αναζήτηση, την κοινή χρήση, τη μεταφορά, την οπτικοποίηση, την αναζήτηση, την ενημέρωση και την προστασία της ιδιωτικής ζωής των πληροφοριών.
Data Science εσSENTIAL για τους επαγγελματίες της Μάρκετινγκ/ Οχειδοπώλησης
21 ΏρεςΑυτή η μάθηση απευθύνεται σε επαγγελματίες πωλήσεων και μάρκετινγκ που επιθυμούν να βρουν περισσότερες λεπτομέρειες για την εφαρμογή των επιστημών δεδομένων στον μάρκετινγκ/ πωλήσεις. Η μάθηση παρέχει αναλυτική κάλυψη των διαφόρων τεχνικών επιστημών δεδομένων που χρησιμοποιούνται για «up-sale», «cross-sale», ανάλυση αγοράς, μάρκετινγκ και CLV.
Διαφορές του Μάρκετινγκ και Πωλήσεων - Πώς διαφέρουν οι πωλήσεις από το μάρκετινγκ;
Σε πολύ απλά λόγια, οι πωλήσεις μπορούν να χαρακτηριστούν ως διαδικασία που εστιάζει ή στόχευει ατόμα ή μικρές ομάδες. Από την άλλη πλευρά, ο μάρκετινγκ εστιάζει σε μεγαλύτερες ομάδες ή στο γενικό κοινό. Ο μάρκετινγκ περιλαμβάνει την έρευνα (αναγνώριση των χρειών του επιβλέποντος), ανάπτυξη προϊόντων (παραγωγή καινοτόμων προϊόντων) και υποστήριξη του προϊόντος (μέσω διαφημίσεων) και δημιουργία ευαισθητοποίησης για το προϊόν μεταξύ των καταναλωτών. Συνεπώς, ο μάρκετινγκ σημαίνει δημιουργία ηγετικών ή προοπτικών. Μόλις το προϊόν είναι κυκλοφορία, είναι η δουλειά του εκπροσωπού πωλήσεων να υποχρεώσει τον πελάτη να αγοράσει το προϊόν. Οι πωλήσεις σημαίνουν την εκδοχή των ηγετικών ή προοπτικών σε αγορές και παραγγελίες, ενώ ο μάρκετινγκ στοχεύει σε μακροπρόθεσμους στόχους, αντίθετα τα πωλήσεις συνδέονται με κοντινές επιφάνειες.
Jupyter για ομάδες Δείκτευσης Δεδομένων
7 ΏρεςΑυτός ο διαλογικός δίδασκος (επίδομης ή πραγματική σцη) εισάγει την ιδέα του συνεργατικού αναπτύξεως στις επιστήμες δεδομένων και δείχνει πώς να χρησιμοποιήσετε το Jupyter για να ακολουθήσετε και να συμμετέχετε με έναν ομάδα στο "ζωγραφικό κύκλο ενός υπολογιστικής ιδέας". Πηγαίνει τους μαθητές πάνω από τη δημιουργία ενός δείγματος έργου επιστήμης δεδομένων βασιζόμενο στο εκοσύστημα Jupyter.
Στο τέλος αυτής της εκπαίδευσης, οι μαθητές θα μπορούν να:
- Εγκαταστήσουν και συμβάλλουν το Jupyter, περιλαμβανομένης δημιουργίας και αναποδοχής μιας ομάδας αποθετηρίων Git.
- Χρησιμοποιήσετε χαρακτηριστικά του Jupyter, όπως επέκταση, δυναμικά παράθυρα, πολλαπλά οικήτορα και περισσότερα για να εγκαταλείψετε τη συνεργασία.
- Δημιουργήσετε, μοιράζεστε και οργανώσετε Jupyter Notebook με τους συναδέλφους σας.
- Επιλέξετε Scala, Python, R για να γράψετε και εκτελέσετε κώδικα ανά τα μεγάλα δεδομένα συστήματα όπως Apache Spark, όλα μέσα από τη διεργασία Jupyter.
Kaggle
14 ΏρεςΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε επιστήμονες δεδομένων και προγραμματιστές που επιθυμούν να μάθουν και να χτίσουν τη σταδιοδρομία τους στο Data Science χρησιμοποιώντας το Kaggle.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Μάθετε για την επιστήμη των δεδομένων και τη μηχανική μάθηση.
- Εξερευνήστε την ανάλυση δεδομένων.
- Μάθετε για το Kaggle και πώς λειτουργεί.
Βασικά του MATLAB, Δεδομένων Επιστήμης και Δημιουργίας Αναφορών
35 ΏρεςΣτο πρώτο μέρος αυτής της εκπαίδευσης, καλύπτουμε τις βασικές αρχές του MATLAB και τη λειτουργία του τόσο ως γλώσσας όσο και ως πλατφόρμας. Σε αυτή τη συζήτηση περιλαμβάνεται μια εισαγωγή στη σύνταξη MATLAB, τους πίνακες και τους πίνακες, την οπτικοποίηση δεδομένων, την ανάπτυξη σεναρίων και τις αντικειμενοστρεφείς αρχές.
Στο δεύτερο μέρος, δείχνουμε πώς να χρησιμοποιήσετε το MATLAB για εξόρυξη δεδομένων, μηχανική μάθηση και προγνωστική ανάλυση. Για να παρέχουμε στους συμμετέχοντες μια σαφή και πρακτική προοπτική της προσέγγισης και της ισχύος του MATLAB, κάνουμε συγκρίσεις μεταξύ της χρήσης του MATLAB και της χρήσης άλλων εργαλείων όπως υπολογιστικά φύλλα, C, C++ και Visual Basic.
Στο τρίτο μέρος της εκπαίδευσης, οι συμμετέχοντες μαθαίνουν πώς να εξορθολογίζουν την εργασία τους αυτοματοποιώντας την επεξεργασία των δεδομένων τους και τη δημιουργία αναφορών.
Καθ' όλη τη διάρκεια του μαθήματος, οι συμμετέχοντες θα εφαρμόσουν τις ιδέες που έμαθαν μέσα από πρακτικές ασκήσεις σε εργαστηριακό περιβάλλον. Μέχρι το τέλος της εκπαίδευσης, οι συμμετέχοντες θα έχουν πλήρη αντίληψη των δυνατοτήτων του MATLAB και θα μπορούν να το χρησιμοποιήσουν για την επίλυση προβλημάτων της επιστήμης δεδομένων του πραγματικού κόσμου καθώς και για τον εξορθολογισμό της εργασίας τους μέσω αυτοματοποίησης.
Θα πραγματοποιούνται αξιολογήσεις καθ' όλη τη διάρκεια του μαθήματος για τη μέτρηση της προόδου.
Μορφή του μαθήματος
- Το μάθημα περιλαμβάνει θεωρητικές και πρακτικές ασκήσεις, συμπεριλαμβανομένων συζητήσεων περιπτώσεων, επιθεώρησης δειγμάτων κώδικα και πρακτικής εφαρμογής.
Σημείωση
- Οι συνεδρίες πρακτικής θα βασίζονται σε προκαθορισμένα δείγματα προτύπων αναφορών δεδομένων. Εάν έχετε συγκεκριμένες απαιτήσεις, επικοινωνήστε μαζί μας για να κανονίσουμε.
Machine Learning για το Data Science με το Python
21 ΏρεςΑυτή η εκπαίδευση με ζωντανό διδάσκοντα στο Ελλάδα (offline ή online) προσβλέπει σε μεσαιτικούς αναλυτές δεδομένων, αναπτυξιακούς ή εφηβευόμενους επιστήμονες δεδομένων που θέλουν να εφαρμόσουν τεχνικές μηχανικής μάθησης στο Python για να αποκτούν δείγματα, να κάνουν πρόβλεψη και να αυτοματοποιήσουν αποφάσεις βασιζόμενες σε δεδομένα.
Στο τέλος αυτής της εκπαιδευτικής μονάδας, οι συμμετέχοντες θα μπορούν να:
- Καταλάβουν και διαφοροποιήσουν τους βασικούς παραδίδασκες της μηχανικής μάθησης.
- Αναζητήσουν τεχνικές προεπεξεργασίας δεδομένων και μετρικές αξιολόγησης μοντέλων.
- Εφαρμόζουν λογισμικά γορίθμων της μηχανικής μάθησης για να επιλύσουν πρακτικά προβλήματα δεδομένων.
- Χρησιμοποιούν βιβλιοθήκες του Python και Jupyter notebooks για αυτόματη ανάπτυξη.
- Κατασκευάζουν μοντέλα πρόβλεψης, ταξινομήσεων, προτάσεων και αγγρύπτησης.
Αξιοποίηση του Modin για ταχύτερους διαδromούς Python Pandas
14 ΏρεςΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε επιστήμονες δεδομένων και προγραμματιστές που επιθυμούν να χρησιμοποιήσουν το Modin για να δημιουργήσουν και να εφαρμόσουν παράλληλους υπολογισμούς με το Pandas για ταχύτερη ανάλυση δεδομένων.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Ρυθμίστε το απαραίτητο περιβάλλον για να ξεκινήσετε την ανάπτυξη Pandas ροών εργασίας σε κλίμακα με Modin.
- Κατανοήστε τα χαρακτηριστικά, την αρχιτεκτονική και τα πλεονεκτήματα του Modin.
- Γνωρίστε τις διαφορές μεταξύ Modin, Dask και Ray.
- Εκτελέστε τις λειτουργίες Pandas πιο γρήγορα με το Modin.
- Εφαρμόστε ολόκληρο το Pandas API και τις λειτουργίες.
Προγραμματισμός με Python για Οικονομικά
35 ΏρεςPython είναι μια γλώσσα προγραμματισμού που έχει αποκτήσει μεγάλη δημοτικότητα στον χρηματοπιστωτικό κλάδο. Εγκρίθηκε από τις μεγαλύτερες επενδυτικές τράπεζες και τα αμοιβαία κεφάλαια αντιστάθμισης κινδύνου, χρησιμοποιείται για την οικοδόμηση ενός ευρέος φάσματος χρηματοοικονομικών εφαρμογών που κυμαίνονται από βασικά προγράμματα συναλλαγών έως συστήματα διαχείρισης κινδύνου.
Σε αυτήν την καθοδηγούμενη από εκπαιδευτές, ζωντανή εκπαίδευση, οι συμμετέχοντες θα μάθουν πώς να χρησιμοποιήσουν την Python για να αναπτύξουν πρακτικές εφαρμογές για την επίλυση ορισμένων ειδικών προβλημάτων χρηματοδότησης.
Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:
- Να κατανοήσουν τις βασικές αρχές της γλώσσας προγραμματισμού Python
- Να κατεβάσουν, να εγκαταστήσουν και να συντηρήσουν τα καλύτερα εργαλεία ανάπτυξης για τη δημιουργία χρηματοοικονομικών εφαρμογών στην Python
- Να επιλέξουν και να χρησιμοποιήσουν τα καταλληλότερα πακέτα και τεχνικές προγραμματισμού Python για να οργανώσουν, να απεικονίσουν και να αναλύσουν χρηματοοικονομικά δεδομένα από διάφορες πηγές (CSV, Excel, βάσεις δεδομένων, διαδίκτυο, κ.λπ.)
- Να δημιουργήσουν εφαρμογές που επιλύουν προβλήματα σχετικά με την κατανομή περιουσιακών στοιχείων, την ανάλυση κινδύνου, την επενδυτική απόδοση και πολλά άλλα
- Να εντοπίσουν και να διορθώσουν σφάλματα, να ενσωματώσουν, να αναπτύξουν και να βελτιστοποιήσουν μια εφαρμογή Python
Κοινό
- Προγραμματιστές
- Αναλυτές
- Ειδικοί ποσοτικής ανάλυσης
Μορφή του μαθήματος
- Μέρος διάλεξη, μέρος συζήτηση, ασκήσεις και εκτενής πρακτική εξάσκηση
Σημείωση
- Αυτή η εκπαίδευση στοχεύει στην παροχή λύσεων για ορισμένα από τα κύρια προβλήματα που αντιμετωπίζουν οι επαγγελματίες του χρηματοπιστωτικού κλάδου. Ωστόσο, εάν έχετε ένα συγκεκριμένο θέμα, εργαλείο ή τεχνική που επιθυμείτε να προσθέσετε ή να επεξεργαστείτε περαιτέρω, παρακαλούμε επικοινωνήστε μαζί μας για να το κανονίσουμε.
GPU Data Science με το NVIDIA RAPIDS
14 ΏρεςΑυτή η εκπαίδευση με εξαγωγό, ζωντανά (online ή onsite), απευθύνεται σε επιστήμονες δεδομένων και προγραμματιστές που θέλουν να χρησιμοποιήσουν το RAPIDS για τη δημιουργία GPU-επιταχυνμένων αναλυτικών και πλυθμού δεδομένων, workflows, και οπτικοποιήσεων, εφαρμόζοντας μηχανικές μέθοδους μάθησης, όπως το XGBoost, cuML κλπ.
Στο τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν να:
- Εγκαθιστήσουν το απαραίτητο περιβάλλον ανάπτυξης για τη δημιουργία μοdel από δεδομένα με NVIDIA RAPIDS.
- Να κατανοήσουν τις πληροφορίες, συστατικά και πλεονεκτήματα του RAPIDS.
- Να χρησιμοποιήσουν GPUs για να επιταχύνουν από κάθε πλευρά τους πίπτοντες αναλυτικούς και δεδομένων.
- Να υλοποιήσουν GPU-επιταχυνμένη προετοίμαση δεδομένων και ETL με cuDF και Apache Arrow.
- Να μάθουν πώς να εκτελούν μηχανικές εργασίες μάθησης με XGBoost και cuML αλγόριθμους.
- Να δημιουργήσουν οπτικοποιήσεις δεδομένων και να εκτελούν γράφημα ανάλυση με cuXfilter και cuGraph.
Python και Spark για Μεγάλα Δεδομένα (PySpark)
21 ΏρεςΣε αυτήν τη ζωντανή εκπαίδευση στο Ελλάδα, καθοδηγούμενη από εκπαιδευτές, οι συμμετέχοντες θα μάθουν πώς να χρησιμοποιούν το Python και το Spark μαζί για να αναλύουν μεγάλα δεδομένα καθώς εργάζονται σε πρακτικές ασκήσεις.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Μάθετε πώς να χρησιμοποιείτε το Spark με το Python για την ανάλυση του Big Data.
- Εργαστείτε σε ασκήσεις που μιμούνται πραγματικές περιπτώσεις.
- Χρησιμοποιήστε διαφορετικά εργαλεία και τεχνικές για την ανάλυση μεγάλων δεδομένων χρησιμοποιώντας το PySpark.
Stratio: Ροκέτ και Δυναμικά Μόδουλα με PySpark
14 ΏρεςStratio είναι μια πλατφόρμα αξιοθέτησης δεδομένων που ενσωματώνει τα big data, την AI και την governance σε μία έντελη λύση. Οι modula Rocket και Intelligence επιτρέπουν γρήγορη αναζήτηση, μετάφραση δεδομένων και προβληματική ανάλυση σε εντελειώδη περιβάλλοντα.
Αυτό το δίδασκτρο με οργανωμένη καθοδήγηση (πολύχρωμος ή live) στόχο ενισχύει τους μεσαίου επιπέδου δεδομένων επαγγελματίες που επιθυμούν να χρησιμοποιήσουν τα modula Rocket και Intelligence στο Stratio αποτελεσματικά με PySpark, εστίαζόντας σε περιβάλλοντα διαδηλώσεων, χρήστες-ορισμένες λειτουργίες και προβληματικά δεδομένα.
Στο τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν να:
- Να περιφέρονται και να εργάζονται στην Stratio platform χρησιμοποιώντας τους modula Rocket και Intelligence.
- Να εφαρμόζουν PySpark σε περιβάλλοντα δεδομένων ingestion, transformation, και analysis.
- Να χρησιμοποιούν loops και συνθηκική λογική για τον έλεγχο δεδομένων workflows και feature engineering tasks.
- Να δημιουργούν και να διαχειρίζονται χρήστες-ορισμένες λειτουργίες (UDFs) για μεταχειριστό data operations στο PySpark.
Μορφή της Εκπαίδευσης
- Διεξοδική εισαγωγή και συζήτηση.
- Πολλά ασκήσεις και πρακτική.
- Αλληλεπίδραση σε μια live-lab περιβάλλον.
Επιλογές Διεξαγωγής Προσαρμοστικών
- Για να αιτηθεί μια προσαρμοσμένη εκπαίδευση για αυτό το δίδασκο, παρακαλώ συνεχίζετε μας.