Ροή Δεδομένων και Επεξεργασία Δεδομένων σε Πραγματικό Χρόνο Κομμάτι εκπαίδευσης
Επισκόπηση Μαθήματος
Αυτό το μάθημα παρέχει μια πρακτική και δομημένη εισαγωγή στην κατασκευή συστημάτων ροής δεδομένων σε πραγματικό χρόνο. Καλύπτει βασικές έννοιες, πρότυπα αρχιτεκτονικής και εργαλεία της βιομηχανίας που χρησιμοποιούνται για την επεξεργασία συνεχών δεδομένων σε κλίμακα. Οι συμμετέχοντες θα μάθουν πώς να σχεδιάζουν, να υλοποιούν και να βελτιστοποιούν σωληνώσεις ροής χρησιμοποιώντας σύγχρονα πλαίσια. Το μάθημα προχωρά από θεμελιώδεις ιδέες σε πρακτικές εφαρμογές, επιτρέποντας στους εκπαιδευόμενους να κατασκευάζουν με αυτοπεποίθηση λύσεις πραγματικού χρόνου έτοιμες για παραγωγή.
Μορφή Εκπαίδευσης
• Συνεδρίες καθοδηγούμενες από εκπαιδευτή με επεξηγήσεις
• Περιηγήσεις εννοιών με παραδείγματα από τον πραγματικό κόσμο
• Πρακτικές επιδείξεις και ασκήσεις κώδικα
• Προοδευτικά εργαστήρια ευθυγραμμισμένα με τα καθημερινά θέματα
• Διαδραστικές συζητήσεις και ερωτήσεις-απαντήσεις
Στόχοι Μαθήματος
• Κατανόηση των εννοιών ροής δεδομένων σε πραγματικό χρόνο και της αρχιτεκτονικής συστημάτων
• Διάκριση μεταξύ μοντέλων επεξεργασίας παρτίδας και ροής
• Σχεδίαση κλιμακούμενων και ανθεκτικών σε σφάλματα σωληνώσεων ροής
• Εργασία με κατανεμημένα εργαλεία και πλαίσια ροής
• Εφαρμογή επεξεργασίας βάσει χρόνου συμβάντος, παραθύρωσης και λειτουργιών με κατάσταση
Δημιουργία και βελτιστοποίηση λύσεων δεδομένων πραγματικού χρόνου για επιχειρηματικές περιπτώσεις χρήσης
Εξέλιξη Κομματιού
Περίγραμμα Μαθήματος Ημέρα 1
• Εισαγωγή στις έννοιες ροής δεδομένων
• Βασικές αρχές επεξεργασίας παρτίδας έναντι πραγματικού χρόνου
• Βασικές αρχές αρχιτεκτονικής βάσει συμβάντων
• Συνήθεις περιπτώσεις χρήσης στη βιομηχανία
• Επισκόπηση του οικοσυστήματος ροής
Ημέρα 2
• Πρότυπα σχεδίασης αρχιτεκτονικής ροής
• Θεμελιώδεις αρχές κατανεμημένων συστημάτων μηνυμάτων
• Παραγωγοί και καταναλωτές
• Θέματα, κατατμήσεις και ροή δεδομένων
• Στρατηγικές εισαγωγής δεδομένων
Ημέρα 3
• Έννοιες και πλαίσια επεξεργασίας ροής
• Χρόνος συμβάντος έναντι χρόνου επεξεργασίας
• Τεχνικές παραθύρωσης και περιπτώσεις χρήσης
• Επεξεργασία ροής με κατάσταση
• Βασικές αρχές ανθεκτικότητας σε σφάλματα και σημείων ελέγχου
Ημέρα 4
• Μετασχηματισμός δεδομένων σε σωληνώσεις ροής
• ETL και ELT σε συστήματα πραγματικού χρόνου
• Διαχείριση και εξέλιξη σχημάτων
• Συνδέσεις και εμπλουτισμός ροών
• Εισαγωγή σε υπηρεσίες ροής βασισμένες στο cloud
Ημέρα 5
• Παρακολούθηση και παρατηρησιμότητα σε συστήματα ροής
• Βασικές αρχές ασφάλειας και ελέγχου πρόσβασης
• Βελτιστοποίηση απόδοσης και ρύθμιση
• Ανασκόπηση σχεδίασης σωλήνωσης από άκρο σε άκρο
• Περιπτώσεις χρήσης πραγματικού κόσμου όπως ανίχνευση απάτης και επεξεργασία IoT
Κομμάτια Εκπαίδευσης χρειάζονται 5+ συμμετέχοντες.
Ροή Δεδομένων και Επεξεργασία Δεδομένων σε Πραγματικό Χρόνο Κομμάτι εκπαίδευσης - Κράτηση
Ροή Δεδομένων και Επεξεργασία Δεδομένων σε Πραγματικό Χρόνο Κομμάτι εκπαίδευσης - Ζήτημα Συμβουλευτικής
Ροή Δεδομένων και Επεξεργασία Δεδομένων σε Πραγματικό Χρόνο - Συμβουλευτική Αίτημα
Σχόλια (1)
Χειροποίητα άσκηση. Η τάξη θα έπρεπε να διαρκέσει 5 ημέρες, αλλά και τις 3 ημέρες βοήθησαν σημαντικά να διευκρινίσω πολλά ερωτήματα που είχα από την εργασία μου με το NiFi.
James - BHG Financial
Κομμάτι - Apache NiFi for Administrators
Μηχανική Μετάφραση
Εφεξής Μαθήματα
Σχετικά Μαθήματα
Προηγμένο Apache Iceberg
21 ΏρεςΑυτή η εκπαίδευση με εισηγητή, που διεξάγεται ζωντανά σε Ελλάδα (online ή δια ζώσης), απευθύνεται σε επαγγελματίες δεδομένων προχωρημένου επιπέδου που επιθυμούν να βελτιστοποιήσουν τις ροές εργασίας επεξεργασίας δεδομένων, να εξασφαλίσουν την ακεραιότητα των δεδομένων και να υλοποιήσουν εύρωστες λύσεις data lakehouse ικανές να αντιμετωπίσουν την πολυπλοκότητα των σύγχρονων εφαρμογών μεγάλων δεδομένων.
Με την ολοκλήρωση αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Να αποκτήσουν εις βάθος κατανόηση της αρχιτεκτονικής του Iceberg, συμπεριλαμβανομένης της διαχείρισης μεταδεδομένων και της διάταξης αρχείων.
- Να παραμετροποιήσουν το Iceberg για βέλτιστη απόδοση σε διάφορα περιβάλλοντα και να το ενσωματώσουν με πολλαπλές μηχανές επεξεργασίας δεδομένων.
- Να διαχειριστούν πίνακες Iceberg μεγάλης κλίμακας, να πραγματοποιήσουν πολύπλοκες αλλαγές σχήματος και να χειριστούν την εξέλιξη κατατμήσεων.
- Να κατακτήσουν τεχνικές για τη βελτιστοποίηση της απόδοσης ερωτημάτων και της αποδοτικότητας σάρωσης δεδομένων σε μεγάλα σύνολα δεδομένων.
- Να εφαρμόσουν μηχανισμούς για την εξασφάλιση συνέπειας δεδομένων, τη διαχείριση εγγυήσεων συναλλακτικότητας και την αντιμετώπιση αποτυχιών σε κατανεμημένα περιβάλλοντα.
Θεμελιώδεις Αρχές του Apache Iceberg
14 ΏρεςΑυτή η εκπαίδευση με καθοδήγηση εκπαιδευτή, ζωντανά στο Ελλάδα (online ή onsite) απευθύνεται σε επαγγελματίες δεδομένων αρχικού επιπέδου που επιθυμούν να αποκτήσουν τις γνώσεις και τις δεξιότητες που απαιτούνται για την αποτελεσματική χρήση του Apache Iceberg για τη διαχείριση συνόλων δεδομένων μεγάλης κλίμακας, τη διασφάλιση της ακεραιότητας των δεδομένων και τη βελτιστοποίηση των ροών εργασίας επεξεργασίας δεδομένων.
Με την ολοκλήρωση αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση να:
- Αποκτήσουν εμπεριστατωμένη κατανόηση της αρχιτεκτονικής, των χαρακτηριστικών και των πλεονεκτημάτων του Apache Iceberg.
- Μάθουν για τις μορφές πινάκων, τον διαμερισμό, την εξέλιξη σχημάτων και τις δυνατότητες χρονικής περιήγησης.
- Εγκαταστήσουν και παραμετροποιήσουν το Apache Iceberg σε διαφορετικά περιβάλλοντα.
- Δημιουργήσουν, διαχειριστούν και τροποποιήσουν πίνακες Iceberg.
- Κατανοήσουν τη διαδικασία μετεγκατάστασης δεδομένων από άλλες μορφές πινάκων στο Iceberg.
Αναλυτική Μεγάλων Δεδομένων με Google Colab και Apache Spark
14 ΏρεςΑυτή η εκπαίδευση με εισηγητή, ζωντανή (online ή onsite) στο Ελλάδα απευθύνεται σε επιστήμονες δεδομένων και μηχανικούς μεσαίου επιπέδου που επιθυμούν να χρησιμοποιήσουν το Google Colab και το Apache Spark για επεξεργασία και ανάλυση μεγάλων δεδομένων.
Με την ολοκλήρωση αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση να:
- Να ρυθμίσουν ένα περιβάλλον μεγάλων δεδομένων χρησιμοποιώντας το Google Colab και το Spark.
- Να επεξεργάζονται και να αναλύουν αποτελεσματικά μεγάλα σύνολα δεδομένων με το Apache Spark.
- Να οπτικοποιούν μεγάλα δεδομένα σε ένα συνεργατικό περιβάλλον.
- Να ενσωματώνουν το Apache Spark με εργαλεία cloud.
Επιχειρηματική Ευφυΐα Μεγάλων Δεδομένων για Κυβερνητικούς Φορείς
35 ΏρεςΟι εξελίξεις στην τεχνολογία και ο συνεχώς αυξανόμενος όγκος πληροφοριών μετασχηματίζουν τον τρόπο λειτουργίας πολλών κλάδων, συμπεριλαμβανομένης της κυβέρνησης. Ο ρυθμός παραγωγής και ψηφιακής αρχειοθέτησης δεδομένων από την κυβέρνηση αυξάνεται χάρη στη ραγδαία ανάπτυξη των κινητών συσκευών και εφαρμογών, των έξυπνων αισθητήρων και συσκευών, των λύσεων υπολογιστικού νέφους και των πυλών εξυπηρέτησης πολιτών. Καθώς η ψηφιακή πληροφορία επεκτείνεται και γίνεται πιο περίπλοκη, η διαχείριση, επεξεργασία, αποθήκευση, ασφάλεια και διάθεσή της γίνονται εξίσου πολυπλοκότερες. Νέα εργαλεία σύλληψης, αναζήτησης, ανακάλυψης και ανάλυσης βοηθούν τους οργανισμούς να αποκτούν γνώση από τα αδόμητα δεδομένα τους. Ο κυβερνητικός τομέας βρίσκεται σε ένα κρίσιμο σημείο καμπής, συνειδητοποιώντας ότι η πληροφορία αποτελεί στρατηγικό περιουσιακό στοιχείο και ότι η κυβέρνηση οφείλει να προστατεύει, να αξιοποιεί και να αναλύει τόσο δομημένα όσο και αδόμητα δεδομένα για να εξυπηρετεί καλύτερα και να ανταποκρίνεται στις αποστολές της. Καθώς οι ηγέτες του δημόσιου τομέα προσπαθούν να εξελίξουν τους οργανισμούς ώστε να βασίζονται στα δεδομένα για την επιτυχή εκπλήρωση των αποστολών τους, θέτουν τα θεμέλια για τον συσχετισμό αλληλεξαρτήσεων ανάμεσα σε γεγονότα, ανθρώπους, διαδικασίες και πληροφορίες.
Οι λύσεις υψηλής αξίας για το δημόσιο θα δημιουργηθούν μέσα από έναν συνδυασμό των πιο ανατρεπτικών τεχνολογιών:
- Κινητές συσκευές και εφαρμογές
- Υπηρεσίες νέφους
- Τεχνολογίες κοινωνικής επιχειρηματικότητας και δικτύωσης
- Μεγάλα Δεδομένα και αναλυτική
Τα Μεγάλα Δεδομένα είναι μία από τις έξυπνες βιομηχανικές λύσεις και επιτρέπουν στην κυβέρνηση να λαμβάνει καλύτερες αποφάσεις, αναλαμβάνοντας δράση βάσει προτύπων που αποκαλύπτονται από την ανάλυση μεγάλων όγκων δεδομένων — συσχετιζόμενων και ασυσχέτιστων, δομημένων και αδόμητων.
Ωστόσο, η επίτευξη αυτών των κατορθωμάτων απαιτεί πολλά περισσότερα από την απλή συσσώρευση τεράστιων ποσοτήτων δεδομένων. «Η εξαγωγή νοήματος από αυτούς τους όγκους Μεγάλων Δεδομένων απαιτεί εργαλεία και τεχνολογίες αιχμής που μπορούν να αναλύουν και να εξάγουν χρήσιμη γνώση από τεράστια και ετερογενή ρεύματα πληροφορίας», έγραψαν ο Tom Kalil και ο Fen Zhao από το Γραφείο Πολιτικής Επιστήμης και Τεχνολογίας του Λευκού Οίκου σε ανάρτησή τους στο ιστολόγιο του OSTP.
Ο Λευκός Οίκος έκανε ένα βήμα προς την υποστήριξη των υπηρεσιών στην εύρεση αυτών των τεχνολογιών, όταν θέσπισε το 2012 την Εθνική Πρωτοβουλία Έρευνας και Ανάπτυξης για τα Μεγάλα Δεδομένα. Η πρωτοβουλία περιελάμβανε πάνω από 200 εκατομμύρια δολάρια για την αξιοποίηση της έκρηξης των Μεγάλων Δεδομένων και των εργαλείων που απαιτούνται για την ανάλυσή τους.
Οι προκλήσεις που θέτουν τα Μεγάλα Δεδομένα είναι σχεδόν εξίσου αποθαρρυντικές όσο και η υπόσχεσή τους. Η αποδοτική αποθήκευση δεδομένων είναι μία από αυτές. Όπως πάντα, οι προϋπολογισμοί είναι περιορισμένοι, οπότε οι υπηρεσίες πρέπει να ελαχιστοποιήσουν το ανά megabyte κόστος αποθήκευσης και να διατηρούν τα δεδομένα εύκολα προσβάσιμα, ώστε οι χρήστες να τα παίρνουν όταν τα θέλουν και με τον τρόπο που τα χρειάζονται. Η δημιουργία αντιγράφων ασφαλείας για τεράστιους όγκους δεδομένων εντείνει την πρόκληση.
Η αποτελεσματική ανάλυση των δεδομένων αποτελεί μία ακόμα σημαντική πρόκληση. Πολλές υπηρεσίες χρησιμοποιούν εμπορικά εργαλεία που τους επιτρέπουν να κοσκινίζουν τα βουνά δεδομένων, εντοπίζοντας τάσεις που μπορούν να τις βοηθήσουν να λειτουργούν πιο αποδοτικά. (Μια πρόσφατη μελέτη της MeriTalk διαπίστωσε ότι τα ανώτερα στελέχη πληροφορικής της ομοσπονδιακής κυβέρνησης πιστεύουν ότι τα Μεγάλα Δεδομένα θα μπορούσαν να βοηθήσουν τις υπηρεσίες να εξοικονομήσουν πάνω από 500 δισεκατομμύρια δολάρια, ενώ ταυτόχρονα θα εκπληρώνουν τους στόχους της αποστολής τους.)
Εξειδικευμένα εργαλεία Μεγάλων Δεδομένων που αναπτύσσονται κατά παραγγελία επιτρέπουν επίσης στις υπηρεσίες να αντιμετωπίσουν την ανάγκη ανάλυσης των δεδομένων τους. Για παράδειγμα, η Ομάδα Υπολογιστικής Ανάλυσης Δεδομένων του Εθνικού Εργαστηρίου Oak Ridge έχει διαθέσει και σε άλλες υπηρεσίες το σύστημα ανάλυσης δεδομένων Piranha. Το σύστημα βοήθησε ιατρικούς ερευνητές να εντοπίσουν μια συσχέτιση που μπορεί να προειδοποιήσει τους γιατρούς για ανεύρυσμα αορτής πριν εκδηλωθεί. Χρησιμοποιείται επίσης για πιο καθημερινές εργασίες, όπως το φιλτράρισμα βιογραφικών για τη σύνδεση υποψηφίων με υπεύθυνους προσλήψεων.
Μια Πρακτική Εισαγωγή στην Ανάλυση Δεδομένων και τα Μεγάλα Δεδομένα - 3 Ημέρες
21 ΏρεςΟι συμμετέχοντες που ολοκληρώνουν αυτήν την εκπαίδευση υπό την καθοδήγηση εκπαιδευτή και σε ζωντανή τάξη στην Ελλάδα θα αποκτήσουν μια πρακτική, εφαρμοσμένη κατανόηση των Μεγάλων Δεδομένων και των σχετικών τεχνολογιών, μεθοδολογιών και εργαλείων.
Οι συμμετέχοντες θα έχουν την ευκαιρία να κάνουν πράξη αυτή τη γνώση μέσω πρακτικών ασκήσεων. Η ομαδική αλληλεπίδραση και η ανατροφοδότηση από τον εκπαιδευτή αποτελούν σημαντικό μέρος του μαθήματος.
Το μάθημα ξεκινά με μια εισαγωγή στις βασικές έννοιες των Μεγάλων Δεδομένων και προχωρά στις γλώσσες προγραμματισμού και τις μεθοδολογίες που χρησιμοποιούνται για την Ανάλυση Δεδομένων. Τέλος, συζητάμε τα εργαλεία και την υποδομή που επιτρέπουν την αποθήκευση Μεγάλων Δεδομένων, την Κατανεμημένη Επεξεργασία και την Κλιμάκωση.
Μεγάλα Δεδομένα και Προηγμένη Ανάλυση
42 ΏρεςΜεγάλα Δεδομένα και Προηγμένη Ανάλυση είναι η εφαρμογή εξελιγμένων τεχνικών και εργαλείων για την ανάλυση μεγάλων, πολύπλοκων συνόλων δεδομένων με στόχο την εξαγωγή δραστικών πληροφοριών και τη λήψη στρατηγικών αποφάσεων.
Αυτή η εκπαίδευση με εισηγητή, σε ζωντανή μορφή (διαδικτυακά ή στους χώρους σας), απευθύνεται σε επαγγελματίες δεδομένων προχωρημένου επιπέδου που επιθυμούν να αξιοποιήσουν σύγχρονες αναλυτικές μεθόδους και τεχνολογίες μεγάλων δεδομένων για προβλεπτική, προτρεπτική και ανάλυση σε πραγματικό χρόνο.
Με την ολοκλήρωση αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση να:
- Σχεδιάζουν και να υλοποιούν αγωγούς επεξεργασίας δεδομένων μεγάλης κλίμακας για δομημένα και αδόμητα δεδομένα.
- Εφαρμόζουν προηγμένες τεχνικές μηχανικής μάθησης και βαθιάς μάθησης σε τεράστια σύνολα δεδομένων.
- Αξιοποιούν κατανεμημένα πλαίσια υπολογισμού για ανάλυση πραγματικού χρόνου και ροή δεδομένων.
- Ενσωματώνουν την ανάλυση μεγάλων δεδομένων σε συστήματα επιχειρηματικής ευφυΐας και λήψης αποφάσεων.
Μορφή του Μαθήματος
- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πρακτική.
- Πρακτική υλοποίηση σε περιβάλλον ζωντανού εργαστηρίου.
Επιλογές Προσαρμογής Μαθήματος
- Για να ζητήσετε προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, παρακαλούμε επικοινωνήστε μαζί μας για να κανονίσουμε.
Apache NiFi για Διαχειριστές
21 ΏρεςΤο Apache NiFi είναι μια πλατφόρμα ανοιχτού κώδικα για ενοποίηση δεδομένων και επεξεργασία συμβάντων βασισμένη σε ροές. Επιτρέπει την αυτοματοποιημένη, σε πραγματικό χρόνο δρομολόγηση, μετασχηματισμό και διαμεσολάβηση συστημάτων μεταξύ ετερογενών συστημάτων, με διεπαφή χρήστη μέσω web και λεπτομερή έλεγχο.
Αυτή η ζωντανή εκπαίδευση με εκπαιδευτή (δια ζώσης ή εξ αποστάσεως) απευθύνεται σε διαχειριστές και μηχανικούς μεσαίου επιπέδου που επιθυμούν να αναπτύσσουν, να διαχειρίζονται, να ασφαλίζουν και να βελτιστοποιούν ροές δεδομένων NiFi σε περιβάλλοντα παραγωγής.
Με την ολοκλήρωση αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Να εγκαθιστούν, να παραμετροποιούν και να συντηρούν συστάδες Apache NiFi.
- Να σχεδιάζουν και να διαχειρίζονται ροές δεδομένων από διάφορες πηγές και προορισμούς.
- Να υλοποιούν αυτοματισμό ροών, δρομολόγηση και λογική μετασχηματισμού.
- Να βελτιστοποιούν την απόδοση, να παρακολουθούν λειτουργίες και να επιλύουν προβλήματα.
Μορφή του Μαθήματος
- Διαδραστική διάλεξη με συζήτηση αρχιτεκτονικής πραγματικού κόσμου.
- Εργαστηριακές ασκήσεις: κατασκευή, ανάπτυξη και διαχείριση ροών.
- Ασκήσεις βασισμένες σε σενάρια σε περιβάλλον ζωντανού εργαστηρίου.
Επιλογές Προσαρμογής Μαθήματος
- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, παρακαλούμε επικοινωνήστε μαζί μας για να το κανονίσουμε.
PySpark και Μηχανική Μάθηση
21 ΏρεςΑυτή η εκπαίδευση παρέχει μια πρακτική εισαγωγή στη δημιουργία κλιμακώσιμων ροών επεξεργασίας δεδομένων και Μηχανικής Μάθησης χρησιμοποιώντας το PySpark. Οι συμμετέχοντες μαθαίνουν πώς λειτουργεί το Apache Spark μέσα σε σύγχρονα οικοσυστήματα Μεγάλων Δεδομένων και πώς να επεξεργάζονται αποδοτικά μεγάλα σύνολα δεδομένων χρησιμοποιώντας αρχές κατανεμημένου υπολογισμού.
Βασικές αρχές του Apache Spark
21 ΏρεςΑυτή η εκπαίδευση με εισηγητή, ζωντανή σε Ελλάδα (διαδικτυακά ή δια ζώσης) απευθύνεται σε μηχανικούς που επιθυμούν να εγκαταστήσουν και να αναπτύξουν το σύστημα Apache Spark για επεξεργασία πολύ μεγάλου όγκου δεδομένων.
Με την ολοκλήρωση αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση να:
- Εγκαταστήσουν και παραμετροποιήσουν το Apache Spark.
- Επεξεργάζονται και αναλύουν γρήγορα πολύ μεγάλα σύνολα δεδομένων.
- Κατανοήσουν τη διαφορά μεταξύ του Apache Spark και του Hadoop MapReduce και πότε να χρησιμοποιούν το καθένα.
- Ενσωματώσουν το Apache Spark με άλλα εργαλεία μηχανικής μάθησης.
Διαχείριση του Apache Spark
35 ΏρεςΑυτή η εκπαίδευση με εισηγητή, ζωντανά στο Ελλάδα (online ή onsite), απευθύνεται σε διαχειριστές συστημάτων αρχαρίου έως μεσαίου επιπέδου που επιθυμούν να αναπτύξουν, να συντηρήσουν και να βελτιστοποιήσουν συστάδες Spark.
Με την ολοκλήρωση αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση να:
- Εγκαθιστούν και να παραμετροποιούν το Apache Spark σε διάφορα περιβάλλοντα.
- Διαχειρίζονται τους πόρους της συστάδας και να παρακολουθούν τις εφαρμογές Spark.
- Βελτιστοποιούν την απόδοση των συστάδων Spark.
- Εφαρμόζουν μέτρα ασφαλείας και να διασφαλίζουν υψηλή διαθεσιμότητα.
- Εντοπίζουν και να επιλύουν συνήθη προβλήματα του Spark.
Apache Spark στο Cloud
21 ΏρεςΗ καμπύλη μάθησης του Apache Spark αυξάνεται αργά στην αρχή· χρειάζεται μεγάλη προσπάθεια για να επιτευχθούν τα πρώτα αποτελέσματα. Αυτό το μάθημα στοχεύει να ξεπεράσει το αρχικό δύσκολο στάδιο. Μετά την παρακολούθηση, οι συμμετέχοντες θα κατανοήσουν τα βασικά του Apache Spark, θα διακρίνουν σαφώς τα RDD από τα DataFrame, θα μάθουν τα API Python και Scala, θα κατανοήσουν τους εκτελεστές (executors) και τις εργασίες (tasks), κ.λπ. Επίσης, ακολουθώντας τις βέλτιστες πρακτικές, το μάθημα εστιάζει έντονα στην ανάπτυξη στο cloud, στο Databricks και στο AWS. Οι φοιτητές θα κατανοήσουν επίσης τις διαφορές μεταξύ του AWS EMR και του AWS Glue, μιας από τις τελευταίες υπηρεσίες Spark της AWS.
ΑΚΡΟΑΤΗΡΙΟ:
Μηχανικός Δεδομένων, DevOps, Επιστήμονας Δεδομένων
Python και Spark για Μεγάλα Δεδομένα (PySpark)
21 ΏρεςΣε αυτή τη ζωντανή εκπαίδευση με εκπαιδευτή, που διεξάγεται σε Ελλάδα, οι συμμετέχοντες θα μάθουν πώς να συνδυάζουν Python και Spark για την ανάλυση μεγάλων δεδομένων, μέσα από πρακτικές ασκήσεις.
Μέχρι το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Να μάθουν πώς να χρησιμοποιούν το Spark με την Python για την ανάλυση Μεγάλων Δεδομένων.
- Να εργαστούν σε ασκήσεις που προσομοιώνουν πραγματικές περιπτώσεις.
- Να χρησιμοποιήσουν διαφορετικά εργαλεία και τεχνικές για την ανάλυση μεγάλων δεδομένων με το PySpark.
Python, Spark και Hadoop για Μεγάλα Δεδομένα
21 ΏρεςΑυτή η εκπαίδευση με εκπαιδευτή, ζωντανά σε Ελλάδα (online ή onsite) απευθύνεται σε προγραμματιστές που επιθυμούν να χρησιμοποιήσουν και να ενσωματώσουν τα Spark, Hadoop και Python για να επεξεργαστούν, να αναλύσουν και να μετασχηματίσουν μεγάλα και πολύπλοκα σύνολα δεδομένων.
Με την ολοκλήρωση της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση να:
- Να ρυθμίσουν το απαραίτητο περιβάλλον για να ξεκινήσουν την επεξεργασία μεγάλων δεδομένων με τα Spark, Hadoop και Python.
- Να κατανοήσουν τα χαρακτηριστικά, τα βασικά στοιχεία και την αρχιτεκτονική των Spark και Hadoop.
- Να μάθουν πώς να ενσωματώνουν τα Spark, Hadoop και Python για επεξεργασία μεγάλων δεδομένων.
- Να εξερευνήσουν τα εργαλεία στο οικοσύστημα του Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka και Flume).
- Να δημιουργήσουν συστήματα σύστασης συνεργατικού φιλτραρίσματος παρόμοια με αυτά των Netflix, YouTube, Amazon, Spotify και Google.
- Να χρησιμοποιήσουν το Apache Mahout για κλιμάκωση αλγορίθμων μηχανικής μάθησης.
Stratio: Rocket και Intelligence Modules με PySpark
14 ΏρεςΤο Stratio είναι μια πλατφόρμα με επίκεντρο τα δεδομένα που ενσωματώνει μεγάλα δεδομένα, ΤΝ και διακυβέρνηση σε μία ενιαία λύση. Οι μονάδες Rocket και Intelligence επιτρέπουν ταχεία εξερεύνηση δεδομένων, μετασχηματισμό και προηγμένα αναλυτικά στοιχεία σε επιχειρηματικά περιβάλλοντα.
Αυτή η ζωντανή εκπαίδευση με καθοδήγηση εκπαιδευτή (διαδικτυακή ή δια ζώσης) απευθύνεται σε επαγγελματίες δεδομένων μεσαίου επιπέδου που επιθυμούν να χρησιμοποιήσουν αποτελεσματικά τις μονάδες Rocket και Intelligence του Stratio με PySpark, εστιάζοντας στις δομές επανάληψης, τις συναρτήσεις οριζόμενες από τον χρήστη και την προηγμένη λογική δεδομένων.
Μετά το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση να:
- Πλοηγηθούν και να εργαστούν στην πλατφόρμα Stratio χρησιμοποιώντας τις μονάδες Rocket και Intelligence.
- Εφαρμόσουν PySpark στο πλαίσιο της εισαγωγής, του μετασχηματισμού και της ανάλυσης δεδομένων.
- Χρησιμοποιήσουν βρόχους και λογικές συνθήκες για τον έλεγχο ροών εργασίας δεδομένων και εργασιών μηχανικής χαρακτηριστικών.
- Δημιουργήσουν και να διαχειριστούν συναρτήσεις οριζόμενες από τον χρήστη (UDFs) για επαναχρησιμοποιήσιμες λειτουργίες δεδομένων στην PySpark.
Μορφή του Μαθήματος
- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πρακτική.
- Πρακτική υλοποίηση σε περιβάλλον ζωντανού εργαστηρίου.
Επιλογές Προσαρμογής Μαθήματος
- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, παρακαλούμε επικοινωνήστε μαζί μας για να το κανονίσουμε.