Talend Big Data Integration Κομμάτι εκπαίδευσης
Το Talend Open Studio for Big Data είναι ένα πηγαίου κώδικα ETL (Extract, Transform, Load) εργαλείο για την επεξεργασία μεγάλων δεδομένων. Περιλαμβάνει ένα περιβάλλον ανάπτυξης για τη σύνδεση με Big Data πηγές και προορισμούς, καθώς και την εκτέλεση δουλειών χωρίς να χρειάζεται η γραφή κώδικα.
Αυτή η εκπαίδευση, που διοργανώνεται με την εξοδή του εκπαιδευτικού (online ή on-site), απευθύνεται σε τεχνικό προσωπικό που επιθυμεί να υποβάλει το Talend Open Studio for Big Data για την εξυγίανση της διαδικασίας ανάγνωσης και επεξεργασίας μεγάλων δεδομένων.
Στο τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν να:
- Εγκαταστήσουν και ρυθμίσουν το Talend Open Studio for Big Data.
- Να συνδεθούν με Big Data συστήματα όπως Cloudera, HortonWorks, MapR, Amazon EMR και Apache.
- Να καταλάβουν και να ρυθμίσουν τις συσταδικές περιοχές μεγάλων δεδομένων και τους συνδέσεις Open Studio.
- Να ρυθμίσουν παραμέτρους για την αυτόματη δημιουργία κώδικα MapReduce.
- Να χρησιμοποιήσουν τη σύρση-βυθισμό (drag-and-drop) διεπαφή Open Studio για την εκτέλεση Hadoop δουλειών.
- Να πρωτοτυποποιήσουν μεγάλα συμβολοσχέδια ροών δεδομένων.
- Να αυτοματοποιήσουν εγχειρήματα μεγάλης περιουσίας δεδομένων.
Μορφή του Μαθήματος
- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πράξεις.
- Εφαρμογή χειροντίνης σε ενεργό εργαστήριο (live-lab).
Επιλογές Προσαρμογής του Μαθήματος
- Για να αιτηθείτε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να διατυπώσουμε σχέδιο.
Εξέλιξη Κομματιού
Παρουσίαση
Κατάληψη των χαρακτηριστικών και της αρχιτεκτονικής "Open Studio for Big Data"
Ρύθμιση Open Studio for Big Data
Ναβίγαση στη διεπαφή χρήστη (UI)
Κατάληψη των μεγάλων περιοχών δεδομένων και συνδέσεων
Σύνδεση με cluster Hadoop
Ανάγνωση και εκτύπωση δεδομένων
Επεξεργασία δεδομένων με Hive και MapReduce
Ανάλυση των αποτελεσμάτων
Βελτίωση της ποιότητας μεγάλων δεδομένων
Δημιουργία συμβολοσχέδιου ροών μεγάλων δεδομένων
Διαχείριση χρηστών, ομάδων, ρόλων και εγχειρημάτων
Εφαρμογή Open Studio στη παραγωγή
Παρακολούθηση Open Studio
Εξάλειψη σφαλμάτων (Troubleshooting)
Περίληψη και επίκλυση
Απαιτήσεις
- Σύνεση των σχετικών βάσεων δεδομένων
- Σύνεση των χώρων αποθήκευσης δεδομένων (Data Warehousing)
- Σύνεση των προσαγωγών ETL (Extract, Transform, Load)
Ακροατήριο
- Επαγγελματίες επιχειρησιακής νοημοσύνης (Business Intelligence)
- Επαγγελματίες βάσεων δεδομένων
- Αναπτυξιών SQL
- Επαγγελματίες ETL
- Σχεδιαστές λύσεων (Solution Architects)
- Σχεδιαστές δεδομένων (Data Architects)
- Επαγγελματίες χώρων αποθήκευσης δεδομένων
- Διαχειριστές συστημάτος και ολοκληρωτές (System Administrators and Integrators)
Κομμάτια Εκπαίδευσης χρειάζονται 5+ συμμετέχοντες.
Talend Big Data Integration Κομμάτι εκπαίδευσης - Κράτηση
Talend Big Data Integration Κομμάτι εκπαίδευσης - Ζήτημα Συμβουλευτικής
Talend Big Data Integration - Συμβουλευτική Αίτημα
Σχόλια (1)
Χειροποίητα άσκηση. Η τάξη θα έπρεπε να διαρκέσει 5 ημέρες, αλλά και τις 3 ημέρες βοήθησαν σημαντικά να διευκρινίσω πολλά ερωτήματα που είχα από την εργασία μου με το NiFi.
James - BHG Financial
Κομμάτι - Apache NiFi for Administrators
Μηχανική Μετάφραση
Εφεξής Μαθήματα
Σχετικά Μαθήματα
Advanced Apache Iceberg
21 ΏρεςΑυτή η καθοδηγημένη από εκπαιδευτικό, ζωντανή εκπαίδευση σε Ελλάδα (online ή on-site) απευθύνεται σε προχωρημένους διαχειριστές δεδομένων που επιθυμούν να βελτιώσουν τα ρούτινες επεξεργασίας δεδομένων, να ασφαλίσουν την ακεραιότητα των δεδομένων και να υλοποιήσουν στοχευμένες λύσεις data lakehouse που μπορούν να αντιμετωπίσουν την περιπλοκότητα σύγχρονων εφαρμογών μεγάλων δεδομένων.
Στο τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν να:
- Να αποκτήσουν εξαντλητική κατανόηση της αρχιτεκτονικής Iceberg, συμπεριλαμβανομένης της διαχείρισης μεταδεδομένων και της διάταξης αρχείων.
- Να ρυθμίσουν το Iceberg για βέλτιστη απόδοση σε διάφορα περιβάλλοντα και να το ενταξιορθώσουν με πολλά μηχανήματα επεξεργασίας δεδομένων.
- Να διαχειρίζονται μεγάλες κλίμακες πινάκων Iceberg, να εκτελούν περίπλοκες αλλαγές σεμασιοθεσίας και να χειριζόμαστε την εξέλιξη καταμερισμών.
- Να αποκτήσουν εξειδίκευση σε τεχνικές για τη βελτίωση της απόδοσης ερωτήσεων και την αποτελεσματικότητα σάρωσης δεδομένων για μεγάλους πίνακες.
- Να υλοποιήσουν μηχανισμούς για την ασφάλιση συνέπειας δεδομένων, να διαχειρίζονται εγγυήσεις συναλλαγών και να χειριστούν αποτυχίες σε κατανεμημένα περιβάλλοντα.
Big Data Analytics με Google Colab και Apache Spark
14 ΏρεςΑυτή η εκπαιδευτική διάλεξη σε ζωντανό μέρος (σε πρόσωπο πρόσωπου ή διαδικτύου) είναι στοχευμένη για μεσαίου επιπέδου ειδικές στατιστικά επιστήμονες και μηχανικούς που θέλουν να χρησιμοποιήσουν Google Colab και Apache Spark για την επεξεργασία και ανάλυση μεγάλων δεδομένων.
Μέχρι το τέλος αυτής της εκπαιδευτικής διαλέξεως, οι μεταφράστες θα μπορούν να:
- Εγκαταστήσουν περιβάλλον μεγάλων δεδομένων χρησιμοποιώντας Google Colab και Spark.
- Επεξεργαστούν και αναλύσουν μεγάλα σημεία δεδομένων εξικανώς με το Apache Spark.
- Δημιουργήστε προβολές για μεγάλα σημεία δεδομένων σε ενόπλη υπεύθυνη ομάδα.
- Συνδυάστε Apache Spark με αστικά εργαλεία.
Αποδόσεις Διαχειριστών Apache NiFi
21 ΏρεςO Apache NiFi είναι ένα open-source πλατφόρμα ροής δεδομένων και επεξεργασίας γεγονότων. Ειδυλλιώνει την αυτόματη, πραγματικής χρονικής διάστασης μεταφορά, μετασχηματισμό και ενδιάμεση μέση επεξεργασία δεδομένων μεταξύ ένων διαφορετικών συστημάτων, με χρήση πλατφόρμας με γραφικό περιβάλλον και λεπτομερή ελέγχου.
Αυτή η διδασκαλία υπό την οδηγία του εκπαιδευτικού (χώρος και απομακρυσμένα) απευθύνεται σε διοικητές και μηχανικούς μεδίου επιπέδου, οι οποίοι επιθυμούν να εφαρμόσουν, να διαχειριστούν, να ασφαλίσουν και να βελτιστοποιήσουν ροές δεδομένων NiFi σε παραγωγικά περιβάλλοντα.
Στο τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση να:
- Εγκαταστήσουν, να ρυθμίσουν και να διατηρήσουν συστήματα συστήματος Apache NiFi.
- Σχεδιάσουν και να διαχειρίζονται ροές δεδομένων από διάφορες πηγές και θερμοκρασίες.
- Εφαρμόσουν λογική αυτοματοποίησης, διαδρομής και μετασχηματισμού ροής.
- Βελτιστοποιήσουν την απόδοση, να παρακολουθήσουν τις λειτουργίες και να εξασφαλίσουν χαλάρωση προβλημάτων.
Μορφή του Μαθήματος
- Αλληλεπιδραστική παράσταση με συζήτηση αρχιτεκτονικής πραγματικού κόσμου.
- Εργασίες χειρονομήτρου: κατασκευή, εφαρμογή και διαχείριση ροών.
- Ασκήσεις με σενάρια σε ζωντανό περιβάλλον εργαστηρίου.
Επιλογές Προσαρμογής Μαθήματος
- Για να κάνετε αίτηση για προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, παρακαλούμε επικοινωνήστε μαζί μας για να οργανώσετε.
PySpark και Μηχανική Μάθησης
21 ΏρεςΗ παρούσα εκπαίδευση παρέχει μια πρακτική εισαγωγή στην κατασκευή επεκτάσιμων ροών εργασίας επεξεργασίας δεδομένων και Μηχανικής Μάθησης με τη χρήση του PySpark. Οι συμμετέχοντες μαθαίνουν πώς λειτουργεί το Apache Spark εντός των σύγχρονων οικοσυστημάτων Big Data και πώς να επεξεργάζονται αποτελεσματικά μεγάλα σύνολα δεδομένων, αξιοποιώντας τις αρχές της κατανεμημένης επεξεργασίας.
Βασικά Στοιχεία του Apache Spark
21 ΏρεςΑυτή η οδηγία υπό διδασκαλία (online ή on-site) απευθύνεται σε μηχανικούς που επιθυμούν να εγκαταστήσουν και να διαχειριστούν το σύστημα Apache Spark για την επεξεργασία πολύ μεγάλων ποσοτήτων δεδομένων.
Στο τέλος αυτής της κατάρτισης, οι συμμετέχοντες θα είναι σε θέση:
- Εγκαταστάσει και διαμόρφωση του Apache Spark.
- Γρήγορη επεξεργασία και ανάλυση πολύ μεγάλων συνόλων δεδομένων.
- Κατανόηση της διαφοράς μεταξύ του Apache Spark και του Hadoop MapReduce, καθώς και πότε να χρησιμοποιήσουν αυτό ή εκείνο.
- Ενσωμάτωση του Apache Spark με άλλες εργαλεία μηχανικής μάθησης.
Διαχείριση του Apache Spark
35 ΏρεςΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε αρχάριους έως μεσαίου επιπέδου διαχειριστές συστημάτων που επιθυμούν να αναπτύξουν, να διατηρήσουν και να βελτιστοποιήσουν συμπλέγματα Spark.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Εγκαταστήστε και διαμορφώστε το Apache Spark σε διάφορα περιβάλλοντα.
- Διαχειριστείτε τους πόρους συμπλέγματος και παρακολουθήστε τις εφαρμογές Spark.
- Βελτιστοποιήστε την απόδοση των συμπλεγμάτων Spark.
- Εφαρμόστε μέτρα ασφαλείας και εξασφαλίστε υψηλή διαθεσιμότητα.
- Εντοπισμός σφαλμάτων και αντιμετώπιση κοινών προβλημάτων Spark.
Apache Spark στον Πυρήνα της Ασπίδας
21 ΏρεςΗ καμπύλη μάθηση του Apache Spark αρχικά είναι ξεκούραση, χρειάζεται πολλή προσπάθεια για να πάρει κανείς το πρώτο αποδότημα. Αυτό το μάθημα στοχεύει να διέλθει τον πρώτο δύσκολο τομέα. Μετά από τη συμμετοχή σε αυτό το μάθημα, οι συμμετέχοντες θα καταλάβουν τις βασικές εννοιές του Apache Spark, θα διακρίνουν με ακρίβεια το RDD από το DataFrame, θα μάθουν τη Python και Scala API, θα καταλάβουν εκτελεστές και εργασίες, κ.α. Επιπλέον, ακολουθώντας τις καλύτερες πρακτικές, αυτό το μάθημα εστιάζει ιδιαίτερα στην υπολογιστική στην Σύνθεση, Databricks και AWS. Οι φοιτητές θα καταλάβουν επίσης τις διαφορές μεταξύ AWS EMR και AWS Glue, μία από τις πιο πρόσφατες υπηρεσίες Spark του AWS.
ΔΙΕΥΘΥΝΤΗΣ:
Data Engineer, DevOps, Data Scientist
Python και Spark για Μεγάλα Δεδομένα (PySpark)
21 ΏρεςΣε αυτήν τη ζωντανή εκπαίδευση στο Ελλάδα, καθοδηγούμενη από εκπαιδευτές, οι συμμετέχοντες θα μάθουν πώς να χρησιμοποιούν το Python και το Spark μαζί για να αναλύουν μεγάλα δεδομένα καθώς εργάζονται σε πρακτικές ασκήσεις.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Μάθετε πώς να χρησιμοποιείτε το Spark με το Python για την ανάλυση του Big Data.
- Εργαστείτε σε ασκήσεις που μιμούνται πραγματικές περιπτώσεις.
- Χρησιμοποιήστε διαφορετικά εργαλεία και τεχνικές για την ανάλυση μεγάλων δεδομένων χρησιμοποιώντας το PySpark.
Python, Spark και Hadoop για Μεγάλα Δεδομένα
21 ΏρεςΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε προγραμματιστές που επιθυμούν να χρησιμοποιήσουν και να ενσωματώσουν το Spark, Hadoop και Python για να επεξεργαστούν, να αναλύσουν και να μετασχηματίσουν μεγάλα και πολύπλοκα σύνολα δεδομένων.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Ρυθμίστε το απαραίτητο περιβάλλον για να ξεκινήσετε την επεξεργασία μεγάλων δεδομένων με το Spark, Hadoop και Python.
- Κατανοήστε τα χαρακτηριστικά, τα βασικά στοιχεία και την αρχιτεκτονική του Spark και Hadoop.
- Μάθετε πώς να ενσωματώνετε το Spark, Hadoop και Python για επεξεργασία μεγάλων δεδομένων.
- Εξερευνήστε τα εργαλεία στο οικοσύστημα Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka και Flume).
- Δημιουργήστε συνεργατικά συστήματα προτάσεων φιλτραρίσματος παρόμοια με το Netflix, το YouTube, το Amazon, το Spotify και το Google.
- Χρησιμοποιήστε το Apache Mahout για να κλιμακώσετε τους αλγόριθμους μηχανικής μάθησης.
Apache Spark SQL
7 ΏρεςO Spark SQL είναι ένας μόδουλος του Apache Spark για να εργάζεται με δομημένα και ανεξάρτητα σε δομή δεδομένα. Ο Spark SQL παρέχει πληροφορίες για τη δομή των δεδομένων καθώς και την εκτέλεση των υπολογισμών. Αυτές οι πληροφορίες μπορούν να χρησιμοποιηθούν για να διεξαχθούν βελτιώσεις. Δύο συνηθισμένες χρήσεις του Spark SQL είναι:
- η εκτέλεση SQL ερωτήσεων.
- η ανάγνωση δεδομένων από υπάρχουσες εγκαταστάσεις Hive.
Σε αυτή την καθοδηγούμενη από καθηγητή, ζωντανή εκπαίδευση (χώρου υποδοχής ή από αποστάση), οι συμμετέχοντες θα μάθουν πώς να αναλύουν διάφορους τύπους συνόλων δεδομένων χρησιμοποιώντας Spark SQL.
Στο τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:
- Να εγκαθιστούν και να ρυθμίζουν το Spark SQL.
- Να διεξάγουν ανάλυση δεδομένων με το Spark SQL.
- Να ερωτήσουν σύνολα δεδομένων σε διάφορα μορφώματα.
- Να οπτικοποιούν δεδομένα και αποτελέσματα ερωτήσεων.
Μορφή του Μαθήματος
- Διαδραστικός διάλεξη και συζήτηση.
- Πολλά ασκήματα και πράξη.
- Χειρονομία εφαρμογής σε ζωντανό lab-περιβάλλον.
Ευκαιρίες Προσαρμογής του Μαθήματος
- Για να ζητήσετε μια προσαρμογμένη εκπαίδευση για αυτό το μάθημα, παρακαλώ επικοινωνήστε μαζί μας για να κάνετε οργάνωση.
Stratio: Ροκέτ και Δυναμικά Μόδουλα με PySpark
14 ΏρεςStratio είναι μια πλατφόρμα αξιοθέτησης δεδομένων που ενσωματώνει τα big data, την AI και την governance σε μία έντελη λύση. Οι modula Rocket και Intelligence επιτρέπουν γρήγορη αναζήτηση, μετάφραση δεδομένων και προβληματική ανάλυση σε εντελειώδη περιβάλλοντα.
Αυτό το δίδασκτρο με οργανωμένη καθοδήγηση (πολύχρωμος ή live) στόχο ενισχύει τους μεσαίου επιπέδου δεδομένων επαγγελματίες που επιθυμούν να χρησιμοποιήσουν τα modula Rocket και Intelligence στο Stratio αποτελεσματικά με PySpark, εστίαζόντας σε περιβάλλοντα διαδηλώσεων, χρήστες-ορισμένες λειτουργίες και προβληματικά δεδομένα.
Στο τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν να:
- Να περιφέρονται και να εργάζονται στην Stratio platform χρησιμοποιώντας τους modula Rocket και Intelligence.
- Να εφαρμόζουν PySpark σε περιβάλλοντα δεδομένων ingestion, transformation, και analysis.
- Να χρησιμοποιούν loops και συνθηκική λογική για τον έλεγχο δεδομένων workflows και feature engineering tasks.
- Να δημιουργούν και να διαχειρίζονται χρήστες-ορισμένες λειτουργίες (UDFs) για μεταχειριστό data operations στο PySpark.
Μορφή της Εκπαίδευσης
- Διεξοδική εισαγωγή και συζήτηση.
- Πολλά ασκήσεις και πρακτική.
- Αλληλεπίδραση σε μια live-lab περιβάλλον.
Επιλογές Διεξαγωγής Προσαρμοστικών
- Για να αιτηθεί μια προσαρμοσμένη εκπαίδευση για αυτό το δίδασκο, παρακαλώ συνεχίζετε μας.
Talend Administration Center (TAC)
14 ΏρεςΑυτή η καθοδήγηση που εκτελείται από δάσκαλο (online ή on-site) στέλνεται σε συστηματικούς διαχειριστές, επιστήμονες δεδομένων και επιχειρηματικούς αναλυτές που θέλουν να ρυθμίσουν το Talend Administration Center για να διαχειριστούν και να διαδώσουν τους ρόλους και τις εργασίες της οργάνωσης.
Μέχρι το τέλος αυτής της καθοδήγησης, οι συμμετέχοντες θα μπορούν να:
- Εγκαταστήσουν και να ρυθμίσουν το Talend Administration Center.
- Κατανοήσουν και να εφαρμόσουν τις βασικές αρχές διαχείρισης του Talend.
- Να κατασκευάζουν, να εγκαθιστούν και να εκτελούν επιχειρηματικές έργα ή εργασίες στο Talend.
- Να παρακολουθούν την ασφάλεια των συνόλων δεδομένων και να αναπτύσσουν επιχειρηματικά προτύπα με βάση το πλαίσιο TAC.
- Να αποκτήσουν χαρακτηριστικότερη κατανόηση για εφαρμογές μεγάλων δεδομένων (big data).
Ταλέντ Διαχείριση Δεδομένων
14 ΏρεςΑυτή η καθοδηγημένη από εκπαιδευτικό, ζωντανή εκπαίδευση σε Ελλάδα (online ή onsite) απευθύνεται σε διαχειριστές δεδομένων με βασικό ή μεσαίο επίπεδο γνώση που επιθυμούν να ενισχύσουν την κατανόησή τους και τις δεξιότητές τους στη διαχείριση και βελτίωση της ποιότητας δεδομένων χρησιμοποιώντας το Talend Data Stewardship.
Στο τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν να:
- Κατανοήσουν πλήρως το ρόλο της διαχείρισης δεδομένων (data stewardship) στην διαφυλάξη της ποιότητας δεδομένων.
- Χρησιμοποιήσουν το Talend Data Stewardship για τη διαχείριση εργασιών ποιότητας δεδομένων.
- Δημιουργήσουν, αναθέσουν και διαχειριστούν εργασίες στο Talend Data Stewardship, συμπεριλαμβανομένης της προσαρμογής ροών εργασιών.
- Χρησιμοποιήσουν τις ικανότητες αναφοράς και παρακολούθησης του εργαλείου για να καταγράφουν την ποιότητα δεδομένων και τους προσπάθειες διαχείρισης δεδομένων.
Talend Open Studio for ESB
21 ΏρεςΣε αυτή την ζωντανή εκπαίδευση που καθοδηγεί ο εκπαιδευτικός στο Ελλάδα, οι συμμετέχοντες θα μάθουν να χρησιμοποιούν το Talend Open Studio για ESB προκειμένου να δημιουργήσουν, συνδέουν, κλόνον και να επιδιέφθυνουν υπηρεσίες και τις αλληλεπιδράσεις τους.
Μέχρι το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση
- Να ολοκληρώνουν, να βελτιώνουν και να παρέχουν τεχνολογίες ESB ως μόνιμα πακέτα σε διάφορες περιβάλλοντα εξαγωγής.
- Να κατανοούν και να χρησιμοποιούν τα πιο δημοφιλή συστατικά του Talend Open Studio.
- Να ενσωματώνουν οποιεσδήποτε εφαρμογές, βάσεις δεδομένων, API, ή Web Services.
- Να ενσωματώνουν πλήρως την ένωση διαφορετικών συστημάτων και εφαρμογών.
- Να ενσωματώνουν υπάρχοντες Java code libraries για την παροχή επεκτάσεων σε έργα.
- Να κερδίζουν αξία από κοινοτικά συστατικά και κώδικα για την παροχή επεκτάσεων σε έργα.
- Να ενσωματώνουν γρήγορα συστήματα, εφαρμογές και πηγές δεδομένων μέσα σε ένα περιβάλλον τύπου drag-and-drop Eclipse.
- Να μειώνουν το χρόνο ανάπτυξης και διαχείρισης κόστους επεκτείνοντας βελτιωμένο, ξανά χρησιμοποιό πρότυπο.