
Local instructor-led live Hadoop training courses in Ελλάδα.
Apache Hadoop Subcategories
Hadoop Course Outlines
Course Name
Duration
Overview
Course Name
Duration
Overview
21 hours
Python είναι μια εκτεταμένη, ευέλικτη και ευρέως χρησιμοποιούμενη γλώσσα προγραμματισμού για την επιστήμη των δεδομένων και τη μηχανική μάθηση. Η Spark είναι μια μηχανή επεξεργασίας δεδομένων που χρησιμοποιείται για την αναζήτηση, την ανάλυση και τη μετατροπή μεγάλων δεδομένων, ενώ Hadoop είναι ένα πλαίσιο βιβλιοθήκης λογισμικού για την αποθήκευση και επεξεργασία δεδομένων μεγάλης κλίμακας.
Αυτή η εκπαιδευτική, ζωντανή εκπαίδευση (online ή on-site) απευθύνεται σε προγραμματιστές που επιθυμούν να χρησιμοποιήσουν και να ενσωματώσουν το Spark, Hadoop, και Python για να επεξεργαστούν, να αναλύσουν και να μεταμορφώσουν μεγάλα και πολύπλοκα σύνολα δεδομένων.
Μετά το τέλος της προπόνησης, οι συμμετέχοντες θα είναι σε θέση να:
-
Δημιουργήστε το απαραίτητο περιβάλλον για να ξεκινήσετε την επεξεργασία των μεγάλων δεδομένων με το Spark, Hadoop, και Python.
Κατανοήστε τα χαρακτηριστικά, τα βασικά συστατικά και την αρχιτεκτονική του Spark και Hadoop.
Μάθετε πώς να ενσωματώσετε το Spark, Hadoop, και Python για την επεξεργασία μεγάλων δεδομένων.
Εξερευνήστε τα εργαλεία στο οικοσύστημα του Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka, και Flume).
Δημιουργήστε συλλογικά συστήματα συστάσεων φιλτραρίσματος παρόμοια με Netflix, YouTube, Amazon, Spotify και Google.
Χρησιμοποιήστε το Apache Mahout για να κλιμακώσετε τους αλγόριθμους μηχανικής μάθησης.
-
Διαδραστική διάλεξη και συζήτηση.
Πολλές ασκήσεις και πρακτικές.
Hands-on εφαρμογή σε ένα ζωντανό εργαστήριο περιβάλλον.
-
Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, παρακαλούμε επικοινωνήστε μαζί μας για να οργανώσετε.
7 hours
This course covers how to use Hive SQL language (AKA: Hive HQL, SQL on Hive, HiveQL) for people who extract data from Hive
14 hours
Datameer is a business intelligence and analytics platform built on Hadoop. It allows end-users to access, explore and correlate large-scale, structured, semi-structured and unstructured data in an easy-to-use fashion.
In this instructor-led, live training, participants will learn how to use Datameer to overcome Hadoop's steep learning curve as they step through the setup and analysis of a series of big data sources.
By the end of this training, participants will be able to:
- Create, curate, and interactively explore an enterprise data lake
- Access business intelligence data warehouses, transactional databases and other analytic stores
- Use a spreadsheet user-interface to design end-to-end data processing pipelines
- Access pre-built functions to explore complex data relationships
- Use drag-and-drop wizards to visualize data and create dashboards
- Use tables, charts, graphs, and maps to analyze query results
- Data analysts
- Part lecture, part discussion, exercises and heavy hands-on practice
21 hours
The course is dedicated to IT specialists that are looking for a solution to store and process large data sets in distributed system environment
Course goal:
Getting knowledge regarding Hadoop cluster administration
35 hours
Κοινό: Το μάθημα απευθύνεται σε ειδικούς πληροφορικής που αναζητούν λύση για την αποθήκευση και επεξεργασία μεγάλων συνόλων δεδομένων σε περιβάλλον κατανεμημένου συστήματος Go αλ: Βαθιά γνώση σχετικά με τη διοίκηση συμπλέγματος Hadoop .
28 hours
Audience:
This course is intended to demystify big data/hadoop technology and to show it is not difficult to understand.
28 hours
Apache Hadoop is the most popular framework for processing Big Data on clusters of servers. This course will introduce a developer to various components (HDFS, MapReduce, Pig, Hive and HBase) Hadoop ecosystem.
21 hours
Το Apache Hadoop είναι ένα από τα πιο δημοφιλή πλαίσια για την επεξεργασία Big Data σε ομάδες συμπλεγμάτων διακομιστών. Αυτό το μάθημα διερευνά τη διαχείριση δεδομένων σε HDFS, προχωρημένο χοίρο, Hive και HBase. Αυτές οι προηγμένες τεχνικές προγραμματισμού θα είναι επωφελείς για τους έμπειρους προγραμματιστές Hadoop . Κοινό : προγραμματιστές Διάρκεια: τρεις ημέρες Μορφή: διαλέξεις (50%) και εργαστήρια (50%).
21 hours
This course introduces HBase – a NoSQL store on top of Hadoop. The course is intended for developers who will be using HBase to develop applications, and administrators who will manage HBase clusters.
We will walk a developer through HBase architecture and data modelling and application development on HBase. It will also discuss using MapReduce with HBase, and some administration topics, related to performance optimization. The course is very hands-on with lots of lab exercises.
Duration : 3 days Audience : Developers & Administrators
Duration : 3 days Audience : Developers & Administrators
21 hours
Το Apache Hadoop είναι το πιο δημοφιλές πλαίσιο για την επεξεργασία Big Data σε συμπλέγματα διακομιστών. Σε αυτά τα τρία (προαιρετικά, τέσσερα) ημερήσια μαθήματα, οι συμμετέχοντες θα ενημερωθούν για τα επιχειρηματικά οφέλη και τις περιπτώσεις χρήσης του Hadoop και του οικοσυστήματός του, πώς να σχεδιάσουν την ανάπτυξη και ανάπτυξη συμπλεγμάτων, πώς να εγκαταστήσετε, να διατηρήσετε, να παρακολουθήσετε, να αντιμετωπίσετε και να βελτιστοποιήσετε τον Hadoop . Επίσης, θα ασκήσουν το φορτίο μαζικών δεδομένων συμπλεγμάτων, θα εξοικειωθούν με διάφορες κατανομές του Hadoop και θα εγκαταστήσουν και θα διαχειριστούν εργαλεία οικολογικού συστήματος Hadoop . Το μάθημα ολοκληρώνεται με συζήτηση για την εξασφάλιση συμπλέγματος με τον Kerberos. "... Τα υλικά ήταν πολύ καλά προετοιμασμένα και καλυμμένα καλά. Το Εργαστήριο ήταν πολύ εξυπηρετικό και καλά οργανωμένο "
- Andrew Nguyen, κύριος μηχανικός ολοκλήρωσης DW, Microsoft Online Advertising Κοινό Διαχειριστές του Hadoop Μορφή Διαλέξεις και πρακτικά εργαστήρια, κατά προσέγγιση ισορροπία 60% διαλέξεις, 40% εργαστήρια.
- Andrew Nguyen, κύριος μηχανικός ολοκλήρωσης DW, Microsoft Online Advertising Κοινό Διαχειριστές του Hadoop Μορφή Διαλέξεις και πρακτικά εργαστήρια, κατά προσέγγιση ισορροπία 60% διαλέξεις, 40% εργαστήρια.
21 hours
Apache Hadoop is the most popular framework for processing Big Data. Hadoop provides rich and deep analytics capability, and it is making in-roads in to tradional BI analytics world. This course will introduce an analyst to the core components of Hadoop eco system and its analytics
Audience
Business Analysts
Duration
three days
Format
Lectures and hands on labs.
21 hours
Hadoop is the most popular Big Data processing framework.
14 hours
Audience
- Developers
- Lectures, hands-on practice, small tests along the way to gauge understanding
21 hours
Αυτό το μάθημα προορίζεται για προγραμματιστές, αρχιτέκτονες, επιστήμονες δεδομένων ή οποιοδήποτε προφίλ που απαιτεί πρόσβαση σε δεδομένα είτε εντατικά είτε σε τακτική βάση. Η κύρια εστίαση του μαθήματος είναι ο χειρισμός των δεδομένων και ο μετασχηματισμός. Μεταξύ των εργαλείων του οικοσυστήματος Hadoop το μάθημα αυτό περιλαμβάνει τη χρήση του Γουρούνι και της Hive τα οποία και τα δύο χρησιμοποιούνται σε μεγάλο βαθμό για μετασχηματισμό και χειρισμό δεδομένων. Αυτή η εκπαίδευση καλύπτει επίσης μετρήσεις απόδοσης και βελτιστοποίηση απόδοσης. Το μάθημα διεξάγεται εξ ολοκλήρου και χαρακτηρίζεται από παρουσιάσεις των θεωρητικών πτυχών.
14 hours
In this instructor-led training in Ελλάδα, participants will learn the core components of the Hadoop ecosystem and how these technologies can be used to solve large-scale problems. By learning these foundations, participants will improve their ability to communicate with the developers and implementers of these systems as well as the data scientists and analysts that many IT projects involve.
Audience
- Project Managers wishing to implement Hadoop into their existing development or IT infrastructure
- Project Managers needing to communicate with cross-functional teams that include big data engineers, data scientists and business analysts
14 hours
Το Apache Samza είναι ένα ασύγχρονο υπολογιστικό πλαίσιο σχεδόν ανοικτού κώδικα για την επεξεργασία ροής. Χρησιμοποιεί το Apache Kafka για ανταλλαγή μηνυμάτων και το Apache Hadoop YARN για ανοχή σφάλματος, απομόνωση επεξεργαστή, ασφάλεια και διαχείριση πόρων. Αυτή η καθοδηγούμενη από εκπαιδευτές, ζωντανή εκπαίδευση εισάγει τις αρχές πίσω από τα συστήματα ανταλλαγής μηνυμάτων και την επεξεργασία κατανεμημένων ροών, ενώ περπατούν οι συμμετέχοντες μέσω της δημιουργίας ενός δείγματος βασισμένου σε Samza έργου και εκτέλεσης εργασιών. Μέχρι το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:
- Χρησιμοποιήστε τη Samza για να απλοποιήσετε τον κώδικα που απαιτείται για την παραγωγή και κατανάλωση μηνυμάτων.
- Αποσυνδέστε το χειρισμό μηνυμάτων από μια εφαρμογή.
- Χρησιμοποιήστε τη Samza για την υλοποίηση ασύγχρονων υπολογισμών σχεδόν σε πραγματικό χρόνο.
- Χρησιμοποιήστε επεξεργασία ροής για να παρέχετε υψηλότερο επίπεδο αφαίρεσης από τα συστήματα μηνυμάτων.
- Προγραμματιστές
- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση
7 hours
Alluxio είναι ένα εικονικό διανεμημένο σύστημα αποθήκευσης ανοιχτού κώδικα που ενώνει διαφορετικά συστήματα αποθήκευσης και επιτρέπει στις εφαρμογές να αλληλεπιδρούν με δεδομένα με ταχύτητα μνήμης. Χρησιμοποιείται από εταιρείες όπως η Intel, η Baidu και η Alibaba.
Σε αυτή την εκπαιδευτική, ζωντανή κατάρτιση, οι συμμετέχοντες θα μάθουν πώς να χρησιμοποιούν Alluxio για να συσσωρεύουν διαφορετικά πλαίσια υπολογισμού με συστήματα αποθήκευσης και να διαχειρίζονται αποτελεσματικά τα δεδομένα πολλαπλής κλίμακας με την πάροδο της δημιουργίας μιας εφαρμογής με Alluxio.
Μετά το τέλος της προπόνησης, οι συμμετέχοντες θα είναι σε θέση να:
-
Αναπτύξτε μια εφαρμογή με Alluxio
Συνδέστε μεγάλα συστήματα δεδομένων και εφαρμογές διατηρώντας ταυτόχρονα ένα όνομα χώρο
Αποτελεσματικά εξάγει αξία από τα μεγάλα δεδομένα σε οποιαδήποτε μορφή αποθήκευσης
Βελτίωση της απόδοσης εργασιακού φορτίου
Επεξεργασία και διαχείριση Alluxio ξεχωριστά ή συσσωρευμένα
-
Επιστήμονας Δεδομένων
Αναπτυξιακός
Διαχειριστής συστήματος
-
Μερικές διαλέξεις, μερικές συζητήσεις, ασκήσεις και σκληρές πρακτικές
14 hours
Tigon is an open-source, real-time, low-latency, high-throughput, native YARN, stream processing framework that sits on top of HDFS and HBase for persistence. Tigon applications address use cases such as network intrusion detection and analytics, social media market analysis, location analytics, and real-time recommendations to users.
This instructor-led, live training introduces Tigon's approach to blending real-time and batch processing as it walks participants through the creation a sample application.
By the end of this training, participants will be able to:
- Create powerful, stream processing applications for handling large volumes of data
- Process stream sources such as Twitter and Webserver Logs
- Use Tigon for rapid joining, filtering, and aggregating of streams
- Developers
- Part lecture, part discussion, exercises and heavy hands-on practice
21 hours
Apache NiFi (Hortonworks DataFlow) είναι μια ολοκληρωμένη πλατφόρμα επεξεργασίας δεδομένων σε πραγματικό χρόνο και απλή πλατφόρμα επεξεργασίας συμβάντων που επιτρέπει τη μετακίνηση, την παρακολούθηση και την αυτοματοποίηση δεδομένων μεταξύ συστημάτων. Γράφεται με προγραμματισμό βάσει ροής και παρέχει μια διεπαφή χρήστη που βασίζεται στον ιστό για τη διαχείριση ροών δεδομένων σε πραγματικό χρόνο. Σε αυτήν την καθοδηγούμενη από εκπαιδευτή, ζωντανή εκπαίδευση (επιτόπια ή απομακρυσμένη), οι συμμετέχοντες θα μάθουν πώς να αναπτύξουν και να διαχειριστούν το Apache NiFi σε περιβάλλον εργαστηρίου. Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:
- Εγκαταστήστε και διαμορφώστε το Apachi NiFi.
- Πηγή, μετασχηματίζει και διαχειρίζεται δεδομένα από διαφορετικές, κατανεμημένες πηγές δεδομένων, συμπεριλαμβανομένων των βάσεων δεδομένων και των μεγάλων λιμνών δεδομένων.
- Αυτοματοποιήστε τις ροές δεδομένων.
- Ενεργοποιήστε τα αναλυτικά ροής.
- Εφαρμόστε διάφορες προσεγγίσεις για την κατάποση δεδομένων.
- Μετασχηματισμός Big Data και επιχειρηματικές γνώσεις.
- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πρακτική.
- Χειροκίνητη υλοποίηση σε εργασιακό περιβάλλον.
- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
7 hours
Apache NiFi (Hortonworks DataFlow) είναι μια ολοκληρωμένη πλατφόρμα επεξεργασίας δεδομένων σε πραγματικό χρόνο και απλή πλατφόρμα επεξεργασίας συμβάντων που επιτρέπει τη μετακίνηση, την παρακολούθηση και την αυτοματοποίηση δεδομένων μεταξύ συστημάτων. Γράφεται με προγραμματισμό βάσει ροής και παρέχει μια διεπαφή χρήστη που βασίζεται στον ιστό για τη διαχείριση ροών δεδομένων σε πραγματικό χρόνο. Σε αυτή την καθοδηγούμενη από εκπαιδευτή, ζωντανή προπόνηση, οι συμμετέχοντες θα μάθουν τα βασικά στοιχεία του προγραμματισμού που βασίζεται στη ροή καθώς αναπτύσσουν μια σειρά επεκτάσεων επίδειξης, εξαρτημάτων και επεξεργαστών που χρησιμοποιούν το Apache NiFi . Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:
- Κατανοήστε την αρχιτεκτονική και τις έννοιες ροής δεδομένων της NiFi.
- Αναπτύξτε επεκτάσεις χρησιμοποιώντας το API και τα API τρίτου μέρους.
- Προσαρμόστε το δικό του επεξεργαστή Apache Nifi.
- Κατανοήστε και επεξεργαστείτε δεδομένα σε πραγματικό χρόνο από διαφορετικές και ασυνήθιστες μορφές αρχείων και πηγές δεδομένων.
- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πρακτική.
- Χειροκίνητη υλοποίηση σε εργασιακό περιβάλλον.
- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
28 hours
Hadoop είναι ένα δημοφιλές Big Data επεξεργαστικό πλαίσιο. Python είναι μια γλώσσα προγραμματισμού υψηλού επιπέδου που είναι γνωστή για την σαφή σύνταξη και την αναγνώριση κώδικα.
Σε αυτή την εκπαιδευτική, ζωντανή εκπαίδευση, οι συμμετέχοντες θα μάθουν πώς να εργαστούν με Hadoop, MapReduce, Pig, και Spark χρησιμοποιώντας Python καθώς περνούν μέσα από πολλά παραδείγματα και χρησιμοποιούν περιπτώσεις.
Μετά το τέλος της προπόνησης, οι συμμετέχοντες θα είναι σε θέση να:
-
Κατανοήστε τις βασικές έννοιες πίσω από Hadoop, MapReduce, Pig, και Spark
Χρησιμοποιήστε Python με Hadoop διανεμημένο σύστημα αρχείων (HDFS), MapReduce, Pig, και Spark
Χρησιμοποιήστε το Snakebite για την προγραμματική πρόσβαση στο HDFS εντός Python
Χρησιμοποιήστε mrjob για να γράψετε MapReduce θέσεις εργασίας σε Python
Γράψτε προγράμματα Spark με Python
Επέκταση της λειτουργικότητας των χοίρων χρησιμοποιώντας Python UDFs
Διαχείριση MapReduce θέσεις εργασίας και σκύλους χρησιμοποιώντας Luigi
-
Οι προγραμματιστές
Οι Επαγγελματίες
-
Μερικές διαλέξεις, μερικές συζητήσεις, ασκήσεις και σκληρές πρακτικές
14 hours
Το Sqoop είναι ένα εργαλείο λογισμικού ανοιχτού κώδικα για τη μεταφορά δεδομένων μεταξύ του Hadoop και σχεσιακών βάσεων δεδομένων ή κεντρικών υπολογιστών. Μπορεί να χρησιμοποιηθεί για την εισαγωγή δεδομένων από ένα σύστημα διαχείρισης σχεσιακής βάσης δεδομένων (RDBMS) όπως το My SQL ή το Oracle ή ένα mainframe στο Hadoop Distributed File System (HDFS). Στη συνέχεια, τα δεδομένα μπορούν να μετατραπούν σε Hadoop MapReduce και, στη συνέχεια, να επανεξαχθούν ξανά σε ένα RDBMS. Σε αυτή την καθοδηγούμενη από εκπαιδευτή, ζωντανή εκπαίδευση, οι συμμετέχοντες θα μάθουν πώς να χρησιμοποιούν το Sqoop για να εισάγουν δεδομένα από μια παραδοσιακή σχεσιακή βάση δεδομένων σε αποθήκευση Hadoop όπως HDFS ή Hive και αντίστροφα. Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:
- Εγκαταστήστε και διαμορφώστε το Sqoop
- Εισαγωγή δεδομένων από το My SQL σε HDFS και το Hive
- Εισαγωγή δεδομένων από HDFS και Hive στο My SQL
- Διαχειριστές συστημάτων
- Μηχανικοί δεδομένων
- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση
- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
21 hours
Οι μεγάλες αναλύσεις δεδομένων περιλαμβάνουν τη διαδικασία εξέτασης μεγάλων ποσοτήτων ποικίλων συνόλων δεδομένων, προκειμένου να αποκαλυφθούν συσχετισμοί, κρυμμένα μοτίβα και άλλες χρήσιμες γνώσεις. Ο τομέας της υγείας έχει τεράστιες ποσότητες σύνθετων ετερογενών ιατρικών και κλινικών δεδομένων. Η εφαρμογή μεγάλων αναλυτικών στοιχείων σχετικά με τα δεδομένα για την υγεία παρουσιάζει τεράστιο δυναμικό για την απόκτηση γνώσεων για τη βελτίωση της παροχής υγειονομικής περίθαλψης. Ωστόσο, το τεράστιο μέγεθος αυτών των συνόλων δεδομένων δημιουργεί μεγάλες προκλήσεις σε αναλύσεις και πρακτικές εφαρμογές σε ένα κλινικό περιβάλλον. Σε αυτή την καθοδηγούμενη από εκπαιδευτή, ζωντανή εκπαίδευση (απομακρυσμένη), οι συμμετέχοντες θα μάθουν πώς να εκτελούν μεγάλες αναλύσεις δεδομένων στην υγεία καθώς περνούν μέσα από μια σειρά πρακτικών εργαστηριακών ασκήσεων. Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:
- Εγκαταστήστε και διαμορφώστε εργαλεία ανάλυσης δεδομένων όπως Hadoop MapReduce και Spark
- Κατανοήστε τα χαρακτηριστικά των ιατρικών δεδομένων
- Εφαρμογή μεγάλων τεχνικών δεδομένων για την αντιμετώπιση των ιατρικών δεδομένων
- Μελετήστε μεγάλα συστήματα δεδομένων και αλγόριθμους στο πλαίσιο εφαρμογών υγείας
- Προγραμματιστές
- Επιστήμονες δεδομένων
- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση.
- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
35 hours
Το Apache Hadoop είναι ένα δημοφιλές πλαίσιο επεξεργασίας δεδομένων για την επεξεργασία μεγάλων συστημάτων δεδομένων σε πολλούς υπολογιστές.
Αυτή η εκπαιδευτική, ζωντανή εκπαίδευση (online ή on-site) απευθύνεται σε διαχειριστές συστήματος που θέλουν να μάθουν πώς να εγκαταστήσουν, να αναπτύξουν και να διαχειριστούν Hadoop κλάδους εντός της οργάνωσης τους.
Μετά το τέλος της προπόνησης, οι συμμετέχοντες θα είναι σε θέση να:
-
Εγκαταστήστε και ρυθμίστε το Apache Hadoop.
Κατανοήστε τα τέσσερα βασικά συστατικά του οικοσυστήματος Hadoop: HDFS, MapReduce, YARN και Hadoop Common.
Χρησιμοποιήστε το Distributed File System (HDFS) για να κλιμακώσετε ένα κλάσμα σε εκατοντάδες ή χιλιάδες κόμβους.   ·
Εγκαταστήστε το HDFS για να λειτουργεί ως μηχανή αποθήκευσης για εγκαταστάσεις Spark.
Εγκαταστήστε το Spark για πρόσβαση σε εναλλακτικές λύσεις αποθήκευσης όπως τα συστήματα βάσης δεδομένων Amazon S3 και NoSQL όπως Redis, Elasticsearch, Couchbase, Aerospike, κλπ.
Εκτελέστε διοικητικά καθήκοντα όπως η παροχή, η διαχείριση, η παρακολούθηση και η διασφάλιση μιας ομάδας Apache Hadoop.
-
Διαδραστική διάλεξη και συζήτηση.
Πολλές ασκήσεις και πρακτικές.
Hands-on εφαρμογή σε ένα ζωντανό εργαστήριο περιβάλλον.
-
Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, παρακαλούμε επικοινωνήστε μαζί μας για να οργανώσετε.
21 hours
Το Cloudera Impala είναι μια μηχανή αναζήτησης ανοιχτού κώδικα μαζικής παράλληλης επεξεργασίας (MPP) SQL για συμπλέγματα Apache Hadoop.Το Impala επιτρέπει στους χρήστες να εκδίδουν ερωτήματα χαμηλής καθυστέρησης SQL σε δεδομένα που είναι αποθηκευμένα στο σύστημα κατανεμημένων αρχείων Hadoop και στο Apache Hbase χωρίς να απαιτείται μετακίνηση ή μετατροπή δεδομένων.ΑκροατήριοΑυτό το μάθημα απευθύνεται σε αναλυτές και επιστήμονες δεδομένων που πραγματοποιούν ανάλυση δεδομένων που είναι αποθηκευμένα στο Hadoop μέσω εργαλείων Business Intelligence ή SQL.Μετά από αυτό το μάθημα οι σύνεδροι θα μπορούν
- Εξάγετε σημαντικές πληροφορίες από τα συμπλέγματα Hadoop με το Impala. Γράψτε συγκεκριμένα προγράμματα για τη διευκόλυνση του Business Intelligence στη διάλεκτο Impala SQL. Αντιμετώπιση προβλημάτων Impala.
21 hours
Apache Ambari είναι μια πλατφόρμα διαχείρισης ανοιχτού κώδικα για την παροχή, τη διαχείριση, την παρακολούθηση και τη διασφάλιση συμπλεγμάτων του Apache Hadoop . Σε αυτή την εκπαιδευτική άσκηση, οι συμμετέχοντες θα μάθουν τα εργαλεία και τις πρακτικές διαχείρισης που παρέχει η Ambari για να διαχειριστούν με επιτυχία τα clusters του Hadoop . Μέχρι το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:
- Ρυθμίστε ένα ζωντανό σύμπλεγμα Big Data χρησιμοποιώντας το Ambari
- Εφαρμόστε τις προηγμένες δυνατότητες και λειτουργίες του Ambari σε διάφορες περιπτώσεις χρήσης
- Προσθέστε και αφαιρέστε τους κόμβους αν χρειάζεται
- Βελτιώστε την απόδοση του συμπλέγματος του Hadoop μέσω του συντονισμού και του μικροαλλαγές
- DevOps
- Διαχειριστές συστήματος
- DBAs
- Hadoop δοκιμές επαγγελματίες
- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση
21 hours
Hortonworks Data Platform (HDP) είναι μια πλατφόρμα υποστήριξης Apache Hadoop ανοικτής πηγής που παρέχει μια σταθερή βάση για την ανάπτυξη μεγάλων λύσεων δεδομένων στο οικοσύστημα Apache Hadoop . Αυτή η καθοδηγούμενη από εκπαιδευτές, ζωντανή προπόνηση (onsite ή απομακρυσμένη) εισάγει Hortonworks Data Platform (HDP) και περπατά τους συμμετέχοντες μέσω της ανάπτυξης της λύσης Spark + Hadoop . Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:
- Χρησιμοποιήστε το Hortonworks για να εκτελέσετε αξιόπιστα τον Hadoop σε μεγάλη κλίμακα.
- Ενοποιήστε τις δυνατότητες ασφάλειας, διακυβέρνησης και λειτουργίας της Hadoop με τις ευέλικτες αναλυτικές ροές εργασίας του Spark.
- Χρησιμοποιήστε το Hortonworks για να διερευνήσετε, να επικυρώσετε, να πιστοποιήσετε και να υποστηρίξετε κάθε ένα από τα στοιχεία ενός έργου Spark.
- Επεξεργαστείτε διάφορους τύπους δεδομένων, συμπεριλαμβανομένων δομημένων, αδόμητων, σε κίνηση και σε ξεκούραση.
- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πρακτική.
- Χειροκίνητη υλοποίηση σε εργασιακό περιβάλλον.
- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
Last Updated:
Other countries
Consulting
Online Apache Hadoop courses, Weekend Hadoop courses, Evening Hadoop training, Hadoop boot camp, Apache Hadoop instructor-led, Weekend Apache Hadoop training, Evening Apache Hadoop courses, Apache Hadoop coaching, Apache Hadoop instructor, Hadoop trainer, Hadoop training courses, Hadoop classes, Apache Hadoop on-site, Apache Hadoop private courses, Apache Hadoop one on one training