Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
Ενότητα 1: Δεδομένα Management σε HDFS
- Διάφορες μορφές δεδομένων (JSON / Avro / Παρκέ) Σχέδια συμπίεσης Data Masking Labs : Ανάλυση διαφορετικών μορφών δεδομένων. επιτρέποντας τη συμπίεση
Ενότητα 2: Προχωρημένος Χοίρος
- Λειτουργίες που καθορίζονται από το χρήστη Εισαγωγή στις βιβλιοθήκες χοίρων (ElephantBird / Data-Fu) Φόρτωση σύνθετων δομημένων δεδομένων χρησιμοποιώντας Pig Pig Tuning Labs: προηγμένη δέσμη ενεργειών χοίρων, ανάλυση πολύπλοκων τύπων δεδομένων
Ενότητα 3 : Για προχωρημένους Hive
- Λειτουργίες που καθορίζονται από το χρήστη Συμπιεσμένοι πίνακες Hive Performance Tuning Labs : δημιουργία συμπιεσμένων πινάκων, αξιολόγηση μορφών πινάκων και διαμόρφωση
Ενότητα 4: Προηγμένη HBase
- Σύνθετη μοντελοποίηση σχήματος Μαζικά δεδομένα συμπίεσης Απορρόφηση Μεγάλου πίνακα / Ψηλής σύγκρισης HBase και Pig HBase και Hive HBase Performance Tuning Labs : συντονισμός HBase; πρόσβαση σε δεδομένα HBase από το Pig & Hive; Χρήση του Phoenix για μοντελοποίηση δεδομένων
Requirements
- άνετα με τη γλώσσα προγραμματισμού Java (οι περισσότερες ασκήσεις προγραμματισμού είναι σε java)
- άνετα σε περιβάλλον Linux (μπορείτε να πλοηγηθείτε στη γραμμή εντολών Linux, να επεξεργαστείτε αρχεία χρησιμοποιώντας vi / nano)
- εργασιακή γνώση του Hadoop.
Εργαστηριακό περιβάλλον
Zero Install: Δεν χρειάζεται να εγκαταστήσετε λογισμικό hadoop στα μηχανήματα των μαθητών! Θα παρέχεται ένα εργασιακό cluster hadoop για τους μαθητές.
Οι μαθητές θα χρειαστούν τα ακόλουθα
- ένας πελάτης SSH (Linux και ο Mac έχουν ήδη προγράμματα-πελάτες ssh, για το Windows Putty συνιστάται)
- ένα πρόγραμμα περιήγησης για πρόσβαση στο σύμπλεγμα. Συνιστούμε το πρόγραμμα περιήγησης Firefox
21 Hours
Testimonials (3)
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Course - Data Analysis with Hive/HiveQL
Many hands-on sessions.
Jacek Pieczątka
Course - Administrator Training for Apache Hadoop
practical things of doing, also theory was served good by Ajay