Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
1.1Hadoop Έννοιες
1.1.1 HDFS
- Σχεδιασμός της διεπαφής γραμμής εντολών HDFS Hadoop Σύστημα αρχείων
1.1.2 Συστάδες
- Ανατομία ενός συμπλέγματος Mater Node / Slave node Όνομα Κόμβος / Κόμβος δεδομένων
1.2 Χειρισμός δεδομένων
1.2.1 Αναλυτικά το MapReduce
- Φάση χάρτη Μείωση τυχαίας φάσης
1.2.2Analytics με μείωση χάρτη
- Group-By with MapReduce Κατανομές συχνότητας και ταξινόμηση με MapReduce Αποτελέσματα σχεδίασης (GNU Plot) Ιστογράμματα με MapReduce Διασκορπίστε γραφικά με MapReduce Ανάλυση σύνθετων συνόλων δεδομένων Καταμέτρηση με MapReduce και Συνδυαστές Δημιουργία αναφορών
1.2.3 Καθαρισμός δεδομένων
- Καθαρισμός εγγράφου Αναζήτηση ασαφούς συμβολοσειράς Σύνδεση εγγραφών / κατάργηση διπλότυπων δεδομένων Μετασχηματισμός και ταξινόμηση ημερομηνιών συμβάντων Επικύρωση αξιοπιστίας πηγής Περικοπή Outliers
1.2.4 Εξαγωγή και Μετασχηματισμός Δεδομένων
- Μετασχηματισμός αρχείων καταγραφής Χρήση του Apache Pig για φιλτράρισμα Χρήση του Apache Pig για ταξινόμηση Χρήση του Apache Pig για τη συνεδρία
1.2.5 Προηγμένες συνδέσεις
- Σύνδεση δεδομένων στο Mapper με χρήση MapReduce Σύνδεση δεδομένων με χρήση αντιγραφής Apache Pig Σύνδεση ταξινομημένων δεδομένων χρησιμοποιώντας συγχώνευση Apache Pig Σύνδεση λοξής σύνδεσης με χρήση λοξής σύνδεσης Apache Pig Χρήση σύνδεσης στην πλευρά χάρτη στον Apache Hive Χρήση βελτιστοποιημένων πλήρους εξωτερικών συνδέσεων στον Apache [1 ] Σύνδεση δεδομένων με χρήση εξωτερικού χώρου αποθήκευσης κλειδιού
1.3 Τεχνικές διάγνωσης και βελτιστοποίησης απόδοσης
- Χάρτης Διερεύνηση αιχμών στα δεδομένα εισόδου Προσδιορισμός προβλημάτων λοξότητας δεδομένων από την πλευρά του χάρτη Διακίνηση εργασιών χάρτη Μικρά αρχεία Αρχεία που δεν χωρίζονται
Requirements
Οι συμμετέχοντες δεν απαιτείται να έχουν κάποια συγκεκριμένη δεξιότητα, καθώς η εκπαίδευση επικεντρώνεται στις δεξιότητες των τελικών χρηστών τόσο για τη διαχείριση όσο και για τη χειραγώγηση δεδομένων στο Apache Hadoop
21 Hours
Testimonials (3)
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Course - Data Analysis with Hive/HiveQL
Many hands-on sessions.
Jacek Pieczątka
Course - Administrator Training for Apache Hadoop
practical things of doing, also theory was served good by Ajay