Big Data Training Courses

Big Data Training Courses

Τα τοπικά μαθήματα κατάρτισης μεγάλων δεδομένων, που διοργανώνονται από εκπαιδευτές, αρχίζουν με μια εισαγωγή στις στοιχειώδεις έννοιες του Big Data και στη συνέχεια προχωρούν στις γλώσσες προγραμματισμού και στις μεθοδολογίες που χρησιμοποιούνται για την ανάλυση δεδομένων. Τα εργαλεία και η υποδομή για την ενεργοποίηση της αποθήκευσης μεγάλων δεδομένων, της Κατανεμημένης Επεξεργασίας και της Επικουρικότητας συζητούνται, συγκρίνονται και εφαρμόζονται σε συνεδρίες πρακτικής εξάσκησης. Η εκπαίδευση Big Data είναι διαθέσιμη ως "onsite live training" ή "remote live training". Η επιτόπια κατάρτιση σε πραγματικό χρόνο μπορεί να πραγματοποιηθεί σε τοπικό επίπεδο στις εγκαταστάσεις του πελάτη Ελλάδα ή σε εταιρικά κέντρα κατάρτισης NobleProg στο Ελλάδα . Η απομακρυσμένη ζωντανή προπόνηση πραγματοποιείται μέσω μιας διαδραστικής, απομακρυσμένης επιφάνειας εργασίας. NobleProg - Ο τοπικός παροχέας εκπαίδευσης

Machine Translated

Testimonials

★★★★★
★★★★★

Big Data Course Outlines

Course Name
Duration
Overview
Course Name
Duration
Overview
21 hours
Overview
Apache Accumulo είναι ένα Apache Accumulo , κατανεμημένο κατάστημα κλειδιού / τιμής που παρέχει ισχυρή, κλιμακούμενη αποθήκευση και ανάκτηση δεδομένων. Βασίζεται στο σχεδιασμό του BigTable του Go ogle και τροφοδοτείται από Apache Hadoop , Apache Zookeeper και Apache Thrift .

Αυτά τα μαθήματα υπό την καθοδήγηση του εκπαιδευτή καλύπτουν τις αρχές λειτουργίας πίσω από το Accumulo και περπατούν τους συμμετέχοντες μέσω της ανάπτυξης μιας εφαρμογής δείγματος στο Apache Accumulo .

Μορφή του μαθήματος

- Διάλεξη μερών, συζήτηση μερών, πρακτική ανάπτυξη και εφαρμογή, περιστασιακές δοκιμές για την κατανόηση της κατανόησης
21 hours
Overview
Η ανακάλυψη γνώσεων σε βάσεις δεδομένων (KDD) είναι η διαδικασία ανεύρεσης χρήσιμων γνώσεων από μια συλλογή δεδομένων. Οι εφαρμογές πραγματικής ζωής για αυτήν την τεχνική εξόρυξης δεδομένων περιλαμβάνουν το μάρκετινγκ, την ανίχνευση απάτης, τις τηλεπικοινωνίες και την κατασκευή.

Σε αυτή την καθοδηγούμενη από εκπαιδευτή, ζωντανή πορεία, εισάγουμε τις διαδικασίες που εμπλέκονται στο KDD και πραγματοποιούμε μια σειρά ασκήσεων για την πρακτική εφαρμογή αυτών των διαδικασιών.

Κοινό

- Αναλυτές δεδομένων ή όσοι ενδιαφέρονται να μάθουν πώς να ερμηνεύουν δεδομένα για την επίλυση προβλημάτων

Μορφή του μαθήματος

- Μετά από μια θεωρητική συζήτηση του KDD, ο εκπαιδευτής θα παρουσιάσει περιπτώσεις πραγματικής ζωής που απαιτούν την εφαρμογή του KDD για την επίλυση ενός προβλήματος. Οι συμμετέχοντες θα προετοιμάσουν, θα επιλέξουν και θα καθαρίσουν δείγματα δεδομένων και θα χρησιμοποιήσουν τις προηγούμενες γνώσεις τους σχετικά με τα δεδομένα για να προτείνουν λύσεις με βάση τα αποτελέσματα των παρατηρήσεών τους.
28 hours
Overview
Το MonetDB είναι μια βάση δεδομένων ανοιχτού κώδικα που πρωτοστάτησε στην προσέγγιση της τεχνολογίας αποθήκευσης στηλών.

Σε αυτή την καθοδηγούμενη από εκπαιδευτές, ζωντανή προπόνηση, οι συμμετέχοντες θα μάθουν πώς να χρησιμοποιούν το MonetDB και πώς να αποκομίζουν τη μέγιστη αξία από αυτό.

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Κατανοήστε το MonetDB και τα χαρακτηριστικά του
- Εγκαταστήστε και ξεκινήστε με το MonetDB
- Εξερευνήστε και εκτελείτε διάφορες λειτουργίες και εργασίες στο MonetDB
- Επιταχύνετε την παράδοση του έργου σας μεγιστοποιώντας τις δυνατότητες του MonetDB

Κοινό

- Προγραμματιστές
- Τεχνικοί ειδικοί

Μορφή του μαθήματος

- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση
7 hours
Overview
Αυτή η καθοδηγούμενη από εκπαιδευτές, ζωντανή εκπαίδευση (επιτόπια ή απομακρυσμένη) απευθύνεται σε τεχνικά άτομα που επιθυμούν να μάθουν πώς να εφαρμόσουν μια στρατηγική μηχανικής μάθησης, μεγιστοποιώντας ταυτόχρονα τη χρήση μεγάλων δεδομένων.

Μέχρι το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα:

- Κατανοήστε την εξέλιξη και τις τάσεις της μηχανικής μάθησης.
- Μάθετε πώς η μηχανική μάθηση χρησιμοποιείται σε διάφορες βιομηχανίες.
- Γνωρίστε τα εργαλεία, τις δεξιότητες και τις υπηρεσίες που είναι διαθέσιμες για την εφαρμογή της μηχανικής μάθησης μέσα σε έναν οργανισμό.
- Κατανοήστε τον τρόπο με τον οποίο η μηχανική μάθηση μπορεί να χρησιμοποιηθεί για τη βελτίωση της εξόρυξης δεδομένων και της ανάλυσης.
- Μάθετε τι είναι το μεσαίο backend δεδομένων και πώς χρησιμοποιείται από τις επιχειρήσεις.
- Κατανοήστε το ρόλο που παίζουν μεγάλα δεδομένα και έξυπνες εφαρμογές σε όλους τους κλάδους.

Μορφή του μαθήματος

- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πρακτική.
- Χειροκίνητη υλοποίηση σε εργασιακό περιβάλλον.

Επιλογές προσαρμογής μαθημάτων

- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
28 hours
Overview
Το Mem SQL είναι ένα διαχειριζόμενο σύστημα διαχείρισης βάσεων δεδομένων SQL για το cloud και στο εσωτερικό. Είναι μια αποθήκη δεδομένων σε πραγματικό χρόνο που παρέχει άμεσα πληροφορίες από ζωντανά και ιστορικά δεδομένα.

Σε αυτή την καθοδηγούμενη από εκπαιδευτή, ζωντανή εκπαίδευση, οι συμμετέχοντες θα μάθουν τα βασικά στοιχεία του Mem SQL για ανάπτυξη και διοίκηση.

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Κατανοήστε τις βασικές έννοιες και τα χαρακτηριστικά του Mem SQL
- Εγκαταστήστε, σχεδιάστε, συντηρήστε και λειτουργήστε Mem SQL
- Βελτιστοποιήστε τα σχήματα στο Mem SQL
- Βελτιώστε τα ερωτήματα στο Mem SQL
- Απόδοση benchmark σε Mem SQL
- Δημιουργήστε εφαρμογές δεδομένων σε πραγματικό χρόνο χρησιμοποιώντας Mem SQL

Κοινό

- Προγραμματιστές
- Διαχειριστές
- Μηχανικοί Λειτουργίας

Μορφή του μαθήματος

- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση
21 hours
Overview
MATLAB είναι ένα αριθμητικό περιβάλλον πληροφορικής και μια γλώσσα προγραμματισμού που αναπτύχθηκε από την MathWorks.
7 hours
Overview
Σε αυτόν τον οδηγό, με ζωντανή προπόνηση, οι συμμετέχοντες θα μάθουν τις βασικές έννοιες πίσω από την MapR Stream Architecture καθώς αναπτύσσουν μια εφαρμογή ροής σε πραγματικό χρόνο.

Μέχρι το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση να δημιουργήσουν εφαρμογές παραγωγών και καταναλωτών για επεξεργασία δεδομένων ροής σε πραγματικό χρόνο.

Κοινό

- Προγραμματιστές
- Διαχειριστές

Μορφή του μαθήματος

- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση

Σημείωση

- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
14 hours
Overview
Το Magellan είναι μια μηχανή εκτέλεσης που διανέμει ανοιχτού κώδικα για γεωχωρικές αναλύσεις σε μεγάλα δεδομένα. Εφαρμοσμένη πάνω από το Apache Spark , επεκτείνει το Spark SQL και παρέχει μια σχεσιακή αφαίρεση για γεωχωρικές αναλύσεις.

Αυτή η καθοδηγούμενη από εκπαιδευτές, ζωντανή εκπαίδευση, εισάγει τις έννοιες και τις προσεγγίσεις για την εφαρμογή γεωσφαιρικών αναλύσεων και περπατά τους συμμετέχοντες μέσω της δημιουργίας μιας εφαρμογής πρόβλεψης ανάλυσης χρησιμοποιώντας το Magellan στο Spark.

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Αποτελεσματικά ερώτημα, ανάλυση και σύνδεση γεωσκοπικών συνόλων δεδομένων σε κλίμακα
- Εφαρμογή γεωχωρικών δεδομένων σε εφαρμογές επιχειρηματικής ευφυΐας και πρόβλεψης
- Χρησιμοποιήστε το χωρικό πλαίσιο για να επεκτείνετε τις δυνατότητες των κινητών συσκευών, των αισθητήρων, των αρχείων καταγραφής και των φορητών συσκευών

Μορφή του μαθήματος

- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πρακτική.
- Χειροκίνητη εφαρμογή σε περιβάλλον εργαστηριακού εργαστηρίου.

Επιλογές προσαρμογής μαθημάτων

- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
14 hours
Overview
Apache Kylin είναι μια εξαιρετική, κατανεμημένη μηχανή ανάλυσης για μεγάλα δεδομένα.

Σε αυτή την εκπαιδευτική άσκηση, οι συμμετέχοντες θα μάθουν πώς να χρησιμοποιούν το Apache Kylin για να δημιουργήσουν μια αποθήκη δεδομένων σε πραγματικό χρόνο.

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Χρησιμοποιήστε δεδομένα ροής σε πραγματικό χρόνο χρησιμοποιώντας το Kylin
- Χρησιμοποιήστε τα ισχυρά χαρακτηριστικά του Apache Kylin , την πλούσια διασύνδεση SQL , τη δημιουργία κεριών και τη λανθάνουσα ερώτηση δευτερολέπτων

Σημείωση

- Χρησιμοποιούμε την τελευταία έκδοση του Kylin (από αυτή τη γραφή, Apache Kylin v2.0)

Κοινό

- Μεγάλοι μηχανικοί δεδομένων
- Αναλυτές Big Data

Μορφή του μαθήματος

- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση
7 hours
Overview
Confluent KSQL is a stream processing framework built on top of Apache Kafka. It enables real-time data processing using SQL operations.

This instructor-led, live training (online or onsite) is aimed at developers who wish to implement Apache Kafka stream processing without writing code.

By the end of this training, participants will be able to:

- Install and configure Confluent KSQL.
- Set up a stream processing pipeline using only SQL commands (no Java or Python coding).
- Carry out data filtering, transformations, aggregations, joins, windowing, and sessionization entirely in SQL.
- Design and deploy interactive, continuous queries for streaming ETL and real-time analytics.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
35 hours
Overview
KNIME is a free and open-source data analytics, reporting and integration platform. KNIME integrates various components for machine learning and data mining through its modular data pipelining concept. A graphical user interface and use of JDBC allows assembly of nodes blending different data sources, including preprocessing (ETL: Extraction, Transformation, Loading), for modeling, data analysis and visualization without, or with only minimal, programming. To some extent as advanced analytics tool KNIME can be considered as a SAS alternative.

Since 2006, KNIME has been used in pharmaceutical research, it also used in other areas like CRM customer data analysis, business intelligence and financial data analysis.
21 hours
Overview
KNIME πλατφόρμα KNIME Analytics είναι μια κορυφαία επιλογή ανοιχτού κώδικα για την καινοτομία που βασίζεται σε δεδομένα, βοηθώντας σας να ανακαλύψετε τις δυνατότητες που είναι κρυμμένες στα δεδομένα σας, τα ορυχεία για νέες ιδέες ή να προβλέψετε νέα συμβόλαια μελλοντικής εκπλήρωσης. Με περισσότερα από 1000 ενότητες, εκατοντάδες έτοιμα για εκτέλεση παραδείγματα, πλήρες εύρος ολοκληρωμένων εργαλείων και την ευρεία επιλογή προηγμένων αλγορίθμων, η πλατφόρμα KNIME Analytics είναι η τέλεια εργαλειοθήκη για οποιονδήποτε επιστήμονα δεδομένων και επιχειρηματικό αναλυτή.

Αυτό το μάθημα για την πλατφόρμα KNIME Analytics είναι μια ιδανική ευκαιρία για αρχάριους, προχωρημένους χρήστες και KNIME εμπειρογνώμονες που θα παρουσιαστούν στο KNIME , για να μάθουν πώς να το χρησιμοποιούν αποτελεσματικότερα και πώς να δημιουργήσουν σαφείς και ολοκληρωμένες αναφορές με βάση τις KNIME εργασίας του KNIME
7 hours
Overview
Το Kafka Streams είναι μια βιβλιοθήκη πελάτη για την κατασκευή εφαρμογών και μικροεπιχειρήσεων, τα δεδομένα των οποίων μεταφέρονται προς και από ένα σύστημα ανταλλαγής μηνυμάτων Kafka. Παραδοσιακά, ο Apache Kafka έχει βασιστεί στο Apache Spark ή στη Apache Storm για να επεξεργάζεται δεδομένα μεταξύ παραγωγών μηνυμάτων και καταναλωτών. Καλώντας το API Streams Kafka από μια εφαρμογή, τα δεδομένα μπορούν να επεξεργαστούν απευθείας μέσα στο Kafka, παρακάμπτοντας την ανάγκη για την αποστολή των δεδομένων σε ένα ξεχωριστό σύμπλεγμα για επεξεργασία.

Σε αυτήν την καθοδηγούμενη από εκπαιδευτή, ζωντανή προπόνηση, οι συμμετέχοντες θα μάθουν πώς να ενσωματώσουν τις ροές του Kafka σε ένα σύνολο από Java εφαρμογές που μεταφέρουν δεδομένα από και προς τον Apache Kafka για επεξεργασία ρεύματος.

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Κατανοήστε τα χαρακτηριστικά και τα πλεονεκτήματα του Kafka Streams σε σχέση με άλλα πλαίσια επεξεργασίας ρευμάτων
- Διαδικασία ροής δεδομένων απευθείας μέσα σε ένα σύμπλεγμα Kafka
- Γράψτε μια εφαρμογή Java ή Scala ή μια μικροεπιχειρησιακή υπηρεσία που ενσωματώνει τις ροές Kafka και Kafka
- Γράψτε τον συνοπτικό κωδικό που μετατρέπει τα θέματα εισαγωγής του Kafka σε θέματα Kafka εξόδου
- Δημιουργήστε, συσκευάστε και αναπτύξτε την εφαρμογή

Κοινό

- Προγραμματιστές

Μορφή του μαθήματος

- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση

Σημειώσεις

- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε
21 hours
Overview
Apache NiFi (Hortonworks DataFlow) είναι μια ολοκληρωμένη πλατφόρμα επεξεργασίας δεδομένων σε πραγματικό χρόνο και απλή πλατφόρμα επεξεργασίας συμβάντων που επιτρέπει τη μετακίνηση, την παρακολούθηση και την αυτοματοποίηση δεδομένων μεταξύ συστημάτων. Γράφεται με προγραμματισμό βάσει ροής και παρέχει μια διεπαφή χρήστη που βασίζεται στον ιστό για τη διαχείριση ροών δεδομένων σε πραγματικό χρόνο.

Σε αυτήν την καθοδηγούμενη από εκπαιδευτή, ζωντανή εκπαίδευση (επιτόπια ή απομακρυσμένη), οι συμμετέχοντες θα μάθουν πώς να αναπτύξουν και να διαχειριστούν το Apache NiFi σε περιβάλλον εργαστηρίου.

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Εγκαταστήστε και διαμορφώστε το Apachi NiFi.
- Πηγή, μετασχηματίζει και διαχειρίζεται δεδομένα από διαφορετικές, κατανεμημένες πηγές δεδομένων, συμπεριλαμβανομένων των βάσεων δεδομένων και των μεγάλων λιμνών δεδομένων.
- Αυτοματοποιήστε τις ροές δεδομένων.
- Ενεργοποιήστε τα αναλυτικά ροής.
- Εφαρμόστε διάφορες προσεγγίσεις για την κατάποση δεδομένων.
- Μετασχηματισμός Big Data και επιχειρηματικές γνώσεις.

Μορφή του μαθήματος

- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πρακτική.
- Χειροκίνητη υλοποίηση σε εργασιακό περιβάλλον.

Επιλογές προσαρμογής μαθημάτων

- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
21 hours
Overview
Stream Processing αναφέρεται στην Stream Processing σε πραγματικό χρόνο των "δεδομένων σε κίνηση", δηλαδή στην εκτέλεση υπολογισμών στα δεδομένα καθώς αυτά λαμβάνονται. Αυτά τα δεδομένα διαβάζονται ως συνεχείς ροές από πηγές δεδομένων όπως συμβάντα αισθητήρων, δραστηριότητα χρηστών ιστοτόπων, οικονομικά συναλλαγές, swipes πιστωτικών καρτών, ροές κλικ κλπ. Stream Processing πλαίσια Stream Processing είναι σε θέση να διαβάζουν μεγάλους όγκους εισερχόμενων δεδομένων και να παρέχουν πολύτιμες πληροφορίες σχεδόν στιγμιαία.

Σε αυτόν τον εκπαιδευτή, ζωντανή εκπαίδευση (onsite ή απομακρυσμένη), οι συμμετέχοντες θα μάθουν πώς να δημιουργήσουν και να ενσωματώσουν διαφορετικά πλαίσια Stream Processing με υπάρχοντα μεγάλα συστήματα αποθήκευσης δεδομένων και συναφείς εφαρμογές λογισμικού και μικροεπιχειρήσεις.

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Εγκαταστήστε και διαμορφώστε διαφορετικά πλαίσια Stream Processing , όπως Spark Streaming και Streaming Kafka.
- Κατανοήστε και επιλέξτε το καταλληλότερο πλαίσιο για την εργασία.
- Διαδικασία δεδομένων συνεχώς, ταυτόχρονα, και με τρόπο ρεκόρ ανά εγγραφή.
- Ενσωματώστε τις λύσεις Stream Processing με υπάρχουσες βάσεις δεδομένων, αποθήκες δεδομένων, λίμνες δεδομένων κλπ.
- Ενσωματώστε την πιο κατάλληλη βιβλιοθήκη επεξεργασίας ροής με επιχειρηματικές εφαρμογές και μικροεπιχειρήσεις.

Κοινό

- Προγραμματιστές
- Αρχιτέκτονες λογισμικού

Μορφή του μαθήματος

- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση

Σημειώσεις

- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
14 hours
Overview
κοινο

- προγραμματιστές

μορφή του μαθήματος

- διαλέξεις, πρακτική εξάσκηση, μικρές δοκιμές κατά μήκος του τρόπου για να μετρήσετε την κατανόηση
21 hours
Overview
Το Cloudera Impala είναι μια μηχανή ερώτησης SQL ανοιχτού κώδικα μαζικής παράλληλης επεξεργασίας (MPP) για συστάδες Apache Hadoop .

Impala επιτρέπει στους χρήστες να εκδίδουν ερωτήματα SQL χαμηλού λανθάνοντος χρόνου σε δεδομένα που είναι αποθηκευμένα σε Hadoop Distributed File System και Apache Hbase χωρίς να απαιτείται κίνηση ή μετασχηματισμός δεδομένων.

Κοινό

Αυτό το μάθημα απευθύνεται σε αναλυτές και επιστήμονες δεδομένων που πραγματοποιούν ανάλυση δεδομένων που έχουν αποθηκευτεί στο Hadoop μέσω Business Intelligence ή εργαλείων SQL .

Μετά από αυτό το μάθημα οι εκπρόσωποι θα είναι σε θέση να

- Εξάγει σημαντικές πληροφορίες από τις ομάδες Hadoop με την Impala .
- Γράψτε συγκεκριμένα προγράμματα για τη διευκόλυνση της Business Intelligence στο Impala SQL Dialect.
- Αντιμετώπιση προβλημάτων της Impala .
7 hours
Overview
Αυτό το μάθημα καλύπτει τον τρόπο χρήσης της γλώσσας Hive SQL (AKA: Hive HQL, SQL σε Hive , Hive QL) για άτομα που εξάγουν δεδομένα από την Hive
21 hours
Overview
Hortonworks Data Platform (HDP) είναι μια πλατφόρμα υποστήριξης Apache Hadoop ανοικτής πηγής που παρέχει μια σταθερή βάση για την ανάπτυξη μεγάλων λύσεων δεδομένων στο οικοσύστημα Apache Hadoop .

Αυτή η καθοδηγούμενη από εκπαιδευτές, ζωντανή προπόνηση (onsite ή απομακρυσμένη) εισάγει Hortonworks Data Platform (HDP) και περπατά τους συμμετέχοντες μέσω της ανάπτυξης της λύσης Spark + Hadoop .

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Χρησιμοποιήστε το Hortonworks για να εκτελέσετε αξιόπιστα τον Hadoop σε μεγάλη κλίμακα.
- Ενοποιήστε τις δυνατότητες ασφάλειας, διακυβέρνησης και λειτουργίας της Hadoop με τις ευέλικτες αναλυτικές ροές εργασίας του Spark.
- Χρησιμοποιήστε το Hortonworks για να διερευνήσετε, να επικυρώσετε, να πιστοποιήσετε και να υποστηρίξετε κάθε ένα από τα στοιχεία ενός έργου Spark.
- Επεξεργαστείτε διάφορους τύπους δεδομένων, συμπεριλαμβανομένων δομημένων, αδόμητων, σε κίνηση και σε ξεκούραση.

Μορφή του μαθήματος

- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πρακτική.
- Χειροκίνητη υλοποίηση σε εργασιακό περιβάλλον.

Επιλογές προσαρμογής μαθημάτων

- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
21 hours
Overview
Αυτό το μάθημα εισάγει το HBase - ένα κατάστημα No SQL πάνω από τον Hadoop . Το μάθημα προορίζεται για προγραμματιστές που θα χρησιμοποιούν το HBase για την ανάπτυξη εφαρμογών και για διαχειριστές που θα διαχειρίζονται τα clusters του HBase.

Θα περπατήσουμε έναν προγραμματιστή μέσω της αρχιτεκτονικής HBase και της μοντελοποίησης δεδομένων και ανάπτυξης εφαρμογών στην HBase. Θα συζητήσει επίσης τη χρήση του MapReduce με το HBase και ορισμένα θέματα διαχείρισης που σχετίζονται με τη βελτιστοποίηση της απόδοσης. Το μάθημα είναι πολύ πρακτικό με πολλές εργαστηριακές ασκήσεις.

Διάρκεια : 3 ημέρες

Κοινό : προγραμματιστές και διαχειριστές
28 hours
Overview
Hadoop is a popular Big Data processing framework. Python is a high-level programming language famous for its clear syntax and code readibility.

In this instructor-led, live training, participants will learn how to work with Hadoop, MapReduce, Pig, and Spark using Python as they step through multiple examples and use cases.

By the end of this training, participants will be able to:

- Understand the basic concepts behind Hadoop, MapReduce, Pig, and Spark
- Use Python with Hadoop Distributed File System (HDFS), MapReduce, Pig, and Spark
- Use Snakebite to programmatically access HDFS within Python
- Use mrjob to write MapReduce jobs in Python
- Write Spark programs with Python
- Extend the functionality of pig using Python UDFs
- Manage MapReduce jobs and Pig scripts using Luigi

Audience

- Developers
- IT Professionals

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
28 hours
Overview
Κοινό:

Αυτό το μάθημα αποσκοπεί στην απομυθοποίηση της μεγάλης τεχνολογίας δεδομένων / hadoop και στην απόδειξη ότι δεν είναι δύσκολο να κατανοηθεί.
14 hours
Overview
As more and more software and IT projects migrate from local processing and data management to distributed processing and big data storage, Project Managers are finding the need to upgrade their knowledge and skills to grasp the concepts and practices relevant to Big Data projects and opportunities.

This course introduces Project Managers to the most popular Big Data processing framework: Hadoop.

In this instructor-led training, participants will learn the core components of the Hadoop ecosystem and how these technologies can be used to solve large-scale problems. In learning these foundations, participants will also improve their ability to communicate with the developers and implementers of these systems as well as the data scientists and analysts that many IT projects involve.

Audience

- Project Managers wishing to implement Hadoop into their existing development or IT infrastructure
- Project Managers needing to communicate with cross-functional teams that include big data engineers, data scientists and business analysts

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
21 hours
Overview
Hadoop is the most popular Big Data processing framework.
21 hours
Overview
Apache Spark is a distributed processing engine for analyzing very large data sets. It can process data in batches and real-time, as well as carry out machine learning, ad-hoc queries, and graph processing. .NET for Apache Spark is a free, open-source, and cross-platform big data analytics framework that supports applications written in C# or F#.

This instructor-led, live training (online or onsite) is aimed at developers who wish to carry out big data analysis using Apache Spark in their .NET applications.

By the end of this training, participants will be able to:

- Install and configure Apache Spark.
- Understand how .NET implements Spark APIs so that they can be accessed from a .NET application.
- Develop data processing applications using C# or F#, capable of handling data sets whose size is measured in terabytes and pedabytes.
- Develop machine learning features for a .NET application using Apache Spark capabilities.
- Carry out exploratory analysis using SQL queries on big data sets.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
7 hours
Overview
Apache NiFi (Hortonworks DataFlow) είναι μια ολοκληρωμένη πλατφόρμα επεξεργασίας δεδομένων σε πραγματικό χρόνο και απλή πλατφόρμα επεξεργασίας συμβάντων που επιτρέπει τη μετακίνηση, την παρακολούθηση και την αυτοματοποίηση δεδομένων μεταξύ συστημάτων. Γράφεται με προγραμματισμό βάσει ροής και παρέχει μια διεπαφή χρήστη που βασίζεται στον ιστό για τη διαχείριση ροών δεδομένων σε πραγματικό χρόνο.

Σε αυτή την καθοδηγούμενη από εκπαιδευτή, ζωντανή προπόνηση, οι συμμετέχοντες θα μάθουν τα βασικά στοιχεία του προγραμματισμού που βασίζεται στη ροή καθώς αναπτύσσουν μια σειρά επεκτάσεων επίδειξης, εξαρτημάτων και επεξεργαστών που χρησιμοποιούν το Apache NiFi .

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Κατανοήστε την αρχιτεκτονική και τις έννοιες ροής δεδομένων της NiFi.
- Αναπτύξτε επεκτάσεις χρησιμοποιώντας το API και τα API τρίτου μέρους.
- Προσαρμόστε το δικό του επεξεργαστή Apache Nifi.
- Κατανοήστε και επεξεργαστείτε δεδομένα σε πραγματικό χρόνο από διαφορετικές και ασυνήθιστες μορφές αρχείων και πηγές δεδομένων.

Μορφή του μαθήματος

- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πρακτική.
- Χειροκίνητη υλοποίηση σε εργασιακό περιβάλλον.

Επιλογές προσαρμογής μαθημάτων

- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
14 hours
Overview
Teradata είναι ένα δημοφιλές Σχεσιακό Σύστημα Management Database για την κατασκευή εφαρμογών αποθήκευσης δεδομένων μεγάλης κλίμακας. Teradata επιτυγχάνει αυτό με παράλληλο τρόπο.

Αυτή η καθοδηγούμενη από εκπαιδευτές, ζωντανή εκπαίδευση (onsite ή απομακρυσμένη) απευθύνεται σε προγραμματιστές εφαρμογών και μηχανικούς που επιθυμούν να κατακτήσουν πιο εξελιγμένες εφαρμογές της βάσης δεδομένων Teradata .

Μέχρι το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Διαχειριστείτε το χώρο Teradata .
- Προστατεύστε και διανείμετε δεδομένα στο Teradata .
- Διαβάστε το σχέδιο εξήγησης.
- Βελτιώστε την ικανότητα SQL .
- Χρησιμοποιήστε τα κύρια βοηθητικά προγράμματα του Teradata .

Μορφή του μαθήματος

- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πρακτική.
- Χειροκίνητη εφαρμογή σε περιβάλλον εργαστηριακού εργαστηρίου.

Επιλογές προσαρμογής μαθημάτων

- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
7 hours
Overview
Το Spark SQL είναι η ενότητα του Apache Spark για την εργασία με δομημένα και αδόμητα δεδομένα. Το Spark SQL παρέχει πληροφορίες σχετικά με τη δομή των δεδομένων καθώς και τον υπολογισμό που εκτελείται. Αυτές οι πληροφορίες μπορούν να χρησιμοποιηθούν για την εκτέλεση βελτιστοποιήσεων. Δύο κοινές χρήσεις για το SQL Spark είναι:
- για εκτέλεση ερωτημάτων SQL .
- για ανάγνωση δεδομένων από υπάρχουσα εγκατάσταση Hive .

Σε αυτόν τον εκπαιδευτή, ζωντανή προπόνηση (onsite ή απομακρυσμένη), οι συμμετέχοντες θα μάθουν πώς να αναλύουν διάφορους τύπους συνόλων δεδομένων χρησιμοποιώντας Spark SQL .

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Εγκαταστήστε και ρυθμίστε τον SQL Spark.
- Εκτελέστε ανάλυση δεδομένων χρησιμοποιώντας Spark SQL .
- Αναζητήστε σύνολα δεδομένων σε διαφορετικές μορφές.
- Οπτικοποιήστε τα δεδομένα και τα αποτελέσματα των ερωτημάτων.

Μορφή του μαθήματος

- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πρακτική.
- Χειροκίνητη υλοποίηση σε εργασιακό περιβάλλον.

Επιλογές προσαρμογής μαθημάτων

- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
14 hours
Overview
Apache Zeppelin is a web-based notebook for capturing, exploring, visualizing and sharing Hadoop and Spark based data.

This instructor-led, live training introduces the concepts behind interactive data analytics and walks participants through the deployment and usage of Zeppelin in a single-user or multi-user environment.

By the end of this training, participants will be able to:

- Install and configure Zeppelin
- Develop, organize, execute and share data in a browser-based interface
- Visualize results without referring to the command line or cluster details
- Execute and collaborate on long workflows
- Work with any of a number of plug-in language/data-processing-backends, such as Scala (with Apache Spark), Python (with Apache Spark), Spark SQL, JDBC, Markdown and Shell.
- Integrate Zeppelin with Spark, Flink and Map Reduce
- Secure multi-user instances of Zeppelin with Apache Shiro

Audience

- Data engineers
- Data analysts
- Data scientists
- Software developers

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
14 hours
Overview
Vespa is an open-source big data processing and serving engine created by Yahoo. It is used to respond to user queries, make recommendations, and provide personalized content and advertisements in real-time.

This instructor-led, live training introduces the challenges of serving large-scale data and walks participants through the creation of an application that can compute responses to user requests, over large datasets in real-time.

By the end of this training, participants will be able to:

- Use Vespa to quickly compute data (store, search, rank, organize) at serving time while a user waits
- Implement Vespa into existing applications involving feature search, recommendations, and personalization
- Integrate and deploy Vespa with existing big data systems such as Hadoop and Storm.

Audience

- Developers

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice

Upcoming Big Data Courses

Online Big Data courses, Weekend Big Data courses, Evening Big Data training, Big Data boot camp, Big Data instructor-led, Weekend Big Data training, Evening Big Data courses, Big Data coaching, Big Data instructor, Big Data trainer, Big Data training courses, Big Data classes, Big Data on-site, Big Data private courses, Big Data one on one training

Course Discounts

Course Discounts Newsletter

We respect the privacy of your email address. We will not pass on or sell your address to others.
You can always change your preferences or unsubscribe completely.

Some of our clients

is growing fast!

We are looking for a good mixture of IT and soft skills in Greece!

As a NobleProg Trainer you will be responsible for:

  • delivering training and consultancy Worldwide
  • preparing training materials
  • creating new courses outlines
  • delivering consultancy
  • quality management

At the moment we are focusing on the following areas:

  • Statistic, Forecasting, Big Data Analysis, Data Mining, Evolution Alogrithm, Natural Language Processing, Machine Learning (recommender system, neural networks .etc...)
  • SOA, BPM, BPMN
  • Hibernate/Spring, Scala, Spark, jBPM, Drools
  • R, Python
  • Mobile Development (iOS, Android)
  • LAMP, Drupal, Mediawiki, Symfony, MEAN, jQuery
  • You need to have patience and ability to explain to non-technical people

To apply, please create your trainer-profile by going to the link below:

Apply now!

This site in other countries/regions