Big Data Training Courses

Big Data Training Courses

Τα τοπικά μαθήματα κατάρτισης μεγάλων δεδομένων, που διοργανώνονται από εκπαιδευτές, αρχίζουν με μια εισαγωγή στις στοιχειώδεις έννοιες του Big Data και στη συνέχεια προχωρούν στις γλώσσες προγραμματισμού και στις μεθοδολογίες που χρησιμοποιούνται για την ανάλυση δεδομένων. Τα εργαλεία και η υποδομή για την ενεργοποίηση της αποθήκευσης μεγάλων δεδομένων, της Κατανεμημένης Επεξεργασίας και της Επικουρικότητας συζητούνται, συγκρίνονται και εφαρμόζονται σε συνεδρίες πρακτικής εξάσκησης. Η εκπαίδευση Big Data είναι διαθέσιμη ως "onsite live training" ή "remote live training". Η επιτόπια κατάρτιση σε πραγματικό χρόνο μπορεί να πραγματοποιηθεί σε τοπικό επίπεδο στις εγκαταστάσεις του πελάτη Ελλάδα ή σε εταιρικά κέντρα κατάρτισης NobleProg στο Ελλάδα . Η απομακρυσμένη ζωντανή προπόνηση πραγματοποιείται μέσω μιας διαδραστικής, απομακρυσμένης επιφάνειας εργασίας. NobleProg - Ο τοπικός παροχέας εκπαίδευσης

Machine Translated

Testimonials

★★★★★
★★★★★

Big Data Course Outlines

Title
Duration
Overview
Title
Duration
Overview
14 hours
Overview
Go αλ:

Μάθηση για συνεργασία με το SPSS σε επίπεδο ανεξαρτησίας

Οι παραλήπτες:

Αναλυτές, ερευνητές, επιστήμονες, φοιτητές και όσοι επιθυμούν να αποκτήσουν τη δυνατότητα να χρησιμοποιήσουν το πακέτο SPSS και να μάθουν τις δημοφιλείς τεχνικές εξόρυξης δεδομένων.
7 hours
Overview
Apache NiFi (Hortonworks DataFlow) είναι μια ολοκληρωμένη πλατφόρμα επεξεργασίας δεδομένων σε πραγματικό χρόνο και απλή πλατφόρμα επεξεργασίας συμβάντων που επιτρέπει τη μετακίνηση, την παρακολούθηση και την αυτοματοποίηση δεδομένων μεταξύ συστημάτων. Γράφεται με προγραμματισμό βάσει ροής και παρέχει μια διεπαφή χρήστη που βασίζεται στον ιστό για τη διαχείριση ροών δεδομένων σε πραγματικό χρόνο.

Σε αυτή την καθοδηγούμενη από εκπαιδευτή, ζωντανή προπόνηση, οι συμμετέχοντες θα μάθουν τα βασικά στοιχεία του προγραμματισμού που βασίζεται στη ροή καθώς αναπτύσσουν μια σειρά επεκτάσεων επίδειξης, εξαρτημάτων και επεξεργαστών που χρησιμοποιούν το Apache NiFi .

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Κατανοήστε την αρχιτεκτονική και τις έννοιες ροής δεδομένων της NiFi.
- Αναπτύξτε επεκτάσεις χρησιμοποιώντας το API και τα API τρίτου μέρους.
- Προσαρμόστε το δικό του επεξεργαστή Apache Nifi.
- Κατανοήστε και επεξεργαστείτε δεδομένα σε πραγματικό χρόνο από διαφορετικές και ασυνήθιστες μορφές αρχείων και πηγές δεδομένων.

Μορφή του μαθήματος

- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πρακτική.
- Χειροκίνητη υλοποίηση σε εργασιακό περιβάλλον.

Επιλογές προσαρμογής μαθημάτων

- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
21 hours
Overview
Apache Drill is a schema-free, distributed, in-memory columnar SQL query engine for Hadoop, NoSQL and other Cloud and file storage systems. The power of Apache Drill lies in its ability to join data from multiple data stores using a single query. Apache Drill supports numerous NoSQL databases and file systems, including HBase, MongoDB, MapR-DB, HDFS, MapR-FS, Amazon S3, Azure Blob Storage, Google Cloud Storage, Swift, NAS and local files. Apache Drill is the open source version of Google's Dremel system which is available as an infrastructure service called Google BigQuery.

In this instructor-led, live training, participants will learn the fundamentals of Apache Drill, then leverage the power and convenience of SQL to interactively query big data across multiple data sources, without writing code. Participants will also learn how to optimize their Drill queries for distributed SQL execution.

By the end of this training, participants will be able to:

- Perform "self-service" exploration on structured and semi-structured data on Hadoop
- Query known as well as unknown data using SQL queries
- Understand how Apache Drills receives and executes queries
- Write SQL queries to analyze different types of data, including structured data in Hive, semi-structured data in HBase or MapR-DB tables, and data saved in files such as Parquet and JSON.
- Use Apache Drill to perform on-the-fly schema discovery, bypassing the need for complex ETL and schema operations
- Integrate Apache Drill with BI (Business Intelligence) tools such as Tableau, Qlikview, MicroStrategy and Excel

Audience

- Data analysts
- Data scientists
- SQL programmers

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
28 hours
Overview
Το MonetDB είναι μια βάση δεδομένων ανοιχτού κώδικα που πρωτοστάτησε στην προσέγγιση της τεχνολογίας αποθήκευσης στηλών.

Σε αυτή την καθοδηγούμενη από εκπαιδευτές, ζωντανή προπόνηση, οι συμμετέχοντες θα μάθουν πώς να χρησιμοποιούν το MonetDB και πώς να αποκομίζουν τη μέγιστη αξία από αυτό.

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Κατανοήστε το MonetDB και τα χαρακτηριστικά του
- Εγκαταστήστε και ξεκινήστε με το MonetDB
- Εξερευνήστε και εκτελείτε διάφορες λειτουργίες και εργασίες στο MonetDB
- Επιταχύνετε την παράδοση του έργου σας μεγιστοποιώντας τις δυνατότητες του MonetDB

Κοινό

- Προγραμματιστές
- Τεχνικοί ειδικοί

Μορφή του μαθήματος

- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση
28 hours
Overview
Το Mem SQL είναι ένα διαχειριζόμενο σύστημα διαχείρισης βάσεων δεδομένων SQL για το cloud και στο εσωτερικό. Είναι μια αποθήκη δεδομένων σε πραγματικό χρόνο που παρέχει άμεσα πληροφορίες από ζωντανά και ιστορικά δεδομένα.

Σε αυτή την καθοδηγούμενη από εκπαιδευτή, ζωντανή εκπαίδευση, οι συμμετέχοντες θα μάθουν τα βασικά στοιχεία του Mem SQL για ανάπτυξη και διοίκηση.

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Κατανοήστε τις βασικές έννοιες και τα χαρακτηριστικά του Mem SQL
- Εγκαταστήστε, σχεδιάστε, συντηρήστε και λειτουργήστε Mem SQL
- Βελτιστοποιήστε τα σχήματα στο Mem SQL
- Βελτιώστε τα ερωτήματα στο Mem SQL
- Απόδοση benchmark σε Mem SQL
- Δημιουργήστε εφαρμογές δεδομένων σε πραγματικό χρόνο χρησιμοποιώντας Mem SQL

Κοινό

- Προγραμματιστές
- Διαχειριστές
- Μηχανικοί Λειτουργίας

Μορφή του μαθήματος

- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση
28 hours
Overview
Hadoop is a popular Big Data processing framework. Python is a high-level programming language famous for its clear syntax and code readibility.

In this instructor-led, live training, participants will learn how to work with Hadoop, MapReduce, Pig, and Spark using Python as they step through multiple examples and use cases.

By the end of this training, participants will be able to:

- Understand the basic concepts behind Hadoop, MapReduce, Pig, and Spark
- Use Python with Hadoop Distributed File System (HDFS), MapReduce, Pig, and Spark
- Use Snakebite to programmatically access HDFS within Python
- Use mrjob to write MapReduce jobs in Python
- Write Spark programs with Python
- Extend the functionality of pig using Python UDFs
- Manage MapReduce jobs and Pig scripts using Luigi

Audience

- Developers
- IT Professionals

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
21 hours
Overview
Python είναι μια γλώσσα προγραμματισμού υψηλού επιπέδου γνωστή για την σαφή σύνταξη και την αναγνωσιμότητα του κώδικα. Το Spark είναι ένας μηχανισμός επεξεργασίας δεδομένων που χρησιμοποιείται για την αναζήτηση, την ανάλυση και τη μετατροπή μεγάλων δεδομένων. PySpark επιτρέπει στους χρήστες να αλληλεπιδρούν με την Python .

Σε αυτή την καθοδηγούμενη από εκπαιδευτή, ζωντανή προπόνηση, οι συμμετέχοντες θα μάθουν πώς να χρησιμοποιούν το Python και το Spark μαζί για να αναλύσουν τα μεγάλα δεδομένα καθώς εργάζονται σε πρακτικές ασκήσεις.

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Μάθετε πώς να χρησιμοποιείτε το Spark με την Python για να αναλύσετε τα Big Data .
- Εργασίες για ασκήσεις που μιμούνται περιστάσεις πραγματικού κόσμου.
- Χρησιμοποιήστε διάφορα εργαλεία και τεχνικές για την ανάλυση μεγάλων δεδομένων χρησιμοποιώντας το PySpark .

Μορφή του μαθήματος

- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση
35 hours
Overview
Advances in technologies and the increasing amount of information are transforming how law enforcement is conducted. The challenges that Big Data pose are nearly as daunting as Big Data's promise. Storing data efficiently is one of these challenges; effectively analyzing it is another.

In this instructor-led, live training, participants will learn the mindset with which to approach Big Data technologies, assess their impact on existing processes and policies, and implement these technologies for the purpose of identifying criminal activity and preventing crime. Case studies from law enforcement organizations around the world will be examined to gain insights on their adoption approaches, challenges and results.

By the end of this training, participants will be able to:

- Combine Big Data technology with traditional data gathering processes to piece together a story during an investigation
- Implement industrial big data storage and processing solutions for data analysis
- Prepare a proposal for the adoption of the most adequate tools and processes for enabling a data-driven approach to criminal investigation

Audience

- Law Enforcement specialists with a technical background

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
14 hours
Overview
Προκειμένου να ανταποκριθεί η συμμόρφωση των ρυθμιστικών αρχών, οι υπεύθυνοι Communication μπορούν να αξιοποιήσουν το Big Data Analytics, το οποίο όχι μόνο τους βοηθά να ανταποκριθούν στη συμμόρφωση, αλλά και στο πλαίσιο του ίδιου έργου, μπορούν να αυξήσουν την ικανοποίηση των πελατών τους και να μειώσουν έτσι το χτύπημα. Στην πραγματικότητα, δεδομένου ότι η συμμόρφωση σχετίζεται με την ποιότητα της υπηρεσίας που συνδέεται με μια σύμβαση, κάθε πρωτοβουλία για την εκπλήρωση της συμμόρφωσης, θα βελτιώσει την «ανταγωνιστική θέση» των ΕΣΧ. Ως εκ τούτου, είναι σημαντικό οι ρυθμιστικές αρχές να είναι σε θέση να συμβουλεύουν / καθοδηγούν ένα σύνολο αναλυτικής πρακτικής Big Data για τους CSP που θα είναι αμοιβαίο όφελος μεταξύ των ρυθμιστικών αρχών και των CSP.

Το μάθημα αποτελείται από 8 ενότητες (4 την ημέρα 1 και 4 την ημέρα 2)
28 hours
Overview
Πολλά προβλήματα πραγματικού κόσμου μπορούν να περιγραφούν με όρους γραφημάτων. Για παράδειγμα, το γράφημα Web, το γράφημα κοινωνικού δικτύου, το γράφημα δικτύου τρένων και το γράφημα γλώσσας. Αυτά τα γραφήματα τείνουν να είναι εξαιρετικά μεγάλα. η επεξεργασία τους απαιτεί ένα εξειδικευμένο σύνολο εργαλείων και διαδικασιών - αυτά τα εργαλεία και οι διαδικασίες μπορούν να αναφέρονται ως Graph Computing (επίσης γνωστό ως Graph Analytics).

Σε αυτή την καθοδηγούμενη από εκπαιδευτή, ζωντανή εκπαίδευση, οι συμμετέχοντες θα μάθουν για τις προσφορές τεχνολογίας και τις προσεγγίσεις υλοποίησης για την επεξεργασία δεδομένων γραφημάτων. Ο στόχος είναι να εντοπιστούν τα αντικείμενα πραγματικού κόσμου, τα χαρακτηριστικά και οι σχέσεις τους, να μοντελοποιηθούν αυτές οι σχέσεις και να επεξεργαστούν ως δεδομένα χρησιμοποιώντας μια προσέγγιση Graph Computing (επίσης γνωστή ως Graph Analytics). Ξεκινάμε με μια ευρεία επισκόπηση και περιορίζουμε τα συγκεκριμένα εργαλεία, καθώς κάνουμε μια σειρά από περιπτωσιολογικές μελέτες, πρακτικές ασκήσεις και ζωντανές αναπτύξεις.

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Κατανοήστε τον τρόπο με τον οποίο εξακολουθούν να υφίστανται και διαβιβάζονται τα δεδομένα γραφήματος.
- Επιλέξτε το καλύτερο πλαίσιο για μια συγκεκριμένη εργασία (από βάσεις δεδομένων γραφημάτων σε πλαίσια επεξεργασίας παρτίδας).
- Εφαρμόστε τους Hadoop , Spark, GraphX και GraphX για να πραγματοποιήσετε υπολογιστικά γραφή σε πολλές μηχανές παράλληλα.
- Προβάλετε μεγάλα προβλήματα δεδομένων σε πραγματικό κόσμο όσον αφορά τα γραφήματα, τις διαδικασίες και τις μετακινήσεις.

Μορφή του μαθήματος

- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση
21 hours
Overview
Predictive analytics is the process of using data analytics to make predictions about the future. This process uses data along with data mining, statistics, and machine learning techniques to create a predictive model for forecasting future events.

In this instructor-led, live training, participants will learn how to use Matlab to build predictive models and apply them to large sample data sets to predict future events based on the data.

By the end of this training, participants will be able to:

- Create predictive models to analyze patterns in historical and transactional data
- Use predictive modeling to identify risks and opportunities
- Build mathematical models that capture important trends
- Use data from devices and business systems to reduce waste, save time, or cut costs

Audience

- Developers
- Engineers
- Domain experts

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
21 hours
Overview
Apache NiFi (Hortonworks DataFlow) είναι μια ολοκληρωμένη πλατφόρμα επεξεργασίας δεδομένων σε πραγματικό χρόνο και απλή πλατφόρμα επεξεργασίας συμβάντων που επιτρέπει τη μετακίνηση, την παρακολούθηση και την αυτοματοποίηση δεδομένων μεταξύ συστημάτων. Γράφεται με προγραμματισμό βάσει ροής και παρέχει μια διεπαφή χρήστη που βασίζεται στον ιστό για τη διαχείριση ροών δεδομένων σε πραγματικό χρόνο.

Σε αυτήν την καθοδηγούμενη από εκπαιδευτή, ζωντανή εκπαίδευση (επιτόπια ή απομακρυσμένη), οι συμμετέχοντες θα μάθουν πώς να αναπτύξουν και να διαχειριστούν το Apache NiFi σε περιβάλλον εργαστηρίου.

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Εγκαταστήστε και διαμορφώστε το Apachi NiFi.
- Πηγή, μετασχηματίζει και διαχειρίζεται δεδομένα από διαφορετικές, κατανεμημένες πηγές δεδομένων, συμπεριλαμβανομένων των βάσεων δεδομένων και των μεγάλων λιμνών δεδομένων.
- Αυτοματοποιήστε τις ροές δεδομένων.
- Ενεργοποιήστε τα αναλυτικά ροής.
- Εφαρμόστε διάφορες προσεγγίσεις για την κατάποση δεδομένων.
- Μετασχηματισμός Big Data και επιχειρηματικές γνώσεις.

Μορφή του μαθήματος

- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πρακτική.
- Χειροκίνητη υλοποίηση σε εργασιακό περιβάλλον.

Επιλογές προσαρμογής μαθημάτων

- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
7 hours
Overview
Σε αυτόν τον οδηγό, με ζωντανή προπόνηση, οι συμμετέχοντες θα μάθουν τις βασικές έννοιες πίσω από την MapR Stream Architecture καθώς αναπτύσσουν μια εφαρμογή ροής σε πραγματικό χρόνο.

Μέχρι το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση να δημιουργήσουν εφαρμογές παραγωγών και καταναλωτών για επεξεργασία δεδομένων ροής σε πραγματικό χρόνο.

Κοινό

- Προγραμματιστές
- Διαχειριστές

Μορφή του μαθήματος

- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση

Σημείωση

- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
14 hours
Overview
Apache SolrCloud is a distributed data processing engine that facilitates the searching and indexing of files on a distributed network.

In this instructor-led, live training, participants will learn how to set up a SolrCloud instance on Amazon AWS.

By the end of this training, participants will be able to:

- Understand SolCloud's features and how they compare to those of conventional master-slave clusters
- Configure a SolCloud centralized cluster
- Automate processes such as communicating with shards, adding documents to the shards, etc.
- Use Zookeeper in conjunction with SolrCloud to further automate processes
- Use the interface to manage error reporting
- Load balance a SolrCloud installation
- Configure SolrCloud for continuous processing and fail-over

Audience

- Solr Developers
- Project Managers
- System Administrators
- Search Analysts

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
28 hours
Overview
Data Vault Modeling is a database modeling technique that provides long-term historical storage of data that originates from multiple sources. A data vault stores a single version of the facts, or "all the data, all the time". Its flexible, scalable, consistent and adaptable design encompasses the best aspects of 3rd normal form (3NF) and star schema.

In this instructor-led, live training, participants will learn how to build a Data Vault.

By the end of this training, participants will be able to:

- Understand the architecture and design concepts behind Data Vault 2.0, and its interaction with Big Data, NoSQL and AI.
- Use data vaulting techniques to enable auditing, tracing, and inspection of historical data in a data warehouse.
- Develop a consistent and repeatable ETL (Extract, Transform, Load) process.
- Build and deploy highly scalable and repeatable warehouses.

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
14 hours
Overview
Datameer is a business intelligence and analytics platform built on Hadoop. It allows end-users to access, explore and correlate large-scale, structured, semi-structured and unstructured data in an easy-to-use fashion.

In this instructor-led, live training, participants will learn how to use Datameer to overcome Hadoop's steep learning curve as they step through the setup and analysis of a series of big data sources.

By the end of this training, participants will be able to:

- Create, curate, and interactively explore an enterprise data lake
- Access business intelligence data warehouses, transactional databases and other analytic stores
- Use a spreadsheet user-interface to design end-to-end data processing pipelines
- Access pre-built functions to explore complex data relationships
- Use drag-and-drop wizards to visualize data and create dashboards
- Use tables, charts, graphs, and maps to analyze query results

Audience

- Data analysts

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
14 hours
Overview
Tigon is an open-source, real-time, low-latency, high-throughput, native YARN, stream processing framework that sits on top of HDFS and HBase for persistence. Tigon applications address use cases such as network intrusion detection and analytics, social media market analysis, location analytics, and real-time recommendations to users.

This instructor-led, live training introduces Tigon's approach to blending real-time and batch processing as it walks participants through the creation a sample application.

By the end of this training, participants will be able to:

- Create powerful, stream processing applications for handling large volumes of data
- Process stream sources such as Twitter and Webserver Logs
- Use Tigon for rapid joining, filtering, and aggregating of streams

Audience

- Developers

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
14 hours
Overview
Apache Ignite is an in-memory computing platform that sits between the application and data layer to improve speed, scale, and availability.

In this instructor-led, live training, participants will learn the principles behind persistent and pure in-memory storage as they step through the creation of a sample in-memory computing project.

By the end of this training, participants will be able to:

- Use Ignite for in-memory, on-disk persistence as well as a purely distributed in-memory database.
- Achieve persistence without syncing data back to a relational database.
- Use Ignite to carry out SQL and distributed joins.
- Improve performance by moving data closer to the CPU, using RAM as a storage.
- Spread data sets across a cluster to achieve horizontal scalability.
- Integrate Ignite with RDBMS, NoSQL, Hadoop and machine learning processors.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
14 hours
Overview
Vespa is an open-source big data processing and serving engine created by Yahoo. It is used to respond to user queries, make recommendations, and provide personalized content and advertisements in real-time.

This instructor-led, live training introduces the challenges of serving large-scale data and walks participants through the creation of an application that can compute responses to user requests, over large datasets in real-time.

By the end of this training, participants will be able to:

- Use Vespa to quickly compute data (store, search, rank, organize) at serving time while a user waits
- Implement Vespa into existing applications involving feature search, recommendations, and personalization
- Integrate and deploy Vespa with existing big data systems such as Hadoop and Storm.

Audience

- Developers

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
21 hours
Overview
Apache Apex is a YARN-native platform that unifies stream and batch processing. It processes big data-in-motion in a way that is scalable, performant, fault-tolerant, stateful, secure, distributed, and easily operable.

This instructor-led, live training introduces Apache Apex's unified stream processing architecture, and walks participants through the creation of a distributed application using Apex on Hadoop.

By the end of this training, participants will be able to:

- Understand data processing pipeline concepts such as connectors for sources and sinks, common data transformations, etc.
- Build, scale and optimize an Apex application
- Process real-time data streams reliably and with minimum latency
- Use Apex Core and the Apex Malhar library to enable rapid application development
- Use the Apex API to write and re-use existing Java code
- Integrate Apex into other applications as a processing engine
- Tune, test and scale Apex applications

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
7 hours
Overview
Alluxio είναι ένα εικονικό κατανεμημένο σύστημα αποθήκευσης ανοικτού κώδικα που ενοποιεί τα διαφορετικά συστήματα αποθήκευσης και επιτρέπει στις εφαρμογές να αλληλεπιδρούν με τα δεδομένα σε ταχύτητα μνήμης. Χρησιμοποιείται από εταιρείες όπως η Intel, η Baidu και η Alibaba.

Σε αυτή την καθοδηγούμενη από εκπαιδευτή, ζωντανή προπόνηση, οι συμμετέχοντες θα μάθουν πώς να χρησιμοποιούν το Alluxio για να γεφυρώσουν διαφορετικά πλαίσια υπολογισμών με συστήματα αποθήκευσης και να διαχειριστούν αποτελεσματικά δεδομένα κλίμακας πολλαπλών petabyte καθώς Alluxio με τη δημιουργία μιας εφαρμογής με την Alluxio .

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Αναπτύξτε μια εφαρμογή με το Alluxio
- Συνδέστε μεγάλα συστήματα δεδομένων και εφαρμογές διατηρώντας παράλληλα ένα χώρο ονομάτων
- Αποτελεσματικά εξαγάγετε την αξία από μεγάλα δεδομένα σε οποιαδήποτε μορφή αποθήκευσης
- Βελτιώστε την απόδοση του φόρτου εργασίας
- Alluxio και διαχειριστείτε το αυτόνομο ή ομαδοποιημένο Alluxio

Κοινό

- Επιστήμονας δεδομένων
- Προγραμματιστής
- Διαχειριστής συστήματος

Μορφή του μαθήματος

- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση
28 hours
Overview
Apache Flink είναι ένα πλαίσιο ανοιχτού κώδικα για την κλιμάκωση επεξεργασίας δεδομένων και ροής δεδομένων.

Αυτή η καθοδηγούμενη από εκπαιδευτές, ζωντανή εκπαίδευση, εισάγει τις αρχές και τις προσεγγίσεις πίσω από την επεξεργασία κατανεμημένων ροών και παρτίδων δεδομένων και περπατά τους συμμετέχοντες μέσω της δημιουργίας μιας εφαρμογής ροής δεδομένων σε πραγματικό χρόνο στο Apache Flink .

Μέχρι το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Δημιουργήστε ένα περιβάλλον για την ανάπτυξη εφαρμογών ανάλυσης δεδομένων.
- Πακέτο, εκτέλεση και παρακολούθηση εφαρμογών συνεχούς ροής που βασίζονται σε Flink, ανεκτικοί σε σφάλματα.
- Διαχειριστείτε διαφορετικούς φόρτους εργασίας.
- Εκτελέστε προηγμένες αναλύσεις χρησιμοποιώντας το Flink ML.
- Ρυθμίστε ένα πολυστρωματικό σύμπλεγμα Flink.
- Μετρήστε και βελτιστοποιήστε την απόδοση.
- Ενσωματώστε το Flink με διαφορετικά συστήματα Big Data .
- Συγκρίνετε τις δυνατότητες Flink με αυτές άλλων μεγάλων πλαισίων επεξεργασίας δεδομένων.

Μορφή του μαθήματος

- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πρακτική.
- Χειροκίνητη υλοποίηση σε εργασιακό περιβάλλον.

Επιλογές προσαρμογής μαθημάτων

- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
14 hours
Overview
Το Apache Samza είναι ένα ασύγχρονο υπολογιστικό πλαίσιο σχεδόν ανοικτού κώδικα για την επεξεργασία ροής. Χρησιμοποιεί το Apache Kafka για ανταλλαγή μηνυμάτων και το Apache Hadoop YARN για ανοχή σφάλματος, απομόνωση επεξεργαστή, ασφάλεια και διαχείριση πόρων.

Αυτή η καθοδηγούμενη από εκπαιδευτές, ζωντανή εκπαίδευση εισάγει τις αρχές πίσω από τα συστήματα ανταλλαγής μηνυμάτων και την επεξεργασία κατανεμημένων ροών, ενώ περπατούν οι συμμετέχοντες μέσω της δημιουργίας ενός δείγματος βασισμένου σε Samza έργου και εκτέλεσης εργασιών.

Μέχρι το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Χρησιμοποιήστε τη Samza για να απλοποιήσετε τον κώδικα που απαιτείται για την παραγωγή και κατανάλωση μηνυμάτων.
- Αποσυνδέστε το χειρισμό μηνυμάτων από μια εφαρμογή.
- Χρησιμοποιήστε τη Samza για την υλοποίηση ασύγχρονων υπολογισμών σχεδόν σε πραγματικό χρόνο.
- Χρησιμοποιήστε επεξεργασία ροής για να παρέχετε υψηλότερο επίπεδο αφαίρεσης από τα συστήματα μηνυμάτων.

Κοινό

- Προγραμματιστές

Μορφή του μαθήματος

- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση
14 hours
Overview
Το AI είναι μια συλλογή τεχνολογιών για την κατασκευή έξυπνων συστημάτων ικανών να κατανοήσουν τα δεδομένα και τις δραστηριότητες που περιβάλλουν τα δεδομένα για να κάνουν "έξυπνες αποφάσεις". Για τους παρόχους τηλεπικοινωνιών, οι εφαρμογές κτιρίων και οι υπηρεσίες που χρησιμοποιούν το AI θα μπορούσαν να ανοίξουν την πόρτα για βελτιωμένες λειτουργίες και εξυπηρέτηση σε τομείς όπως η συντήρηση και η βελτιστοποίηση του δικτύου.

Σε αυτό το μάθημα εξετάζουμε τις διάφορες τεχνολογίες που απαρτίζουν το AI και τα σύνολα ικανοτήτων που απαιτούνται για να τα χρησιμοποιήσουμε. Σε όλη τη διάρκεια του μαθήματος, εξετάζουμε τις συγκεκριμένες εφαρμογές της AI στο πλαίσιο της βιομηχανίας τηλεπικοινωνιών.

Κοινό

- Μηχανικοί δικτύων
- Δυναμικό του δικτύου
- Τεχνικοί διευθυντές τηλεπικοινωνιών

Μορφή του μαθήματος

- Διάλεξη μέρους, συζήτηση, πρακτική ασκήσεις
7 hours
Overview
Apache Drill is a schema-free, distributed, in-memory columnar SQL query engine for Hadoop, NoSQL and other Cloud and file storage systems. The power of Apache Drill lies in its ability to join data from multiple data stores using a single query. Apache Drill supports numerous NoSQL databases and file systems, including HBase, MongoDB, MapR-DB, HDFS, MapR-FS, Amazon S3, Azure Blob Storage, Google Cloud Storage, Swift, NAS and local files. Apache Drill is the open source version of Google's Dremel system which is available as an infrastructure service called Google BigQuery.

In this instructor-led, live training, participants will learn how to optimize and debug Apache Drill to improve the performance of queries on very large data sets. The course begins with an architectural overview and feature comparison between Apache Drill and other interactive data analysis tools. Participants then step through a series of interactive, hands-on practice sessions that include installation, configuration, performance evaluation, query optimization, data partitioning, and debugging of an Apache Drill instance in a live lab environment.

By the end of this training, participants will be able to:

- Install and configure Apache Drill
- Understand Apache Drill's architecture and features
- Understand how Apache Drills receives and executes queries
- Optimize Drill queries for distributed SQL execution
- Debug Apache Drill

Audience

- Developers
- Systems administrators
- Data analysts

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice

Notes

- To request a customized training for this course, please contact us to arrange.
14 hours
Overview
Το Magellan είναι μια μηχανή εκτέλεσης που διανέμει ανοιχτού κώδικα για γεωχωρικές αναλύσεις σε μεγάλα δεδομένα. Εφαρμοσμένη πάνω από το Apache Spark , επεκτείνει το Spark SQL και παρέχει μια σχεσιακή αφαίρεση για γεωχωρικές αναλύσεις.

Αυτή η καθοδηγούμενη από εκπαιδευτές, ζωντανή εκπαίδευση, εισάγει τις έννοιες και τις προσεγγίσεις για την εφαρμογή γεωσφαιρικών αναλύσεων και περπατά τους συμμετέχοντες μέσω της δημιουργίας μιας εφαρμογής πρόβλεψης ανάλυσης χρησιμοποιώντας το Magellan στο Spark.

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Αποτελεσματικά ερώτημα, ανάλυση και σύνδεση γεωσκοπικών συνόλων δεδομένων σε κλίμακα
- Εφαρμογή γεωχωρικών δεδομένων σε εφαρμογές επιχειρηματικής ευφυΐας και πρόβλεψης
- Χρησιμοποιήστε το χωρικό πλαίσιο για να επεκτείνετε τις δυνατότητες των κινητών συσκευών, των αισθητήρων, των αρχείων καταγραφής και των φορητών συσκευών

Μορφή του μαθήματος

- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πρακτική.
- Χειροκίνητη υλοποίηση σε εργασιακό περιβάλλον.

Επιλογές προσαρμογής μαθημάτων

- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
14 hours
Overview
Apache Arrow είναι ένα πλαίσιο επεξεργασίας δεδομένων ανοικτού κώδικα μέσα στην μνήμη. Συχνά χρησιμοποιείται μαζί με άλλα εργαλεία επιστήμης δεδομένων για την πρόσβαση σε ανόμοιες αποθήκες δεδομένων για ανάλυση. Ενσωματώνεται καλά με άλλες τεχνολογίες όπως βάσεις δεδομένων GPU , βιβλιοθήκες μηχανών μάθησης και εργαλεία, μηχανές εκτέλεσης και πλαίσια απεικόνισης δεδομένων.

Σε αυτή την επιτόπου εκπαιδευτή υπό την ηγεσία, ζωντανή κατάρτισης, οι συμμετέχοντες θα μάθουν πώς να ενσωματώσουν Apache Arrow με διάφορα Data Science πλαισίων για την πρόσβαση σε δεδομένα από διαφορετικές πηγές δεδομένων.

Μέχρι τη λήξη αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:

- Εγκαταστήστε και ρυθμίστε τις παραμέτρους του Apache Arrow σε περιβάλλον κατανεμημένου συμπλέγματος
- Χρησιμοποιήστε το Apache Arrow για να αποκτήσετε πρόσβαση σε δεδομένα από διαφορετικές πηγές δεδομένων
- Χρησιμοποιήστε το Apache Arrow για να παρακάμψετε την ανάγκη κατασκευής και συντήρησης σύνθετων αγωγών ETL
- Αναλύστε τα δεδομένα σε διαφορετικές πηγές δεδομένων χωρίς να χρειάζεται να την ενοποιήσετε σε ένα κεντρικό αποθετήριο

Κοινό

- Οι επιστήμονες των δεδομένων
- Μηχανικοί δεδομένων

Μορφή του μαθήματος

- Διάλεξη μέρους, μερική συζήτηση, ασκήσεις και βαριά πρακτική άσκηση

Σημείωση

- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
7 hours
Overview
Αυτή η καθοδηγούμενη από εκπαιδευτές, ζωντανή εκπαίδευση (επιτόπια ή απομακρυσμένη) απευθύνεται σε τεχνικά άτομα που επιθυμούν να μάθουν πώς να εφαρμόσουν μια στρατηγική μηχανικής μάθησης, μεγιστοποιώντας ταυτόχρονα τη χρήση μεγάλων δεδομένων.

Μέχρι το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα:

- Κατανοήστε την εξέλιξη και τις τάσεις της μηχανικής μάθησης.
- Μάθετε πώς η μηχανική μάθηση χρησιμοποιείται σε διάφορες βιομηχανίες.
- Γνωρίστε τα εργαλεία, τις δεξιότητες και τις υπηρεσίες που είναι διαθέσιμες για την εφαρμογή της μηχανικής μάθησης μέσα σε έναν οργανισμό.
- Κατανοήστε τον τρόπο με τον οποίο η μηχανική μάθηση μπορεί να χρησιμοποιηθεί για τη βελτίωση της εξόρυξης δεδομένων και της ανάλυσης.
- Μάθετε τι είναι το μεσαίο backend δεδομένων και πώς χρησιμοποιείται από τις επιχειρήσεις.
- Κατανοήστε το ρόλο που παίζουν μεγάλα δεδομένα και έξυπνες εφαρμογές σε όλους τους κλάδους.

Μορφή του μαθήματος

- Διαδραστική διάλεξη και συζήτηση.
- Πολλές ασκήσεις και πρακτική.
- Χειροκίνητη υλοποίηση σε εργασιακό περιβάλλον.

Επιλογές προσαρμογής μαθημάτων

- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσετε.
14 hours
Overview
Teradata is a popular Relational Database Management System for building large scale data warehousing applications. Teradata achieves this by way of parallelism.

This instructor-led, live training (onsite or remote) is aimed at application developers and engineers who wish to master more sophisticated usages of the Teradata database.

By the end of this training, participants will be able to:

- Manage Teradata space.
- Protect and distribute data in Teradata.
- Read Explain Plan.
- Improve SQL proficiency.
- Use main utilities of Teradata.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
35 hours
Overview
KNIME is a free and open-source data analytics, reporting and integration platform. KNIME integrates various components for machine learning and data mining through its modular data pipelining concept. A graphical user interface and use of JDBC allows assembly of nodes blending different data sources, including preprocessing (ETL: Extraction, Transformation, Loading), for modeling, data analysis and visualization without, or with only minimal, programming. To some extent as advanced analytics tool KNIME can be considered as a SAS alternative.

Since 2006, KNIME has been used in pharmaceutical research, it also used in other areas like CRM customer data analysis, business intelligence and financial data analysis.
Weekend Big Data courses, Evening Big Data training, Big Data boot camp, Big Data instructor-led, Weekend Big Data training, Evening Big Data courses, Big Data coaching, Big Data instructor, Big Data trainer, Big Data training courses, Big Data classes, Big Data on-site, Big Data private courses, Big Data one on one training

Course Discounts

Course Discounts Newsletter

We respect the privacy of your email address. We will not pass on or sell your address to others.
You can always change your preferences or unsubscribe completely.

Some of our clients

is growing fast!

We are looking to expand our presence in Greece!

As a Business Development Manager you will:

  • expand business in Greece
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!