From Data to Decision with Big Data and Predictive Analytics Training Course
Κοινό
Αν προσπαθήσετε να κατανοήσετε τα δεδομένα στα οποία έχετε πρόσβαση ή θέλετε να αναλύσετε μη δομημένα δεδομένα που είναι διαθέσιμα στο διαδίκτυο (όπως το Twitter, το Linked in, κ.λπ.), αυτό το μάθημα απευθύνεται σε εσάς.
Στόχος είναι κυρίως οι υπεύθυνοι λήψης αποφάσεων και οι άνθρωποι που πρέπει να επιλέξουν ποια δεδομένα αξίζει να συλλέξουν και τι αξίζει να αναλύσουμε.
Δεν στοχεύει στους ανθρώπους να διαμορφώσουν τη λύση, αλλά αυτοί θα επωφεληθούν από τη μεγάλη εικόνα.
Λειτουργία παράδοσης
Κατά τη διάρκεια του μαθήματος οι εκπρόσωποι θα παρουσιαστούν με παραδείγματα εργασίας για τις περισσότερες τεχνολογίες ανοιχτού κώδικα.
Οι σύντομες διαλέξεις θα ακολουθούνται από παρουσίαση και απλές ασκήσεις από τους συμμετέχοντες
Το περιεχόμενο και το λογισμικό που χρησιμοποιήθηκαν
Όλο το λογισμικό που χρησιμοποιείται ενημερώνεται κάθε φορά που εκτελείται το μάθημα, έτσι ελέγχουμε τις πιο πρόσφατες εκδόσεις.
Καλύπτει τη διαδικασία από την απόκτηση, τη μορφοποίηση, την επεξεργασία και την ανάλυση των δεδομένων, για να εξηγήσει πώς αυτοματοποιείται η διαδικασία λήψης αποφάσεων με τη μηχανική μάθηση.
Course Outline
γρήγορη επισκόπηση
- Πηγές δεδομένων Minding Data Recommender Systems Target Marketing
Τύποι δεδομένων
- Δομημένα έναντι μη δομημένων Στατικά έναντι ροής Δεδομένα συμπεριφοράς, συμπεριφοράς και δημογραφικά δεδομένα Εγκυρότητα δεδομένων αναλυτικών στοιχείων βάσει δεδομένων έναντι χρήστη Όγκος, ταχύτητα και ποικιλία δεδομένων
Μοντέλα
- Κατασκευή μοντέλων Στατιστικά μοντέλα Μηχανική μάθηση
Ταξινόμηση Δεδομένων
- Ομαδοποίηση kGroups, k-means, οι πλησιέστεροι γείτονες Αποικίες μυρμηγκιών, πουλιά που συρρέουν
Προγνωστικά μοντέλα
- Δέντρα αποφάσεων Υποστήριξη διανυσματική μηχανή Naive Bayes ταξινόμηση Νευρωνικά δίκτυα Markov Model Regression Ensemble μέθοδοι
ROI
- Αναλογία οφέλους/κόστους Κόστος λογισμικού Κόστος ανάπτυξης Πιθανά οφέλη
Μοντέλα Κτιρίων
- Προετοιμασία δεδομένων (MapReduce) Καθαρισμός δεδομένων Επιλογή μεθόδων Ανάπτυξη μοντέλου Δοκιμή μοντέλου Αξιολόγηση μοντέλου Ανάπτυξη και ενοποίηση μοντέλου
Επισκόπηση λογισμικού ανοιχτού κώδικα και εμπορικού λογισμικού
- Επιλογή πακέτου R-project Python βιβλιοθηκών Hadoop και Mahout Επιλεγμένα έργα Apache που σχετίζονται με Big Data και Analytics Επιλεγμένη εμπορική λύση Ενσωμάτωση με υπάρχον λογισμικό και πηγές δεδομένων
Requirements
Κατανόηση των παραδοσιακών μεθόδων διαχείρισης και ανάλυσης δεδομένων όπως SQL, αποθήκες δεδομένων, επιχειρηματική ευφυΐα, OLAP, κ.λπ... Κατανόηση βασικών στατιστικών και πιθανοτήτων (μέσος όρος, διακύμανση, πιθανότητα, πιθανότητα υπό όρους, κ.λπ...)
Open Training Courses require 5+ participants.
From Data to Decision with Big Data and Predictive Analytics Training Course - Booking
From Data to Decision with Big Data and Predictive Analytics Training Course - Enquiry
From Data to Decision with Big Data and Predictive Analytics - Consultancy Enquiry
Testimonials (2)
Το περιεχόμενο, καθώς το βρήκα πολύ ενδιαφέρον και πιστεύω ότι θα με βοηθούσε στην τελευταία μου χρονιά στο Πανεπιστήμιο.
Krishan - NBrown Group
Course - From Data to Decision with Big Data and Predictive Analytics
Machine Translated
Richard's training style kept it interesting, the real world examples used helped to drive the concepts home.
Jamie Martin-Royle - NBrown Group
Course - From Data to Decision with Big Data and Predictive Analytics
Upcoming Courses
Related Courses
Predictive AI in DevOps: Enhancing Software Delivery
14 HoursΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε επαγγελματίες μεσαίου επιπέδου DevOps που επιθυμούν να ενσωματώσουν την προγνωστική τεχνητή νοημοσύνη στις DevOps πρακτικές τους.
Μέχρι το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Εφαρμόστε μοντέλα πρόβλεψης ανάλυσης για την πρόβλεψη και την επίλυση προκλήσεων στη γραμμή DevOps.
- Χρησιμοποιήστε εργαλεία που βασίζονται σε AI για βελτιωμένη παρακολούθηση και λειτουργίες.
- Εφαρμόστε τεχνικές μηχανικής εκμάθησης για να βελτιώσετε τις ροές εργασίας παράδοσης λογισμικού.
- Σχεδιάστε στρατηγικές AI για προληπτική επίλυση προβλημάτων και βελτιστοποίηση.
- Περιηγηθείτε στα ηθικά ζητήματα της χρήσης τεχνητής νοημοσύνης στο DevOps.
Introduction to Predictive AI
21 HoursΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακή ή επιτόπου) απευθύνεται σε αρχάριους επαγγελματίες πληροφορικής που επιθυμούν να κατανοήσουν τις βασικές αρχές του Predictive AI.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Κατανοήστε τις βασικές έννοιες του Predictive AI και των εφαρμογών του.
- Συλλέξτε, καθαρίστε και προεπεξεργαστείτε δεδομένα για προγνωστική ανάλυση.
- Εξερευνήστε και οπτικοποιήστε δεδομένα για να ανακαλύψετε πληροφορίες.
- Δημιουργήστε βασικά στατιστικά μοντέλα για να κάνετε προβλέψεις.
- Αξιολογήστε την απόδοση των προγνωστικών μοντέλων.
- Εφαρμόστε έννοιες Predictive AI σε σενάρια πραγματικού κόσμου.
Data Vault: Building a Scalable Data Warehouse
28 HoursΣε αυτή τη ζωντανή εκπαίδευση που καθοδηγείται από εκπαιδευτές στο Ελλάδα, οι συμμετέχοντες θα μάθουν πώς να δημιουργούν ένα Data Vault.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Κατανοήστε τις έννοιες της αρχιτεκτονικής και του σχεδιασμού πίσω από το Data Vault 2.0 και την αλληλεπίδρασή του με τα Big Data, NoSQL και AI.
- Χρησιμοποιήστε τεχνικές αποθήκευσης δεδομένων για να ενεργοποιήσετε τον έλεγχο, την ανίχνευση και την επιθεώρηση ιστορικών δεδομένων σε μια αποθήκη δεδομένων.
- Αναπτύξτε μια συνεπή και επαναλαμβανόμενη διαδικασία ETL (Extract, Transform, Load).
- Δημιουργία και ανάπτυξη αποθηκών υψηλής κλιμάκωσης και επαναλήψεων.
Spark Streaming with Python and Kafka
7 HoursΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε μηχανικούς δεδομένων, επιστήμονες δεδομένων και προγραμματιστές που επιθυμούν να χρησιμοποιήσουν Spark Streaming δυνατότητες για την επεξεργασία και την ανάλυση δεδομένων σε πραγματικό χρόνο.
Μέχρι το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν να χρησιμοποιούν το Spark Streaming για να επεξεργάζονται ζωντανές ροές δεδομένων για χρήση σε βάσεις δεδομένων, συστήματα αρχείων και ζωντανούς πίνακες εργαλείων.
Confluent KSQL
7 HoursΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε προγραμματιστές που επιθυμούν να εφαρμόσουν επεξεργασία ροής Apache Kafka χωρίς να γράφουν κώδικα.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Εγκαταστήστε και διαμορφώστε το Confluent KSQL.
- Ρυθμίστε μια διοχέτευση επεξεργασίας ροής χρησιμοποιώντας μόνο εντολές SQL (χωρίς κωδικοποίηση Java ή Python).
- Πραγματοποιήστε φιλτράρισμα δεδομένων, μετασχηματισμούς, συναθροίσεις, συνδέσεις, παράθυρα και συνεδριάσεις εξ ολοκλήρου σε SQL.
- Σχεδιάστε και αναπτύξτε διαδραστικά, συνεχή ερωτήματα για ροή ETL και αναλυτικά στοιχεία σε πραγματικό χρόνο.
Apache Ignite for Developers
14 HoursΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε προγραμματιστές που επιθυμούν να μάθουν τις αρχές πίσω από την επίμονη και καθαρή αποθήκευση στη μνήμη καθώς προχωρούν στη δημιουργία ενός δείγματος υπολογιστικού έργου στη μνήμη.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Χρησιμοποιήστε το Ignite για επιμονή στη μνήμη, στο δίσκο, καθώς και μια καθαρά κατανεμημένη βάση δεδομένων στη μνήμη. Επίτευξη επιμονής χωρίς συγχρονισμό δεδομένων πίσω σε μια σχεσιακή βάση δεδομένων. Χρησιμοποιήστε το Ignite για να πραγματοποιήσετε SQL και κατανεμημένες συνδέσεις. Βελτιώστε την απόδοση μετακινώντας τα δεδομένα πιο κοντά στην CPU, χρησιμοποιώντας τη μνήμη RAM ως χώρο αποθήκευσης. Διαδώστε σύνολα δεδομένων σε ένα σύμπλεγμα για να επιτύχετε οριζόντια επεκτασιμότητα. Ενσωματώστε το Ignite με επεξεργαστές RDBMS, NoSQL, Hadoop και μηχανικής εκμάθησης.
Unified Batch and Stream Processing with Apache Beam
14 HoursΤο Apache Beam είναι ένα ανοιχτού κώδικα, ενοποιημένο μοντέλο προγραμματισμού για τον καθορισμό και την εκτέλεση παράλληλων αγωγών επεξεργασίας δεδομένων. Η δύναμή του έγκειται στην ικανότητά του να εκτελεί αγωγούς παρτίδας και ροής, με την εκτέλεση να εκτελείται από ένα από τα υποστηριζόμενα κατανεμημένα back-ends επεξεργασίας της Beam: Apache Apex, Apache Flink, Apache Spark και Google Cloud Dataflow. Το Apache Beam είναι χρήσιμο για εργασίες ETL (Εξαγωγή, Μεταμόρφωση και Φόρτωση), όπως η μετακίνηση δεδομένων μεταξύ διαφορετικών μέσων αποθήκευσης και πηγών δεδομένων, η μετατροπή δεδομένων σε μια πιο επιθυμητή μορφή και η φόρτωση δεδομένων σε ένα νέο σύστημα.
Σε αυτήν τη ζωντανή εκπαίδευση (επί τόπου ή εξ αποστάσεως) υπό την καθοδήγηση εκπαιδευτών, οι συμμετέχοντες θα μάθουν πώς να υλοποιούν τα Apache Beam SDK σε μια εφαρμογή Java ή Python που ορίζει έναν αγωγό επεξεργασίας δεδομένων για την αποσύνθεση ενός μεγάλου συνόλου δεδομένων σε μικρότερα κομμάτια για ανεξάρτητες παράλληλη επεξεργασία.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Εγκαταστήστε και διαμορφώστε το Apache Beam. Χρησιμοποιήστε ένα ενιαίο μοντέλο προγραμματισμού για να πραγματοποιήσετε επεξεργασία δέσμης και ροής από την εφαρμογή Java ή Python. Εκτελέστε αγωγούς σε πολλαπλά περιβάλλοντα.
Μορφή του μαθήματος
- Μέρος διάλεξη, μέρος συζήτηση, ασκήσεις και βαριά πρακτική εξάσκηση
Σημείωση
- Αυτό το μάθημα θα είναι διαθέσιμο Scala στο μέλλον. Επικοινωνήστε μαζί μας για να κανονίσουμε.
Apache Apex: Processing Big Data-in-Motion
21 HoursΤο Apache Apex είναι μια εγγενής πλατφόρμα του YARN που ενοποιεί την επεξεργασία ροής και παρτίδας. Επεξεργάζεται μεγάλα δεδομένα σε κίνηση με τρόπο που είναι επεκτάσιμο, αποδοτικό, ανεκτικό σε σφάλματα, κατάσταση, ασφαλές, κατανεμημένο και εύκολα λειτουργικό.
Αυτή η ζωντανή εκπαίδευση καθοδηγούμενη από εκπαιδευτές εισάγει την ενοποιημένη αρχιτεκτονική επεξεργασίας ροής του Apache Apex και καθοδηγεί τους συμμετέχοντες στη δημιουργία μιας κατανεμημένης εφαρμογής χρησιμοποιώντας το Apex στο Hadoop.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Κατανοήστε έννοιες αγωγών επεξεργασίας δεδομένων, όπως συνδέσεις για πηγές και καταβόθρες, συνήθεις μετασχηματισμούς δεδομένων, κ.λπ. Δημιουργήστε, κλιμακώστε και βελτιστοποιήστε μια εφαρμογή Apex Επεξεργαστείτε ροές δεδομένων σε πραγματικό χρόνο με αξιοπιστία και με ελάχιστο λανθάνοντα χρόνο Χρησιμοποιήστε το Apex Core και τη βιβλιοθήκη Apex Malhar για να ενεργοποιήσετε την ταχεία εφαρμογή ανάπτυξη Χρησιμοποιήστε το API Apex για να γράψετε και να επαναχρησιμοποιήσετε τον υπάρχοντα κώδικα Java Ενσωματώστε το Apex σε άλλες εφαρμογές ως μηχανή επεξεργασίας Συντονίστε, δοκιμάστε και κλιμακώστε τις εφαρμογές Apex
Μορφή του μαθήματος
- Διαδραστική διάλεξη και συζήτηση. Πολλές ασκήσεις και εξάσκηση. Πρακτική εφαρμογή σε περιβάλλον ζωντανού εργαστηρίου.
Επιλογές προσαρμογής μαθήματος
- Για να ζητήσετε μια εξατομικευμένη εκπαίδευση για αυτό το μάθημα, επικοινωνήστε μαζί μας για να κανονίσουμε.
Apache Storm
28 HoursApache Storm είναι μια διανεμημένη μηχανή υπολογισμού σε πραγματικό χρόνο που χρησιμοποιείται για την παροχή επιχειρηματικής νοημοσύνης σε πραγματικό χρόνο. Το κάνει αυτό επιτρέποντας στις εφαρμογές να επεξεργάζονται αξιόπιστα απεριόριστα ρεύματα δεδομένων (π.χ. Διαχείριση ρεύματος).
"Storm είναι για επεξεργασία σε πραγματικό χρόνο τι Hadoop είναι για επεξεργασία συσκευών!"
Σε αυτή την εκπαιδευτική άσκηση, οι συμμετέχοντες θα μάθουν πώς να εγκαταστήσουν και να ρυθμίσουν Apache Storm και στη συνέχεια να αναπτύξουν και να αναπτύξουν μια Apache Storm εφαρμογή για την επεξεργασία μεγάλων δεδομένων σε πραγματικό χρόνο.
Μερικά από τα θέματα που περιλαμβάνονται σε αυτή την εκπαίδευση περιλαμβάνουν:
- Apache Storm στο πλαίσιο του Hadoop
- Εργασία με απεριόριστα δεδομένα
- Συνεχείς υπολογισμοί
- Ανάλυση σε πραγματικό χρόνο
- Διανεμημένη επεξεργασία RPC και ETL
Ζητήστε αυτή την πορεία τώρα!
Δημοσιογράφος
- Προγραμματιστές λογισμικού και ETL
- Επαγγελματίες Mainframe
- Επιστήμονες δεδομένων
- Big Data αναλυτές
- Hadoop Επαγγελματίες
Η μορφή της πορείας
- Μερική διάλεξη, Μερική συζήτηση, ασκήσεις και βαριά πρακτική
Apache NiFi for Administrators
21 HoursΣε αυτή τη ζωντανή εκπαίδευση που καθοδηγείται από εκπαιδευτές στο Ελλάδα (επιτόπου ή απομακρυσμένα), οι συμμετέχοντες θα μάθουν πώς να αναπτύσσουν και να διαχειρίζονται το Apache NiFi σε ένα ζωντανό εργαστηριακό περιβάλλον.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Εγκαταστήστε και διαμορφώστε το Apachi NiFi.
- Προέλευση, μετατροπή και διαχείριση δεδομένων από διαφορετικές, κατανεμημένες πηγές δεδομένων, συμπεριλαμβανομένων βάσεων δεδομένων και λιμνών μεγάλων δεδομένων.
- Αυτοματοποιήστε τις ροές δεδομένων.
- Ενεργοποίηση αναλύσεων ροής.
- Εφαρμόστε διάφορες προσεγγίσεις για την απορρόφηση δεδομένων.
- Μετατρέψτε το Big Data και σε επιχειρηματικές γνώσεις.
Apache NiFi for Developers
7 HoursΣε αυτήν τη ζωντανή εκπαίδευση που καθοδηγείται από εκπαιδευτές στο Ελλάδα, οι συμμετέχοντες θα μάθουν τις βασικές αρχές του προγραμματισμού που βασίζεται στη ροή καθώς αναπτύσσουν μια σειρά από επεκτάσεις επίδειξης, στοιχεία και επεξεργαστές χρησιμοποιώντας το Apache NiFi.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Κατανοήστε την αρχιτεκτονική του NiFi και τις έννοιες ροής δεδομένων.
- Αναπτύξτε επεκτάσεις χρησιμοποιώντας NiFi και API τρίτων.
- Προσαρμοσμένα αναπτύσσουν τον δικό τους επεξεργαστή Apache Nifi.
- Απορροφήστε και επεξεργαστείτε δεδομένα σε πραγματικό χρόνο από διαφορετικές και ασυνήθιστες μορφές αρχείων και πηγές δεδομένων.
Apache Flink Fundamentals
28 HoursΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) εισάγει τις αρχές και τις προσεγγίσεις πίσω από την κατανεμημένη επεξεργασία δεδομένων ροής και παρτίδας και καθοδηγεί τους συμμετέχοντες στη δημιουργία μιας εφαρμογής ροής δεδομένων σε πραγματικό χρόνο στο Apache Flink.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Ρυθμίστε ένα περιβάλλον για την ανάπτυξη εφαρμογών ανάλυσης δεδομένων. Κατανοήστε πώς λειτουργεί η βιβλιοθήκη επεξεργασίας γραφικών του Apache Flink (Gelly). Συσκευάστε, εκτελέστε και παρακολουθήστε εφαρμογές ροής δεδομένων που βασίζονται σε Flink, ανεκτικές σε σφάλματα. Διαχειριστείτε διαφορετικούς φόρτους εργασίας. Εκτελέστε προηγμένες αναλύσεις. Ρυθμίστε ένα σύμπλεγμα Flink πολλαπλών κόμβων. Μετρήστε και βελτιστοποιήστε την απόδοση. Ενσωματώστε το Flink με διαφορετικά Big Data συστήματα. Συγκρίνετε τις δυνατότητες του Flink με εκείνες άλλων πλαισίων επεξεργασίας μεγάλων δεδομένων.
Python and Spark for Big Data (PySpark)
21 HoursΣε αυτή τη ζωντανή εκπαίδευση στο Ελλάδα, υπό την καθοδήγηση εκπαιδευτών, οι συμμετέχοντες θα μάθουν πώς να χρησιμοποιούν το Python και το Spark μαζί για να αναλύουν μεγάλα δεδομένα καθώς εργάζονται σε πρακτικές ασκήσεις.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Μάθετε πώς να χρησιμοποιείτε το Spark with Python για την ανάλυση Big Data.
- Εργαστείτε σε ασκήσεις που μιμούνται πραγματικές περιπτώσεις.
- Χρησιμοποιήστε διαφορετικά εργαλεία και τεχνικές για την ανάλυση μεγάλων δεδομένων χρησιμοποιώντας το PySpark.
Introduction to Graph Computing
28 HoursΣε αυτήν τη ζωντανή εκπαίδευση στο Ελλάδα από εκπαιδευτές, οι συμμετέχοντες θα μάθουν για τις προσφορές τεχνολογίας και τις προσεγγίσεις υλοποίησης για την επεξεργασία δεδομένων γραφήματος. Ο στόχος είναι να εντοπιστούν αντικείμενα του πραγματικού κόσμου, τα χαρακτηριστικά και οι σχέσεις τους, στη συνέχεια να μοντελοποιηθούν αυτές οι σχέσεις και να επεξεργαστούν ως δεδομένα χρησιμοποιώντας μια προσέγγιση Graph Computing (γνωστή και ως Graph Analytics). Ξεκινάμε με μια ευρεία επισκόπηση και περιορίζουμε τα συγκεκριμένα εργαλεία καθώς προχωράμε σε μια σειρά περιπτωσιολογικών μελετών, πρακτικών ασκήσεων και ζωντανών αναπτύξεων.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Κατανοήστε πώς διατηρούνται και διασχίζονται τα δεδομένα γραφήματος.
- Επιλέξτε το καλύτερο πλαίσιο για μια δεδομένη εργασία (από βάσεις δεδομένων γραφημάτων έως πλαίσια επεξεργασίας παρτίδας.)
- Εφαρμόστε τα Hadoop, Spark, GraphX και Pregel για να πραγματοποιήσετε υπολογισμούς γραφημάτων παράλληλα σε πολλές μηχανές.
- Δείτε τα προβλήματα μεγάλων δεδομένων του πραγματικού κόσμου όσον αφορά τα γραφήματα, τις διαδικασίες και τις διαβάσεις.
Apache Spark MLlib
35 HoursΤο MLlib είναι η βιβλιοθήκη εκμάθησης μηχανών Spark (ML). Σκοπός του είναι να κάνει την πρακτική εκμάθηση μηχανών κλιμακωτή και εύκολη. Αποτελείται από κοινούς αλγόριθμους και βοηθητικά προγράμματα μάθησης, συμπεριλαμβανομένης της ταξινόμησης, της παλινδρόμησης, της ομαδοποίησης, του συνεργατικού φιλτραρίσματος, της μείωσης των διαστάσεων, καθώς και των πρωτόγονων βελτιστοποίησης χαμηλότερου επιπέδου και των API αγωγών υψηλότερου επιπέδου.
Διαχωρίζεται σε δύο πακέτα:
Το spark.mllib περιέχει το αρχικό API που είναι ενσωματωμένο στο RDD.
Το spark.ml παρέχει API υψηλότερου επιπέδου που είναι ενσωματωμένο στο DataFrames για την κατασκευή αγωγών ML.
Κοινό
Αυτό το μάθημα απευθύνεται σε μηχανικούς και προγραμματιστές που επιδιώκουν να χρησιμοποιήσουν μια ενσωματωμένη βιβλιοθήκη μηχανών για Apache Spark