Course Outline
Εισαγωγή
Εγκατάσταση και διαμόρφωση του Dataiku Data Science Studio (DSS)
- Απαιτήσεις συστήματος για Dataiku DSS Ρύθμιση Apache Hadoop και ενσωματώσεις Apache Spark Ρύθμιση παραμέτρων Dataiku DSS με web proxies Μετάβαση από άλλες πλατφόρμες στο Dataiku DSS
Επισκόπηση των χαρακτηριστικών και της αρχιτεκτονικής του Dataiku DSS
- Βασικά αντικείμενα και γραφήματα βασικά στο Dataiku DSS Τι είναι μια συνταγή στο Dataiku DSS; Τύποι συνόλων δεδομένων που υποστηρίζονται από Dataiku DSS
Δημιουργία έργου Dataiku DSS
Ορισμός συνόλων δεδομένων για σύνδεση με πόρους δεδομένων στο Dataiku DSS
- Εργασία με υποδοχές DSS και μορφές αρχείων Τυπικές μορφές DSS έναντι ειδικών μορφών Hadoop Μεταφόρτωση αρχείων για ένα έργο Dataiku DSS
Επισκόπηση του συστήματος αρχείων διακομιστή στο Dataiku DSS
Δημιουργία και χρήση διαχειριζόμενων φακέλων
- Συνταγή Dataiku DSS για συγχώνευση φακέλων Τοπικοί έναντι μη τοπικών διαχειριζόμενων φακέλων
Δημιουργία συνόλου δεδομένων συστήματος αρχείων με χρήση περιεχομένων διαχειριζόμενων φακέλων
- Εκτέλεση καθαρισμών με συνταγή κωδικού DSS
Εργασία με το σύνολο δεδομένων Metrics και το Internal Stats Dataset
Εφαρμογή της συνταγής λήψης DSS για το σύνολο δεδομένων HTTP
Μετατόπιση συνόλων δεδομένων SQL και συνόλων δεδομένων HDFS με χρήση DSS
Παραγγελία συνόλων δεδομένων στο Dataiku DSS
- Παραγγελία συγγραφέα έναντι παραγγελίας χρόνου ανάγνωσης
Εξερεύνηση και προετοιμασία οπτικών δεδομένων για ένα έργο Dataiku DSS
Επισκόπηση των σχημάτων Dataiku, των τύπων αποθήκευσης και των σημασιών
Εκτέλεση σεναρίων καθαρισμού, κανονικοποίησης και εμπλουτισμού δεδομένων στο Dataiku DSS
Εργασία με τη διεπαφή γραφημάτων Dataiku DSS και τους τύπους οπτικών συναθροίσεων
Χρησιμοποιώντας τη δυνατότητα διαδραστικής Statistics του DSS
- Ανάλυση μονομεταβλητής έναντι ανάλυσης διμεταβλητών Χρήση του εργαλείου DSS ανάλυσης κύριου στοιχείου (PCA)
Επισκόπηση του Machine Learning με Dataiku DSS
- Εποπτευόμενη ML έναντι μη εποπτευόμενης Αναφορές ML για αλγόριθμους DSS ML και χειρισμό χαρακτηριστικών Deep Learning με Dataiku DSS
Επισκόπηση της ροής που προέρχεται από σύνολα δεδομένων και συνταγές DSS
Μετασχηματισμός υπαρχόντων συνόλων δεδομένων σε DSS με οπτικές συνταγές
Χρήση συνταγών DSS με βάση κώδικα που καθορίζεται από το χρήστη
Βελτιστοποίηση Εξερεύνησης και Πειραματισμού Κώδικα με Σημειωματάρια Κώδικα DSS
Σύνταξη προηγμένων οπτικοποιήσεων DSS και προσαρμοσμένων δυνατοτήτων διεπαφής με εφαρμογές Web
Εργασία με τη δυνατότητα Dataiku DSS Code Reports
Κοινή χρήση έργου δεδομένων Element και εξοικείωση με τον πίνακα ελέγχου DSS
Σχεδιασμός και συσκευασία ενός έργου Dataiku DSS ως επαναχρησιμοποιήσιμης εφαρμογής
Επισκόπηση Προηγμένων Μεθόδων στο Dataiku DSS
- Υλοποίηση βελτιστοποιημένης κατάτμησης συνόλων δεδομένων με χρήση DSS Εκτέλεση συγκεκριμένων τμημάτων επεξεργασίας DSS μέσω υπολογισμών σε Kubernetes κοντέινερ
Επισκόπηση του Collaboration και Έλεγχος έκδοσης στο Dataiku DSS
Εφαρμογή σεναρίων αυτοματισμού, μετρήσεων και ελέγχων για δοκιμές έργου DSS
Ανάπτυξη και ενημέρωση ενός έργου με τον κόμβο και τα πακέτα αυτοματισμού DSS
Εργασία με API σε πραγματικό χρόνο στο Dataiku DSS
- Πρόσθετα API και Rest API στο DSS
Ανάλυση και Forecasting Dataiku DSS Time Series
Εξασφάλιση έργου στο Dataiku DSS
- Διαχείριση αδειών έργου και εξουσιοδοτήσεων πίνακα ελέγχου Εφαρμογή προηγμένων επιλογών ασφαλείας
Ενσωμάτωση Dataiku DSS με το Cloud
Αντιμετώπιση προβλημάτων
Περίληψη και Συμπέρασμα
Requirements
- Εμπειρία με γλώσσες προγραμματισμού Python, SQL και R
- Βασικές γνώσεις επεξεργασίας δεδομένων με Apache Hadoop και Spark
- Κατανόηση εννοιών μηχανικής μάθησης και μοντέλων δεδομένων
- Ιστορικό σε στατιστικές αναλύσεις και έννοιες της επιστήμης δεδομένων
- Εμπειρία οπτικοποίησης και επικοινωνίας δεδομένων
Ακροατήριο
- Μηχανικοί
- Επιστήμονες Δεδομένων
- Αναλυτές Δεδομένων