Course Outline

Εισαγωγή

    Κατανόηση της σημασίας της προετοιμασίας δεδομένων στην ανάλυση και τη μηχανική μάθηση Διοχέτευση προετοιμασίας δεδομένων και του ρόλου της στον κύκλο ζωής δεδομένων Διερεύνηση κοινών προκλήσεων στα ακατέργαστα δεδομένα και τον αντίκτυπο στην ανάλυση

Συλλογή και απόκτηση δεδομένων

    Πηγές δεδομένων: βάσεις δεδομένων, API, υπολογιστικά φύλλα, αρχεία κειμένου και άλλα Τεχνικές για τη συλλογή δεδομένων και τη διασφάλιση της ποιότητας δεδομένων κατά τη συλλογή Συλλογή δεδομένων από διάφορες πηγές

Data Cleaning Τεχνικές

    Προσδιορισμός και χειρισμός τιμών που λείπουν, ακραίες τιμές και ασυνέπειες Αντιμετώπιση διπλότυπων και σφαλμάτων στο σύνολο δεδομένων Καθαρισμός συνόλων δεδομένων πραγματικού κόσμου

Μετασχηματισμός και Τυποποίηση Δεδομένων

    Τεχνικές κανονικοποίησης και τυποποίησης δεδομένων Κατηγορικός χειρισμός δεδομένων: κωδικοποίηση, δέσμευση και μηχανική χαρακτηριστικών Μετατροπή ακατέργαστων δεδομένων σε χρησιμοποιήσιμες μορφές

Data Integration και Συνάθροιση

    Συγχώνευση και συνδυασμός συνόλων δεδομένων από διαφορετικές πηγές Επίλυση διενέξεων δεδομένων και ευθυγράμμιση τύπων δεδομένων Τεχνικές για συγκέντρωση και ενοποίηση δεδομένων

Data Quality Διασφάλιση

    Μέθοδοι για τη διασφάλιση της ποιότητας και της ακεραιότητας των δεδομένων σε όλη τη διαδικασία Εφαρμογή ποιοτικών ελέγχων και διαδικασιών επικύρωσης Μελέτες περιπτώσεων και πρακτικές εφαρμογές διασφάλισης ποιότητας δεδομένων

Μείωση διαστάσεων και επιλογή χαρακτηριστικών

    Κατανόηση της ανάγκης για μείωση διαστάσεων Τεχνικές όπως PCA, επιλογή χαρακτηριστικών και στρατηγικές μείωσης Εφαρμογή τεχνικών μείωσης διαστάσεων

Περίληψη και Επόμενα Βήματα

Requirements

    Βασική κατανόηση των εννοιών δεδομένων

Ακροατήριο

    Αναλυτές δεδομένων Database διαχειριστές επαγγελματίες πληροφορικής
 14 Hours

Number of participants



Price per participant

Testimonials (2)

Related Courses

How to Audit GDPR Compliance

14 Hours

Talend Data Stewardship

14 Hours

Pimcore PIM/MDM

21 Hours

Related Categories