Course Outline

Εισαγωγή

Επισκόπηση του Data Cleaning

    Γιατί είναι σημαντικό το Data Cleaning;

Μελέτη περίπτωσης: Όταν το Big Data είναι βρώμικο

Ανάπτυξη μιας διεξοδικής Data Cleaning στρατηγικής

Κοινά Data Cleaning Εργαλεία

    Drake OpenRefine Pandas (για Python) Dplyr (για R)

Επίτευξη υψηλής ακεραιότητας δεδομένων

    Πλήρης Σωστός Ακριβής Σχετικός Συνεπής

Αυτοματοποίηση της διαδικασίας Data Cleaning

Παρακολούθηση του συστήματος Data Cleaning σας

Περίληψη και Συμπέρασμα

Requirements

  • Κατανόηση των εννοιών της ανάλυσης δεδομένων.

Ακροατήριο

  • Επιστήμονες Δεδομένων
  • Αναλυτές Δεδομένων
  • Business Αναλυτές
  7 Hours
 

Number of participants


Starts

Ends


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Testimonials (2)

Related Courses

Apache Arrow for Data Analysis across Disparate Data Sources

  14 Hours

Azure for Data Engineer

  35 Hours

A Practical Introduction to Data Analysis and Big Data

  35 Hours

Data and Analytics - from the ground up

  42 Hours

Scaling Data Analysis with Python and Dask

  14 Hours

Data Analysis for Marketers

  14 Hours

Datameer for Data Analysts

  14 Hours

A Practical Introduction to Data Science

  35 Hours

Dremio for Self-Service Data Analysis

  21 Hours

Related Categories