Course Outline

Εισαγωγή

    Οι Data Science Ρόλοι και οι ευθύνες της διαδικασίας ενός Επιστήμονα Δεδομένων

Προετοιμασία Αναπτυξιακού Περιβάλλοντος

    Βιβλιοθήκες, πλαίσια, γλώσσες και εργαλεία Τοπική ανάπτυξη Συνεργατική ανάπτυξη μέσω web

Συλλογή δεδομένων

    Διαφορετικοί τύποι τοπικών βάσεων δεδομένων δομημένων δεδομένων Συνδέσεις βάσεων δεδομένων Συνήθεις μορφές: xlxs, XML, Json, csv, ...
Μη δομημένα κλικ, λογοκριτές, smartphone
  • API
  • Internet of Things (IoT)
  • Έγγραφα, εικόνες, βίντεο, ήχοι
  • Μελέτη περίπτωσης: Συλλογή μεγάλων ποσοτήτων αδόμητων δεδομένων συνεχώς
  • Αποθήκευση δεδομένωνΣχεσιακές βάσεις δεδομένων Μη σχεσιακές βάσεις δεδομένων Hadoop: Distributed File System (HDFS) Spark: Resilient Distributed Dataset (RDD) Cloud storage
  • Προετοιμασία Δεδομένων
  • Απορρόφηση, επιλογή, καθαρισμός και μετασχηματισμός Διασφάλιση ποιότητας δεδομένων - ορθότητα, σημασία και ασφάλεια Αναφορές εξαίρεσης

      Languages χρησιμοποιείται για την προετοιμασία, την επεξεργασία και την ανάλυση

    Γλώσσα R Εισαγωγή στο R Χειρισμός δεδομένων, υπολογισμός και γραφική απεικόνιση

      Python Εισαγωγή στο Python

    Χειρισμός, επεξεργασία, καθαρισμός και σύνθλιψη δεδομένων

      Αναλύσεις δεδομένων
    Διερευνητική ανάλυση Βασικά στατιστικά στοιχεία Προσχέδια οπτικοποιήσεις Κατανόηση δεδομένων
  • Αιτιότητα
  • Χαρακτηριστικά και μεταμορφώσεις
  • Machine Learning Εποπτευόμενος έναντι μη επιτηρούμενου

      Πότε να χρησιμοποιήσετε ποιο μοντέλο
    Natural Language Processing (NLP)
  • Data Visualization
  • Βέλτιστες πρακτικές Επιλογή του σωστού γραφήματος για τα σωστά δεδομένα Παλέτες χρωμάτων Μεταφορά στο επόμενο επίπεδο Πίνακες εργαλείων Διαδραστικές οπτικοποιήσεις
  • Αφήγηση με δεδομένα
  • Περίληψη και Συμπέρασμα
  • Requirements

    • Μια γενική κατανόηση των εννοιών της βάσης δεδομένων
    • Βασική κατανόηση της στατιστικής
     35 Hours

    Number of participants



    Price per participant

    Testimonials (2)

    Related Courses

    GPU Data Science with NVIDIA RAPIDS

    14 Hours

    Anaconda Ecosystem for Data Scientists

    14 Hours

    QGIS for Geographic Information System

    21 Hours

    Fluentd for Log Data Unification

    14 Hours

    Related Categories