Course Outline

spark.mllib: τύποι δεδομένων, αλγόριθμοι και βοηθητικά προγράμματα

    Τύποι δεδομένων Βασικές στατιστικές συνοπτικές στατιστικές συσχετίσεις στρωματοποιημένη δειγματοληψία υπόθεση έλεγχος ροής έλεγχος σημασίας δοκιμή τυχαίας δημιουργίας δεδομένων
Ταξινόμηση και γραμμικά μοντέλα παλινδρόμησης (SVMs, λογιστική παλινδρόμηση, γραμμική παλινδρόμηση)
  • αφελής Bayes
  • δέντρα απόφασης
  • σύνολα δέντρων (Random Forests και δέντρα ενισχυμένα με κλίση)
  • ισοτονική παλινδρόμηση
  • Συνεργατικό φιλτράρισμα εναλλασσόμενων ελαχίστων τετραγώνων (ALS)
  • Ομαδοποίηση k-means
  • Gaussian μείγμα
  • ομαδοποίηση επανάληψης ισχύος (PIC)
  • λανθάνουσα κατανομή Dirichlet (LDA)
  • διχοτόμηση k-means
  • streaming k-means
  • Αποσύνθεση μοναδικής τιμής μείωσης διαστάσεων (SVD)
  • ανάλυση κύριου συστατικού (PCA)
  • Εξαγωγή και μετασχηματισμός χαρακτηριστικών
  • Συχνή ανάπτυξη προτύπων εξόρυξης FP
  • κανόνες ένωσης
  • PrefixSpan
  • Μετρήσεις αξιολόγησης
  • Εξαγωγή μοντέλου PMML
  • Βελτιστοποίηση (προγραμματιστής) στοχαστική κλίση κάθοδος
  • περιορισμένης μνήμης BFGS (L-BFGS)
  • spark.ml: API υψηλού επιπέδου για αγωγούς ML
  • Επισκόπηση: εκτιμητές, μετασχηματιστές και αγωγοί Εξαγωγή, μετασχηματισμός και επιλογή χαρακτηριστικών Ταξινόμηση και παλινδρόμηση Ομαδοποίηση Προχωρημένων θεμάτων

    Requirements

    Γνώση ενός από τα ακόλουθα:

    • Ιάβα
    • Scala
    • Πύθων
    • SparkR.
     35 Hours

    Number of participants



    Price per participant

    Testimonials (1)

    Related Courses

    Big Data Analytics in Health

    21 Hours

    Hadoop and Spark for Administrators

    35 Hours

    A Practical Introduction to Stream Processing

    21 Hours

    Magellan: Geospatial Analytics on Spark

    14 Hours

    Apache Spark for .NET Developers

    21 Hours

    Scaling Data Pipelines with Spark NLP

    14 Hours

    Python, Spark, and Hadoop for Big Data

    21 Hours

    Related Categories