Εξέλιξη Κομματιού

Αρχιτεκτονική Greenplum

  • Παράλληλη επεξεργασία και συμμετρική πολυεπεξεργασία (SMP)
  • Ρόλοι των κομβών και διαμόρφωση συστήματος χάρακας (cluster)
  • Κλίμακα ανάπτυξης και μετακίνηση δεδομένων
  • Αρχιτεκτονική Data Warehouse του Greenplum

Δομές Ταμπλό Greenplum

  • Κατανεμημένα σε αντίθεση με τυχαία ανάθεση ταμπλό
  • Ταμπλό Heap vs. append-only (μόνο προσθήκη)
  • Δομές αποθήκευσης σε γραμμές (row) και στήλες (columnar)
  • Κατανεμημένα και συσχετισμένα ταμπλό

Κατανομή Δεδομένων και Hashing (Τριγωνομετρική Συνάρτηση)

  • Λογική του hashing και διακλαδώσεις (distribution keys)
  • Διαχείριση εξατονισμού (skew) και επιπτυττόμενο ανάκτησης στην παραδοσιακή διαδικασία
  • Χάρτες (maps) hashing και συνθήματα τοποθέτησης γραμμών (row placement strategies)

Δείκτες και Βελτιστοποίηση Απόδοσης

  • Συσχετισμένοι (clustered) και μη συσχετισμένοι (non-clustered) δείκτες
  • Χρήσεις B-tree και bitmap δεικτών
  • Διαδίκαση ανάμεσα σε δείκτες (index scan) και συμπεριφορά αποθήκευσης

Φυσική Σχεδίαση Βάσης Δεδομένων (Database)

  • Κανονικοποίηση και σχεδιασμός λογικού μοντέλου (logical model design)
  • Συμβουλές για πρόσβαση χρηστών και ανάλυση διακλαδώσεων (distribution analysis)
  • Συμπεριφορά δεδομένων και αποφάσεις για δείκτες (indexing decisions)

Τεχνικές Απονόρμωσης (Denormalization)

  • Παράγοντας δεδομένων, αποσυνθέτα ταμπλό και προ-σύνθεση (pre-joins)
  • Ταμπλό στήλων ως κάθετη διαίρεση (vertical partitioning)
  • Data marts και προσοχές θεώρημα (materialized views)

Προχωρημένο SQL και Εκτέλεση Απορρόφησης (Query Execution)

  • Συνδυασμοί (join strategies) και επανδιανεμημένη ανάθεση (redistribution)
  • OLAP και πλατωνικές συναρτήσεις (window functions)
  • Προσωρινά ταμπλό, υποερωτήματα και προκυμηγμένα (derived tables) ταμπλό

Εκθέσεις EXPLAIN και Ανάκτηση Ανάρτησης (Query Tuning)

  • Διαβάζοντας και ερμηνεύοντας τους EXPLAIN output
  • Ανάλυση κόστους (cost analysis) και βελτιστοποίηση προγράμματος (plan optimization)
  • Κίνηση συνδυασμών και τοπικές επιχειρήματα σε κλάσμα (segment-local operations)

Εργαλεία Greenplum και Κανόνες Συμπεριφοράς (Best Practices)

  • ANALYZE και VACUUM
  • Φόρτωση δεδομένων και μετακίνηση σε Nexus (data loading and movement)
  • Ασφάλεια, δικαιώματα πρόσβασης και βελτιστοποίηση απόδοσης (performance tips)

Περίληψη και επόμενα βήματα (Summary and Next Steps)

Απαιτήσεις

  • Ένας κατανοητικός ρυθμός για σχέσεις βάσεων δεδομένων και SQL
  • Εμπειρία με data warehousing ή αναλυτικά συστήματα
  • Γνώση των εντολών γραμμής εντολών Linux

Ακροατήριο

  • Αρχιτέκτονες και μηχανικοί δεδομένων
  • Διαχειριστές βάσεων δεδομένων και τεχνικοί ηγέτες
  • BI εξελιγμένοι αναπτυξευόντες και εξειδικευμένοι σε Greenplum
 21 Ώρες

Αριθμός συμμετέχοντων


Τιμή ανά συμμετοχαστή

Σχόλια (1)

Εφεξής Μαθήματα

Σχετικές Κατηγορίες