Εξέλιξη Κομματιού
Εισαγωγή στο Apache Iceberg
- Γενική περίληψη του Apache Iceberg
- Ανασκόπηση βασικών εννοιών
Εξονυχτική ανάλυση του σχεδίου Iceberg
- Εξονυχτική ανάλυση του πίνακα των Iceberg
- Πλήρης επισκόπηση του σχεδίου, συμπεριλαμβανομένων των μετadados και του αρχείου layout
- Εσωτερική λεπτομέρεια σχηματογράφησης και εξέλιξης partitioning
Προχωρημένη εγκατάσταση και ρύθμιση
- Ρύθμιση του Iceberg για αποδοτική λειτουργία σε διάφορες περιβάλλοντα
- Ένσωμη αξιοποίηση με διάφορους εκδοχές επεξεργασίας δεδομένων
- Προχωρημένη ρύθμιση: ασφάλεια, κρυπτογράφηση και ελέγχους πρόσβασης
- Εγκατάσταση Iceberg σε κατανεμημένο περιβάλλον
Προχωρημένες λειτουργίες και διαχείριση
- Διαχείριση μεγάλων Iceberg πινάκων
- Εφαρμογή και διαχείριση περίπλοκων αλλαγών συστήματος τύπων (schema)
- Διαχείριση εξέλιξης partitioning και κρυφού partitioning
- Προχωρημένες CRUD λειτουργίες με αλλαγές συστήματος τύπων (schema) και partitioning
Τεχνικές βελτιστοποίησης querys
- Τεχνικές για μείωση του latency των queries
- Αποδότρικη αξιοποίηση partition pruning και file pruning
- Κεφαλίδες μετadados και στρατηγικές βελτιστοποίησης metadata
- Εφαρμογή και δοκιμή τεχνικών βελτιστοποίησης queries
Βελτιστοποίηση απόδοσης για μεγάλους datasets
- Βελτιστοποίηση της απόδοσης για μεγάλους datasets
- Χρήση ενδιαιτημάτων του Iceberg για βελτιστοποίηση απόδοσης
- Σε πρακτικές περιπτώσεις, μελέτες περιπτώσεων για βελτιστοποίηση απόδοσης σε πραγματικά χρησιμοποιήσεις
- Βελτιστοποίηση της απόδοσης για μεγάλους datasets
Προχωρημένη μεταφορά και ένσωμη αξιοποίηση δεδομένων
- Μεταφορά περίπλοκων δομών δεδομένων από άλλα συστήματα
- Ένσωμη αξιοποίηση του Iceberg με πραγματικές ροές δεδομένων (real-time data streams)
- Μεταφορά περίπλοκων datasets και ένσωμη αξιοποίηση real-time data streams
Αξιοπιστία και συνέχεια (consistency)
- Εγγύηση της συνέχειας και ακεραιότητας δεδομένων σε κατανεμημένα περιβάλλοντα
- Εφαρμογή και διαχείριση transactional guarantees (διασφαλισμένων συναλλαγών)
- Διαχείριση αποτυχιών και μηχανισμών ανάκαμψης (recovery mechanisms)
- Εφαρμογή λειτουργιών αξιοπιστίας και συνέχειας
Προχωρημένες λειτουργίες και προσαρμογή (customization)
- Εφαρμογή προσαρμοσμένων catalogs (καταλόγων)
- Έκταση του Iceberg με προσαρμοσμένες λειτουργίες (features)
- Εφαρμογή προσαρμοσμένων catalogs και έκταση των λειτουργιών Iceberg
Διαχείριση δεδομένων (data governance) και συμμόρφωση (compliance)
- Εφαρμογή πολιτικών διαχείρισης δεδομένων (data governance policies)
- Συμμόρφωση με κανονισμούς προστασίας δεδομένων (data regulations)
- Διαχείριση audit trails και data lineage (τυπολογία δεδομένων)
- Εφαρμογή λειτουργιών governance και compliance
Περίληψη και επόμενα βήματα
Απαιτήσεις
- Συνηθισμένος με τα βασικά χαρακτηριστικά, τις βασικές επιχειρήσεις και τη διαχείριση πινάκων Iceberg
Διευθύνοντας
- Διαχειριστές δεδομένων (Data Engineers)
- Αρχιτέκτονες δεδομένων (Data Architects)
- Αναλυτές δεδομένων (Data Analysts)
- Εφαρμογογράφοι λογισμικού (Software Developers)
Σχόλια (5)
Τα ζωντανά παραδείγματα
Ahmet Bolat - Accenture Industrial SS
Κομμάτι - Python, Spark, and Hadoop for Big Data
Μηχανική Μετάφραση
εξαιρετικά επικοινωνητικό...
Richard Langford
Κομμάτι - SMACK Stack for Data Science
Μηχανική Μετάφραση
Αρκετή πρακτική εμπειρία, ο καθηγητής είναι γνώστες
Chris Tan
Κομμάτι - A Practical Introduction to Stream Processing
Μηχανική Μετάφραση
Εξάπινα να μάθετε το Spark Streaming, Databricks και AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Κομμάτι - Apache Spark in the Cloud
Μηχανική Μετάφραση
πρακτικές εργασίες
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Κομμάτι - Python and Spark for Big Data (PySpark)
Μηχανική Μετάφραση