Course Outline

Ανάλυση θεμάτων σε καθημερινή βάση: (Κάθε συνεδρία είναι 2 ώρες)

Day-1: Session -1: Business Overview of Why Big Data Business Intelligence στην Telco.

    Περιπτωσιολογικές μελέτες από την T-Mobile, την Verizon κ.λπ. Ποσοστό προσαρμογής μεγάλων δεδομένων στην Τηλεπικοινωνιακή εταιρεία Βόρειας Αμερικής και πώς ευθυγραμμίζουν το μελλοντικό επιχειρηματικό τους μοντέλο και λειτουργία γύρω από το Big Data BI ευρείας κλίμακας Application Area Network and Service Customer Churn Management Data Integration & Οπτικοποίηση πίνακα ελέγχου Διαχείριση απάτης Δημιουργία επιχειρηματικών κανόνων Δημιουργία προφίλ πελατών Τοπική προώθηση διαφημίσεων

Day-1: Session-2 : Εισαγωγή του Big Data-1

    Κύρια χαρακτηριστικά των Big Data-όγκος, ποικιλία, ταχύτητα και ακρίβεια. Αρχιτεκτονική MPP για όγκο. Αποθήκες δεδομένων – στατικό σχήμα, αργά εξελισσόμενες βάσεις δεδομένων MPP δεδομένων όπως Greenplum, Exadata, Teradata, Netezza, Vertica κ.λπ. Λύσεις που βασίζονται στο Hadoop – δεν υπάρχουν προϋποθέσεις για τη δομή του συνόλου δεδομένων. Τυπικό μοτίβο : HDFS, MapReduce (crch), ανάκτηση από HDFS Batch κατάλληλο για αναλυτικό/μη αλληλεπιδραστικό όγκο: CEP ροή δεδομένων Τυπικές επιλογές – προϊόντα CEP (π.χ. Infostreams, Apama, MarkLogic κ.λπ.) Λιγότερη έτοιμη παραγωγή – Storm/S4 NoSQL Databass – (στήλη και κλειδί-τιμή): Ταιριάζει καλύτερα ως αναλυτικό συμπλήρωμα σε αποθήκη δεδομένων/βάση δεδομένων

Ημέρα-1 : Συνεδρία -3 : Εισαγωγή στο Big Data-2

ΌχιSQL λύσεις

    KV Store - Keyspace, Flare, SchemaFree, RAMCloud, Oracle NoSQL Database (OnDB) KV Store - Dynamo, Voldemort, Dynomite, SubRecord, Mo8onDb, DovetailDB KV Store (Ιεραρχικό) - GT.m, Cache KV Store (TokyoTyr, Orderant) Lightcloud, NMDB, Luxio, MemcacheDB, Actord KV Cache - Memcached, Repcached, Coherence, Infinispan, EXtremeScale, JBossCache, Velocity, Terracoqua Tuple Store - Gigaspaces, Coord, Apache River Object DatabaseB,Dlouch,Douch,DouchD0 , Couchbase, MongoDB, Jackrabbit, XML-Βάσεις δεδομένων, ThruDB, CloudKit, Prsevere, Riak-Basho, Scalaris Wide Columnar Store - BigTable, HBase, Apache Cassandra, Hypertable, KAI, OpenNeptune, Qbase, KDI

Ποικιλίες Δεδομένων: Εισαγωγή στο τεύχος Data Cleaning στα Μεγάλα Δεδομένα

    RDBMS – στατική δομή/σχήμα, δεν προωθεί ευέλικτο, εξερευνητικό περιβάλλον. ΌχιSQL – ημιδομημένη, αρκετή δομή για αποθήκευση δεδομένων χωρίς ακριβές σχήμα πριν από την αποθήκευση δεδομένων Ζητήματα καθαρισμού δεδομένων

Day-1 : Session-4 : Big Data Introduction-3 : Hadoop

    Πότε να επιλέξετε Hadoop; ΔΟΜΗΜΕΝΑ - Οι αποθήκες/βάσεις δεδομένων των επιχειρήσεων μπορούν να αποθηκεύσουν τεράστια δεδομένα (με κόστος), αλλά επιβάλλουν δομή (δεν είναι καλή για ενεργή εξερεύνηση) ΗΜΙΔΟΜΗΜΕΝΑ δεδομένα – δύσκολα με παραδοσιακές λύσεις (DW/DB) Δεδομένα αποθήκευσης = ΤΕΡΑΣΤΙΑ προσπάθεια και στατική ακόμα και μετά υλοποίηση Για ποικιλία και όγκο δεδομένων, κομμένα στο υλικό εμπορευμάτων – το HADOOP Commodity H/W απαιτείται για τη δημιουργία ενός Hadoop Cluster

Εισαγωγή στο Map Reduce /HDFS

    MapReduce – διανομή υπολογιστών σε πολλούς διακομιστές HDFS – καθιστούν διαθέσιμα δεδομένα τοπικά για τη διαδικασία υπολογισμού (με πλεονασμό) Δεδομένα – μπορεί να είναι αδόμητα/χωρίς σχήματα (σε αντίθεση με το RDBMS) Ευθύνη προγραμματιστή να κατανοήσει τα δεδομένα Programming MapReduce = εργασία με Java ( πλεονεκτήματα/μειονεκτήματα), μη αυτόματη φόρτωση δεδομένων στο HDFS

Day-2: Session-1.1: Spark : In Memory κατανεμημένη βάση δεδομένων

    Τι είναι η επεξεργασία «Στη μνήμη»; Spark SQL Spark SDK Spark API RDD Spark Lib Hanna Πώς να μετεγκαταστήσετε ένα υπάρχον σύστημα Hadoop στο Spark

Ημέρα-2 Συνεδρία -1.2: Καταιγίδα -Επεξεργασία σε πραγματικό χρόνο σε Big Data

    Τοπολογίες Streams Sprouts Bolts

Day-2: Session-2: Big Data Management Σύστημα

    Κινούμενα μέρη, υπολογιστικοί κόμβοι εκκίνηση/αποτυχία :ZooKeeper - Για υπηρεσίες διαμόρφωσης/συντονισμού/ονομασίας Σύνθετη γραμμή αγωγών/ροής εργασίας: Oozie – διαχείριση ροής εργασιών, εξαρτήσεων, αλυσίδας μαργαρίτας Ανάπτυξη, διαμόρφωση, διαχείριση συμπλέγματος, αναβάθμιση κ.λπ. (διαχειριστής sys) :Ambari στο Cloud: Εργαλεία πλατφόρμας Whirr Evolving Big Data για την παρακολούθηση ζητημάτων εφαρμογής επιπέδου ETL

Ημέρα-2: Περίοδος-3: Προγνωστικά αναλυτικά στοιχεία στο Business Intelligence -1: Θεμελιώδεις τεχνικές και μηχανική μάθηση BI :

    Εισαγωγή στη μηχανική μάθηση Τεχνικές ταξινόμησης μάθησης Bayesian Πρόβλεψη-προετοιμασία αρχείου εκπαίδευσης Markov τυχαίο πεδίο Εποπτευόμενη και χωρίς επίβλεψη μάθηση Εξαγωγή λειτουργιών Υποστήριξη Διάνυσμα Μηχανικό νευρωνικό δίκτυο Ενίσχυση εκμάθησης Big Data πρόβλημα μεγάλης μεταβλητής - Τυχαίο δάσος (RF) Εκμάθηση αναπαράστασης Βαθιά μάθηση Big Data Πρόβλημα αυτοματισμού – Σύνολο πολλαπλών μοντέλων RF Αυτοματισμός μέσω Soft10-M LDA και μοντελοποίησης θεμάτων Agile learning Agent based learning- Παράδειγμα από τη λειτουργία Telco Κατανεμημένη μάθηση –Παράδειγμα από τη λειτουργία Telco Εισαγωγή στα Εργαλεία ανοιχτού κώδικα για προγνωστικές αναλύσεις: R, Rapidminer, Mahut Πιο κλιμακωτό Αναλυτικό- Εργαστήριο Apache Hama, Spark και CMU Graph

Ημέρα-2: Συνεδρία-4 Οικοσύστημα προγνωστικής ανάλυσης-2: Κοινά προβλήματα πρόβλεψης αναλυτικής ανάλυσης στο Telecom

    Insight analytic Αναλυτική οπτικοποίηση Δομημένη προγνωστική αναλυτική Μη δομημένη πρόβλεψη αναλυτική Προφίλ πελάτη Σύσταση Ανίχνευσης μοτίβων κινητήρα Ανακάλυψη κανόνα/σεναρίου – αποτυχία, απάτη, βελτιστοποίηση Ανακάλυψη ρίζας Ανάλυση συναισθήματος Αναλυτική ανάλυση δικτύου CRM Αναλυτική τεχνολογία ανάλυσης κειμένου υποβοηθούμενη αναθεώρηση Real Time Analy Analytic Analytics

Ημέρα 3 : Συνεδρία 1 : Αναλυτική λειτουργία δικτύου - ανάλυση βασικών αιτιών αστοχιών δικτύου, διακοπή υπηρεσίας από μεταδεδομένα, IPDR και CRM:

    Χρήση CPU Χρήση μνήμης QoS Ουρά Χρήση συσκευής Σφάλμα διεπαφής θερμοκρασίας Εκδόσεις IoS Συμβάντα δρομολόγησης Παραλλαγές λανθάνοντος χρόνου Αναλυτικά στοιχεία καταγραφής δεδομένων Προσομοίωση φόρτου απώλειας πακέτων Συμπερασματικά τοπολογία Όριο απόδοσης Συσκευή παγιδεύει IPDR ( λεπτομερής εγγραφή IP) συλλογή και επεξεργασία Χρήση δεδομένων IPDR κατανάλωσης για Συνδρομητή εύρος ζώνης , κατάσταση μόντεμ και διαγνωστικές πληροφορίες HFC

Ημέρα-3: Συνεδρία-2: Εργαλεία για ανάλυση αποτυχίας υπηρεσίας δικτύου:

    Πίνακας εργαλείων σύνοψης δικτύου: παρακολουθήστε τις συνολικές αναπτύξεις δικτύου και παρακολουθήστε τους βασικούς δείκτες απόδοσης του οργανισμού σας Πίνακας ελέγχου περιόδου αιχμής: κατανοήστε τις τάσεις της εφαρμογής και των συνδρομητών που οδηγούν στη χρήση αιχμής, με ευκρίνεια για συγκεκριμένη τοποθεσία. πλήρης κατανόηση των σχέσεων διασύνδεσης και διαμετακόμισης Πίνακας ελέγχου σε πραγματικό χρόνο ψυχαγωγίας: μετρήσεις πρόσβασης που έχουν σημασία, συμπεριλαμβανομένων των προβολών βίντεο, της διάρκειας και της ποιότητας εμπειρίας βίντεο (QoE) Πίνακας ελέγχου μετάβασης IPv6: διερευνήστε τη συνεχιζόμενη υιοθέτηση του IPv6 στο δίκτυό σας και αποκτήστε πληροφορίες για οι εφαρμογές και οι συσκευές που οδηγούν τις τάσεις Μελέτη περίπτωσης-1: The Alcatel-Lucent Big Network Analytics (BNA) Data Miner Πολυδιάστατη ευφυΐα για φορητές συσκευές (m.IQ6)

Ημέρα 3: Συνεδρία 3: Big Data BI για Marketing/Πωλήσεις – Κατανόηση των πωλήσεων/μάρκετινγκ από δεδομένα πωλήσεων: (Όλα αυτά θα εμφανίζονται με μια ζωντανή προγνωστική αναλυτική επίδειξη)

    Για τον εντοπισμό πελατών υψηλότερης ταχύτητας Για τον εντοπισμό πελατών για ένα δεδομένο προϊόν Για τον προσδιορισμό του σωστού συνόλου προϊόντων για έναν πελάτη ( Μηχανή σύστασης) Τεχνική τμηματοποίησης αγοράς Τεχνική πολλαπλών πωλήσεων και ανωπωλήσεων Τεχνική τμηματοποίησης πελατών Τεχνική πρόβλεψης εσόδων από πωλήσεις

Ημέρα 3: Συνεδρία 4: Απαιτείται BI για το γραφείο CFO της Telco:

    Επισκόπηση των εργασιών του Analytics που απαιτούνται σε ένα γραφείο CFO Ανάλυση κινδύνου για νέες επενδύσεις Έσοδα, πρόβλεψη κερδών Πρόβλεψη απόκτησης νέων πελατών Πρόβλεψη ζημιών Αναλυτική απάτη στα οικονομικά (λεπτομέρειες επόμενη συνεδρία )

Ημέρα 4 : Περίοδος 1: BI πρόληψης απάτης από το Big Data στην ανάλυση Τηλεφωνικής απάτης:

    Διαρροή εύρους ζώνης / Απάτη κατά εύρους ζώνης Απάτη προμηθευτή/υπέρβαση χρέωσης για έργα Απάτες επιστροφής χρημάτων πελατών/απαιτήσεις Απάτες αποζημίωσης ταξιδιωτικών

Ημέρα-4 : Συνεδρία-2: Από την πρόβλεψη αναδόμησης έως την πρόληψη ανατροπής:

    3 Τύποι Churn : Ενεργός/Εσκεμμένος, Περιστροφικός/Τυχαίος, Παθητικός ακούσιος 3 Ταξινόμηση μεταβλητών CRM: Συνολική, Κρυφή, μερική κατανόηση Μεταβλητές CRM για απόσπαση Συλλογή δεδομένων συμπεριφοράς πελατών Συλλογή δεδομένων αντίληψης πελατών Συλλογή δεδομένων δημογραφικών πελατών Συλλογή δεδομένων δημογραφικών πελατών Καθαρισμός δεδομένων CRM μη δομημένου CRM ( κλήση πελατών, εισιτήρια, email) και τη μετατροπή τους σε δομημένα δεδομένα για την ανάλυση Churn Social Media CRM-νέος τρόπος εξαγωγής δείκτη ικανοποίησης πελατών Μελέτη περίπτωσης-1 : T-Mobile ΗΠΑ: Μείωση Churn κατά 50%

Ημέρα-4: Συνεδρία-3: Πώς να χρησιμοποιήσετε την προγνωστική ανάλυση για την ανάλυση της βασικής αιτίας της δυσαρέσκειας των πελατών:

    Μελέτη περίπτωσης -1 : Σύνδεση της δυσαρέσκειας με ζητήματα – Λογιστικά, Μηχανικές αποτυχίες όπως διακοπή υπηρεσίας, κακή υπηρεσία εύρους ζώνης Μελέτη περίπτωσης-2: Big Data Πίνακας ελέγχου QA για παρακολούθηση του δείκτη ικανοποίησης πελατών από διάφορες παραμέτρους όπως κλιμακώσεις κλήσεων, κρισιμότητα ζητημάτων, υπηρεσία σε εκκρεμότητα συμβάντα διακοπής κ.λπ.

Day-4: Session-4: Big Data Ταμπλό για γρήγορη πρόσβαση σε διάφορα δεδομένα και εμφάνιση:

    Ενσωμάτωση της υπάρχουσας πλατφόρμας εφαρμογών με Big Data Dashboard Διαχείριση μεγάλων δεδομένων Μελέτη περίπτωσης Big Data Dashboard: Tableau και Pentaho Χρησιμοποιήστε την εφαρμογή Big Data για να προωθήσετε το σύστημα παρακολούθησης διαφημίσεων βάσει τοποθεσίας και διαχείρισης

Ημέρα-5 : Συνεδρία-1: Πώς να δικαιολογήσετε την εφαρμογή Big Data BI σε έναν οργανισμό:

    Καθορισμός απόδοσης επένδυσης για Big Data υλοποίηση Μελέτες περιπτώσεων για εξοικονόμηση χρόνου αναλυτή για συλλογή και προετοιμασία δεδομένων – αύξηση του κέρδους παραγωγικότητας Μελέτες περίπτωσης κέρδους εσόδων από την απόρριψη πελατών Κέρδος εσόδων από διαφημίσεις βάσει τοποθεσίας και άλλες στοχευμένες διαφημίσεις Μια ολοκληρωμένη προσέγγιση υπολογιστικών φύλλων για τον υπολογισμό περίπου. δαπάνη έναντι κέρδους/εξοικονόμησης εσόδων από την εφαρμογή Big Data.

Ημέρα 5 : Περίοδος 2: Διαδικασία βήμα προς βήμα για την αντικατάσταση του παλαιού συστήματος δεδομένων στο Big Data Σύστημα:

    Κατανόηση του πρακτικού Big Data Χάρτη πορείας μετανάστευσης Ποιες είναι οι σημαντικές πληροφορίες που απαιτούνται πριν από την αρχιτεκτονική Big Data υλοποίηση Ποιοι είναι οι διαφορετικοί τρόποι υπολογισμού του όγκου, της ταχύτητας, της ποικιλίας και της ακρίβειας των δεδομένων Πώς να εκτιμήσετε την ανάπτυξη δεδομένων Μελέτες περιπτώσεων στο 2 Telco

Ημέρα 5: Συνεδρία 3 & 4: Έλεγχος Big Data προμηθευτών και αναθεώρηση των προϊόντων τους. Συνεδρία Q/A:

    AccentureAlcatel-Lucent Amazon –A9 APTEAN (Πρώην Λογισμικό CDC) Συστήματα Cisco Cloudera Dell EMC GoodData Corporation Guavus Hitachi Data Systems Hortonworks Huawei HP IBM Informatica Intel Jaspersoft Microsoft MongoDB (Πρώην 10Gen) MU Λογισμικό Πληροφορικής Analytics Salesforce SAP SAS Institute Sisense Software AG/Terracotta Soft10 Automation Splunk Sqrrl Supermicro Tableau Software Teradata Think Big Analytics Tidemark Systems VMware (Μέρος του EMC)

Requirements

  • Θα πρέπει να έχουν βασικές γνώσεις για τη λειτουργία των επιχειρήσεων και τα συστήματα δεδομένων στο Telecom στον τομέα τους
  • Πρέπει να έχει βασική κατανόηση της SQL/Oracle ή της σχεσιακής βάσης δεδομένων
  • Βασική κατανόηση των στατιστικών (σε επίπεδα Excel)
  35 Hours
 

Number of participants


Starts

Ends


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Testimonials (3)

Related Courses

GPU Data Science with NVIDIA RAPIDS

  14 Hours

Anaconda Ecosystem for Data Scientists

  14 Hours

Data Analysis with Redash

  14 Hours

Business Intelligence and Data Analysis with Metabase

  14 Hours

Related Categories