Programming με Big Data στο R Κομμάτι εκπαίδευσης
Το Big Data είναι ένα όρος που αναφέρεται σε λύσεις που προορίζονται για την αποθήκευση και επεξεργασία μεγάλων συνόλων δεδομένων. Αναπτύχθηκαν αρχικά από τη Google, αυτές οι λύσεις Big Data εξελίχθηκαν και έφεραν σε εμφάνιση άλλα παρόμοια έγχειρήματα, από τα οποία πολλά είναι διαθέσιμα ως open-source. Το R είναι μια δημοφιλής γλώσσα προγραμματισμού στη βιομηχανία των χρηματοπιστωτικών υπηρεσιών.
Εξέλιξη Κομματιού
Εισαγωγή στην Προγραμματισμό Μεγάλων Δεδομένων με R (bpdR)
- Ρύθμιση του περιβάλλοντός σας για τη χρήση bpdR
- Περιοχή και εργαλεία διαθέσιμα στο bpdR
- Εφαρμογές που χρησιμοποιούνται συχνά με Μεγάλα Δεδομένα και bpdR
Διεπαφή Παράδοσης Μηνυμάτων (MPI)
- Χρήση pbdR MPI 5
- Παράλληλη επεξεργασία
- Επικοινωνία πόντου-με-πόντο (point-to-point)
- Αποστολή Πινάκων
- Προσθήκη Πινάκων
- Συλλεκτική επικοινωνία
- Προσθήκη Πινάκων με Reduce
- Spread / Gather (Διάχυση/Συστολή)
- Άλλες επικοινωνίες MPI
Κατανεμημένοι Πίνακες
- Δημιουργία κατανεμημένου διαγώνιου πίνακα
- SVD ενός κατανεμημένου πίνακα
- Δημιουργία κατανεμημένου πίνακα σε παράλληλο τρόπο
Εφαρμογές Στατιστικής
- Μέθοδος Μοντε Κάρλω για την ολοκλήρωση
- Διάβασμα συνόλων δεδομένων
- Διάβασμα σε όλους τους διεργασίες
- Αποστολή από μία διεργασία
- Διάβασμα κατανεμημένων δεδομένων
- Κατανεμημένη παλινδρόμηση
- Κατανεμημένη βοηθούπειρος (Bootstrap)
Κομμάτια Εκπαίδευσης χρειάζονται 5+ συμμετέχοντες.
Programming με Big Data στο R Κομμάτι εκπαίδευσης - Κράτηση
Programming με Big Data στο R Κομμάτι εκπαίδευσης - Ζήτημα Συμβουλευτικής
Programming με Big Data στο R - Συμβουλευτική Αίτημα
Συμβουλευτική Αίτημα
Σχόλια (2)
The subject matter and the pace were perfect.
Tim - Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada
Κομμάτι - Programming with Big Data in R
Μηχανική Μετάφραση
Michael the trainer is very knowledgeable and skillful about the subject of Big Data and R. He is very flexible and quickly customize the training meeting clients' need. He is also very capable to solve technical and subject matter problems on the go. Fantastic and professional training!.
Xiaoyuan Geng - Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada
Κομμάτι - Programming with Big Data in R
Μηχανική Μετάφραση
Εφεξής Μαθήματα
Σχετικά Μαθήματα
Big Data Analytics με Google Colab και Apache Spark
14 ΏρεςΑυτή η εκπαιδευτική διάλεξη σε ζωντανό μέρος (σε πρόσωπο πρόσωπου ή διαδικτύου) είναι στοχευμένη για μεσαίου επιπέδου ειδικές στατιστικά επιστήμονες και μηχανικούς που θέλουν να χρησιμοποιήσουν Google Colab και Apache Spark για την επεξεργασία και ανάλυση μεγάλων δεδομένων.
Μέχρι το τέλος αυτής της εκπαιδευτικής διαλέξεως, οι μεταφράστες θα μπορούν να:
- Εγκαταστήσουν περιβάλλον μεγάλων δεδομένων χρησιμοποιώντας Google Colab και Spark.
- Επεξεργαστούν και αναλύσουν μεγάλα σημεία δεδομένων εξικανώς με το Apache Spark.
- Δημιουργήστε προβολές για μεγάλα σημεία δεδομένων σε ενόπλη υπεύθυνη ομάδα.
- Συνδυάστε Apache Spark με αστικά εργαλεία.
Ανάλυση Μεγάλων Δεδομένων στην Υγεία
21 ΏρεςΗ ανάλυση μεγάλων δεδομένων επικεντρώνεται στην εξέταση μεγάλων ποσοτήτων διάφορων συνόλων δεδομένων, προκειμένου να αποκαλύψει σχέσεις, κρυφέ μοτίβα και άλλες χρήσιμες επιστημονικές γνώσεις.
Η βιομηχανία της υγείας διαθέτει τεράστιες ποσότητες περίπλοκων, έτερων μεδικών και κλινικών δεδομένων. Η εφαρμογή τεχνικών ανάλυσης μεγάλων δεδομένων στα δεδομένα υγείας παρουσιάζει τεράστιο δυναμικό για την απόκτηση επιστημονικών γνώσεων που θα βελτιώσουν την παροχή υγειονομικής φροντίδας. Ωστόσο, η μεγάλη κλίμακα αυτών των συνόλων δεδομένων παρουσιάζει μεγάλες προκλήσεις στην ανάλυση και τις πρακτικές εφαρμογές σε κλινικό περιβάλλον.
Σε αυτή τη διδασκαλία υπό την καθοδήγηση εκπαιδευτικών (από Αποστάσης), οι συμμετέχοντες θα μάθουν πώς να πραγματοποιούν ανάλυση μεγάλων δεδομένων στην υγεία, καθώς προχωρούν σε μια σειρά εξασκήσεων ζωντανής εργαστηριακής.
Στο τέλος αυτής της διδασκαλίας, οι συμμετέχοντες θα είναι σε θέση να:
- Εγκαταστήσουν και ρυθμίσουν εργαλεία ανάλυσης μεγάλων δεδομένων, όπως το Hadoop MapReduce και το Spark
- Να κατανοήσουν τις προσδιοριστικές χαρακτηριστικές των μεδικών δεδομένων
- Να εφαρμόσουν τεχνικές μεγάλων δεδομένων για να αντιμετωπίζουν τα μεδικά δεδομένα
- Να μελετήσουν συστήματα και αλγόριθμους μεγάλων δεδομένων στο πλαίσιο των εφαρμογών υγείας
Ακροατήριο
- Προγραμματιστές
- Επιστήμονες Δεδομένων
Μορφή του Κούρσου
- Μέρος διάλεξη, μέρος συζήτηση, ασκήσεις και πολλή πρακτική εφαρμογή.
Σημείωση
- Για να ζητήσετε μια προσαρμοσμένη εκπαίδευση γι' αυτό το μάθημα, παρακαλώ επικοινωνήστε μαζί μας για να διατυπώσετε τη ζήτησή σας.
Hadoop και Spark για Διαχετικούς
35 ΏρεςΑυτή η εκπαιδευτική κατεύθυνση, που διεξάγεται από εκπαιδευτικό (σε διαδίκτυο ή εντός του χώρου), απευθύνεται σε διαχετικούς που θέλουν να μάθουν πώς να ρυθμίσουν, να εγκαταστήσουν και να διαχειριστούν συνόλων Hadoop στην οργάνωσή τους.
Είναι προφανές ότι, μέχρι το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα έχουν τη δυνατότητα να:
- Εγκαθιστήσουν και να ρυθμίσουν το Apache Hadoop.
- Να καταλάβουν τα τέσσερα βασικά συστατικά στην οικογένεια Hadoop: HDFS, MapReduce, YARN, και Hadoop Common.
- Να χρησιμοποιήσουν το Hadoop Distributed File System (HDFS) για να εκτελέσουν σχόλια που μπορούν να ανέρχονται έως εκατό ή χιλίαδες κόμβους.
- Να ρυθμίσουν το HDFS ως μηχανή αποθήκευσης για εγκατεστημένες εφαρμογές Spark.
- Να ρυθμίσουν το Spark για να πρόσπεσε σε εναλλακτικά κράτη αποθήκευσης, όπως η Amazon S3 και τα συστήματα βάση δεδομένων NoSQL (Redis, Elasticsearch, Couchbase, Aerospike, κλπ.).
- Να εκτελέσουν διαχειριστικές πράξεις όπως η κατοχή, διαχείριση, παρακολούθηση και ασφάλιση ενός συνόλου Apache Hadoop.
Πρακτική Εισαγωγή στην Ροή Δεδομένων
21 ΏρεςΣε αυτή την καθοδήγηση υπό διεύθυνση εκπαιδευτή Ελλάδα (προσωπικά ή απομακρυσμένα), οι συμμετέχοντες θα μάθουν πώς να ρυθμίζουν και να ενσωματώνουν διάφορα πλαίσια Ροής Δεδομένων σε υπάρχουσες συστήματα αποθήκης μεγάλων δεδομένων και σχετικές λογισμικές εφαρμογές και μικρουσλογισμικά.
Στο τέλος αυτής της καθοδήγησης, οι συμμετέχοντες θα είναι σε θέση να:
- Να εγκαθιστούν και να ρυθμίζουν διάφορα πλαίσια Ροής Δεδομένων, όπως το Spark Streaming και Kafka Streaming.
- Να καταλαβαίνουν και να επιλέγουν το πιο κατάλληλο πλαίσιο για τη συγκεκριμένη εργασία.
- Να επεξεργάζονται δεδομένα συνεχώς, παράλληλα και ένα-από-ένα.
- Να ενσωματώνουν λύσεις Ροής Δεδομένων σε υπάρχουσες βάσεις δεδομένων, data warehouses, data lakes, κλπ.
- Να ενσωματώνουν την πιο κατάλληλη βιβλιοθήκη ροής δεδομένων σε επιχειρηματικές εφαρμογές και μικρουσλογισμικά.
SMACK Stack για Δείγματα Δεδομένων
14 ΏρεςΑυτή η εκπαίδευση με εξηγητή, ζωντανά σε Ελλάδα (online ή on-site), απευθύνεται σε επιστήμονες δεδομένων που θέλουν να χρησιμοποιήσουν το στακ SMACK για να κατασκευάσουν πλατφόρμες επεξεργασίας δεδομένων για λύσεις μεγάλων δεδομένων.
Στο τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση να:
- Εφαρμόσουν μια αρχιτεκτονική διαδίκτυου δεδομένων για την επεξεργασία μεγάλων δεδομένων.
- Αναπτύξουν υποδομή κλαστηρικής τόπου με Apache Mesos και Docker.
- Ανάλυση δεδομένων με Spark και Scala.
- Διαχείριση ανοργανωμένων δεδομένων με Apache Cassandra.
Βασικά Στοιχεία του Apache Spark
21 ΏρεςΑυτή η οδηγία υπό διδασκαλία (online ή on-site) απευθύνεται σε μηχανικούς που επιθυμούν να εγκαταστήσουν και να διαχειριστούν το σύστημα Apache Spark για την επεξεργασία πολύ μεγάλων ποσοτήτων δεδομένων.
Στο τέλος αυτής της κατάρτισης, οι συμμετέχοντες θα είναι σε θέση:
- Εγκαταστάσει και διαμόρφωση του Apache Spark.
- Γρήγορη επεξεργασία και ανάλυση πολύ μεγάλων συνόλων δεδομένων.
- Κατανόηση της διαφοράς μεταξύ του Apache Spark και του Hadoop MapReduce, καθώς και πότε να χρησιμοποιήσουν αυτό ή εκείνο.
- Ενσωμάτωση του Apache Spark με άλλες εργαλεία μηχανικής μάθησης.
Διαχείριση του Apache Spark
35 ΏρεςΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε αρχάριους έως μεσαίου επιπέδου διαχειριστές συστημάτων που επιθυμούν να αναπτύξουν, να διατηρήσουν και να βελτιστοποιήσουν συμπλέγματα Spark.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Εγκαταστήστε και διαμορφώστε το Apache Spark σε διάφορα περιβάλλοντα.
- Διαχειριστείτε τους πόρους συμπλέγματος και παρακολουθήστε τις εφαρμογές Spark.
- Βελτιστοποιήστε την απόδοση των συμπλεγμάτων Spark.
- Εφαρμόστε μέτρα ασφαλείας και εξασφαλίστε υψηλή διαθεσιμότητα.
- Εντοπισμός σφαλμάτων και αντιμετώπιση κοινών προβλημάτων Spark.
Apache Spark στον Πυρήνα της Ασπίδας
21 ΏρεςΗ καμπύλη μάθηση του Apache Spark αρχικά είναι ξεκούραση, χρειάζεται πολλή προσπάθεια για να πάρει κανείς το πρώτο αποδότημα. Αυτό το μάθημα στοχεύει να διέλθει τον πρώτο δύσκολο τομέα. Μετά από τη συμμετοχή σε αυτό το μάθημα, οι συμμετέχοντες θα καταλάβουν τις βασικές εννοιές του Apache Spark, θα διακρίνουν με ακρίβεια το RDD από το DataFrame, θα μάθουν τη Python και Scala API, θα καταλάβουν εκτελεστές και εργασίες, κ.α. Επιπλέον, ακολουθώντας τις καλύτερες πρακτικές, αυτό το μάθημα εστιάζει ιδιαίτερα στην υπολογιστική στην Σύνθεση, Databricks και AWS. Οι φοιτητές θα καταλάβουν επίσης τις διαφορές μεταξύ AWS EMR και AWS Glue, μία από τις πιο πρόσφατες υπηρεσίες Spark του AWS.
ΔΙΕΥΘΥΝΤΗΣ:
Data Engineer, DevOps, Data Scientist
Spark για Προγραμματιστές
21 ΏρεςΣΚΟΠΟΣ:
Αυτό το μάθημα θα παρουσιάσει το Apache Spark. Οι φοιτητές θα μάθουν πώς το Spark ενσωματώνεται στο οικοσύστημα Big Data και πώς να χρησιμοποιήσουν το Spark για ανάλυση δεδομένων. Το μάθημα καλύπτει το ενεργό σκέλος του Spark για αλληλεπίδραση με δεδομένα, τα εσωτερικά του Spark, τις API του Spark, το Spark SQL, τη ρύθμιση χρόνου του Spark και ο μηχανισμός μάθησης και γράφων GraphX.
ΑΝΤΙΚΕΙΜΕΝΟ :
Προγραμματιστές / Αναλυτές Δεδομένων
Μεγέθανση Δεικτών Δεδομένων με το Spark NLP
14 ΏρεςΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε επιστήμονες δεδομένων και προγραμματιστές που επιθυμούν να χρησιμοποιήσουν το Spark NLP, που βασίζεται στο Apache Spark, για να αναπτύξουν, να εφαρμόσουν και να κλιμακώσουν την επεξεργασία κειμένου σε φυσική γλώσσα μοντέλα και αγωγούς.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Ρυθμίστε το απαραίτητο περιβάλλον ανάπτυξης για να ξεκινήσετε την κατασκευή αγωγών NLP με το Spark NLP.
- Κατανοήστε τα χαρακτηριστικά, την αρχιτεκτονική και τα οφέλη από τη χρήση του Spark NLP.
- Χρησιμοποιήστε τα προεκπαιδευμένα μοντέλα που είναι διαθέσιμα στο Spark NLP για να εφαρμόσετε την επεξεργασία κειμένου.
- Μάθετε πώς να κατασκευάζετε, εκπαιδεύετε και κλιμακώνετε μοντέλα Spark NLP για έργα παραγωγής.
- Εφαρμογή ταξινόμησης, συμπερασμάτων και ανάλυσης συναισθήματος σε περιπτώσεις χρήσης πραγματικού κόσμου (κλινικά δεδομένα, πληροφορίες συμπεριφοράς πελατών, κ.λπ.).
Python και Spark για Μεγάλα Δεδομένα (PySpark)
21 ΏρεςΣε αυτήν τη ζωντανή εκπαίδευση στο Ελλάδα, καθοδηγούμενη από εκπαιδευτές, οι συμμετέχοντες θα μάθουν πώς να χρησιμοποιούν το Python και το Spark μαζί για να αναλύουν μεγάλα δεδομένα καθώς εργάζονται σε πρακτικές ασκήσεις.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Μάθετε πώς να χρησιμοποιείτε το Spark με το Python για την ανάλυση του Big Data.
- Εργαστείτε σε ασκήσεις που μιμούνται πραγματικές περιπτώσεις.
- Χρησιμοποιήστε διαφορετικά εργαλεία και τεχνικές για την ανάλυση μεγάλων δεδομένων χρησιμοποιώντας το PySpark.
Python, Spark και Hadoop για Μεγάλα Δεδομένα
21 ΏρεςΑυτή η ζωντανή εκπαίδευση υπό την καθοδήγηση εκπαιδευτών στο Ελλάδα (διαδικτυακό ή επιτόπου) απευθύνεται σε προγραμματιστές που επιθυμούν να χρησιμοποιήσουν και να ενσωματώσουν το Spark, Hadoop και Python για να επεξεργαστούν, να αναλύσουν και να μετασχηματίσουν μεγάλα και πολύπλοκα σύνολα δεδομένων.
Με το τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα είναι σε θέση:
- Ρυθμίστε το απαραίτητο περιβάλλον για να ξεκινήσετε την επεξεργασία μεγάλων δεδομένων με το Spark, Hadoop και Python.
- Κατανοήστε τα χαρακτηριστικά, τα βασικά στοιχεία και την αρχιτεκτονική του Spark και Hadoop.
- Μάθετε πώς να ενσωματώνετε το Spark, Hadoop και Python για επεξεργασία μεγάλων δεδομένων.
- Εξερευνήστε τα εργαλεία στο οικοσύστημα Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka και Flume).
- Δημιουργήστε συνεργατικά συστήματα προτάσεων φιλτραρίσματος παρόμοια με το Netflix, το YouTube, το Amazon, το Spotify και το Google.
- Χρησιμοποιήστε το Apache Mahout για να κλιμακώσετε τους αλγόριθμους μηχανικής μάθησης.
Apache Spark SQL
7 ΏρεςO Spark SQL είναι ένας μόδουλος του Apache Spark για να εργάζεται με δομημένα και ανεξάρτητα σε δομή δεδομένα. Ο Spark SQL παρέχει πληροφορίες για τη δομή των δεδομένων καθώς και την εκτέλεση των υπολογισμών. Αυτές οι πληροφορίες μπορούν να χρησιμοποιηθούν για να διεξαχθούν βελτιώσεις. Δύο συνηθισμένες χρήσεις του Spark SQL είναι:
- η εκτέλεση SQL ερωτήσεων.
- η ανάγνωση δεδομένων από υπάρχουσες εγκαταστάσεις Hive.
Σε αυτή την καθοδηγούμενη από καθηγητή, ζωντανή εκπαίδευση (χώρου υποδοχής ή από αποστάση), οι συμμετέχοντες θα μάθουν πώς να αναλύουν διάφορους τύπους συνόλων δεδομένων χρησιμοποιώντας Spark SQL.
Στο τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν:
- Να εγκαθιστούν και να ρυθμίζουν το Spark SQL.
- Να διεξάγουν ανάλυση δεδομένων με το Spark SQL.
- Να ερωτήσουν σύνολα δεδομένων σε διάφορα μορφώματα.
- Να οπτικοποιούν δεδομένα και αποτελέσματα ερωτήσεων.
Μορφή του Μαθήματος
- Διαδραστικός διάλεξη και συζήτηση.
- Πολλά ασκήματα και πράξη.
- Χειρονομία εφαρμογής σε ζωντανό lab-περιβάλλον.
Ευκαιρίες Προσαρμογής του Μαθήματος
- Για να ζητήσετε μια προσαρμογμένη εκπαίδευση για αυτό το μάθημα, παρακαλώ επικοινωνήστε μαζί μας για να κάνετε οργάνωση.
Stratio: Ροκέτ και Δυναμικά Μόδουλα με PySpark
14 ΏρεςStratio είναι μια πλατφόρμα αξιοθέτησης δεδομένων που ενσωματώνει τα big data, την AI και την governance σε μία έντελη λύση. Οι modula Rocket και Intelligence επιτρέπουν γρήγορη αναζήτηση, μετάφραση δεδομένων και προβληματική ανάλυση σε εντελειώδη περιβάλλοντα.
Αυτό το δίδασκτρο με οργανωμένη καθοδήγηση (πολύχρωμος ή live) στόχο ενισχύει τους μεσαίου επιπέδου δεδομένων επαγγελματίες που επιθυμούν να χρησιμοποιήσουν τα modula Rocket και Intelligence στο Stratio αποτελεσματικά με PySpark, εστίαζόντας σε περιβάλλοντα διαδηλώσεων, χρήστες-ορισμένες λειτουργίες και προβληματικά δεδομένα.
Στο τέλος αυτής της εκπαίδευσης, οι συμμετέχοντες θα μπορούν να:
- Να περιφέρονται και να εργάζονται στην Stratio platform χρησιμοποιώντας τους modula Rocket και Intelligence.
- Να εφαρμόζουν PySpark σε περιβάλλοντα δεδομένων ingestion, transformation, και analysis.
- Να χρησιμοποιούν loops και συνθηκική λογική για τον έλεγχο δεδομένων workflows και feature engineering tasks.
- Να δημιουργούν και να διαχειρίζονται χρήστες-ορισμένες λειτουργίες (UDFs) για μεταχειριστό data operations στο PySpark.
Μορφή της Εκπαίδευσης
- Διεξοδική εισαγωγή και συζήτηση.
- Πολλά ασκήσεις και πρακτική.
- Αλληλεπίδραση σε μια live-lab περιβάλλον.
Επιλογές Διεξαγωγής Προσαρμοστικών
- Για να αιτηθεί μια προσαρμοσμένη εκπαίδευση για αυτό το δίδασκο, παρακαλώ συνεχίζετε μας.
Εισαγωγή στην Οπτικοποίηση Δεδομένων με Tidyverse και R
7 ΏρεςΠαρεύσιμο
Σχήμα της εκπαιδευτικής μάθησης
Κατά το τέλος αυτής της εκπαιδευτικής μάθησης, οι συμμετέχοντες θα μπορούν να:
Σε αυτή την εκπαιδευτική μάθηση με πρόσωπο εξηγητή, οι συμμετέχοντες θα μάθουν να ελέγχουν και να απεικονίζουν δεδομένα χρησιμοποιώντας τα εργαλεία που περιλαμβάνονται στο Tidyverse.
Το Tidyverse είναι μια συλλογή ρολόηγων ακτινού περιβάλλον (R) για καθαρισμό, επεξεργασία, μοντελοποίηση και απεικόνιση δεδομένων. Κάποια από τα ρολόηγα που περιλαμβάνονται είναι: ggplot2, dplyr, tidyr, readr, purrr και tibble.
- Αρχάριοι στη γλώσσα R
- Αρχάριοι στην ανάλυση και την απεικόνιση δεδομένων
- Μέρος λόγου, μέρος συζήτησης, ασκήσεις και πολύπλοκη εφαρμογή
- Να εκτελέσουν ανάλυση δεδομένων και να δημιουργήσουν υπεύθυνες αποδείξεις
- Να συλλέξουν επωφελείς κατασκευές από διάφορες σημειώσεις πίνακες δεδομένων
- Να φίλτραρουν, να ταξινομήσουν και να συμπεριφέρουν δεδομένα για να απαντήσουν σε προσκαρτώρηση ερωτήσεις
- Να μετατρέψουν τα επεξεργασμένα δεδομένα σε πληροφοριακά γραφήματα γραμμών, ορόσωμα-χάρτες και ιστόγραμμα
- Να εισάγουν και να φίλτραρουν δεδομένα από ποικιλούς πηγές δεδομένων, συμπεριλαμβανομένων Excel, CSV και αρχεία SPSS