Course Outline

I. Εισαγωγή και προκαταρκτικά

1. Επισκόπηση

    Κάνοντας το R πιο φιλικό, R και διαθέσιμα GUI Rstudio Σχετικό λογισμικό και τεκμηρίωση R και στατιστικά Διαδραστική χρήση του R Μια εισαγωγική συνεδρία Λήψη βοήθειας με λειτουργίες και δυνατότητες Εντολές R, ευαισθησία πεζών-κεφαλαίων κ.λπ. Ανάκληση και διόρθωση προηγούμενων εντολών Εκτέλεση εντολών από ή εκτροπή εξόδου σε ένα αρχείο Μονιμότητα δεδομένων και αφαίρεση αντικειμένων Goαπό πρακτική προγραμματισμού: Αυτοδύναμα σενάρια, καλή αναγνωσιμότητα, π.χ. CRAN και Bioconductor

2. Ανάγνωση δεδομένων

    Αρχεία Txt (read.delim) Αρχεία CSV

3. Απλοί χειρισμοί. αριθμοί και διανύσματα + πίνακες

    Διανύσματα και ανάθεση Αριθμητική διανυσμάτων Δημιουργία κανονικών ακολουθιών Λογικά διανύσματα Λείπουν τιμές Διανύσματα χαρακτήρων Διανύσματα ευρετηρίου; επιλογή και τροποποίηση υποσυνόλων Πίνακες συνόλων δεδομένων
Ευρετηρίαση πίνακα. Υποτμήματα ενός πίνακα
  • Πίνακες ευρετηρίου
  • Η συνάρτηση array() + απλές πράξεις σε πίνακες π.χ. πολλαπλασιασμός, μεταφορά
  • Άλλοι τύποι αντικειμένων
  • 4. Λίστες και πλαίσια δεδομένων
  • Λίστες Κατασκευή και τροποποίηση λιστών Συνένωση λιστών

      Πλαίσια δεδομένων Κατασκευή πλαισίων δεδομένων
    Εργασία με πλαίσια δεδομένων
  • Επισύναψη αυθαίρετων λιστών
  • Διαχείριση της διαδρομής αναζήτησης
  • 5. Χειρισμός δεδομένων
  • Επιλογή, υποσύνολο παρατηρήσεων και μεταβλητών Φιλτράρισμα, ομαδοποίηση Ανακωδικοποίηση, μετασχηματισμοί Συνάθροιση, συνδυασμός συνόλων δεδομένων Σχηματισμός διαμερισμένων πινάκων, cbind() και rbind() Η συνάρτηση συνένωσης, (), με πίνακες Χειρισμός χαρακτήρων, πακέτο stringr σύντομη εισαγωγή σε grep και regexpr
  • 6. Περισσότερα για την Ανάγνωση δεδομένων

      XLS, XLSX αρχεία ανάγνωσης και πακέτα readxl SPSS, SAS, Stata,… και άλλες μορφές δεδομένων Εξαγωγή δεδομένων σε txt, csv και άλλες μορφές

    6. Ομαδοποίηση, βρόχοι και εκτέλεση υπό όρους

      Ομαδοποιημένες εκφράσεις Δηλώσεις ελέγχου Εκτέλεση υπό όρους: εάν εντολές Επαναληπτική εκτέλεση: για βρόχους, επανάληψη και κατά την εισαγωγή στην εφαρμογή, εφαρμογή, εφαρμογή, εφαρμογή

    7. Λειτουργίες

      Δημιουργία συναρτήσεων Προαιρετικά ορίσματα και προεπιλεγμένες τιμές Μεταβλητός αριθμός ορισμάτων Πεδίο εφαρμογής και οι συνέπειές του

    8. Απλά γραφικά στο R

      Δημιουργία γραφήματος Πυκνότητα Οικόπεδα Σημεία με κουκκίδες Γραμμές Γραμμές Διαγράμματα πίτας Γραφήματα πλαισίων Πλάκες διασποράς Οικόπεδα Συνδυασμός γραφημάτων

    II. Στατιστική ανάλυση στο R

      1. Κατανομές πιθανοτήτων

    Το R ως σύνολο στατιστικών πινάκων Εξέταση της κατανομής ενός συνόλου δεδομένων

    2. Έλεγχος Υποθέσεων

      Δοκιμές σχετικά με μια Δοκιμή αναλογίας μέσης πιθανότητας πληθυσμού Δοκιμές ενός και δύο δειγμάτων Δοκιμή Chi-Square GoΔοκιμασία odness-of-Fit Kolmogorov-Smirnov Statistic One-Sample Wilcoxon Signed-Rank Test Two-Sample Test Wilcoxon Rank Sum Test Mann-Whitney Δοκιμή Kolmogorov-Smirnov Test

    3. Πολλαπλός Έλεγχος Υποθέσεων

      Σφάλμα τύπου Ι και καμπύλες ROC FDR και Πολλαπλές Διαδικασίες δοκιμών AUC (BH, Bonferroni κ.λπ.)

    4. Μοντέλα γραμμικής παλινδρόμησης

      Γενικές συναρτήσεις για την εξαγωγή πληροφοριών μοντέλου Ενημέρωση προσαρμοσμένων μοντέλων Γενικευμένα γραμμικά μοντέλα Οικογένειες Η συνάρτηση glm()

    Ταξινόμηση Logistic Regression

      Γραμμική Διακριτική Ανάλυση
    Ανάλυση βασικών στοιχείων χωρίς επίβλεψη μάθησης
  • Μέθοδοι ομαδοποίησης (k-means, ιεραρχική ομαδοποίηση, k-medoids)
  • 5. Ανάλυση επιβίωσης (πακέτο επιβίωσης)
  • Αντικείμενα επιβίωσης σε r Εκτίμηση Kaplan-Meier, δοκιμή log-rank, παραμετρική παλινδρόμηση Ζώνες εμπιστοσύνης Λογοκριμένα (λογοκριμένα με διαστήματα) ανάλυση δεδομένων Μοντέλα Cox PH, σταθερές συμμεταβλητές Μοντέλα Cox PH, εξαρτώμενες από το χρόνο συμμεταβλητές Προσομοίωση: Σύγκριση μοντέλων (Σύγκριση μοντέλων παλινδρόμησης)
  • 6. Ανάλυση Διακύμανσης
  • Μονόδρομος ANOVA Αμφίδρομη Ταξινόμηση ANOVA MANOVA
  • III. Εργασμένα προβλήματα στη βιοπληροφορική

      Σύντομη εισαγωγή στο πακέτο limma Ροή εργασιών ανάλυσης δεδομένων Microarray Λήψη δεδομένων από το GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397 Επεξεργασία δεδομένων (QC, κανονικοποίηση, διαφορική έκφραση) Παραδείγματα Custering ηφαιστείων + χάρτες θερμότητας
      28 Hours

    Number of participants


    Starts

    Ends


    Dates are subject to availability and take place between 09:30 and 16:30.

    Price per participant

    Testimonials (8)

    Related Courses

    Knowledge Discovery in Databases (KDD)

      21 Hours

    Introduction to Data Visualization with Tidyverse and R

      7 Hours

    From Data to Decision with Big Data and Predictive Analytics

      21 Hours

    Process Mining

      21 Hours

    Related Categories