Course Outline

I. Εισαγωγή και προκαταρκτικά

1. Επισκόπηση

  • Κάνοντας το R πιο φιλικό, το R και τα διαθέσιμα GUI
  • Rstudio
  • Σχετικό λογισμικό και τεκμηρίωση
  • R και στατιστικά
  • Χρησιμοποιώντας το R διαδραστικά
  • Μια εισαγωγική συνεδρία
  • Λήψη βοήθειας με λειτουργίες και δυνατότητες
  • Εντολές R, ευαισθησία πεζών-κεφαλαίων κ.λπ.
  • Ανάκληση και διόρθωση προηγούμενων εντολών
  • Εκτέλεση εντολών από ή εκτροπή εξόδου σε αρχείο
  • Μονιμότητα δεδομένων και αφαίρεση αντικειμένων
  • GoΠρακτική προγραμματισμού: Αυτοδύναμα σενάρια, καλή αναγνωσιμότητα π.χ. δομημένα σενάρια, τεκμηρίωση, σήμανση
  • εγκατάσταση πακέτων? CRAN και Bio αγωγός

2. Ανάγνωση δεδομένων

  • Αρχεία Txt (read.delim)
  • Αρχεία CSV

3. Απλοί χειρισμοί. αριθμοί και διανύσματα + πίνακες

  • Διανύσματα και ανάθεση
  • Διάνυσμα αριθμητική
  • Δημιουργία κανονικών ακολουθιών
  • Λογικά διανύσματα
  • Λείπουν αξίες
  • Διανύσματα χαρακτήρων
  • Διανύσματα ευρετηρίου; επιλογή και τροποποίηση υποσυνόλων ενός συνόλου δεδομένων
    • Πίνακες
  • Ευρετηρίαση πίνακα. Υποτμήματα ενός πίνακα
  • Πίνακες ευρετηρίου
  • Η συνάρτηση array() + απλές πράξεις σε πίνακες π.χ. πολλαπλασιασμός, μεταφορά
  • Άλλοι τύποι αντικειμένων

4. Λίστες και πλαίσια δεδομένων

  • Κονίστρα
  • Κατασκευή και τροποποίηση λιστών
    • Συνδέοντας λίστες
  • Πλαίσια δεδομένων
    • Δημιουργία πλαισίων δεδομένων
    • Εργασία με πλαίσια δεδομένων
    • Επισύναψη αυθαίρετων λιστών
    • Διαχείριση της διαδρομής αναζήτησης

5. Χειρισμός δεδομένων

  • Επιλογή, υποσύνολο παρατηρήσεων και μεταβλητών
  • Φιλτράρισμα, ομαδοποίηση
  • Κωδικοποίηση, μεταμορφώσεις
  • Συνάθροιση, που συνδυάζει σύνολα δεδομένων
  • Σχηματισμός διαμερισμένων πινάκων, cbind() και rbind()
  • Η συνάρτηση συνένωσης, (), με πίνακες
  • Χειρισμός χαρακτήρων, πακέτο stringr
  • σύντομη εισαγωγή στο grep και το regexpr

6. Περισσότερα για την Ανάγνωση δεδομένων

  • Αρχεία XLS, XLSX
  • πακέτα readr και readxl
  • SPSS, SAS, Stata,… και δεδομένα άλλων μορφών
  • Εξαγωγή δεδομένων σε txt, csv και άλλες μορφές

6. Ομαδοποίηση, βρόχοι και εκτέλεση υπό όρους

  • Ομαδοποιημένες εκφράσεις
  • Δηλώσεις ελέγχου
  • Εκτέλεση υπό όρους: εάν δηλώσεις
  • Επαναλαμβανόμενη εκτέλεση: για βρόχους, επανάληψη και ενώ
  • εισαγωγή στην εφαρμογή, εφαρμογή, εφαρμογή, εφαρμογή

7. Λειτουργίες

  • Δημιουργία συναρτήσεων
  • Προαιρετικά ορίσματα και προεπιλεγμένες τιμές
  • Μεταβλητός αριθμός ορισμάτων
  • Πεδίο εφαρμογής και οι συνέπειές του

8. Απλά γραφικά στο R

  • Δημιουργία Γραφήματος
  • Οικόπεδα Πυκνότητας
  • Οικόπεδα με τελείες
  • Οικόπεδα μπαρ
  • Γραμμικά γραφήματα
  • Διαγράμματα πίτας
  • Κουτιά
  • Οικόπεδα Scatter
  • Συνδυασμός Οικόπεδων

II. Στατιστική ανάλυση στο R

1. Κατανομές πιθανοτήτων

  • R ως σύνολο στατιστικών πινάκων
  • Εξέταση της κατανομής ενός συνόλου δεδομένων

2. Έλεγχος Υποθέσεων

  • Δοκιμές για μέσο όρο πληθυσμού
  • Δοκιμή αναλογίας πιθανοτήτων
  • Δοκιμές ενός και δύο δειγμάτων
  • Τεστ Chi-Square Goodness-of-fit
  • Στατιστική ενός δείγματος Kolmogorov-Smirnov
  • Wilcoxon Signed-Rank Test
  • Δοκιμή δύο δειγμάτων
  • Wilcoxon Rank Sum Test
  • Τεστ Mann-Whitney
  • Δοκιμή Kolmogorov-Smirnov

3. Πολλαπλός Έλεγχος Υποθέσεων

  • Σφάλμα τύπου I και FDR
  • Καμπύλες ROC και AUC
  • Πολλαπλές διαδικασίες δοκιμών (BH, Bonferroni κ.λπ.)

4. Μοντέλα γραμμικής παλινδρόμησης

  • Γενικές λειτουργίες για την εξαγωγή πληροφοριών μοντέλου
  • Ενημέρωση τοποθετημένων μοντέλων
  • Γενικευμένα γραμμικά μοντέλα
    • Οικογένειες
    • Η συνάρτηση glm().
  • Ταξινόμηση
    • Logistic Regression
    • Γραμμική Διακριτική Ανάλυση
  • Εκμάθηση χωρίς επίβλεψη
    • Ανάλυση βασικών εξαρτημάτων
    • Μέθοδοι ομαδοποίησης (k-means, ιεραρχική ομαδοποίηση, k-medoids)

5. Ανάλυση επιβίωσης (πακέτο επιβίωσης)

  • Αντικείμενα επιβίωσης στο r
  • Εκτίμηση Kaplan-Meier, log-rank test, παραμετρική παλινδρόμηση
  • Ζώνες εμπιστοσύνης
  • Λογοκριμένη (διαστημική λογοκρισία) ανάλυση δεδομένων
  • Μοντέλα Cox PH, σταθερές συμμεταβλητές
  • Μοντέλα Cox PH, χρονικά εξαρτώμενες συμμεταβλητές
  • Προσομοίωση: Σύγκριση μοντέλων (Σύγκριση μοντέλων παλινδρόμησης)

6. Ανάλυση Διακύμανσης

  • Μονόδρομη ANOVA
  • Αμφίδρομη Ταξινόμηση ANOVA
  • ΜΑΝΟΒΑ

III. Εργασμένα προβλήματα στη βιοπληροφορική

  • Σύντομη εισαγωγή στο πακέτο limma
  • Ροή εργασιών ανάλυσης δεδομένων μικροσυστοιχίας
  • Λήψη δεδομένων από το GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • Επεξεργασία δεδομένων (QC, κανονικοποίηση, διαφορική έκφραση)
  • Οικόπεδο ηφαιστείου
  • Παραδείγματα Custering + θερμικοί χάρτες
 28 Hours

Number of participants


Price per participant

Testimonials (5)

Upcoming Courses

Related Categories