eLearning Ο.Π.Α. - Προχωρημένη Ανάλυση Δεδομένων με την Χρήση της R - Πρόγραμμα elearning ΟΠΑ

eLearning Οικονομικού Πανεπιστημίου Αθηνών

Έναρξη Μαθημάτων: 26 Οκτωβρίου 2017 Λήξη Εγγραφών: 19 Οκτωβρίου 2017

Προχωρημένη Ανάλυση Δεδομένων με την Χρήση της R

Η στατιστική γλώσσα R αποτελεί ένα πολύτιμο εργαλείο διαχείρισης δεδομένων αλλά κυρίως στατιστικής ανάλυσης που περιλαμβάνει σύγχρονες μεθοδολογίες αιχμής. Το γεγονός ότι η R είναι μια γλώσσα ανοικτού κώδικα όπου καθένας μπορεί να συνεισφέρει με την ανάπτυξη βιβλιοθηκών που υλοποιούν στατιστικές μεθοδολογίες έχει οδηγήσει σε έναν αλματώδη, σχεδόν φρενήρη, ρυθμό ανάπτυξης. Ταυτόχρονα η R διαθέτει υψηλής ποιότητας γραφικά αποτελώντας έτσι ένα σημαντικό εργαλείο στην οπτικοποίηση δεδομένων. Έτσι προκύπτει η άμεση ανάγκη για εκπαίδευση και κατάρτιση ενός μεγάλου αριθμού πτυχιούχων στη γλώσσα αυτή που μέχρι πρότινος βασίζονταν στη χρήση εμπορικών στατιστικών λογισμικών κλειστού τύπου. Συγχρόνως η ανάπτυξη μεθοδολογιών ανάλυσης μεγάλου όγκου δεδομένων αλλά και οι εξελίξεις τόσο στη στατιστική επιστήμη όσο και άλλες συναφείς επιστήμες οδηγεί στην ανάγκη επιμόρφωσης στην R και τις δυνατότητες της. Έχουμε ήδη ξεκινήσει με επιτυχία ένα πρόγραμμα eLearning με τίτλο «Ανάλυση Δεδομένων με τη Χρήση της R». Στο υπάρχον πρόγραμμα διδάσκονται βασικές γνώσεις και το κομμάτι της ανάλυσης δεδομένων περιορίζεται σε σχετικά απλό επίπεδο. Στο νέο προτεινόμενο πρόγραμμα θα ασχοληθούμε με πιο προχωρημένα θέματα ανάλυσης δεδομένων που είναι και πιο ρεαλιστικά από την άποψη ότι αφορούν πρακτικά και πραγματικά προβλήματα ανάλυσης δεδομένων. Σκοπός του νέου προγράμματος είναι αφενός να εκπαιδεύσει πτυχιούχους και στελέχη στην ανάλυση δεδομένων με την R αλλά συγχρόνως να προσφέρει και να διδάξει σημαντικές έννοιες της στατιστικής με σωστό και συστηματικό τρόπο χρησιμοποιώντας την R ως εργαλείο. Σε αυτό το πλαίσιο το νέο πρόγραμμα προσφέρει τρόπους χρήσης της R για τη στατιστική ανάλυση δεδομένων σε πραγματικά προβλήματα έχοντας πάντα υπόψη τις εφαρμογές αλλά και σύγχρονα προβλήματα διαχείρισης δεδομένων που εμφανίζονται στην πράξη.

Σε ποιους απευθύνεται

Το πρόγραμμα απευθύνεται σε

  • Εν ενεργεία φοιτητές τμηματων στατιστικής η συναφών τμημάτων που θέλουν να μάθουν τη γλώσσα R η οποία παρεπιτπόντως δεν διδάσκεται περαν από το τμήμα Στατιστικής
  • Απόφοιτους τμημάτων Στατιστικής από προηγούμενα έτη όπου η R δεν ηταν διαδεδομένη και δεν διδασκόταν
  • Απόφοιτους τμημάτων Στατιστικής από πρόσφατα έτη που είτε δεν διδάχτηκαν R είτε θα ήθελαν να εμβαθύνουν.
  • Απόφοιτους Μαθηματικών τμημάτων που ενώ έχουν διδαχθεί θεωρητικά μαθήματα έχουν ελάχιστη εξοικείωση με τη χρήση στατιστικών προγραμμάτων όπως η R
  • Άτομα που ήδη εργάζονται και στην καθημερινότητα τους χρειάζεται να αναλύουν δεδομένα και να χρησιμοποιούν R
  • Ερευνητές από διάφορα άλλα αντικείμενα που χρειάζονται για την έρευνας τους τόσο στατιστικές μεθόδους όπως και τη χρήση της R.
  • Επιστήμονες με βασικές γνώσεις στατιστικής που θέλουν να εμβαθύνουν σε πιο προχωρημένες μεθόδους.
  • Ερευνητες που θέλουν να δουν σύγχρονες μεθόδους ανάλυσης δεδομένων. 

Ενότητες

Το μάθημα αυτό έχει σκοπό να προσφέρει στους φοιτητές τη δυνατότητα να χρησιμοποιήσουν ένα πολύ σύγχρονο εργαλείο στατιστικής ανάλυσης, την R, αλλά και συγχρόνως να τη χρησιμοποιήσουν για στατιστική ανάλυση δεδομένων, λαμβάνοντας υπόψη τις τεράστιες δυνατότητες της R. Οι ενότητες είναι οι ακόλουθες:

  1. Introduction - Simple Regression (Εισαγωγή - Απλή παλινδρόμηση)
    1. Intoduction to models and regression analysis - Theory & Interpretation (Εισαγωγή στα μοντέλα και στην ανάλυση παλινδρόμησης) - Θεωρία και Ερμηνεία)
    2. Example of Simple Regression in R (Παράδειγμα απλής Παλινδρόμησης στην R)
    3. Testing for the model assumptions (Έλεγχοι προϋποθέσεων μοντέλου)
  2. Multiple Regression (Πολλαπλή Παλινδρόμηση)
    1. Introduction, theory, and interpretation of multiple regression models (Εισαγωγή, Θεωρία και Ερμηνεία μοντέλων πολλαπλής παλινδρόμησης)
    2. Example of multiple regression in R (Παράδειγμα πολλαπλής παλινδρόμησης στην R)
    3. Testing for the model assumptions (Έλεγχοι προϋποθέσεων μοντέλου)
    4. Multi-collinearity Tests (Έλεγχοι Πολυσυγραμικότητας)
    5. Variable Selection (Επιλογή μεταβλητών)
  3. Including Categorical Factors in Regression - Analysis of Covariance (ANCOVA) (Συμπεριλαμβάνοντας κατηγορικές μεταβλητές στα μοντέλα παλινδρόμησης - Ανάλυση Συνδιακύμανσης)
    1. Using Categorical Factors and Dummy Variables (Χρήση κατηγορικών μεταβλητών και ψευδομεταβλητές)
    2. Analysis of covariance with one numerical and one categorical covariate (Ανάλυση συνδιακύμανσης με μια ποσοτική και μια κατηγορική μεταβλητή)
  4. Two-Way Analysis of Variance (Ανάλυση Διακύμανσης κατά δύο παράγοντες)
    1. Two-way ANOVA without interactions (Ανάλυση Διακύμανσης κατά δύο παράγοντες χωρίς αλληλεπιδράσεις)
    2. Two-way ANOVA with interactions (Ανάλυση Διακύμανσης κατά δύο παράγοντες με αλληλεπιδράσεις)
  5. Models for Binomial and Binary Responses - Logistic Regression (Μοντέλα για διωνυμικά και Δίτιμα δεδομένα - Λογιστική παλινδρόμηση)
    1. Introduction in Generalized Linear Models (Εισαγωγή στα γενικευμένα γραμμικά μοντέλα)
    2. Models for binary and binomial responses: Logistic Regression & other link functions (Probit and clog-log models) - (Mοντέλα με δίτιμες ή διωνυμικές μεταβλητές απόκρισης: Μοντέλα Λογιστικής Παλινδρόμησης & άλλες συνδετικές συναρτήσεις (Μοντέλα Probit & cloglog))
    3. Case study - Challenger Explosion (Μελέτη Περίπτωσης: Η έκρηξη του Challenger)
  6. Models for counts - Poisson Regression (Μοντέλα για συχνότητες - Παλινδρόμηση Poisson)
    1. Introduction - Theory - Interpretation (Εισαγωγή - Θεωρία - Ερμηνεία)
    2. Examples in R (Παραδείγματα στην R)
  7. Classification (Μοντέλα Ταξινόμησης)
    1. Discriminant analysis
    2. k-nn method
    3. Decisions Trees
    4. Other methods

Η «αξία» του προγράμματος

Το πρόγραμμα προσφέρει τρόπους χρήσης της R για τη στατιστική ανάλυση δεδομένων σε πραγματικά προβλήματα έχοντας πάντα υπόψη τις εφαρμογές αλλά και σύγχρονα προβλήματα διαχείρισης δεδομένων που εμφανίζονται στην πράξη.

Γιατί να το παρακολουθήσει κάποιος

Στο τέλος  της ενότητας ο φοιτητής θα ξέρει: 

  • Να χρησιμοποιεί τη γλώσσα R και διάφορες βιβλιοθήκες της
  • Να διαβάζει δεδομένα και να τα αναλύει χρησιμοποιώντας R
  • Να μπορεί να αναλύσει με κατάλληλες στατιστικές μεθόδους δεδομένα
  • Να γνωρίζει μεθόδους στατιστικής ανάλυσης δεδομένων  και πως αυτές χρησιμοποιούνται στην καθημερινότητα για επίλυση προβλημάτων και διαχείριση της αβεβαιότητας
  • Να διαχειρίζεται δεδομένα και να προβαίνει στις κατάλληλες προεργασίες ώστε να τα φέρει σε θέση για στατιστική ανάλυση

Διδάσκοντες

ΙΩΑΝΝΗΣ ΝΤΖΟΥΦΡΑΣ
Επιστημονικός υπεύθυνος προγράμματος
Καθηγητής στο Τμήμα Στατιστικής, ΟΠΑ
 
ΔΗΜΗΤΡΗΣ ΚΑΡΛΗΣ
Επιστημονικός υπεύθυνος προγράμματος
Καθηγητής στο Τμήμα Στατιστικής, ΟΠΑ
 
ΠΑΝΑΓΙΩΤΗΣ ΤΣΙΑΜΥΡΤΖΗΣ
Αναπλ. Καθηγητής στο Τμήμα Στατιστικής, ΟΠΑ
 

Βεβαίωση παρακολούθησης

Στους εκπαιδευόμενους που θα ολοκληρώσουν επιτυχώς το πρόγραμμα χορηγείται βεβαίωση παρακολούθησης, η οποία συνοδεύεται από συμπληρωματική βεβαίωση στην οποία αναφέρονται αναλυτικά το αντικείμενο του προγράμματος, οι θεματικές ενότητες που παρακολούθησε ο εκπαιδευόμενος, καθώς και η μεθοδολογία εκπαίδευσης που ακολουθήθηκε. Τα προγράμματα eLearning του ΟΠΑ δεν οδηγούν στην απόκτηση πτυχίου, διπλώματος ή άλλης πιστοποίησης.

Λόγω της πρόσφατης αλλαγής του νομοθετικού πλαισίου (Ν. 4485/2017) που διέπει τη λειτουργία των προγραμμάτων eLearning του ΟΠΑ, το συγκεκριμένο πρόγραμμα θα χωριστεί σε δύο φάσεις. Η πρώτη φάση θα έχει ολοκληρωθεί ως 31/12/2017. Η δεύτερη φάση θα ολοκληρωθεί σύμφωνα με τον αρχικό προγραμματισμό του προγράμματος και θα παρασχεθεί, χωρίς νέα εγγραφή και χωρίς αλλαγή του συνολικού ποσού των διδάκτρων, από το νέο Κέντρο Επιμόρφωσης και Δια Βίου Μάθησης (ΚΕΔΙΒΙΜ) του ΟΠΑ στους εκπαιδευόμενους που θα παρακολουθήσουν την πρώτη φάση. Η αλλαγή αυτή δεν θα επηρεάσει την ύλη και τον τρόπο διδασκαλίας του προγράμματος. Οι εκπαιδευόμενοι που θα ολοκληρώσουν επιτυχώς τις δύο φάσεις του προγράμματος θα λάβουν βεβαίωση παρακολούθησης και συμπλήρωμα βεβαίωσης παρακολούθησης από το ΚΕΔΙΒΙΜ του ΟΠΑ.

Στοιχεία Επικοινωνίας

  • elearning.aueb.gr
  • Αυτή η διεύθυνση ηλεκτρονικού ταχυδρομείου προστατεύεται από τους αυτοματισμούς αποστολέων ανεπιθύμητων μηνυμάτων. Χρειάζεται να ενεργοποιήσετε τη JavaScript για να μπορέσετε να τη δείτε.
  • 210 8203753 (09.00-16.00)
  • 4ος όροφος, Πατησίων 80, Αθήνα 10434

Πληροφόρηση

Newsletter

  • Τα προγράμματά μας ανανεώνονται συνεχώς. Αφήστε μας το email σας να σας ενημερώνουμε.

Log in

create an account

fb iconLog in with Facebook