Calendar icon
Application period:
09/12/2024 00:00:00 - 30/01/2025 23:59:59
Applications open
Alarm icon
Duration: 80 ώρες, 4 μήνες
Time icon
Lectures start: Will be announced soon
Currency icon
Cost: 350€
Desctop icon
Teaching mode:
Asynchronous distance education
Currency icon
Type of certificate granted:
Certificate of Specialized Training
Programme banner

Short description:

  • Απόφοιτες/Απόφοιτοι ή γενικά όσες/όσοι θέλουν να μάθουν να χρησιμοποιούν την R για τη στατιστική επεξεργασία των δεδομένων σε εργασίες και έρευνες,
  • πτυχιούχοι και ερευνήτριες/ερευνητές όλων των επιστημών,
  • εκπαιδευόμενοι και υποψήφιες/υποψήφιοι σε θέσεις εργασίας όπου είναι απαραίτητη η γλώσσα R,
  • όσες/όσοι γνωρίζουν βασικές γνώσεις προγραμματισμού και επιθυμούν να μάθουν τις δυνατότητες της και να τις αξιοποιήσουν στην αγορά εργασίας,
  • όσες/όσοι χρησιμοποιούν μέχρι τώρα στατιστικά λογισμικά κλειστού τύπου καθώς η γλώσσα R είναι ανοιχτού τύπου, δηλαδή όλοι έχουν πρόσβαση στον κώδικα της και μπορούν να κάνουν διορθώσεις,
  • και γενικά σε όλες/όλους όσες/όσους δεν έχουν προηγούμενη εμπειρία με τον προγραμματισμό και τη γλώσσα R, ξεκινούν από το «μηδέν» και ανεξάρτητα από το επίπεδο γνώσεων τους θέλουν να αποκτήσουν την ικανότητα χρήσης της σε κάθε επιστημονικό και εργασιακό επίπεδο.

ECTS: 2,5

Tuition Details:

Το κόστος συμμετοχής του προγράμματος ανέρχεται στο ποσό των 350 ευρώ και θα καταβάλλεται σε δύο δόσεις.

Οι εκπαιδευόμενες/εκπαιδευόμενοι θα ενημερώνονται για την καταβολή των δύο δόσεων, στην αρχή και στο μέσο του προγράμματος.  

Evaluation method:
Με ενδιάμεσες αξιολογήσεις στο τέλος της κάθε ενότητας, Τελική γραπτή εξέταση λήξη του προγράμματος

Scientific director:
ΧΑΡΑΛΑΜΠΟΣ ΜΠΡΑΤΣΑΣ (γνωστικό αντικείμενο: Ευφυή Συστήματα Λογισμικού)

Academic director:
ΧΑΡΑΛΑΜΠΟΣ ΜΠΡΑΤΣΑΣ

Basic subject:
Science and Engineering

Subject subcategories:
Mathematics & Statistics

Απαιτούμενα τυπικά προσόντα και όροι συμμετοχής

  • Πρόσβαση στο Διαδίκτυο 
  • Κατοχή προσωπικού e-mail 
  • Βασικές γνώσεις χειρισμού ηλεκτρονικών υπολογιστών

Σκοπός του προγράμματος

Η γλώσσα R αποτελεί ένα πολύτιμο εργαλείο διαχείρισης και ανάλυσης δεδομένων. Το πρόγραμμα αυτό παρέχει τη δυνατότητα στις/στους συμμετέχουσες/συμμετέχοντες να αποκτήσουν γνώσεις χρήσης της γλώσσας, ξεκινώντας από τα βασικά χαρακτηριστικά της και φτάνοντας σε ένα πολύ καλό επίπεδο επεξεργασίας και ανάλυσης δεδομένων. Αρχικά, αναλύονται οι βασικές δομές, βιβλιοθήκες και εντολές και στη συνέχεια μαθαίνουν πως να εισάγουν, να διαχειρίζονται και να οπτικοποιούν δεδομένα. Η στατιστική ανάλυση των δεδομένων και η μεθοδολογία μιας έρευνας αποτελούν βασικά κεφάλαια του προγράμματος, μέσα από τα οποία η συμμετέχουσα/ο συμμετέχων θα μπορέσει να αναπτύξει άποψη για πρακτικά προβλήματα ανάλυσης δεδομένων. Σκοπός του νέου προγράμματος είναι να προσφέρει την ευκαιρία στις/στους υποψήφιες/υποψήφιους από το μηδέν ενώ δεν έχουν καμία εμπειρία στην γλώσσα R, να εξοικειωθούν με το περιβάλλον της και να εκπαιδευτούν να δίνουν απαντήσεις σε επιστημονικά προβλήματα στις σπουδές αλλά και σε ερευνητικές δραστηριότητες κάθε είδους.

Εκπαιδευτικοί στόχοι

Ολοκληρώνοντας το Εκπαιδευτικό Πρόγραμμα, οι συμμετέχουσες/συμμετέχοντες θα μπορούν να:

  • Γράφουν κώδικα ώστε να εισάγουν δεδομένα από άλλα στατιστικά πακέτα, αρχεία και άλλα προγράμματα ενώ θα έχουν δει πως λειτουργεί η βασική δομή της R.
  • Διαχειριστούν δεδομένα και να χρησιμοποιούν ευέλικτους και δημιουργικούς τρόπους σχεδίασης γραφημάτων.
  • Ασχοληθούν με τη διερευνητική ανάλυση δεδομένων και να υπολογίζουν στατιστικά μέτρα.
  • Ασχοληθούν με τις τεχνικές της συσχέτισης και παλινδρόμησης.
  • Εφαρμόσουν στατιστικές μεθόδους σε δείγματα.
  • Ασχοληθούν με βασικές γνώσεις machine learning.
  • Αναπτύξουν άποψη για πρακτικά προβλήματα ανάλυσης δεδομένων.
  • Δίνουν απαντήσεις σε επιστημονικά προβλήματα αλλά και σε ερευνητικές δραστηριότητες κάθε είδους.

Στοιχεία επικοινωνίας

Για περισσότερες πληροφορίες οι ενδιαφερόμενες/οι μπορούν να επικοινωνούν με τον κ. Χαράλαμπο Μπράτσα και την κα Παπαγεωργίου Μυρτώ στα κάτωθι στοιχεία επικοινωνίας: cbratsas@iee.ihu.gr και myrtopapageorgiou@ihu.gr.

Διδάσκοντες

  1. Ιωάννης Αντωνίου, Καθηγητής ΑΠΘ
  2. Χαράλαμπος Μπράτσας, Επίκουρος Καθηγητής ΔΙΠΑΕ
  3. Μυρτώ Παπαγεωργίου, Υπ. Διδάκτωρ Μαθηματικό ΑΠΘ, Επιστημονικός συνεργάτης
  4. Αλέξανδρος Αγγελίδης, Υπ. Διδακτώρ ΔΙΠΑΕ, Επιστημονικός συνεργάτης
  5. Ευστάθιος Κωνσταντίνος Αναστασιάδης, Επιστημονικός συνεργάτης

Διδακτικές ενότητες και διάρκεια αυτών

Θεματική Ενότητα 1 : Εισαγωγή στην R                        

1.   Εισαγωγή στις βασικές έννοιες της R

2.   Διανύσματα

3.   Πίνακες

4.   Παράγοντες

5.   Πλαίσια Δεδομένων

6.   Λίστες

7.   Πακέτα R

8.   Εργαστηριακές Ασκήσεις

Θεματική Ενότητα 2: Μέσο Επίπεδο στην R                

1.   Ροές ελέγχου

2.   Δομές επανάληψης

3.   Συναρτήσεις

4.   Οι εντολές apply

5.   Βοηθητικά εργαλεία

6.   Εργαστηριακές Ασκήσεις

Θεματική Ενότητα 3: Εισαγωγή Δεδομένων στην R         

1.   Εισαγωγή δεδομένων με το πακέτο utils

2.   readr και data.table

3.   Εισαγωγή δεδομένων από Excel

4.   Εισαγωγή δεδομένων από τον ιστό

5.   Εισαγωγή δεδομένων από βάσεις δεδομένων

6.   Εισαγωγή δεδομένων από πακέτα στατιστικών λογισμικών

7.   Εισαγωγή δεδομένων – R Studio 

8.   Εργαστηριακές Ασκήσεις

Θεματική Ενότητα 4: Διαχείριση Δεδομένων dplyr  

1.   Εισαγωγή   

2.   Επιλογή και Μετατροπή Δεδομένων

3.   Συγκέντρωση Δεδομένων

4.   Ένωση Συνόλων Δεδομένων

5.   Εργαστηριακές Ασκήσεις

Θεματική Ενότητα 5: Οπτικοποίηση Δεδομένων  

1.   Εισαγωγή

2.   Δεδομένα

3.   Aesthetics, Positions and Scales

4.   Geometries

5.   Statistics

6.   Coordinates and Facets

7.   Themes

8.   Εργαστηριακές Ασκήσεις

Θεματική Ενότητα 6: Διερευνητική Ανάλυση Δεδομένων   

1.   Εξερεύνηση κατηγορικών δεδομένων

2.   Εξερευνώντας Αριθμητικά Δεδομένα

3.   Στατιστικά Μέτρα

4.   Παράδειγμα

5.   Εργαστηριακές Ασκήσεις

Θεματική Ενότητα 7: Στατιστική Συμπερασματολογία   

1.   Συμπερασματολογία για ένα δείγμα

2.   Συμπερασματολογία για δύο δείγματα

3.   Έλεγχοι Χ2

4.   Εργαστηριακές Ασκήσεις

Θεματική Ενότητα 8: Συσχέτιση και Παλινδρόμηση στην R 

1.   Συσχέτιση

2.   Απλή γραμμική παλινδρόμηση

3.   Αξιολόγηση μοντέλων απλής γραμμικής παλινδρόμησης

4.   Εργαστηριακές Ασκήσεις

Θεματική Ενότητα 9: Εισαγωγή στη Μηχανική Μάθηση 

1.   Εισαγωγή στη Μηχανική Μάθηση

2.   Πολλαπλή Γραμμική Παλινδρόμηση

3.   Λογιστική παλινδρόμηση

4.   Δέντρα αποφάσεων – Δέντρα ταξινόμησης 

5.   Δέντρα παλινδρόμησης

6.   Εργαστηριακές Ασκήσεις

Αναλυτική παρουσίαση διδακτικών ενοτήτων

Θεματική Ενότητα 1 : Εισαγωγή στην R 

Στην ενότητα “Εισαγωγή στην R”, οι συμμετέχοντες θα μάθουν τα βασικά εργαλεία αυτής της ευρέως χρησιμοποιούμενης γλώσσας ανοιχτού κώδικα. Επίσης θα μάθουν να διαχειρίζονται αντικείμενα δεδομένων όπως διανύσματα, παράγοντες (factors), πίνακες, πλαίσια δεδομένων και λίστες. Τέλος, θα μάθουν να φορτώνουν και να διαχειρίζονται πακέτα της R.

 

Θεματική Ενότητα 2: Μέσο Επίπεδο στην R                      

Σε αυτή την ενότητα περιλαμβάνει το επόμενο βήμα στις γνώσεις και τις ικανότητές των συμμετεχόντων στην R. Συγκεκριμένα, θα μάθουν για τις συνθήκες και ροές ελέγχου, τους βρόγχους και τις συναρτήσεις για να ενισχύσουν τον κώδικά τους. Επίσης θα χρησιμοποιήσουν τις εντολές της οικογένειας apply για να βελτιώσουν την αποδοτικότητα του κώδικά σας. Τέλος, το κεφάλαιο των βοηθητικών εργαλείων θα τους βοηθήσει στην διαχείριση των κανονικών εκφράσεων, των δομών δεδομένων, καθώς και τις μορφές για την ημερομηνία και την ώρα.

 

Θεματική Ενότητα 3: Εισαγωγή Δεδομένων στην R

Η εισαγωγή δεδομένων στο R θα έπρεπε να είναι το ευκολότερο βήμα στην διαδικασία της ανάλυσης. Δυστυχώς, όμως τα δεδομένα μπορεί να διατίθενται σε διάφορες μορφές όπως για παράδειγμα σε αρχεία .csv, .txt, spss, sas, dta, κτλ, με αποτέλεσμα να μην είναι πάντα εύκολη η εισαγωγή τους στην ανάλυση. Σε αυτό το μάθημα, οι συμμετέχοντες θα ξεκινήσουν μαθαίνοντας πώς να εισάγουν αρχεία .csv, txt με εντολές της R και στη συνέχεια, θα διερευνήσουν τα πακέτα readr και data.table τα οποία αποτελούν μια εναλλακτική και πιο αποτελεσματική εισαγωγή δεδομένων τέτοιου είδους αρχείων. Ακολούθως, θα διερευνηθεί ο τρόπος με τον οποίο θα γίνεται η εισαγωγή αρχείων .xls στην R χρησιμοποιώντας το πακέτο readxl. Τέλος θα μάθουν πώς να εισάγουν δεδομένα από τον ιστό καθώς και από πακέτα στατιστικών λογισμικών SPSS, SAS και STATA .

 

Θεματική Ενότητα 4: Διαχείριση Δεδομένων dplyr  

Στην ενότητα αυτή οι συμμετέχοντες θα δουν πως μπορούν να χρησιμοποιήσουν εντολές του πακέτου dplyr για να διαχειριστούν τα σύνολα δεδομένων τους. Θα δουλέψουν για πρώτη φορά με τον τελεστή pipe (%>%) καθώς και με τη δομή δεδομένων tibble. Αρχικά θα μάθουν πως μπορούν να επιλέγουν συγκεκριμένες μεταβλητές, να φιλτράρουν τις παρατηρήσεις σας και να τις αναδιατάσσουν. Επίσης, θα μάθουν πως να δημιουργήσουν νέες μεταβλητές ως συνάρτηση των ήδη υπαρχουσών μεταβλητών, καθώς και πως να μετονομάσουν τις μεταβλητές τους. Ακόμη, θα μάθουν πως να ομαδοποιούν τα δεδομένα τους αλλά και πως να συνοψίζουν τις αρχικές παρατηρήσεις βάσει μιας συνάρτησης. Τέλος, θα δείτε πως μπορούν να ενώσουν σε έναν πίνακα δεδομένα από δύο διαφορετικά σύνολα δεδομένων.

 

Θεματική Ενότητα 5: Οπτικοποίηση Δεδομένων  

Στην ενότητα αυτή θα μάθουν πως οι συμμετέχοντες να παράγουν γραφήματα με το πακέτο της R, ggplot2. Αρχικά, θα τους παρουσιαστεί η έννοια της γραμματικής των γραφικών, το πλαίσιο σχεδιασμού στο οποίο χτίστηκε η ggplot2 και στηρίζεται στην παραγωγή γραφημάτων με την προσθήκη επιπέδων. Ακολούθως θα τους γίνει παρουσίαση όλων των επιπέδων. Πρώτα θα δουν για τα δεδομένα και την αισθητική, ενώ μετά για τις γεωμετρίες, τα στατιστικά, το σύστημα συντεταγμένων, τα γραφήματα σε πάνελ (facets) και τέλος για τα θέματα (themes). Μέσα από την ενότητα αυτή θα δουν πως να σχεδιάζουν διαγράμματα διασποράς, ραβδογράμματα, ιστογράμματα, διαγράμματα γραμμής καθώς και θηκογράμματα.

 

Θεματική Ενότητα 6: Διερευνητική Ανάλυση Δεδομένων  

Η διερευνητική επισκόπηση των δεδομένων είναι το πρώτο βήμα στην ανάλυση δεδομένων. Εκτός από το μέγεθος και το πλήθος των μεταβλητών των δεδομένων, σε αυτή την ενότητα, οι συμμετέχοντες θα μάθουν τεχνικές οι οποίες αποκαλύπτουν τη δομή των δεδομένων σας, αναζητούν τις μεταβλητές που ενδεχομένως να συσχετίζονται με κάποιες άλλες και εντοπίζουν αν υπάρχουν, τις παρατηρήσεις που είναι «ασυνήθιστες» (παράτυπα σημεία).

 

Θεματική Ενότητα 7: Στατιστική Συμπερασματολογία  

Σε αυτή την ενότητα οι συμμετέχοντες θα μάθουν τους βασικούς ελέγχους της στατιστικής συμπερασματολογίας. Συγκεκριμένα θα μάθουν να χρησιμοποιούν παραμετρικούς και μη παραμετρικούς στατιστικούς ελέγχους για ένα δείγμα, για δύο ανεξάρτητα ή εξαρτημένα δείγματα, τους ελέγχους κανονικότητας Kolmogorov-Smirnov, Shapiro-Wilk και τους οπτικούς ελέγχους qqplots καθώς επίσης και τον έλεγχο ανεξαρτησίας Χ2.

 

Θεματική Ενότητα 8: Συσχέτιση και Παλινδρόμηση στην R

Τελικά, η ανάλυση δεδομένων αφορά την κατανόηση των σχέσεων μεταξύ των μεταβλητών. Η διερεύνηση δεδομένων με πολλές μεταβλητές απαιτεί νέα, πιο περίπλοκα εργαλεία, αλλά επιτρέπει ένα πιο πλούσιο σύνολο συγκρίσεων. Σε αυτό το μάθημα, οι συμμετέχοντες θα μάθουν πώς να περιγράψουν τη σχέση μεταξύ δύο ποσοτικών μεταβλητών. Θα κατασκευάσουν γραφήματα για να οπτικοποιήσουν τη σχέση τους, χρησιμοποιώντας συνοπτικά στατιστικά στοιχεία καθώς και τεχνικές απλών μοντέλων γραμμικής παλινδρόμησης.

 

Θεματική Ενότητα 9: Εισαγωγή στη Μηχανική Μάθηση

Από την άποψη της μηχανικής μάθησης, η παλινδρόμηση είναι το καθήκον της πρόβλεψης αριθμητικών αποτελεσμάτων από διάφορες εισόδους. Σε αυτό το μάθημα, οι συμμετέχοντες θα μάθουν για διαφορετικά μοντέλα παλινδρόμησης, πώς να εκπαιδεύσουν αυτά τα μοντέλα σε R, πώς να αξιολογήσουν τα μοντέλα που εκπαιδεύονται και να τα χρησιμοποιήσουν για να κάνετε προβλέψεις. Αυτή η εισαγωγή σε αρχάριου επιπέδου στη μηχανική μάθηση καλύπτει τέσσερις από τους πιο κοινούς αλγόριθμους ταξινόμησης. Οι συμμετέχοντες θα καταλήξουν σε μια βασική κατανόηση του τρόπου με τον οποίο κάθε αλγόριθμος προσεγγίζει μια μαθησιακή εργασία, καθώς και να μάθουν τις λειτουργίες R που απαιτούνται για την εφαρμογή αυτών των εργαλείων στη δική τους εργασία.