Calendar icon
Διάστημα αιτήσεων:
22/01/2023 00:00:00 - 29/02/2024 00:00:00
Αιτήσεις κλειστές
Alarm icon
Διάρκεια: 80 ώρες, 4 μήνες
Time icon
Έναρξη προγράμματος: Θα ανακοινωθεί σύντομα
Currency icon
Δίδακτρα: 350€
Desctop icon
Τρόπος διεξαγωγής προγράμματος:
Εξ Αποστάσεως Εκπαίδευση
Currency icon
Τύπος χορηγούμενου πιστοποιητικού:
Πιστοποιητικό Επιμόρφωσης
Programme banner

Σύντομη περιγραφή:

  • Απόφοιτες/Απόφοιτοι ή γενικά όσες/όσοι θέλουν να μάθουν να χρησιμοποιούν την R για τη στατιστική επεξεργασία των δεδομένων σε εργασίες και έρευνες,
  • πτυχιούχοι και ερευνήτριες/ερευνητές όλων των επιστημών,
  • εκπαιδευόμενοι και υποψήφιες/υποψήφιοι σε θέσεις εργασίας όπου είναι απαραίτητη η γλώσσα R,
  • όσες/όσοι γνωρίζουν βασικές γνώσεις προγραμματισμού και επιθυμούν να μάθουν τις δυνατότητες της και να τις αξιοποιήσουν στην αγορά εργασίας,
  • όσες/όσοι χρησιμοποιούν μέχρι τώρα στατιστικά λογισμικά κλειστού τύπου καθώς η γλώσσα R είναι ανοιχτού τύπου, δηλαδή όλοι έχουν πρόσβαση στον κώδικα της και μπορούν να κάνουν διορθώσεις,
  • και γενικά σε όλες/όλους όσες/όσους δεν έχουν προηγούμενη εμπειρία με τον προγραμματισμό και τη γλώσσα R, ξεκινούν από το «μηδέν» και ανεξάρτητα από το επίπεδο γνώσεων τους θέλουν να αποκτήσουν την ικανότητα χρήσης της σε κάθε επιστημονικό και εργασιακό επίπεδο.

Πιστωτικές μονάδες: 2,5

Τρόπος αξιολόγησης των εκπαιδευομένων:
Με ενδιάμεσες αξιολογήσεις στο τέλος της κάθε ενότητας, Τελική γραπτή εξέταση λήξη του προγράμματος

Επιστημονικός υπεύθυνος:
ΧΑΡΑΛΑΜΠΟΣ ΜΠΡΑΤΣΑΣ (γνωστικό αντικείμενο: Ευφυή Συστήματα Λογισμικού)

Ακαδημαϊκός υπεύθυνος:
ΧΑΡΑΛΑΜΠΟΣ ΜΠΡΑΤΣΑΣ

Βασικό θεματικό πεδίο:
Θετικές Επιστήμες και Επιστήμες Μηχανικών

Υποκατηγορίες θεματικών πεδίων:
Μαθηματικά & Στατιστική

Απαιτούμενα τυπικά προσόντα και όροι συμμετοχής

  • Πρόσβαση στο Διαδίκτυο 
  • Κατοχή προσωπικού e-mail 
  • Βασικές γνώσεις χειρισμού ηλεκτρονικών υπολογιστών

Στοιχεία επικοινωνίας

Για περισσότερες πληροφορίες οι ενδιαφερόμενες/οι μπορούν να επικοινωνούν με τον κ. Χαράλαμπο Μπράτσα και την κα Παπαγεωργίου Μυρτώ στα κάτωθι στοιχεία επικοινωνίας: cbratsas@iee.ihu.gr και myrtopapageorgiou@hotmail.com.

Διδάσκοντες

  1. Ιωάννης Αντωνίου, Καθηγητής ΑΠΘ
  2. Χαράλαμπος Μπράτσας, Επίκουρος Καθηγητής ΔΙΠΑΕ
  3. Μυρτώ Παπαγεωργίου, Υπ. Διδάκτωρ Μαθηματικό ΑΠΘ, Επιστημονικός συνεργάτης

Διδακτικές ενότητες και διάρκεια αυτών

Θεματική Ενότητα 1 : Εισαγωγή στην R                        

1.   Εισαγωγή στις βασικές έννοιες της R

2.   Διανύσματα

3.   Πίνακες

4.   Παράγοντες

5.   Πλαίσια Δεδομένων

6.   Λίστες

7.   Πακέτα R

8.   Εργαστηριακές Ασκήσεις

Θεματική Ενότητα 2: Μέσο Επίπεδο στην R                

1.   Ροές ελέγχου

2.   Δομές επανάληψης

3.   Συναρτήσεις

4.   Οι εντολές apply

5.   Βοηθητικά εργαλεία

6.   Εργαστηριακές Ασκήσεις

Θεματική Ενότητα 3: Εισαγωγή Δεδομένων στην R         

1.   Εισαγωγή δεδομένων με το πακέτο utils

2.   readr και data.table

3.   Εισαγωγή δεδομένων από Excel

4.   Εισαγωγή δεδομένων από τον ιστό

5.   Εισαγωγή δεδομένων από βάσεις δεδομένων

6.   Εισαγωγή δεδομένων από πακέτα στατιστικών λογισμικών

7.   Εισαγωγή δεδομένων – R Studio 

8.   Εργαστηριακές Ασκήσεις

Θεματική Ενότητα 4: Διαχείριση Δεδομένων dplyr  

1.   Εισαγωγή   

2.   Επιλογή και Μετατροπή Δεδομένων

3.   Συγκέντρωση Δεδομένων

4.   Ένωση Συνόλων Δεδομένων

5.   Εργαστηριακές Ασκήσεις

Θεματική Ενότητα 5: Οπτικοποίηση Δεδομένων  

1.   Εισαγωγή

2.   Δεδομένα

3.   Aesthetics, Positions and Scales

4.   Geometries

5.   Statistics

6.   Coordinates and Facets

7.   Themes

8.   Εργαστηριακές Ασκήσεις

Θεματική Ενότητα 6: Διερευνητική Ανάλυση Δεδομένων   

1.   Εξερεύνηση κατηγορικών δεδομένων

2.   Εξερευνώντας Αριθμητικά Δεδομένα

3.   Στατιστικά Μέτρα

4.   Παράδειγμα

5.   Εργαστηριακές Ασκήσεις

Θεματική Ενότητα 7: Στατιστική Συμπερασματολογία   

1.   Συμπερασματολογία για ένα δείγμα

2.   Συμπερασματολογία για δύο δείγματα

3.   Έλεγχοι Χ2

4.   Εργαστηριακές Ασκήσεις

Θεματική Ενότητα 8: Συσχέτιση και Παλινδρόμηση στην R 

1.   Συσχέτιση

2.   Απλή γραμμική παλινδρόμηση

3.   Αξιολόγηση μοντέλων απλής γραμμικής παλινδρόμησης

4.   Εργαστηριακές Ασκήσεις

Θεματική Ενότητα 9: Εισαγωγή στη Μηχανική Μάθηση 

1.   Εισαγωγή στη Μηχανική Μάθηση

2.   Πολλαπλή Γραμμική Παλινδρόμηση

3.   Λογιστική παλινδρόμηση

4.   Δέντρα αποφάσεων – Δέντρα ταξινόμησης 

5.   Δέντρα παλινδρόμησης

6.   Εργαστηριακές Ασκήσεις

Αναλυτική παρουσίαση διδακτικών ενοτήτων

Θεματική Ενότητα 1 : Εισαγωγή στην R 

Στην ενότητα “Εισαγωγή στην R”, οι συμμετέχοντες θα μάθουν τα βασικά εργαλεία αυτής της ευρέως χρησιμοποιούμενης γλώσσας ανοιχτού κώδικα. Επίσης θα μάθουν να διαχειρίζονται αντικείμενα δεδομένων όπως διανύσματα, παράγοντες (factors), πίνακες, πλαίσια δεδομένων και λίστες. Τέλος, θα μάθουν να φορτώνουν και να διαχειρίζονται πακέτα της R.

 

Θεματική Ενότητα 2: Μέσο Επίπεδο στην R                      

Σε αυτή την ενότητα περιλαμβάνει το επόμενο βήμα στις γνώσεις και τις ικανότητές των συμμετεχόντων στην R. Συγκεκριμένα, θα μάθουν για τις συνθήκες και ροές ελέγχου, τους βρόγχους και τις συναρτήσεις για να ενισχύσουν τον κώδικά τους. Επίσης θα χρησιμοποιήσουν τις εντολές της οικογένειας apply για να βελτιώσουν την αποδοτικότητα του κώδικά σας. Τέλος, το κεφάλαιο των βοηθητικών εργαλείων θα τους βοηθήσει στην διαχείριση των κανονικών εκφράσεων, των δομών δεδομένων, καθώς και τις μορφές για την ημερομηνία και την ώρα.

 

Θεματική Ενότητα 3: Εισαγωγή Δεδομένων στην R

Η εισαγωγή δεδομένων στο R θα έπρεπε να είναι το ευκολότερο βήμα στην διαδικασία της ανάλυσης. Δυστυχώς, όμως τα δεδομένα μπορεί να διατίθενται σε διάφορες μορφές όπως για παράδειγμα σε αρχεία .csv, .txt, spss, sas, dta, κτλ, με αποτέλεσμα να μην είναι πάντα εύκολη η εισαγωγή τους στην ανάλυση. Σε αυτό το μάθημα, οι συμμετέχοντες θα ξεκινήσουν μαθαίνοντας πώς να εισάγουν αρχεία .csv, txt με εντολές της R και στη συνέχεια, θα διερευνήσουν τα πακέτα readr και data.table τα οποία αποτελούν μια εναλλακτική και πιο αποτελεσματική εισαγωγή δεδομένων τέτοιου είδους αρχείων. Ακολούθως, θα διερευνηθεί ο τρόπος με τον οποίο θα γίνεται η εισαγωγή αρχείων .xls στην R χρησιμοποιώντας το πακέτο readxl. Τέλος θα μάθουν πώς να εισάγουν δεδομένα από τον ιστό καθώς και από πακέτα στατιστικών λογισμικών SPSS, SAS και STATA .

 

Θεματική Ενότητα 4: Διαχείριση Δεδομένων dplyr  

Στην ενότητα αυτή οι συμμετέχοντες θα δουν πως μπορούν να χρησιμοποιήσουν εντολές του πακέτου dplyr για να διαχειριστούν τα σύνολα δεδομένων τους. Θα δουλέψουν για πρώτη φορά με τον τελεστή pipe (%>%) καθώς και με τη δομή δεδομένων tibble. Αρχικά θα μάθουν πως μπορούν να επιλέγουν συγκεκριμένες μεταβλητές, να φιλτράρουν τις παρατηρήσεις σας και να τις αναδιατάσσουν. Επίσης, θα μάθουν πως να δημιουργήσουν νέες μεταβλητές ως συνάρτηση των ήδη υπαρχουσών μεταβλητών, καθώς και πως να μετονομάσουν τις μεταβλητές τους. Ακόμη, θα μάθουν πως να ομαδοποιούν τα δεδομένα τους αλλά και πως να συνοψίζουν τις αρχικές παρατηρήσεις βάσει μιας συνάρτησης. Τέλος, θα δείτε πως μπορούν να ενώσουν σε έναν πίνακα δεδομένα από δύο διαφορετικά σύνολα δεδομένων.

 

Θεματική Ενότητα 5: Οπτικοποίηση Δεδομένων  

Στην ενότητα αυτή θα μάθουν πως οι συμμετέχοντες να παράγουν γραφήματα με το πακέτο της R, ggplot2. Αρχικά, θα τους παρουσιαστεί η έννοια της γραμματικής των γραφικών, το πλαίσιο σχεδιασμού στο οποίο χτίστηκε η ggplot2 και στηρίζεται στην παραγωγή γραφημάτων με την προσθήκη επιπέδων. Ακολούθως θα τους γίνει παρουσίαση όλων των επιπέδων. Πρώτα θα δουν για τα δεδομένα και την αισθητική, ενώ μετά για τις γεωμετρίες, τα στατιστικά, το σύστημα συντεταγμένων, τα γραφήματα σε πάνελ (facets) και τέλος για τα θέματα (themes). Μέσα από την ενότητα αυτή θα δουν πως να σχεδιάζουν διαγράμματα διασποράς, ραβδογράμματα, ιστογράμματα, διαγράμματα γραμμής καθώς και θηκογράμματα.

 

Θεματική Ενότητα 6: Διερευνητική Ανάλυση Δεδομένων  

Η διερευνητική επισκόπηση των δεδομένων είναι το πρώτο βήμα στην ανάλυση δεδομένων. Εκτός από το μέγεθος και το πλήθος των μεταβλητών των δεδομένων, σε αυτή την ενότητα, οι συμμετέχοντες θα μάθουν τεχνικές οι οποίες αποκαλύπτουν τη δομή των δεδομένων σας, αναζητούν τις μεταβλητές που ενδεχομένως να συσχετίζονται με κάποιες άλλες και εντοπίζουν αν υπάρχουν, τις παρατηρήσεις που είναι «ασυνήθιστες» (παράτυπα σημεία).

 

Θεματική Ενότητα 7: Στατιστική Συμπερασματολογία  

Σε αυτή την ενότητα οι συμμετέχοντες θα μάθουν τους βασικούς ελέγχους της στατιστικής συμπερασματολογίας. Συγκεκριμένα θα μάθουν να χρησιμοποιούν παραμετρικούς και μη παραμετρικούς στατιστικούς ελέγχους για ένα δείγμα, για δύο ανεξάρτητα ή εξαρτημένα δείγματα, τους ελέγχους κανονικότητας Kolmogorov-Smirnov, Shapiro-Wilk και τους οπτικούς ελέγχους qqplots καθώς επίσης και τον έλεγχο ανεξαρτησίας Χ2.

 

Θεματική Ενότητα 8: Συσχέτιση και Παλινδρόμηση στην R

Τελικά, η ανάλυση δεδομένων αφορά την κατανόηση των σχέσεων μεταξύ των μεταβλητών. Η διερεύνηση δεδομένων με πολλές μεταβλητές απαιτεί νέα, πιο περίπλοκα εργαλεία, αλλά επιτρέπει ένα πιο πλούσιο σύνολο συγκρίσεων. Σε αυτό το μάθημα, οι συμμετέχοντες θα μάθουν πώς να περιγράψουν τη σχέση μεταξύ δύο ποσοτικών μεταβλητών. Θα κατασκευάσουν γραφήματα για να οπτικοποιήσουν τη σχέση τους, χρησιμοποιώντας συνοπτικά στατιστικά στοιχεία καθώς και τεχνικές απλών μοντέλων γραμμικής παλινδρόμησης.

 

Θεματική Ενότητα 9: Εισαγωγή στη Μηχανική Μάθηση

Από την άποψη της μηχανικής μάθησης, η παλινδρόμηση είναι το καθήκον της πρόβλεψης αριθμητικών αποτελεσμάτων από διάφορες εισόδους. Σε αυτό το μάθημα, οι συμμετέχοντες θα μάθουν για διαφορετικά μοντέλα παλινδρόμησης, πώς να εκπαιδεύσουν αυτά τα μοντέλα σε R, πώς να αξιολογήσουν τα μοντέλα που εκπαιδεύονται και να τα χρησιμοποιήσουν για να κάνετε προβλέψεις. Αυτή η εισαγωγή σε αρχάριου επιπέδου στη μηχανική μάθηση καλύπτει τέσσερις από τους πιο κοινούς αλγόριθμους ταξινόμησης. Οι συμμετέχοντες θα καταλήξουν σε μια βασική κατανόηση του τρόπου με τον οποίο κάθε αλγόριθμος προσεγγίζει μια μαθησιακή εργασία, καθώς και να μάθουν τις λειτουργίες R που απαιτούνται για την εφαρμογή αυτών των εργαλείων στη δική τους εργασία.