Αντικείμενο της παρούσας Διπλωματικής Εργασίας αποτελεί η ανάλυση δεδομένων φυσικής οδήγησης (Naturalistic Driving Data – NDD) για την ταξινόμηση και πρόβλεψη της οδικής συμπεριφοράς και των σοβαρών περιστατικών (harsh events), με τεχνικές Μηχανικής Μάθησης (Machine Learning). Αξιοποιήθηκαν δεδομένα τηλεματικής της εταιρίας OSeven, για την ταξινόμηση και πρόβλεψη της Οδικής συμπεριφοράς, με τη χρήση των δεικτών Επικίνδυνης Οδικής συμπεριφοράς απότομων επιταχύνσεων και επιβραδύνσεων σε αναγωγή 100 χιλιομέτρων διαδρομής. Πιο συγκεκριμένα, επιδιώκεται ο προσδιορισμός του βαθμού επιρροής των οδικών δεδομένων στις καταστάσεις εμφάνισης απότομων περιστατικών, μέσω της διαδικασίας Επιλογής Χαρακτηριστικών (Feature Selection) και η ταξινόμηση των απότομων επιταχύνσεων (harsh accelerations) και απότομων επιβραδύνσεων (harsh brakings) σε δύο επίπεδα ασφαλείας μέσα από τεχνικές Μηχανικής Μάθησης. Η ομαδοποίηση με K-means κατέδειξε ότι οι οδηγοί με περισσότερες από 48 απότομες επιταχύνσεις και 45 απότομες επιβραδύνσεις ανά 100χλμ. οδήγησης εμφάνισαν την πιο επικίνδυνη συμπεριφορά. Τα αποτελέσματα της εργασίας ανέδειξαν την συνολική διανυθείσα απόσταση διαδρομής ως την μεταβλητή με την μεγαλύτερη επιρροή σε
απότομα περιστατικά, ενώ τις καλύτερες μετρικές αξιολογήσεις ταξινόμησης σε κλάσεις για το συγκεκριμένο πρόβλημα Μη Ισορροπημένης Μάθησης έδωσαν οι αλγόριθμοι Gradient Boosting και Multilayered Perceptrons, με αξιόλογες επιδόσεις για την εξαγωγή χρήσιμων συμπερασμάτων σχετικά με τα επίπεδα ασφάλειας της Οδικής συμπεριφοράς.