Η συγκεκριμένη Διπλωματική Εργασία αποσκοπεί στη διερεύνηση της επιρροής της χρήσης κινητού τηλεφώνου στη συμπεριφορά του οδηγού μέσω στατιστικής ανάλυσης ανισόρροπων δεδομένων με τεχνικές Μηχανικής Μάθησης (Machine Learning). Για την ταξινόμηση, την παλινδρόμηση και την πρόβλεψη της χρήσης κινητού τηλεφώνου αξιοποιήθηκαν δεδομένα τηλεματικής της εταιρείας OSeven, τα οποία συλλέχθηκαν από μετρήσεις σε πραγματικές οδικές συνθήκες. Ως δείκτης επικίνδυνης συμπεριφοράς ορίστηκε η χρήση κινητού τηλεφώνου και η ταξινόμηση πραγματοποιήθηκε σε δύο επίπεδα συμπεριφοράς του οδηγού (επικίνδυνη και μη επικίνδυνη οδήγηση). Στο πρώτο μέρος των αναλύσεων, αναπτύχθηκαν συνολικά τέσσερις αλγόριθμοι ταξινόμησης, δύο συμπεριλαμβανομένων όλων των υπό εξέταση ανεξάρτητων μεταβλητών και οι δύο ίδιοι αλγόριθμοι με τις πέντε σημαντικότερες εξ’ αυτών, όπως εκείνες προέκυψαν από τη μέθοδο Σημαντικότητας Χαρακτηριστικών (Feature Importance). Σημαντικότερες ανεξάρτητες μεταβλητές αναδείχθηκαν μεταβλητές σχετικές με την ταχύτητα διαδρομής, ενώ σύμφωνα με τις μετρικές αξιολόγησης ταξινόμησης καταλληλότερο μοντέλο κρίθηκε εκείνο της ‘Γραμμικής Διαχωριστικής Ανάλυσης’. Στο δεύτερο μέρος των αναλύσεων,
ακολουθήθηκε πανομοιότυπη διαδικασία για την παλινδρόμηση με εξαρτημένη μεταβλητή τη διάρκεια χρήσης κινητού τηλεφώνου με τον αλγόριθμο της ‘Προσαρμοστικής Ενδυνάμωσης’ με όλες τις ανεξάρτητες μεταβλητές να παρουσιάζει καλύτερη προβλεπτική ικανότητα και τη μεταβλητή της διάρκειας οδικής διαδρομής να θεωρείται σημαντικότερη.