Η τεχνητή νοημοσύνη διαβάζει ανθρώπινα χείλη

Επιστήμονες του Oxford University  με επικεφαλής τον  Έλληνα ερευνητή Γιάννη Ασσαέλ, δημιούργησαν ένα σύστημα τεχνητής νοημοσύνης που τα καταφέρνει καλύτερα στο διάβασμα χειλιών από τους ανθρώπους.

Σύμφωνα με το BBC, το  σύστημα  LipNet,  παρακολουθεί βίντεο χωρίς ήχο με έναν άνθρωπο να μιλάει και μπορεί να μαντέψει τι λέει με ακρίβεια 93%, παρακολουθώντας την κίνηση του στόματος του ομιλητή, αναφέρουν οι Βρετανοί ερευνητές, που υποστηρίζουν πως η αυτοματοποίηση της διαδικασίας θα μπορούσε να βοηθήσει εκατομμύρια ανθρώπους.

Ο Τζουν Σον Τσουνγκ, διδακτορικός του Τμήματος Μηχανολογίας του Oxford University, εξήγησε στο BBC για πόσο δύσκολη δουλειά πρόκειται: «Λέξεις όπως mat, bat και pat έχουν παρόμοια σχήματα στόματος».

«Αυτό που κάνει το σύστημα είναι να μαθαίνει τα πράγματα τα οποία πάνε μαζί, σε αυτή την περίπτωση τα σχήματα του στόματος και τους χαρακτήρες, και τους πιθανούς επόμενους χαρακτήρες».

Η ανάπτυξη του συστήματος χρηματοδοτήθηκε εν μέρει από τη θυγατρική τεχνητής νοημοσύνης Deep Mind της Google. Οι πιθανές πρακτικές εφαρμογές ενός τέτοιου συστήματος περιλαμβάνουν τη βελτίωση των ακουστικών βαρηκοΐας, την αυτόματη μετατροπή συζητήσεων σε κείμενο, την αναγνώριση ομιλίας σε περιβάλλοντα με θόρυβο, τη βιομετρική ταυτοποίηση ατόμων, τον υποτιτλισμό ταινιών του βωβού κινηματογράφου κ.α.