Συσκευές που ακούν!

Οι μηχανικοί υπολογιστών έχουν ονειρευτεί μια συσκευή που θα μπορεί να μεταφράζει την ομιλία σε κάτι που θα μπορούσε να καταλάβει ένας κενός σωλήνας.

Τώρα, επιτέλους ανακαλύπτονται κάποιοι πολλά υποσχόμενοι μηχανισμοί. Βέβαια, απέχουν πολύ ακόμα από το είδος ενός υπολογιστή επιστημονικής φαντασίας που θα μπορεί να καταλαβαίνει προτάσεις και ολόκληρες ομιλίες. – Science News, 4 Μαρτίου 1967.

Σήμερα
Αυτή η συσκευή του 1967 αναγνώριζε μόνο τα νούμερα από το 1-9. Προηγούμενες συσκευές αναγνώρισης φωνής έκοβαν μία λέξη σε κομμάτια και την ανέλυαν για την απόλυτη ένταση. Αλλά αυτή η μηχανή, που δημιουργήθηκε από τον Genung L. Clapper στο IBM, αναγνώριζε τον όγκο ενός τμήματος σε σύγκριση με τα γειτονικά του για να υπολογίσει τη μεταβλητότητα της ανθρώπινης ομιλίας.

Η σημερινή αναγνώριση ομιλίας πηγαίνει ένα βήμα παραπέρα, διαιρώντας τις λέξεις σε ξεχωριστές μονάδες ήχου και σύνταξης. Το λογισμικό αποκωδικοποιεί την ομιλία εφαρμόζοντας αναγνώριση προτύπων και μια στατιστική μέθοδο που ονομάζεται κρυμμένο μοντέλο Markov για τους ήχους. Βασιζόμαστε στην αναγνώριση ομιλίας για να ανοίξoυμε μια εφαρμογή, για να παραγγείλουμε είδη παντοπωλείου, για να στείλουμε ένα κείμενο ή για να ρωτήσουμε κάποιον στο σπίτι εάν χρειαζόμαστε γάλα. Hello, Siri.