- Global Voices στα Ελληνικά - https://el.globalvoices.org -

Αυτοί οι ειδικοί τεχνολογίας θέλουν να σου μιλά το κινητό σου στα σουαχίλι

Κατηγορίες: Κένυα, Γλώσσα, Μέσα των πολιτών, Τεχνολογία, Rising Voices
[1]

Φωτογραφία: Eli Duke, Flickr (CC BY-SA 2.0)

Με περίπου 100 εκατομμύρια ομιλητές, η σουαχίλι είναι η δεύτερη πιο διαδεδομένη γλώσσα στην αφρικανική ήπειρο μετά την αραβική. Ωστόσο, υπηρεσίες όπως η αυτόματη αναγνώριση ομιλίας (ASR) δεν διατίθενται στο εμπόριο σε αυτή τη γλώσσα, αρνούμενες σε πολλούς χρήστες με αναπηρίες και σε όσους δεν είναι εγγράμματοι πληροφορίες που χρειάζονται απεγνωσμένα στην καθημερινότητά τους. Αυτό μπορεί όμως να αλλάξει πολύ σύντομα, καθώς οι ακαδημαϊκές έρευνες και οι νεοσύστατες τεχνολογίες συγκλίνουν, ώστε να παρέχουν τοπικοποιημένες τεχνολογίες στους ομιλητές σουαχίλι.

Αναζήτηση στο Διαδίκτυο σε ένα απλό κινητό τηλέφωνο

Μία από αυτές τις πολύ ελπιδοφόρες καινοτομίες πρόκειται να αναδειχθεί στην Κένυα. Το Uliza [2](που σημαίνει “ρώτα” στα σουαχίλι) είναι μια φωνητική διασύνδεση, που επιτρέπει στους χρήστες να έχουν πρόσβαση σε πληροφορίες από το Διαδίκτυο χρησιμοποιώντας ένα βασικό κινητό τηλέφωνο.

Το  μόνο που χρειάζεται να κάνουν οι χρήστες είναι να καλέσουν και να κάνουν μια ερώτηση στα σουαχίλι. Εντός 15 έως 90 λεπτών, ένας “πράκτορας απαντήσεων” (πραγματικό άτομο που εργάζεται στο παρασκήνιο) απαντά με φωνητική απάντηση. Επί του παρόντος, ένα “πλήθος” από περίπου 50 πράκτορες αντιμετωπίζουν τα ερωτήματα μεταγράφοντας τις φωνητικές εγγραφές, αναζητώντας απαντήσεις διαδικτυακά σε πολλές γλώσσες, μεταφράζοντας τις πληροφορίες και στέλνοντάς τες πίσω στον καλούντα στα σουαχίλι.

Κατά τη διάρκεια του πιλοτικού πειράματος που διεξήχθη στην πρωτεύουσα της Κένυας, Ναϊρόμπι, και στη Δυτική Κένυα, περίπου 600 beta χρήστες έστειλαν ερωτήσεις σχετικά με τους τοπικούς αντιπροσώπους τους, ζήτησαν βοήθεια για την εργασία τους στα σουαχίλι και ζήτησαν ιατρικές πληροφορίες, που θα ήταν υπερβολικά ευαίσθητες για να αναφέρουν αυτοπροσώπως.

Κατά τη διάρκεια του πιλοτικού έργου Uliza, αυτές ήταν οι λέξεις που περιλαμβάνονταν στις συχνότερες ερωτήσεις που έστειλαν οι χρήστες (μεταφράστηκαν από τα σουαχίλι στα αγγλικά).

Το Uliza θα λύσει άλλο ένα πρόβλημα για τους μελλοντικούς χρήστες του: την έλλειψη πρόσβασης σε πληροφορίες που φιλοξενούνται στο Διαδίκτυο. Υπάρχουν πολλοί επικαλυπτόμενοι λόγοι για αυτήν την κατάσταση: μη προσβάσιμα πακέτα δεδομένων κινητής τηλεφωνίας, απόσταση έως το πλησιέστερο ίντερνετ καφέ, αναλφαβητισμός σε γλώσσες ευρύτερης επικοινωνίας, συν έλλειψη διαθέσιμου περιεχομένου σε τοπικές γλώσσες.

Δεν είναι πρόβλημα τεχνολογίας

Το πληθοποριστικό μοντέλο του Uliza έχει ομολογουμένως έντονη εργασία, αλλά έχει ένα σημαντικό πλεονέκτημα: με το να χειρίζονται ανθρώπινα όντα τη μεταγραφή και τη μετάφραση, παρακάμπτει προσωρινά την έλλειψη μεγάλων συνόλων δεδομένων φωνής, που συνήθως περιορίζουν τις προσπάθειες ASR στις αφρικανικές γλώσσες, ενώ ταυτόχρονα συλλέγει δεδομένα από πραγματικούς ομιλητές σε μια ποικιλία προφορών και διαλέκτων. Ο ιδρυτής του Uliza Grant Bridgman σχεδιάζει να χρησιμοποιήσει αυτή τη βάση δεδομένων για μικρές ηχογραφήσεις και μεταγραφές για να δημιουργήσει δυνατότητες εκμάθησης μηχανών και να αυτοματοποιήσει πλήρως το σύστημα στο μέλλον. Σε αυτή τη συζήτηση στο Πανεπιστήμιο Tufts, ο Bridgman παρουσίασε την ιδέα πίσω από το έργο:

Αρκετή έρευνα έχει ήδη ξεκινήσει για την κατασκευή αυτόματου λογισμικού αναγνώρισης ομιλίας για  σουαχίλι και άλλες ευρύτατα ομιλούμενες αφρικανικές γλώσσες, αλλά αργεί να βρεθεί η τεχνολογία στα χέρια των ανθρώπων. Σε μια συνέντευξη στο Global Voices, ο Bridgman εξήγησε:

The technology exists and all of this is already available for first world languages, now we need to find a commercial model to make it viable for low-resource languages.

Η τεχνολογία υπάρχει και όλα αυτά είναι ήδη διαθέσιμα για τις γλώσσες του ανεπτυγμένου κόσμου, τώρα πρέπει να βρούμε ένα εμπορικό μοντέλο για να γίνει βιώσιμο και για γλώσσες με λιγότερους πόρους.

Οι εταιρείες που επιθυμούν να στήσουν τηλεφωνικές γραμμές βοήθειας για μια αγροτική πελατειακή βάση με μειωμένο κόστος είναι δυνητικοί πελάτες για την αρχική φάση της ανάπτυξης του Uliza. Τελικά, θα εφαρμοστεί μια πλήρης υπηρεσία, που θα επιτρέπει στους χρήστες κινητών τηλεφώνων χωρίς πρόσβαση στο Διαδίκτυο να βρίσκουν απαντήσεις στις ερωτήσεις τους και να ανεβάζουν το δικό τους περιεχόμενο φωνής. Το κόστος για τον χρήστη θα είναι ελάχιστο – κοντά στην τιμή ενός SMS.

Το μοντέλο Uliza θα μπορούσε να είναι βιώσιμο για άλλες γλώσσες με αρκετά μεγάλο αριθμό ομιλητών. Αλλά για τη συντριπτική πλειοψηφία των 2.000 γλωσσών που ομιλούνται στην αφρικανική ήπειρο, αυτό δεν συμβαίνει. Ωστόσο, οι λύσεις θα μπορούσαν να προέρχονται από ένα ερευνητικό πρόγραμμα [3] υπό την καθοδήγηση του Preethi Jyothi στο Ινστιτούτο Beckman, όπου μια ομάδα ερευνητών χρησιμοποίησε μια πιθανολογική μέθοδο για να συγκεντρώσει μεταγραφές από μη-γηγενείς ομιλητές. Με το που βελτιωνόταν, η πιθανολογική μεταγραφή θα μπορούσε να ανοίξει τη δυνατότητα για ASR για λιγότερο εκπροσωπούμενες γλώσσες, ελπίζουμε με λογικό κόστος.