Το διάστημα 13-19 Απριλίου 2021, ο Blessing Sibanda θα διαχειρίζεται τον εναλλασσόμενο λογαριασμό @DigiAfricanLang στο Twitter, ο οποίος εξερευνά τους τρόπους, με τους οποίους μπορεί να χρησιμοποιηθεί η τεχνολογία για την αναζωογόνηση των αφρικανικών γλωσσών. Διαβάστε περισσότερα για την εκστρατεία εδώ.
Η σόνα, επίσημη γλώσσα της Ζιμπάμπουε, είναι μια από τις πιο ομιλούμενες γλώσσες μπαντού, με περίπου 10,8 εκατομμύρια ομιλητές. Όμως, ενώ υπάρχουν αρκετοί ιστορικοί και λογοτεχνικοί πόροι στη σόνα, η προβολή της γλώσσας στο Διαδίκτυο δεν είναι καθόλου ενθαρρυντική.
Ο Blessing Sibanda, μηχανικός λογισμικού, βρίσκεται στην πρώτη γραμμή της προσπάθειας να αναγνωριστεί η γλώσσα σόνα στον τομέα της επεξεργασίας φυσικής γλώσσας, ο τομέας της τεχνητής νοημοσύνης που ασχολείται με το να κάνει τους υπολογιστές να “κατανοούν” και να αποκωδικοποιούν γραπτή και προφορική γλώσσα.
Ο Adéṣinà Ọmọ Yoòbá του Rising Voices μίλησε με τον Blessing για να μάθει περισσότερα για το έργο του για την αναγνώριση της γλώσσας σόνα σε περιβάλλοντα μηχανικής μάθησης και στο διαδίκτυο.
Adéṣinà Ọmọ Yoòbá (AOY): Μπορείτε να μας πείτε λίγα πράγματα για εσάς;
Blessing Kudzaishe Sibanda (BKS): Το όνομά μου είναι Blessing Kudzaishe Sibanda. Είμαι μηχανικός λογισμικού και ερευνητής. Επί του παρόντος παρακολουθώ μεταπτυχιακό στην Επιστήμη Υπολογιστών στο Πανεπιστήμιο Επιστημών και Τεχνολογίας της Ναμίμπια. Τα ερευνητικά μου ενδιαφέροντα είναι στην Μηχανική Όραση και στην επεξεργασία φυσικής γλώσσας (NLP).
Είμαι μέλος του Masakhane, όπου πραγματοποιώ έρευνα NLP για γλώσσες με λίγες πηγές, και επικεντρώνομαι συγκεκριμένα στη μητρική μου γλώσσα, σόνα. Έχω ασχοληθεί ιδιαίτερα με τις πρωτοβουλίες μηχανικής μετάφρασης και αναγνώρισης οντοτήτων (NER) για τη σόνα.
AOY: Ποια είναι η τρέχουσα κατάσταση της γλώσσας εντός και εκτός διαδικτύου;
BKS: Η σόνα είναι πολύ ενεργή και ζωντανή εκτός διαδικτύου. Σύμφωνα με τον ιστότοπο mustgo, είναι μια από τις πιο ομιλούμενες γλώσσες μπαντού, με περίπου 10,7 εκατομμύρια ομιλητές. Έχει πλούσια ιστορία και λογοτεχνία με πολλές καταγραφές. Παρόλο που διαθέτει εξαιρετικούς πόρους εκτός διαδικτύου, εξακολουθούν να υπάρχουν πολλές δυνατότητες αύξησης της παρουσίας της στο διαδίκτυο.
AOY: Ποιες πιστεύετε ότι είναι οι μεγαλύτερες προκλήσεις, που αντιμετωπίζει η γλωσσική σας κοινότητα όσον αφορά τις ψηφιακές επικοινωνίες ή τη δημιουργία ψηφιακού περιεχομένου στη μητρική γλώσσα;
BKS: Νομίζω ότι, στις περισσότερες αφρικανικές χώρες, συμπεριλαμβανομένης της χώρας μου, η μεγαλύτερη πρόκληση είναι η ύπαρξη της γλώσσας των πρώην αποικιστών ως μητρική γλώσσα. Αν και αυτό ήταν πλεονεκτικό κατά την επικοινωνία σε μια διεθνή σκηνή, έχει κάνει τις μητρικές μας γλώσσες να μην εκτιμώνται, όπως θα έπρεπε. Αυτό έκανε σε κάποιο βαθμό όσους μιλούν, για παράδειγμα, αγγλικά, να θεωρούνται πιο μορφωμένοι ή ανώτερης κοινωνικής τάξης, ενώ οι δικές μας μητρικές γλώσσες περιφρονούνταν. Έτσι, βρίσκεις άτομα, που προτιμούν την ξένη γλώσσα περισσότερο από τη μητρική.
Με αυτό, νομίζω ότι το μεγαλύτερο ζήτημα, που πρέπει να αντιμετωπιστεί, είναι η προοπτική της μητρικής γλώσσας. Πρέπει να μετατοπιστεί, ώστε να είναι πιο ελκυστική για χρήση είτε στην επιχείρηση είτε στο Διαδίκτυο, έτσι ώστε οι άνθρωποι να μπορούν να την αγκαλιάσουν καλύτερα. Από τεχνολογική άποψη, καθυστερεί, όσον αφορά τα εργαλεία και το λογισμικό, που καθιστούν ευκολότερη και προσβάσιμη τη χρήση στο διαδίκτυο. Αυτό οφείλεται κυρίως στην έλλειψη πόρων, που μπορούν να χρησιμοποιηθούν για την παραγωγή αυτών των εργαλείων. Εργαλεία και υπηρεσίες, όπως λεξικά, μετάφραση, πληκτρολόγια (για γλώσσες με ειδικούς χαρακτήρες), λόγος, μεταξύ άλλων, θα αποδώσουν μακροπρόθεσμα, καθώς διευκολύνουν την επικοινωνία με τη δική μας γλώσσα στο διαδίκτυο.
AOY: Κατά τη γνώμη σας, ποια είναι μερικά από τα μέτρα, που θα μπορούσαν να ληφθούν, για να ενθαρρυνθεί η αυξημένη χρήση της γλώσσας στο Διαδίκτυο;
BKS: Πιστεύω ότι η ενσωμάτωση τοπικών γλωσσών σε καθημερινά διαδικτυακά εργαλεία και τεχνολογίες, που χρησιμοποιούμε, μπορεί να ενθαρρύνει την αυξημένη χρήση της γλώσσας στο Διαδίκτυο. Για παράδειγμα, με την Αναζήτηση Google, να μπορούσες να αλλάξεις την κύρια γλώσσα σε σόνα και να εμφανίζονται όλα στα σόνα. Τέτοια θα πρέπει επίσης να είναι η επιλογή για ιστότοπους κοινωνικών μέσων, όπου οι περισσότερες από τις γλώσσες από την Αφρική δεν καλύπτονται για εξατομίκευση της γλώσσας προβολής.
Ένα άλλο παράδειγμα είναι με τη Βικιπαίδεια. Οι χρήστες μπορούν να συνεισφέρουν σελίδες χρησιμοποιώντας τις δικές τους μητρικές γλώσσες, κάτι που, κατά κάποιον τρόπο, αυξάνει την δυνατότητα ανακάλυψης αυτών των γλωσσών. Πιστεύω ότι ένα άλλο βήμα, όπως προαναφέρθηκε, είναι η επένδυση στην έρευνα και σε προϊόντα, που χρησιμοποιούν μητρικές γλώσσες.
Από τεχνολογικής άποψης, υπάρχει μεγάλη έκταση προς κάλυψη σε σύγκριση με τις πιο διαδεδομένες γλώσσες, που πρέπει να είναι στο ίδιο επίπεδο όσον αφορά την έρευνα και τα προϊόντα. Αυτό είναι ένα εμπόδιο, καθώς δεν μπορούμε να εκφράσουμε πλήρως τη δική μας γλώσσα, κάνοντας παράλληλα όσους δεν είναι εξοικειωμένοι με αυτήν να μπορούν να την καταλάβουν, καθώς το Διαδίκτυο έχει κάνει τον κόσμο ένα παγκόσμιο χωριό. Με αυτές τις συντονισμένες προσπάθειες, πιστεύω ότι μπορεί να ενθαρρυνθεί η χρήση μητρικών γλωσσών στο διαδίκτυο.
AOY: Ποιο είναι το πρωταρχικό σας κίνητρο για να δείτε τη γλώσσα και τον πολιτισμό σας διαθέσιμα στο Διαδίκτυο;
BKS: Το κίνητρό μου είναι να βλέπω πολλή δραστηριότητα, όσον αφορά τις τεχνολογίες NLP για τη σόνα, και να διαθέτω εργαλεία συγκρίσιμα στην απόδοση με τις ευρέως χρησιμοποιούμενες γλώσσες στο Διαδίκτυο. Πιστεύω ότι ικανά εργαλεία θα ενθαρρύνουν αναπόφευκτα τη χρήση της γλώσσας στο Διαδίκτυο και, για να συμβεί αυτό, οι γηγενείς ομιλητές θα πρέπει να βρίσκονται στην πρώτη γραμμή της έρευνας και της παραγωγής αυτών των εργαλείων, καθώς κατανοούν καλύτερα τη δική τους γλώσσα.
Γι’ αυτό λατρεύω και είμαι μέλος της κοινότητας Masakhane. Ωθεί γηγενείς ομιλητές να εργαστούν και να ερευνήσουν στις γλώσσες τους. Μειώνει το εμπόδιο εισόδου στην εργασία με αυτές τις τεχνολογίες, παρέχοντας μια κοινότητα και μέντορες για να βοηθήσουν σε αυτό το ταξίδι παραγωγής αυτών των εργαλείων. Εκτός από αυτό, δημοσιεύει έρευνα, που θα διευκολύνει κι άλλους να συνεχίσουν αυτό το έργο και να διασφαλίσουν ότι οι μητρικές γλώσσες εκπροσωπούνται στην τεχνολογία.