Χαμένοι στη μετάφραση: Γιατί το Google Translate συχνά κάνει λάθος στη γιορούμπα και άλλες γλώσσες

Wikimedia User Group Nigeria, Οκτώβριος 2018, Wikimedia Commons CC.BY.2.0.

Η αγγλική γλώσσα έχει κυριαρχήσει στον ηλεκτρονικό διάλογο ως “καθολική” γλώσσα επικοινωνίας από την έναρξη του διαδικτύου. Ως τον Φεβρουάριο του 2020, πάνω από το ήμισυ των ιστότοπων στο διαδίκτυο είναι στα αγγλικά, σύμφωνα με το WebTech3.

Αλλά καθώς περισσότεροι άνθρωποι βγαίνουν στο διαδίκτυο μιλώντας διαφορετικές γλώσσες, έχει προκαλέσει μια γλωσσική ψηφιακή επανάσταση: άμεση πρόσβαση σε αγγλικές μεταφράσεις πολλαπλών γλωσσών με το πάτημα ενός κουμπιού.

Πολλές εταιρείες τεχνολογίας έχουν πρόσφατα καταβάλει προσπάθειες για την τεκμηρίωση μη αγγλικών λέξεων στο διαδίκτυο, ανοίγοντας το δρόμο για την ψηφιοποίηση πολλών γλωσσών. Η Google, η Yoruba Names, η Masakhane MT και η ALC αποτελούν παραδείγματα εταιρειών και νεοσύστατων επιχειρήσεων, που προσπαθούν να παντρέψουν την τεχνολογία με μη αγγλικές γλώσσες.

Στα τέλη Φεβρουαρίου του 2020, η Google ανακοίνωσε ότι θα προσθέσει πέντε νέες γλώσσες στις υπηρεσίες του Google Translate, μετά από τετραετή παύση της προσθήκης νέων γλωσσών: της κινιαρουάντα, της ουιγούρικης, της ταταρικής, της τουρκμενικής και της όντια.

Άνδρας κοιτά μπερδεμένος, όσο διαβάζει ένα κείμενο διαδικτυακά. Φωτογραφία: Oladimeji Ajegbile, ανοιχτού κώδικα, μέσω Pexels.

Έχετε κάνει ποτέ κλικ στην επιλογή μετάφρασης και να συνειδητοποιήσετε ότι η αγγλική μετάφραση είναι, στην καλύτερη περίπτωση, απλά ΟΚ; Και στη χειρότερη περίπτωση, δεν είναι καθόλου ακριβής;

Υπάρχουν πολλές αμφισβητήσεις και δυσκολίες, όταν πρόκειται να κάνουμε αυτό το είδος μετάφρασης και εργασίας πρόσβασης.

Το Twitter προσφέρει μετάφραση της γλώσσας γιορούμπα στα αγγλικά μέσω του Google Translate όσο το δυνατόν περισσότερο και συνήθως το αποτέλεσμα δεν είναι εντελώς κακό: ίσως μερικές λέξεις είναι σωστές.

Ο λόγος αυτών των προκλήσεων είναι ότι οι εταιρείες τεχνολογίας συλλέγουν συνήθως τα γλωσσικά τους στοιχεία για την αγγλική μετάφραση από το Διαδίκτυο. Αυτά τα δεδομένα μπορεί να λειτουργούν σε ορισμένες γλώσσες, αλλά γλώσσες όπως η γιορούμπα και η ίγκμπο, δύο κύριες γλώσσες από τη Νιγηρία, αποτελούν πρόκληση λόγω των ανεπαρκών ή ανακριβών σημείων προφοράς, που υποδεικνύουν τονισμό αυτών των λέξεων.

Σε απάντηση στο γιατί πήρε στην Google τέσσερα χρόνια για να προσθέσει πέντε νέες γλώσσες, ένας εκπρόσωπος της εταιρείας εξήγησε:

 Google Translate learns from existing translations found on the web, and when languages don’t have an abundance of web content, it’s been difficult for our system to support them effectively. … However, due to recent advances in our machine learning technology, and active involvement from our Google Translate Community members, we’ve been able to add support for these languages.

Το Google Translate μαθαίνει από υπάρχουσες μεταφράσεις, που βρίσκονται στον ιστό, και όταν οι γλώσσες δεν έχουν αφθονία περιεχομένου ιστού, είναι δύσκολο για το σύστημά μας να τις υποστηρίζει αποτελεσματικά…Ωστόσο, λόγω των πρόσφατων εξελίξεων στην τεχνολογία εκμάθησης μηχανών και της ενεργού συμμετοχής των μελών της κοινότητας του Google Translate, μπορέσαμε να προσθέσουμε υποστήριξη για αυτές τις γλώσσες.

Επίσης, οι περισσότεροι άνθρωποι δεν είναι τόσο καλοί στην ορθογραφία σε αυτές τις γλώσσες. Ως αποτέλεσμα, οι καλές μεταφράσεις δεν υπολογίζονται, επειδή αυτά τα σφάλματα δεν επισημαίνονται ως ανεπαρκή.

Οι περισσότερες μεταφράσεις από μηχανές καταγράφουν ως λάθος μερικές λέξεις, ειδικά λέξεις, που φέρουν πολιτισμικό “βάρος”. Για παράδειγμα, στη γιορούμπα οι λέξεις ayaba και obabinrin έχουν τις έννοιές τους σε ένα πολιτισμικό πλαίσιο. Οι περισσότερες μηχανές μεταφράζουν και τις δύο λέξεις ως “βασίλισσα”. Ωστόσο, από μια οπτική γωνία παράδοσης-πολιτισμού, είναι σημαντικό να σημειωθεί ότι οι έννοιες των λέξεων ayaba και obabinrin είναι διαφορετικές: obabìnrin σημαίνει “βασίλισσα” ενώ ayaba “σύζυγος του βασιλιά”.

Ακόμη και με αυτές τις μεταφραστικές επιπλοκές, η τεχνολογία συνέβαλε στην προώθηση των αφρικανικών γλωσσών σε ψηφιακούς χώρους, προωθώντας τη γέννηση νέων λέξεων. Οι αφρικανικές γλώσσες έχουν αυξηθεί με την εισροή νέων συσκευών όπως τα smartphones και τα tablets, καθώς νέες λέξεις γεννιούνται για να ονομαστούν αυτά τα νέα τεχνολογικά εργαλεία και έννοιες. Αυτή η διαδικασία επέκτεινε έτσι τη χρήση και τη λειτουργικότητα αυτών των γλωσσών.

Με την εμφάνιση νέων τεχνολογιών, τα λεξιλόγια πολλών αφρικανικών γλωσσών έχουν γίνει πιο εξελιγμένα. Για παράδειγμα, η γλώσσα γιορούμπα έχει μερικές τεχνολογικά επηρεασμένες λέξεις όπως erọ amúlétutù (“κλιματιστικό”), erọ Ìbánisọrọ (“τηλέφωνο”) και erọ Ìlọta (“τρίφτης”). Ομοίως, η γλώσσα ίγκμπο έχει λέξεις όπως ekwè nti (“τηλέφωνο”) και ugbọ àlà (“όχημα”). Αυτές οι κοινωνίες έχουν δώσει σε αυτά τα gadgets ονόματα, με βάση τις λειτουργίες που εκτελούν.

Σε μαθήματα τηλεπικοινωνιών και διαφήμισης στη γλώσσα γιορούμπα, οι φοιτητές μαθαίνουν ότι οι περισσότεροι άνθρωποι αποκαλούν την τηλεόραση erọ Amóhùnmáwòrán. Αυτός ο νεολογισμός δημιουργεί πολλά ερωτήματα και απόψεις: ορισμένοι φοιτητές υποστηρίζουν ότι οι βιντεοκάμερες και οι συσκευές εγγραφής ήχου μπορούν επίσης να ονομαστούν erọ amóhùnmáwòrán με βάση τις λειτουργίες τους.

Αυτές οι γλωσσικές προκλήσεις στον χώρο της τεχνολογίας είναι υγιείς για τις γλώσσες: διεγείρεται η κριτική σκέψη τόσο για τη γλωσσική όσο και για την τεχνολογική πρόοδο.

Το 2019, η Google άνοιξε το πρώτο ερευνητικό κέντρο AI στην Άκρα της Γκάνα, στοχεύοντας “στη βελτίωση της ικανότητας του Google Translate να συλλάβει με μεγαλύτερη ακρίβεια τις αφρικανικές γλώσσες”, σύμφωνα με το CNN. Ο ερευνητής Moustapha Cisse, ο οποίος διευθύνει το έργο AI της Google στην Αφρική, πιστεύει ότι “μια ήπειρος με περισσότερες από 2.000 διαλέκτους αξίζει να εξυπηρετηθεί καλύτερα”, όπως ανέφερε το CNN.

Η Mozilla και η BMZ ανακοίνωσαν πρόσφατα τη συνεργασία τους για το άνοιγμα φωνητικής τεχνολογίας για τις αφρικανικές γλώσσες. Με παρόμοιες πρωτοβουλίες, υπάρχουν περισσότερα για να δείξουμε στο μέλλον σχετικά με τις σπουδές στις αφρικανικές γλώσσες.

Ξεκινήστε τη συζήτηση

Συντάκτες, παρακαλώ σύνδεση »

Οδηγίες

  • Όλα τα σχόλια ελέγχονται. Μην καταχωρείτε το σχόλιο σας πάνω από μία φορά γιατί θα θεωρηθεί spam.
  • Παρακαλούμε, δείξτε σεβασμό στους άλλους. Σχόλια τα οποία περιέχουν ρητορική μίσους, προσβολές ή προσωπικές επιθέσεις δεν θα καταχωρούνται.