- Global Voices στα Ελληνικά - https://el.globalvoices.org -

Ένα νέο εργαλείο ηχητικού ανεβάσματος για το έργο του πληθοποριστικού Βικιλεξικού για την γλώσσα όντια

Κατηγορίες: Νότια Ασία, Ινδία, Γλώσσα, Λογοτεχνία, Μέσα των πολιτών, Τεχνολογία, Ψηφιακός ακτιβισμός, Rising Voices
[1]

Μία εγκατάσταση ηχογράφησης στο σπίτι για το έργο Kathabhidhana για το Wiktionary. Εικόνα μέσω Subhashish Panigrahi από το Wikimedia Commons. CC BY-SA 4.0

Το Βικιλεξικό, πολύγλωσσο έργο, αδερφάκι της Βικιπαίδειας, υπόσχεται πολλά. Προς το παρόν, δεν υπάρχουν πολλές ηχογραφήσεις ανοιχτής άδειας που μπορείτε να ακούσετε ή να κατεβάσετεειδικά αν η μητρική σας γλώσσα δεν είναι μία από τις κύριες γλώσσες [2]. Το Βικιλεξικό είναι ήδη διαθέσιμο σε πολλές γλώσσες και εκτός από τους ορισμούς των λέξεων, είναι διαθέσιμες πολλές φωνητικές σημειώσεις — τουλάχιστον όσον αφορά το Διεθνές Φωνητικό Αλφάβητο (IPA). Τώρα, ένα έργο της γλωσσικής κοινότητας όντια βοηθά να απλοποιηθεί η διαδικασία των εθελοντικών εισφορών στο Βικιλεξικό Όντια [3].

Το Kathabhidhana, ένα έργο της κοινότητας με επικεφαλής τον Subhashish Panigrahi [4], συντάκτη στο Global Voices και στην όντια έκδοση της Βικιπαίδειας, είναι μία λύση ανοικτού κώδικα για την καταγραφή μεγάλων κομματιών λέξεων. Στη συνέχεια, τα ανεβάζει υπό ανοικτές άδειες, ώστε να μπορούν να είναι χρήσιμα για έργα όπως το Βικιλεξικό.

Η όντια [5]μία από τις κρατικές γλώσσες στην Ινδία, είναι μια ινδο-άρια γλώσσα που μιλιέται κυρίως στην ανατολική Ινδία με περίπου 40 εκατομμύρια ντόπιους ομιλητές. Με πάνω από 5.000 χρόνια [6] λογοτεχνικής κληρονομιάς, έχει αναγνωριστεί ως μία από τις παλαιότερες γλώσσες της Νότιας Ασίας, και της έχει δοθεί το καθεστώς της κλασικής γλώσσας [7] από την Ινδική κυβέρνηση.

Αλλά χάρη στη χρήση των συστημάτων δακτυλογράφησης που βασίζονται σε μη-Unicode χαρακτήρες, η διαδικτυακή παρουσία της γλώσσας εξακολουθεί να υστερεί. Για την αντιμετώπιση αυτών των ζητημάτων, κάμποσοι μετατροπείς κωδικοποίησης χαρακτήρων [8] που αλλάζουν το δακτυλογραφημένο κείμενο σε Unicode, χρησιμοποιώντας διάφορα συστήματα μη-Unicode κωδικοποίησης, ενσωματώνονται στην Βικιπαίδεια όντια [9]: έχει τώρα περισσότερες από 12.000 εγγραφές. Το Όντια Βικιλεξικό, από την άλλη πλευρά, ως ένα δωρεάν, με διαδικτυακή βάση και πλήρως πληθοποριστικό λεξικό στη γλώσσα όντια, προσπαθεί να γεφυρώσει το χάσμα.

Το έργο αντλεί την έμπνευσή του σε μεγάλο βαθμό από άλλα λογισμικά [10] ανοικτού κώδικα που δημιουργήθηκαν από τον Shrinivasan T [11], ο οποίος χρησιμοποίησε τη γλώσσα προγραμματισμού Python για να αυτοματοποιήσει και να απλοποιήσει τη διαδικασία. Έχει δημοσιεύσει αυτές τις οδηγίες στο YouTube:

 Ο Panigrahi εμπνεύστηκε να κάνει το έργο Kathabhidhana επειδή η υπάρχουσα μέθοδος [12] ήταν μία περίπλοκη διαδικασία: θα πρέπει να προφέρεις και να καταγράψεις μία λέξη, στη συνέχεια, να την εξάγεις σε μορφή Ogg Vorbis στο λογαριασμό σου στο Wikimedia Commons, το οποίο είναι μία κεντρική αποθήκη των αρχείων πολυμέσων για όλα τα έργα της Wikimedia. Μόλις φορτωθεί, η εγγραφή προστίθεται στο έργο του Βικιλεξικού. Εκτός από την χειροκίνητη καταγραφή της προφοράς, υπάρχει επίσης ένα πρόγραμμα ανοιχτού κώδικα, από κείμενο σε ομιλία, που ονομάζεται Dhvani [13], που λειτουργεί για τις περισσότερες Ινδικές γλώσσες.

Σε αντίθεση, έχοντας ηχογραφήσεις των λέξεων στο Βικιλεξικό βοηθά τους μη φυσικούς ομιλητές — καθώς και τα άτομα με προβλήματα όρασης — να ακούσουν την προφορά των διαφορετικών λέξεων. Η γλωσσική βιβλιοθήκη μπορεί επίσης να χρησιμοποιηθεί για διάφορα έργα Επεξεργασίας της Φυσικής Γλώσσας [14], όπως η οικοδόμηση μηχανών από κείμενο σε ομιλία [15] και από ομιλία σε ομιλία [16].

Μπορείτε να κατεβάσετε ένα αντίγραφο [17] του Kathabhidhana και να βρείτε όλες τις ηχογραφήσεις [18] που έγιναν με αυτό το λογισμικό.