Η ΕΕ κατασκευάζει chatbot για να σώσει τον ευρωπαϊκό πολιτισμό και τις γλώσσες της

Από τη Μαδρίτη έως τη Σόφια, οι χώρες της Ευρωπαϊκής Ένωσης έχουν αρχίσει να υποστηρίζουν μια πληθώρα πρωτοβουλιών με στόχο τη δημιουργία chatbot που ομιλούν άπταιστα τις τοπικές γλώσσες

Στην κούρσα της ανάπτυξης της τεχνητής νοημοσύνης και των προβλημάτων που απορρέουν από την επέκτασή της, οι Ευρωπαίοι έχουν επιδοθεί σε έναν αγώνα για τη δημιουργία δικών τους chatbot τεχνητής νοημοσύνης προκειμένου να προστατεύσουν τις οικονομίες, τον πολιτισμό, αλλά και τις γλώσσες τους.

Από τη Μαδρίτη έως τη Σόφια, οι χώρες της Ευρωπαϊκής Ένωσης έχουν αρχίσει να υποστηρίζουν μια πληθώρα πρωτοβουλιών με στόχο τη δημιουργία chatbot που ομιλούν άπταιστα τις τοπικές γλώσσες, αναφέρει σε άρθρο του το Politico.

Τα τελευταία εργαλεία τροφοδοσίας τεχνολογίας AI, όπως το δημοφιλές chatbot ChatGPT, βασίζονται σε «Μεγάλα Γλωσσικά Μοντέλα» ή LLM. Η γλώσσα βρίσκεται στον πυρήνα αυτών των καινοτομιών και η ΕΕ, ένας Πύργος της Βαβέλ με 24 επίσημες γλώσσες, από τα λιθουανικά έως τα μαλτέζικα, θέλει η συγκεκριμένη τεχνολογία να λειτουργεί στο δικό της πολιτισμικό περιεχόμενο.

Χαρακτηριστική είναι η δήλωση του υπουργού Οικονομίας της Γαλλίας Μπρούνο Λεμέρ σε εκδήλωση τεχνολογίας στις Κάννες τον Φεβρουάριο, ο οποίος ανέφερε ότι «δεν θέλουμε να αρκεστούμε μόνο στα αγγλικά… Προχωρώντας, δεν θέλουμε η γλώσσα μας να αποδυναμωθεί από αλγόριθμους και συστήματα τεχνητής νοημοσύνης».

Οι Ηνωμένες Πολιτείες ηγούνται των καινοτομιών από το ChatGPT OpenAI και τον μεγάλο υποστηρικτή της, τη Microsoft, την Google με το μοντέλο Gemini ενώ την ίδια ώρα στην κούρσα της κατασκευής κορυφαίων μοντέλων μπαίνει η Anthropic, η Meta και το xAI του Elon Musk.

Η ταχύτητα της αμερικανικής βιομηχανίας έχει κάνει τις ευρωπαϊκές κυβερνήσεις να ανησυχούν καθώς φοβούνται επανάληψη της κυριαρχίας των αμερικανικών εταιρειών όπως στην εποχή των social media και του Web 2.0.

Από ακαδημαϊκά εγχειρήματα μέχρι masterplans που χρηματοδοτούνται από την κυβέρνηση έως νεοφυείς επιχειρήσεις και ομάδες ανεξάρτητων κωδικοποιητών, η Ευρώπη δίνει μάχη ενάντια στα μεγαθήρια της Καλιφόρνια. Μόνο τον τελευταίο χρόνο, 13 ευρωπαϊκές χώρες έχουν ανακοινώσει ή έχουν λάβει μέτρα για την ανάπτυξη τοπικών μοντέλων με επίκεντρο τις τοπικές τους γλώσσες, σύμφωνα με έρευνα POLITICO.

Τα περισσότερα από τα υπάρχοντα ή αναπτυσσόμενα έργα είναι ανοιχτού κώδικα, σε μια προσπάθεια να καλυφθούν τα κενά υπολογιστών και χρηματοδότησης με τις ΗΠΑ, βασιζόμενα σε μια τεράστια κοινότητα εθελοντών προγραμματιστών. 

Για ορισμένες χώρες, όπως η Ισπανία, τα μοντέλα στην τοπική γλώσσα θα μπορούσαν να βοηθήσουν στην ενίσχυση της επιρροής τους σε πολιτιστικά και ιστορικά συνδεδεμένα μέρη με αυτές. Η Μαδρίτη, η οποία χρηματοδοτεί τη δημιουργία ενός LLM ικανού να μιλάει ισπανικά με βάση ένα σύνολο υψηλής ποιότητας ισπανικού περιεχομένου για εκπαίδευση τεχνητής νοημοσύνης, επιδιώκει μέσω της συγκεκριμένης τεχνολογίας στενότερη συνεργασία με τις ιβηροαμερικανικές χώρες .

Η Γαλλία έχει επίσης πρωτοστατήσει στη δημιουργία του Alt-EDIC , μιας κοινοπραξίας 12 χωρών της ΕΕ που είναι αφιερωμένη στη συνεργασία εντός του μπλοκ για την ανάπτυξη LLM σε ευρωπαϊκές γλώσσες.

Χάνεται στη μετάφραση

Η ειρωνεία είναι ότι για να είναι πραγματικά ανταγωνιστικοί, οι Ευρωπαίοι LLM θα πρέπει να μιλούν άπταιστα Αγγλικά, τα οποία παραμένουν η γλώσσα των περισσότερων επιστημονικών εργασιών του κόσμου και μετρούν λίγο πάνω από τις μισές σελίδες στον παγκόσμιο ιστό, σύμφωνα με διαδικτυακές έρευνες της εταιρείας W3Techs .

«Υπάρχει μια ανισορροπία ισχύος όσον αφορά την ποσότητα και την ποιότητα των δεδομένων εκπαίδευσης: απλά κοιτάξτε πόσο μεγάλη είναι η αγγλική Wikipedia σε σύγκριση με τις εκδόσεις της σε άλλες γλώσσες», δήλωσε ο Sebastian Ruder, ερευνητής στην πολυγλωσσική εταιρεία AI Cohere με έδρα τον Καναδά.

Ορισμένα LLM που κατασκευάζονται στις ΗΠΑ γνωρίζουν άλλες γλώσσες εκτός από τα αγγλικά, αλλά δεν φέρουν πάντα την επάρκεια και τις λεπτομέρειες που απαιτούνται για να ανταποκριθούν στους τοπικούς χρήστες.  

Για chatbots σχεδιασμένα να αλληλεπιδρούν μέσω ολόκληρων συνομιλιών από τους πολίτες μιας χώρας έως τους πελάτες μιας εταιρείας, αυτό μπορεί να δημιουργήσει προβλήματα. Μια αξιολόγηση «πολιτιστικής ευθυγράμμισης» τον Αύγουστο του 2023 από ερευνητές στο University College του Λονδίνου διαπίστωσε ότι τα LLM του OpenAI και της Google δεν ανταποκρίνονται στα πολιτιστικά πρότυπα σε χώρες όπως η Κίνα, η Σαουδική Αραβία και η Σλοβακία.

Καθώς η τεχνητή νοημοσύνη εδραιώνεται σε όλους τους κοινωνικούς τομείς, ο αντίκτυπος τέτοιων πολιτισμικών συγκρούσεων θα μπορούσε να είναι σημαντικός. Ο Kris Shrishak, συνεργάτης τεχνολογίας στο Irish Council for Civil Liberties, δήλωσε: «Μια αμερικανική εταιρεία τεχνολογίας μπορεί να εκπαιδεύσει το μοντέλο της, ας πούμε, στα λιθουανικά, αλλά αυτό είναι ζημιογόνο. Οπότε συνήθως το εκπαίδευε στα αγγλικά και μετά το βελτίωνε».

Η λύση, σύμφωνα με τον Ruder, είναι οι Ευρωπαίοι προγραμματιστές τεχνητής νοημοσύνης να εκπαιδεύουν τα bot τους τόσο στη γλώσσα τους όσο και στα αγγλικά, επιτρέποντας έτσι στο LLM να αξιοποιεί τις γνώσεις που κωδικοποιούνται στα αγγλικά όταν μιλά τη μητρική του γλώσσα.
 

Πηγή: skai.gr