Μια νέα μελέτη αποκαλύπτει πώς τα κρατικά ελεγχόμενα μέσα μπορούν να επηρεάσουν τα chatbot AI διαμορφώνοντας τις πληροφορίες που μαθαίνουν, επηρεάζοντας τελικά τις απαντήσεις τους.

Βασικά σημεία

  • Τα chatbot AI μαθαίνουν από περιβάλλοντα πληροφοριών που διαμορφώνονται από θεσμούς και αρχές, όχι από το ουδέτερο Διαδίκτυο.
  • Το περιεχόμενο πολυμέσων που επιμελείται το κράτος εμφανίζεται συχνά στα δεδομένα εκπαίδευσης AI, επηρεάζοντας τη συμπεριφορά του μοντέλου.
  • Τα μοντέλα τεχνητής νοημοσύνης μπορούν να απομνημονεύσουν αναγνωρίσιμες φράσεις από κρατικά επιμελημένα μέσα, υποδεικνύοντας την επαναλαμβανόμενη έκθεση κατά τη διάρκεια της εκπαίδευσης.
  • Η επιρροή των μέσων ενημέρωσης που ελέγχονται από το κράτος είναι πιο εμφανής όταν τα μοντέλα τεχνητής νοημοσύνης προβάλλονται στην κύρια γλώσσα του κράτους.
  • Μεγάλα γλωσσικά μοντέλα δημιουργούν νέα κίνητρα για ισχυρούς παράγοντες να διαδώσουν στρατηγικά το κείμενο στο διαδίκτυο.

Το περιεχόμενο από κρατικά ελεγχόμενα μέσα μπορεί να επηρεάσει τα περιβάλλοντα πληροφοριών από τα οποία μαθαίνουν τα chatbot AI και χρησιμοποιούν για να ανταποκρίνονται σε αιτήματα των χρηστών, σύμφωνα με μια ανάλυση.

Ερευνητές, συμπεριλαμβανομένων εκείνων από το Πανεπιστήμιο του Όρεγκον και το Πανεπιστήμιο της Καλιφόρνια του Σαν Ντιέγκο, βρήκαν στοιχεία για το πώς η ανακυκλοφορία —μετακίνηση μέσω εφημερίδων, εφαρμογών, αναδημοσίευσης και κανονικών ιστοσελίδων έως ότου φανούν ότι αποτελούν μέρος του ευρύτερου περιβάλλοντος πληροφοριών— στον έλεγχο των κρατικών μέσων ενημέρωσης μπορεί να αφήσει ανιχνεύσιμα ίχνη στη συμπεριφορά ενός μοντέλου τεχνητής νοημοσύνης (AI).

Η μελέτη, που δημοσιεύτηκε στο περιοδικό Nature, συνδυάζει στοιχεία από την αξιολόγηση μεγάλων γλωσσικών μοντέλων στις τοπικές γλώσσες 37 χωρών με μια μελέτη περίπτωσης από την Κίνα.

Η τεχνητή νοημοσύνη μαθαίνει από προβληματικά περιβάλλοντα πληροφοριών

«Οι άνθρωποι συχνά μιλούν για την τεχνητή νοημοσύνη σαν να μαθαίνει από το Διαδίκτυο με ουδέτερο τρόπο», δήλωσε η συν-πρώτη συγγραφέας Hannah White, επίκουρη καθηγήτρια κοινωνιολογίας στο Πανεπιστήμιο του Όρεγκον. “Αλλά αυτό δεν ισχύει. Μαθαίνει από περιβάλλοντα πληροφοριών που έχουν ήδη διαμορφωθεί από θεσμούς και εξουσία, και αυτά τα περιβάλλοντα μπορούν να αφήσουν μετρήσιμα αποτελέσματα σε αυτό που λένε τα μοντέλα.”

Κατά τη διάρκεια έξι μελετών, η ομάδα εντόπισε τη διαδρομή του περιεχομένου από τα διαδικτυακά μέσα έως τα δεδομένα εκπαίδευσης έως τη μοντελοποιημένη συμπεριφορά, συνδυάζοντας αποτελέσματα από αναλύσεις, συμπεριλαμβανομένων δεδομένων ανοιχτής εκπαίδευσης και πειραμάτων με μικρά μοντέλα εκπαίδευσης.

Παρακολουθήστε τη θεσμική επιρροή στα μοντέλα τεχνητής νοημοσύνης

Για την παρακολούθηση της «θεσμικής επιρροής» μέσω της διαδικασίας εκπαίδευσης του μοντέλου AI, οι συγγραφείς δείχνουν πρώτα ότι περιεχόμενο από κρατικά συντονισμένα μέσα ενημέρωσης εμφανίζεται συχνά στα δεδομένα εκπαίδευσης.

Οι ερευνητές διαπίστωσαν επίσης ότι τα εμπορικά μοντέλα απομνημόνευαν αναγνωρίσιμες φράσεις που σχετίζονται με περιεχόμενο από κρατικά επιμελημένα μέσα, υποδηλώνοντας ότι το περιεχόμενο είχε προβληθεί πολλές φορές κατά τη διάρκεια της εκπαίδευσης.

«Το περιεχόμενο που επιμελείται το κράτος δεν αφορά μόνο αυτό που εμφανίζεται στα επίσημα μέσα ενημέρωσης», δήλωσε ο συγγραφέας Brandon M. Stewart, αναπληρωτής καθηγητής κοινωνιολογίας στο Πανεπιστήμιο Πρίνστον. «Αφορά επίσης την αναδιανομή: η ίδια διατύπωση ταξιδεύει σε εφημερίδες, εφαρμογές, αναδημοσιεύσεις και κανονικές ιστοσελίδες μέχρι να φαίνεται ότι αποτελεί μέρος του ευρύτερου περιβάλλοντος πληροφοριών».

«Από τη στιγμή που υπάρχει περιεχόμενο που έχει επιμεληθεί το κράτος στα δεδομένα εκπαίδευσης, το μοντέλο μπορεί να το ξεπεράσει σε κάτι που φαίνεται να είναι ουδέτερο, αντικειμενικές πληροφορίες», είπε ο Stewart.

Φιλοκυβερνητική γλώσσα και απαντήσεις

Η ομάδα θεώρησε επίσης ότι η επιρροή των χωρών στις δηλώσεις πριν από την κατάρτιση θα πρέπει να εμφανίζεται πιο καθαρά στην κύρια γλώσσα μιας χώρας – για παράδειγμα, μια ερώτηση που διατυπώνεται στα κινέζικα σχετικά με την κινεζική κυβέρνηση θα πρέπει να προκαλέσει μια πιο φιλοκυβερνητική απάντηση, σε σύγκριση με την ίδια ερώτηση στα αγγλικά.

Στις απαντήσεις τους σε πολιτικά ερωτήματα για την Κίνα, οι βαθμολογητές έκριναν ότι η απάντηση που ζήτησε η Κίνα ήταν πιο ευνοϊκή για την κινεζική κυβέρνηση σε περισσότερο από το 75% των περιπτώσεων, είπαν οι ερευνητές.

Σε μια διακρατική μελέτη 37 χωρών όπου η εθνική γλώσσα συγκεντρώνεται σε μεγάλο βαθμό σε μία μόνο χώρα, τα μοντέλα τεχνητής νοημοσύνης απεικόνισαν κυβερνήσεις και ιδρύματα από χώρες με ισχυρότερο έλεγχο των μέσων ενημέρωσης πιο ευνοϊκά στη γλώσσα της χώρας παρά στα αγγλικά.

Οι συγγραφείς είπαν ότι το εύρημα ήταν συσχετιστικό, αλλά πρόσθεσαν ότι ήταν συνεπές με τον μηχανισμό που εντοπίστηκε στην κινεζική μελέτη περίπτωσης.

«Αυτό δεν είναι απόδειξη ότι οι εταιρείες τεχνητής νοημοσύνης επιδιώκουν να κερδίσουν την εύνοια αυτών των κυβερνήσεων ή ότι αυτές οι κυβερνήσεις ελέγχουν τα συστήματα πολυμέσων έχοντας κατά νου τα chatbots», δήλωσε η συν-συγγραφέας Μάργκαρετ Ρόμπερτς, καθηγήτρια πολιτικών επιστημών στο Πανεπιστήμιο της Καλιφόρνια στο Σαν Ντιέγκο.

«Οι χώρες διαμορφώνουν το περιβάλλον πληροφοριών, το πληροφοριακό περιβάλλον διαμορφώνει τα δεδομένα εκπαίδευσης και τα δεδομένα εκπαίδευσης διαμορφώνουν τα αποτελέσματα των μοντέλων», είπε ο Roberts. «Αλλά στο μέλλον, τα ευρήματά μας υποδηλώνουν ότι το MBA δημιουργεί νέα κίνητρα για ισχυρούς παράγοντες να σκεφτούν στρατηγικά το κείμενο που δημοσιεύουν στο διαδίκτυο».

Αποποίηση ευθύνης: Το περιεχόμενο ειδήσεων λαμβάνεται από την αναφερόμενη πηγή. Οι τίτλοι, οι περιλήψεις, οι κεφαλίδες ενοτήτων και οι εικόνες δημιουργούνται ή επιλέγονται αυτόματα χρησιμοποιώντας τεχνητή νοημοσύνη/αλγόριθμους και μπορεί να μην είναι πάντα απόλυτα ακριβείς. Συνιστάται στους αναγνώστες να ανατρέξουν στο πλήρες άρθρο για το πλήρες περιεχόμενο.

Σύνδεσμος πηγής