Το ChatGPT δημιούργησε μια εμμονή με τους καλικάντζαρους ενώ το OpenAI προσπάθησε να το κάνει νευρικό

Μετά την κυκλοφορία του GPT-5.5 την περασμένη εβδομάδα, οι άνθρωποι παρατήρησαν κάτι ενδιαφέρον σχετικά με το τελευταίο μοντέλο του OpenAI. Στην εφαρμογή κωδικοποίησης Codex, η εταιρεία έβαλε μια προτροπή συστήματος που δίνει εντολή στο GPT 5.5 να αποφεύγει τις αναφορές σε καλικάντζαρους, γκρέμλιν και άλλα πλάσματα. Ναι, καλά διαβάσατε. «Μην μιλάτε για καλικάντζαρους, γκρεμλίν, ρακούν, τρολ, δράκους, περιστέρια ή άλλα ζώα ή πλάσματα εκτός εάν είναι απολύτως και αναμφίβολα σχετικό με την ερώτηση του χρήστη», αναφέρεται στην προτροπή.

Προφανώς, αρκετοί άνθρωποι άρχισαν να μιλούν για την εμμονή των ζώων του ChatGPT που το OpenAI ένιωσε την ανάγκη να παράσχει έναν απολογισμό για την προέλευση των καλικάντζαρων. Σε μια ανάρτηση ιστολογίου που δημοσιεύτηκε την Τετάρτη, η εταιρεία εξήγησε ότι άρχισε να παρατηρεί αλλαγές στο ChatGPT μετά την κυκλοφορία του GPT-5.1 τον περασμένο Νοέμβριο. Αφού ένας ερευνητής ασφαλείας ζήτησε από το OpenAI να συμπεριλάβει τις λέξεις “goblin” και “gremlin” στην έρευνά του για τα λεκτικά τικ του chatbot, η χρήση του “goblin” από το ChatGPT αυξήθηκε κατά 175% μετά την κυκλοφορία του GPT-5.1 από την εταιρεία. Εν τω μεταξύ, η χρήση του “Gremlin” αυξήθηκε κατά 52 τοις εκατό κατά την ίδια περίοδο.

Αυτή είναι μια πρωτότυπη γραμμή που προστέθηκε από το OpenAI στην επίσημη προτροπή συστήματος του κώδικα για το GPT-5.5. Συνήθως η προτροπή συστήματος είναι όσο το δυνατόν πιο ελάχιστη, οπότε υποθέτω ότι διαφορετικά θα αναφερόταν πολύ στο Goblin.

Τα AI είναι περίεργα.

— Ethan Mollick (@emollick.bsky.social) 2026-04-28T06:14:22.988Z

“Ένας “μικρός καλικάντζαρος” σε μια απάντηση μπορεί να είναι επιβλαβής, ακόμη και γοητευτικός. Ωστόσο, σε πολλές γενιές μοντέλων, η συνήθεια έχει γίνει δύσκολο να χαθεί: οι καλικάντζαροι συνεχίζουν να πολλαπλασιάζονται και πρέπει να καταλάβουμε από πού προέρχονται”, λέει η OpenAI. Μετά την κυκλοφορία του GPT-5.4, η εταιρεία (και ορισμένοι χρήστες) παρατήρησαν μια ακόμη μεγαλύτερη αύξηση στις αναφορές Goblin. Σε εκείνο το σημείο, μια έρευνα μπόρεσε να προσδιορίσει αυτό που το OpenAI περιγράφει ως «την πρώτη σύνδεση με τη βασική αιτία».

Εδώ και αρκετό καιρό, το ChatGPT έχει συμπεριλάβει μια δυνατότητα προσωπικότητας που επιτρέπει στους χρήστες να προσαρμόζουν το στυλ και τον τόνο των απαντήσεων του chatbot. Πριν από τον Μάρτιο του τρέχοντος έτους, μια επιλογή που μπορούσαν να επιλέξουν οι άνθρωποι ήταν το “nerdy”. Μέρος της προτροπής του συστήματος για αυτό το πρόσωπο είναι το εξής: “Ο κόσμος είναι περίπλοκος και παράξενος, και η παραξενιά του πρέπει να αναγνωριστεί, να αναλυθεί και να απολαύσει κανείς. Αντιμετωπίστε τα βαριά πράγματα χωρίς να πέσετε στην παγίδα της αυτο-σοβαρότητας.”

Όταν το OpenAI αντιστοίχισε το Goblin σε διάφορες προσωπικότητες του ChatGPT, διαπίστωσε ότι το nerdy person ήταν δυσανάλογα υπεύθυνο για τη χρήση αυτού του όρου. Παρά το γεγονός ότι αντιπροσώπευε μόνο το 2,5 τοις εκατό όλων των απαντήσεων ChatGPT, αντιπροσώπευε το 66,7 τοις εκατό όλων των αναφορών Goblin που δημιουργήθηκαν από το chatbot. Περαιτέρω έρευνα αποκάλυψε ότι η ενισχυτική μάθηση ήταν υπεύθυνη για την αυξημένη χρήση των Goblin και Gremlin. Συγκεκριμένα, το OpenAI ανακάλυψε ότι ένας μόνο μηχανισμός ανταμοιβής είναι υπεύθυνος για τη διδασκαλία των νευρικών προσωπικοτήτων να υποστηρίζουν με συνέπεια τη γλώσσα των ζώων.

«Σε όλα τα σύνολα δεδομένων στον έλεγχο, το Nerdy Personality Award έδειξε μια σαφή τάση για υψηλότερα αποτελέσματα για το ίδιο πρόβλημα από τα αποτελέσματα χωρίς «Goblin» ή «Gremlin», με θετική βελτίωση στο 76,2 τοις εκατό των συνόλων δεδομένων», εξηγεί η εταιρεία.

Αργότερα, το OpenAI ανακάλυψε ότι, λόγω του τρόπου με τον οποίο μπορεί να λειτουργήσει η ενισχυτική μάθηση, η αγάπη της σπασίκλας προσωπικότητας για τους καλικάντζαρους μεταφέρθηκε σε άλλα μέρη του μοντέλου της. «Οι ανταμοιβές εφαρμόστηκαν μόνο στην κατάσταση Nerdy, αλλά η ενισχυτική μάθηση δεν εγγυάται ότι οι μαθημένες συμπεριφορές ταιριάζουν απόλυτα με την κατάσταση που τις προκάλεσε», εξηγεί η εταιρεία. “Μόλις ανταμειφθεί ένα στιλ, η επακόλουθη εκπαίδευση μπορεί να εξαπλωθεί ή να το ενισχύσει αλλού, ειδικά εάν αυτά τα αποτελέσματα επαναπροορίζονται για εποπτευόμενα δεδομένα λεπτομέρειας ή προτιμήσεων.”

Πριν ξεκινήσει το OpenAI να εκπαιδεύει το GPT-5.5, εντόπισε τη συγγένεια του ChatGPT με τους καλικάντζαρους, γι’ αυτό και ο κώδικας έλαβε γρήγορα οδηγίες να αποφεύγει τη γλώσσα των ζώων. «Το Codex, τελικά, είναι αρκετά ηλίθιο», σημειώνει το OpenAI Στην αναζήτηση goblin του ChatGPT, η εταιρεία σημειώνει ότι έχει αναπτύξει νέα εργαλεία για τον έλεγχο και τη διόρθωση της συμπεριφοράς του μοντέλου. Αν ήταν στο χέρι μου, δεν θα χρησιμοποιούσα αυτά τα εργαλεία. Κρατήστε το AI περίεργο, λέω.


Σύνδεσμος πηγής: www.engadget.com