Το Claude Fable 5 επιστρέφει με «εξαιρετικά ισχυρή» προστασία

Αφού αφαιρέθηκε με εντολή της κυβέρνησης των ΗΠΑ, το Fable 5 επιστρέφει στη βιβλιοθήκη μοντέλων του Claude. Λόγω των νέων περιορισμών, το Fable 5 μπορεί να είναι μόνο το Opus 4.8 σε μάσκα.

Η Anthropic λέει ότι το Fable 5 θα επιστρέψει στους χρήστες σε όλο τον κόσμο την 1η Ιουλίου. Η Returning Edition είναι μια απογυμνωμένη έκδοση του Fable 5, από “πολλές προειδοποιήσεις”. Το μοντέλο που αντιμετωπίζει ο χρήστης έχει επανασχεδιαστεί για να διαχειρίζεται πιο αποτελεσματικά και να εξαλείφει εργασίες στον κυβερνοχώρο που αρχικά είχαν υποβιβαστεί στη δημιουργία κινδύνων για την ασφάλεια.

ρε Ενημερώσεις Εταιρείας είπαν ότι οι ερευνητές της Amazon ειδοποίησαν την κυβέρνηση των ΗΠΑ ότι βρήκαν μια μέθοδο για να παρακάμψουν τις διασφαλίσεις του Fable 5. Η μέθοδος δοκιμής της Amazon ήταν να ζητήσει από το μοντέλο να εντοπίσει αρκετές ευπάθειες λογισμικού. Η προτροπή δοκιμής αναφέρθηκε ότι ήταν μια εργασία υψηλής ασφάλειας, αν και η Anthropic λέει ότι θα μπορούσε να γίνει με οποιοδήποτε άλλο μοντέλο.

Η Anthropologie ισχυρίζεται ότι οι δικές της δοκιμές έχουν δώσει παρόμοια αποτελέσματα με λιγότερο ικανά μοντέλα μεταξύ των προγραμματιστών, όπως το Opus 4.8 και το GPT-5.5. Επιπλέον, κάθε μοντέλο που δοκιμάστηκε στο Anthropic παρήγαγε παρόμοια αποτελέσματα κατά την εκμετάλλευση αυτής της ευπάθειας και κανένα από αυτά τα αποτελέσματα δεν αποκάλυψε μοναδικές δυνατότητες σε επίπεδο μύθου.

Διαφήμιση – Κάντε κύλιση για περισσότερο περιεχόμενο

Οι δοκιμές μας επιβεβαίωσαν ότι πολλά λιγότερο ικανά μοντέλα — συμπεριλαμβανομένων των Claude Opus 4.8, GPT-5.5 και Kimi K2.7 — θα μπορούσαν να αναφέρουν την ίδια ευπάθεια με το Fable 5. Όσον αφορά την επίδειξη του τρόπου εκμετάλλευσης μιας ευπάθειας, κάθε μοντέλο Fable 5 που δοκιμάσαμε (συμπεριλαμβανομένου του Claude Haiku Opus, 4.6, Opus 4.6, 6.4,6. 4.7, Opus 4.8, GPT-5.4, GPT-5.5 και Kimi-5.5.5) θα μπορούσαν να παράγουν την ίδια επίδειξη.

Περίπου ένα μήνα αργότερα, το Claude Fable 5 επιστρέφει σε περιορισμένη μορφή. Αυτά τα μέτρα ασφαλείας έχουν πλέον βελτιωθεί, επομένως είναι πολύ πιο εύκολο να παίξετε από ό,τι σε προηγούμενες εκδόσεις

Το επανασχεδιασμένο Fable 5 φέρνει μερικά ελαττώματα. Οι ανθρωπολόγοι λένε ότι το σύνθετο μοντέλο δεν θα είναι σε θέση να χειριστεί όλες τις εργασίες. Όχι επειδή δεν μπορεί, αλλά λόγω των διασφαλίσεων που επιβάλλονται. Κατά τη διάρκεια εργασιών ρουτίνας, μπορεί να εμφανιστεί μια ειδοποίηση που προειδοποιεί ότι το μοντέλο πρέπει να επανέλθει στο Opus 4.8. Αυτό μπορεί να συμβεί με την κωδικοποίηση και τον εντοπισμό σφαλμάτων, είπε η εταιρεία στην ενημέρωση.

Σε στενή συνεργασία με την κυβέρνηση, εκπαιδεύσαμε έναν προηγμένο ταξινομητή ασφαλείας που στοχεύει και αποκλείει τη συμπεριφορά που περιγράφεται στην αναφορά. Οι χρήστες θα ειδοποιηθούν εάν ένα αίτημα αποκλειστεί στο Fable 5 και το αίτημα θα σταλεί στο Opus 4.8.

Όταν κυκλοφόρησε αρχικά το Fable 5, η Anthropic παρουσίασε την ίδια προειδοποίηση και σημείωσε ότι ορισμένοι χρήστες ενδέχεται να επιστρέψουν το μοντέλο εάν η προτροπή είναι υψηλού κινδύνου. Δεν έχει αλλάξει εγγενώς, αλλά έχει γίνει πιο άκαμπτο.

Μπορεί να μην λειτουργεί στο 99% των περιπτώσεων, αλλά το Fable 5 θα αυτοαναφέρεται και είναι πιο πιθανό να επιστρέψει σε ένα ασφαλές μοντέλο. Σύμφωνα με τους ερευνητές του, τα νέα μέτρα ασφαλείας είναι «εξαιρετικά ισχυρά». CAISI.

Το Claude Fable 5 και το Mythos 5 μοιράζονται πολλά από τα ίδια πλαίσια, αν και το τελευταίο είναι πολύ πιο κατάλληλο για τον χειρισμό των εργασιών κυβερνοασφάλειας που το Fable 5, ακόμη και από την αρχή, φαίνεται ότι έχει σχεδιαστεί να αποφεύγει. Ανεξάρτητα από αυτό, και τα δύο είναι σχεδιασμένα για πολύ σύνθετες εργασίες, όχι για απλές εργασίες σε επίπεδο chatbot. Για το λόγο αυτό, η Anthropic δεν θα επιτρέψει στους χρήστες να έχουν ελεύθερη πρόσβαση στο μοντέλο με τα καθορισμένα όρια χρήσης τους.

Το Claude Fable 5 λέγεται ότι θα είναι διαθέσιμο για χρήση ξανά από την 1η Ιουλίου. Την πρώτη φορά που κυκλοφόρησε, θα χρησιμοποιούσε πολύ μεγαλύτερο αριθμό κουπονιών και θα καταναλώσει πολύ πιο γρήγορα την παρακολούθηση της χρήσης. Η Anthropic είπε ότι τα σχέδια Pro, Max, Team και επιλεγμένα Enterprise θα μπορούν να χρησιμοποιούν το μοντέλο μέχρι τις 7 Ιουλίου με το 50% του ορίου χρήσης τους. Μετά από αυτό, θα είναι διαθέσιμο μόνο μέσω πιστώσεων προσωρινής χρήσης

FTC: Χρησιμοποιούμε αυτόματους συνδέσμους συνεργατών για να δημιουργήσουμε εισόδημα. Περισσότερο

Σύνδεσμος πηγής