Η αυστηρά ελεγχόμενη κυκλοφορία του Claude Mythos από την Anthropic έχει πάρει μια περίεργη τροπή. Αφού πέρασαν εβδομάδες επιμένοντας ότι ένα μοντέλο τεχνητής νοημοσύνης είναι τόσο ικανό για κυβερνοασφάλεια που είναι πολύ επικίνδυνο να αναπτυχθεί δημόσια, φαίνεται ότι το μοντέλο έπεσε σε λάθος χέρια ούτως ή άλλως.
σύμφωνα με Bloomberg“μια μικρή ομάδα μη εξουσιοδοτημένων χρηστών” είχε πρόσβαση στο Mythos – η ύπαρξη του οποίου αποκαλύφθηκε για πρώτη φορά σε μια διαρροή – από την ημέρα που η Anthropic ανακοίνωσε τα σχέδιά της να το προσφέρει σε μια επιλεγμένη ομάδα εταιρειών για δοκιμή. Η Anthropic λέει ότι ερευνά. Αυτή είναι μια πρόχειρη ματιά σε μια εταιρεία που έχει χτίσει την επωνυμία της λαμβάνοντας σοβαρά υπόψη την ασφάλεια της τεχνητής νοημοσύνης ενώ διαφημίζει την ικανότητα του τελευταίου της μοντέλου στον τομέα της κυβερνοασφάλειας.
Από τεχνολογική άποψη, το hack του Mythos είναι ενοχλητικά απλό. Bloomberg Οι αναφορές αναφέρουν ότι η ομάδα είχε πρόσβαση στο Mythos κάνοντας «μια επιμορφωμένη εικασία για την τοποθεσία του μοντέλου στο διαδίκτυο», χρησιμοποιώντας πληροφορίες για άλλα μοντέλα Anthropic που αποκαλύφθηκαν στην παραβίαση της Mercor – μια εταιρεία που παράγει δεδομένα εκπαίδευσης τεχνητής νοημοσύνης – μαζί με πρόσβαση ενός μέλους που απέκτησε μέσω συμβάσεων για την αξιολόγηση μοντέλων Anthropic. Η ομάδα απέκτησε μη εξουσιοδοτημένη πρόσβαση στο Mythos μέσω ενός συνδυασμού εμπιστευτικής γνώσης και τυχερών εικασιών, όχι μέσω εξελιγμένης τεχνολογικής εκμετάλλευσης ή κλοπής μοντέλων χονδρικής.
Τα τρωτά σημεία είναι αναπόφευκτα και ήταν η Mercor, όχι η Anthropic, που αποκάλυψε τις πληροφορίες που χρησιμοποίησαν οι χάκερ για να μαντέψουν την τοποθεσία του Mythos. Η Pia Hoch, ερευνήτρια στο Royal United Services Institute (RUSI), μια βρετανική δεξαμενή σκέψης, μου είπε ότι καμία εταιρεία δεν είναι ποτέ απολύτως ασφαλής και ότι οι άνθρωποι είναι συχνά ο πιο αδύναμος κρίκος, αν και «φαίνεται αρχικά λίγο τυχερός» που δεν υπάρχουν σοβαρές συνέπειες.
Η Anthropic απέτυχε να προβλέψει ένα είδος αποτυχίας που μπορεί να φανταστεί κανείς.
Αλλά δεν είναι εντελώς κακή τύχη. Αυτού του είδους οι μορφωμένες εικασίες είναι μια αρκετά τυπική τακτική hacking και το hack της Mercor ήταν ήδη γνωστό πριν από την κυκλοφορία του Mythos. Ο ερευνητής ασφάλειας Λούκας Ολέινικ μου το περιέγραψε αυτό ως το είδος της «εντελώς νοητή» αποτυχίας με την οποία αντιμετώπισε τακτικά η βιομηχανία της κυβερνοασφάλειας τα τελευταία 20 χρόνια. Οπότε η Anthropic θα έπρεπε να το είχε προβλέψει και να προετοιμαστεί ανάλογα, ειδικά γνωρίζοντας ότι οι πληροφορίες της είχαν παραβιαστεί.
Φαίνεται επίσης ότι η Anthropic είχε τα μέσα για να εντοπίσει την παραβίαση. Ο Olejnik είπε ότι η εταιρεία είναι σε θέση να “καταγράψει και να παρακολουθεί τη χρήση του μοντέλου”, κάτι που θα καθιστούσε δυνατή τη διακοπή της μη εξουσιοδοτημένης ή κακόβουλης πρόσβασης, ειδικά επειδή η διάθεση του Mythos υποτίθεται ότι ήταν πολύ περιορισμένη. Είναι σαφές ότι η Anthropic δεν παρακολουθούσε αρκετά προσεκτικά και δεδομένου του πόσο επικίνδυνο είναι το μοντέλο, είναι λογικό να αναρωτηθούμε γιατί.
με Bloomberg Αν και η ομάδα δεν χρησιμοποιούσε το Mythos για αποστολές κυβερνοασφάλειας, εν μέρει επειδή ήθελε απλώς να πειράξει το νέο μοντέλο και εν μέρει επειδή κάτι τέτοιο θα είχε αποξενώσει την Anthropic. Αν τα ανθρωπικά μηνύματα γύρω από τον Μύθο πρέπει να ληφθούν σοβαρά υπόψη, αυτό είναι ένα τυχερό διάλειμμα. Η εταιρεία χαρακτήρισε το Mythos ως «στιγμή για την ασφάλεια», υποστηρίζοντας ότι έχει βρει τρωτά σημεία σε «κάθε σημαντικό λειτουργικό σύστημα και πρόγραμμα περιήγησης ιστού» και λέγοντας ότι η κυκλοφορία του θα πρέπει να συντονιστεί ώστε να δοθεί χρόνος για «ενίσχυση της άμυνας στον κυβερνοχώρο του κόσμου».
Η Anthropic έχει τη συνήθεια να χρησιμοποιεί δραματική, ανησυχητική γλώσσα που μπορεί να είναι δύσκολο να αμφισβητηθεί ξεκάθαρα, συμπεριλαμβανομένου του φλερτ με την ιδέα ότι το μοντέλο της Claude μπορεί να είναι ευαίσθητο. Ωστόσο, οι αρχικές αναφορές από μέρη με πρόσβαση υποδεικνύουν ότι η Mythos είναι ιδιαίτερα εξειδικευμένη στην ασφάλεια στον κυβερνοχώρο. Ο Bobby Holley, CTO της Mozilla, είπε ότι έχει βρει εκατοντάδες σφάλματα στον Firefox 150 και μπορεί τελικά να δώσει στους υπερασπιστές την ευκαιρία να επιτύχουν πλήρη νίκη επί των επιτιθέμενων. Όπως ήταν αναμενόμενο, οι κυβερνήσεις και τα χρηματοπιστωτικά ιδρύματα σε όλο τον κόσμο ήταν πρόθυμοι να το πάρουν στα χέρια τους. Η NSA και άλλες υπηρεσίες των ΗΠΑ φέρεται να έχουν πρόσβαση παρά το γεγονός ότι η Anthropic έχει ταξινομηθεί ως κίνδυνος εφοδιαστικής αλυσίδας, αν και η εγκατάσταση φαίνεται να έχει παρακάμψει την αμερικανική υπηρεσία κυβερνοασφάλειας, CISA, μέχρι στιγμής.
«Η Anthropic ισχυρίζεται ότι βρίσκεται στην απόλυτη πρώτη γραμμή όλων αυτών των τεχνολογιών, αλλά τοποθετείται επίσης ως υπεύθυνος παράγοντας σε όλα αυτά».
Το γεγονός ότι το hack ανακαλύφθηκε από δημοσιογράφο και όχι από Anthropist εγείρει επίσης το προφανές ερώτημα εάν επρόκειτο για μεμονωμένο περιστατικό. «Δείχνει πόσο ευρύς ο κύκλος των ανθρώπων μπορεί να το κάνει αυτό, ακόμα κι αν δεν διαθέτουν τα πιο προηγμένα τεχνολογικά μέσα», είπε ο Χοχ. Η Anthropic πιθανότατα θα διερευνήσει την αλυσίδα εφοδιασμού της για να καταλάβει πώς συνέβη αυτό και να καλύψει τα κενά, αλλά είπε ότι υπάρχει ένα ευρύ φάσμα παικτών που θα ήθελαν να μπουν σε ένα μοντέλο όπως αυτό, μερικοί από τους οποίους έχουν ένα σημαντικό χρηματικό ποσό πίσω από αυτό. Δεν υπάρχει κανένας λόγος να πιστεύουμε ότι οποιοσδήποτε άλλος απέκτησε πρόσβαση θα ήταν τόσο περιορισμένος όσο η ομάδα Bloomberg ανέφερα στις.
Η ανθρωπότητα έχει, σε κάποιο βαθμό, πυροβοληθεί στα πόδια. Η εταιρεία έχει οικοδομήσει την ταυτότητά της γύρω από το να παίρνει πιο σοβαρά την ασφάλεια της τεχνητής νοημοσύνης από τους ανταγωνιστές της, δημιουργώντας πολύ υψηλές προσδοκίες για την ασφάλεια των μοντέλων που διαψεύδουν την προφανή παραμέλησή της. Το γεγονός ότι ο Μύθος εκτέθηκε μέσα από μια τόσο θεμελιώδη και προβλέψιμη αποτυχία το επιβεβαιώνει. Ακόμη χειρότερα, προωθώντας το Mythos ως ένα εξαιρετικά ισχυρό και πολύ επικίνδυνο εργαλείο δημόσιας διάδοσης, το Anthropic το έχει μετατρέψει σε προφανή στόχο, τόσο για κακόβουλους παράγοντες όσο και για χάκερ που απλώς αναζητούν μια πρόκληση.
Αυτό δεν είναι καν το πρώτο ενοχλητικό περιστατικό ασφαλείας γύρω από το Mythos. Η ύπαρξη του μοντέλου αποκαλύφθηκε κατά λάθος πριν από την κυκλοφορία του μέσω ενός «μη ασφαλούς συνόλου δεδομένων» σε ένα κεντρικό σύστημα που περιέχει περιεχόμενο για τον ιστότοπό του. Τώρα, αυτό το μοντέλο είχε κρυφή πρόσβαση μέσω μιας εντελώς προβλέψιμης ευπάθειας που η Anthropic δεν σκέφτηκε ποτέ να επιδιορθώσει. Η τελειότητα είναι αδύνατη, αλλά για μια αυτοαποκαλούμενη εταιρεία στην πρώτη γραμμή της ασφάλειας της τεχνητής νοημοσύνης, είναι δύσκολο να δικαιολογηθεί ένα τόσο θεμελιώδες σφάλμα, ακόμη και με κάποια από την κακή τύχη που συναντά.
Για τον Χοχ, ολόκληρο το περιστατικό μπορεί να συνοψιστεί σε μια λέξη: ταπείνωση. «Η Anthropic ισχυρίζεται ότι βρίσκεται στην απόλυτη πρώτη γραμμή όλων αυτών των τεχνολογιών, αλλά τοποθετείται επίσης ως υπεύθυνος παράγοντας σε όλα αυτά», είπε. «Το γεγονός ότι αυτό επιτεύχθηκε τώρα με μη εξουσιοδοτημένα μέσα τόσο γρήγορα, και μέσω μιας τόσο απλής προσπάθειας, είναι στην πραγματικότητα ταπεινωτικό για αυτούς».
Σύνδεσμος πηγής: www.theverge.com