Το πιο επικίνδυνο μοντέλο ανθρώπινης τεχνητής νοημοσύνης έπεσε σε λάθος χέρια

Το μοντέλο Mythos AI της Anthropic, ένα ισχυρό εργαλείο κυβερνοασφάλειας που η εταιρεία είπε ότι θα μπορούσε να είναι επικίνδυνο σε λάθος χέρια, είχε πρόσβαση από μια «μικρή ομάδα μη εξουσιοδοτημένων χρηστών». Bloomberg Αναφορές. Ένα ανώνυμο μέλος της ομάδας, που προσδιορίστηκε μόνο ως “τρίτος ανάδοχος για την Anthropic”, είπε στο δημοσίευμα ότι μέλη ενός ιδιωτικού διαδικτυακού φόρουμ εισήλθαν στο Mythos μέσω ενός συνδυασμού τακτικών, χρησιμοποιώντας πρόσβαση αναδόχου και “κοινώς χρησιμοποιούμενα διαδικτυακά εργαλεία κατασκοπείας”.

Το Claude Mythos Preview είναι ένα νέο μοντέλο γενικής χρήσης, ικανό να εντοπίζει και να εκμεταλλεύεται τρωτά σημεία «σε κάθε σημαντικό λειτουργικό σύστημα και κάθε μεγάλο πρόγραμμα περιήγησης ιστού όταν το ζητήσει ο χρήστης», σύμφωνα με το Anthropic. Η επίσημη πρόσβαση στο μοντέλο περιορίζεται σε λίγες εταιρείες μέσω της πρωτοβουλίας Project Glasswing, συμπεριλαμβανομένων των Nvidia, Google, Amazon Web Services, Apple και Microsoft. Οι κυβερνήσεις προσβλέπουν επίσης σε αυτήν την τεχνολογία. Επί του παρόντος, η Anthropic δεν σχεδιάζει να κυκλοφορήσει το μοντέλο δημόσια λόγω ανησυχιών ότι θα μπορούσε να χρησιμοποιηθεί ως όπλο.

“Διερευνούμε μια αναφορά που ισχυρίζεται ότι δεν έχει εξουσιοδοτηθεί η πρόσβαση στο Claude Mythos Preview μέσω ενός από τα περιβάλλοντα τρίτων προμηθευτών μας”, δήλωσε εκπρόσωπος της Anthropic σε δήλωση. Bloomberg. Επί του παρόντος, η Anthropic δεν διαθέτει στοιχεία ότι η μη εξουσιοδοτημένη πρόσβαση επηρεάζει τα συστήματα της εταιρείας ή υπερβαίνει το περιβάλλον του τρίτου προμηθευτή.

Το μοντέλο φέρεται να είχε πρόσβαση παράνομη στις 7 Απριλίου, την ίδια ημέρα που η Anthropic ανακοίνωσε ότι θα κυκλοφορήσει το Mythos σε περιορισμένο αριθμό εταιρειών για δοκιμή. Ωστόσο, η ομάδα που απέκτησε τη μη εξουσιοδοτημένη πρόσβαση δεν έχει αναγνωριστεί δημόσια Bloomberg Αναφέρει ότι τα μέλη του είναι μέρος ενός καναλιού Discord που αναζητά πληροφορίες σχετικά με μοντέλα τεχνητής νοημοσύνης που δεν έχουν κυκλοφορήσει.

Η ομάδα είχε πρόσβαση στο Mythos χρησιμοποιώντας τη γνώση των άλλων μορφών μοντέλων της Anthropic που προέκυψαν από την πρόσφατη παραβίαση δεδομένων της Mercor για να κάνει μια «μορφωμένη εικασία» σχετικά με τον ιστότοπό της. Τα μέλη χρησιμοποιούν το Mythos τακτικά από τότε που απέκτησαν πρόσβαση – προσφέροντας στιγμιότυπα οθόνης και ζωντανή επίδειξη του μοντέλου ως απόδειξη Bloomberg – Αν και όχι για σκοπούς κυβερνοασφάλειας σε μια προσπάθεια αποφυγής εντοπισμού από την Anthropic. Η ομάδα απέκτησε επίσης πρόσβαση σε άλλα μοντέλα Anthropic AI που δεν έχουν κυκλοφορήσει, σύμφωνα με Bloomberg.

Σύνδεσμος πηγής: www.theverge.com

Σχολιάστε Ακύρωση απάντησης