Το Anthropic Project κυκλοφόρησε το GlassWing, μια προσπάθεια αντιμετώπισης κυβερνοεπιθέσεων AI με AI

Βλέπουμε πολλή καταστροφή και θλίψη σχετικά με τις πιθανές αρνητικές επιπτώσεις της τεχνητής νοημοσύνης, ειδικά με επίκεντρο το πώς θα μπορούσε να δημιουργήσει νέα προβλήματα στην ασφάλεια στον κυβερνοχώρο. Η Anthropic ανακοίνωσε μια νέα πρωτοβουλία με την ονομασία Project Glasswing για να βοηθήσει στην αντιμετώπιση αυτών των ανησυχιών, εργαζόμενη για την «ασφάλιση του πιο κρίσιμου λογισμικού στον κόσμο» από επιθέσεις που βασίζονται στην τεχνητή νοημοσύνη. Η προσπάθεια περιλαμβάνει τις υπηρεσίες Web Amazon, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, The Linux Foundation, Microsoft, NVIDIA και Palo Alto Networks ως συνεργάτες.

Οι συμμετέχοντες θα χρησιμοποιήσουν το Claude Mythos Preview, ένα μοντέλο γενικής χρήσης που δεν έχει κυκλοφορήσει από την Anthropic, για να βελτιώσουν τα δικά τους έργα ασφαλείας. Η Anthropic ισχυρίζεται ότι αυτό το μοντέλο βρήκε χιλιάδες εκμεταλλεύσιμα τρωτά σημεία, «συμπεριλαμβανομένων ορισμένων σε κάθε σημαντικό λειτουργικό σύστημα και πρόγραμμα περιήγησης ιστού». Η εταιρεία δήλωσε ότι θέλει να αρχίσει να χρησιμοποιεί τα εργαλεία της αμυντικά για να αποτρέψει την κακόβουλη χρήση της τεχνητής νοημοσύνης που θα μπορούσε να έχει τρομερές συνέπειες για την οικονομία και την ασφάλεια.

Η Enthropic έχει γίνει μια αξιοσημείωτη εταιρεία τεχνητής νοημοσύνης που εγείρει ανησυχίες σχετικά με τη δεοντολογία στον τομέα. Νωρίτερα αυτό το έτος, η επιχείρηση αρνήθηκε να αφαιρέσει φράκτες στις υπηρεσίες της για χρήση από το Πεντάγωνο, με αποτέλεσμα το Υπουργείο Άμυνας να επιβάλει κυρώσεις στην Anthropic με τον χαρακτηρισμό του “κινδύνου της εφοδιαστικής αλυσίδας” ως αντίποινα. Η κυκλοφορία του Project Glasswing μπορεί να είναι μια χρήσιμη αρχή για βελτιωμένη ασφάλεια στον κυβερνοχώρο στην εποχή της τεχνητής νοημοσύνης, αλλά κάποια ζημιά έχει ήδη γίνει. Το δικό της σύννεφο φέρεται να χρησιμοποιήθηκε από χάκερ εναντίον πολλών κυβερνητικών υπηρεσιών στο Μεξικό τον Φεβρουάριο.


Σύνδεσμος πηγής: www.engadget.com