Το νέο μοντέλο του Κλοντ είναι πιο «ειλικρινές» όταν κάνει λάθος

Η Anthropic λανσάρει το Claude Opus 4.8 την Πέμπτη και η εταιρεία διαφημίζει την «αυθεντικότητα» του μοντέλου.

Σύμφωνα με To AnthropicΕκπαιδεύει «όλα τα μοντέλα της να είναι ειλικρινή – για παράδειγμα, να αποφεύγουν να κάνουν ισχυρισμούς που δεν μπορούν να υποστηρίξουν». Ωστόσο, επισημαίνει ότι «ένα γενικό πρόβλημα με τα μοντέλα τεχνητής νοημοσύνης είναι ότι μερικές φορές βγάζουν βιαστικά συμπεράσματα, παρουσιάζοντας με σιγουριά τη δουλειά τους ότι σημειώνει πρόοδο παρά τα λίγα στοιχεία».

Το εργαστήριο AI ισχυρίζεται ότι οι πρώτοι δοκιμαστές διαπίστωσαν ότι το Opus 4.8 ήταν «πιο πιθανό να σηματοδοτήσει αμφιβολίες σχετικά με τη λειτουργία του και λιγότερο πιθανό να κάνει μη υποστηριζόμενους ισχυρισμούς». Σύμφωνα με τις εκτιμήσεις της εταιρείας, το Opus 4.8 είναι «περίπου 4 φορές λιγότερο πιθανό από τον προκάτοχό του να επιτρέψει στα ελαττώματα στον γραπτό κώδικα να περάσουν απαρατήρητα».

Εκτός από τις βελτιώσεις ειλικρίνειας, με το Opus 4.8, οι χρήστες μπορούν να καθοδηγήσουν την προσπάθεια που καταβάλλει ο Claude σε μια εργασία. Οι αποκρίσεις υψηλότερης προσπάθειας θα χρησιμοποιούν μεγαλύτερο αριθμό κουπονιών, δίνοντας στους χρήστες την επιλογή αποκρίσεων χαμηλότερης προσπάθειας, εάν δεν θέλουν να υπερβούν τα όρια ρυθμού τους τόσο γρήγορα.

Η Anthropic λανσάρει επίσης μια λειτουργία που ονομάζεται “Dynamic Workflow” στην προεπισκόπηση αναζήτησης, η οποία σύμφωνα με την εταιρεία θα επιτρέψει στον Claude να “αναλαμβάνει μεγαλύτερες εργασίες”. Χρησιμοποιώντας μια δυναμική ροή εργασίας, “Ο Claude μπορεί να σχεδιάσει την εργασία και στη συνέχεια να εκτελέσει εκατοντάδες παράλληλους δευτερεύοντες πράκτορες σε μία μόνο περίοδο λειτουργίας (και με το Opus 4.8, οι πράκτορες μπορούν να εκτελούνται περισσότερο). Στη συνέχεια, επαληθεύει την παραγωγή του πριν υποβάλει αναφορά στον χρήστη.”

Σύνδεσμος πηγής