Υπάρχει μια σκληρή αλήθεια για το chatbot Grok του Elon Musk που αναζητά την αλήθεια: Δεν είναι πολύ καλό και δεν το χρησιμοποιούν πολλοί άνθρωποι. Αυτό είναι το νέο takeaway Reuters μια αναφοράτο οποίο διαπίστωσε ότι ο Grok μόλις και μετά βίας εμφανίζεται στα ομοσπονδιακά αρχεία σχετικά με το πώς η κυβέρνηση των ΗΠΑ χρησιμοποίησε την τεχνητή νοημοσύνη πέρυσι. Αυτό δεν είναι το μόνο σημάδι ότι το chatbot του xAI αντιμετωπίζει προβλήματα, ακόμη και όταν ο Musk το τοποθετεί στην καρδιά της μεγαλύτερης δημόσιας εγγραφής στην ιστορία.
Reuters Εξέτασε περισσότερα από 400 παραδείγματα κυβερνητικής χρήσης τεχνητής νοημοσύνης όπου κατονομάστηκαν συγκεκριμένοι προμηθευτές. Διαπιστώθηκε ότι το Grok ή το xAI εμφανίστηκαν σε μόλις τρία — το καθένα για βασικές χρήσεις όπως η σύνταξη εγγράφων ή η διαχείριση μέσων κοινωνικής δικτύωσης και πάντα δίπλα σε ανταγωνιστές όπως η Microsoft και το OpenAI. Συγκριτικά, τα μοντέλα του OpenAI εμφανίστηκαν σε περισσότερα από 230 παραδείγματα, ενώ το Google και το Anthropic εμφανίστηκαν το καθένα δεκάδες φορές.
Ένα παρόμοιο μοτίβο προέκυψε σε μια άλλη βάση δεδομένων με πιο φιλόδοξα κυβερνητικά έργα τεχνητής νοημοσύνης με μικρότερο αριθμό χρηστών. Ο Γκροκ εμφανίστηκε μόνο τρεις φορές: δύο φορές για τα συνήθη διοικητικά καθήκοντα στην Επιτροπή Εκλογικής Βοήθειας και μία φορά ως πιλότος DOE στο Εθνικό Εργαστήριο Lawrence Livermore για περιλήψεις εγγράφων και γενική έρευνα. Reuters Βρήκα 140 καταχωρήσεις που περιελάμβαναν Microsoft και OpenAI, ενώ η σύντομη ανασκόπησή μου βρήκε τουλάχιστον 10 καταχωρήσεις για το Anthropic και δώδεκα για το Gemini της Google.
Οι λίστες είναι ένα ελλιπές και αποσπασματικό μέτρο κυβερνητικής διαπίστευσης. Πολλά παραδείγματα παρατίθενται χωρίς συγκεκριμένο προμηθευτή και είναι σαφές ότι δεν υπάρχει καθολικός ορισμός του τι θεωρείται τεχνητή νοημοσύνη. Τα δεδομένα δεν περιλαμβάνουν επίσης τις υπηρεσίες πληροφοριών ή το Πεντάγωνο – όπου η xAI είχε συμβόλαιο 200 εκατομμυρίων δολαρίων πέρυσι και πρόσφατα της επετράπη να λειτουργεί σε διαβαθμισμένα δίκτυα μετά τη μαύρη λίστα του Anthropic.
Ωστόσο, δεν φαίνεται καλό για τον Γκροκ. Εμφανίζεται πολύ λιγότερο συχνά από τους ανταγωνιστές του, και όταν το κάνει, είναι κυρίως για βασικές διοικητικές εργασίες – ακατάλληλο για το παγκόσμιο μοντέλο συνόρων για το οποίο ο Μασκ περνούσε χρόνια να καυχιέται.
«Δεν είναι το καλύτερο μοντέλο εκεί έξω».
Οι άνθρωποι με τους οποίους μίλησαν Reuters Η εξήγηση, πρότεινε, είναι απλή: Το Grok δεν είναι τόσο καλό όσο οι ανταγωνιστές του. «Δεν είναι το καλύτερο μοντέλο εκεί έξω», είπε μια ανώνυμη πηγή του Πενταγώνου, προσθέτοντας ότι οι εργαζόμενοι εκεί τείνουν να προτιμούν τους Gemini ή τον Claude. Οι δημόσιοι βαθμολογικοί πίνακες κατατάσσουν μοντέλα AI Δώστε βάρος σε αυτή τη γνώμη. Οι Anthropic, Google και OpenAI κυριαρχούν στις κορυφαίες θέσεις, ενώ ο Grok σπάνια μπαίνει στις 10 πρώτες θέσεις εκτός της κατηγορίας περιστασιακών φωτογραφιών ή βίντεο.
Αυτό είναι ντροπιαστικό για τον Musk, και ακόμη περισσότερο για τη SpaceX, η οποία ανέλαβε την τεχνητή νοημοσύνη νωρίτερα φέτος. IPO για το έργο πυραύλων Κατάθεση Δείχνει ότι η εταιρεία έχει θέσει το AI – και συγκεκριμένα το Grok – στο επίκεντρο της θέσης των επενδυτών της. Η SpaceX ισχυρίζεται ότι έχει εντοπίσει «τη μεγαλύτερη βιώσιμη, συνολική αγορά στην ανθρώπινη ιστορία»: μια εκπληκτική ευκαιρία 28,5 τρισεκατομμυρίων δολαρίων, αν και, δυστυχώς, δεν προσφέρει χρονοδιάγραμμα για να φτάσετε εκεί. Στην πράξη, όλη αυτή η πρόταση αξίας προέρχεται από την τεχνητή νοημοσύνη, ειδικά την επιχειρηματική τεχνητή νοημοσύνη, όχι από πυραύλους ή δορυφόρους.
Reuters Επισημαίνει ότι η απόδοση του κουταβιού σας σε κρατικούς φορείς μπορεί να υποδεικνύει πόσο επιτυχημένο θα είναι και σε άλλους χώρους εργασίας. Ως μέρος μιας καμπάνιας xAI για εταιρικούς πελάτες, ο Μασκ έκανε ακριβώς αυτό Οι τράπεζες λέγεται ότι είναι ισχυρά οπλισμένες Ο Grok πραγματοποιεί εξαγορές εάν θέλουν να συμμετάσχουν στην IPO της SpaceX — αλλά αν δεν έχουν την αξία των χρημάτων τους, αυτές οι συμφωνίες μπορεί να είναι μια βραχυπρόθεσμη λύση.
Σαν να μην ήταν αρκετά ενοχλητική η θλιβερή απόδοσή του, ο Μασκ παραδέχτηκε πρόσφατα ότι η xAI χρησιμοποίησε μοντέλα OpenAI για να βοηθήσει στην εκπαίδευση και τη βελτίωση του Grok. Αυτή η διαδικασία, γνωστή ως απόσταξη, είναι τυπική όταν οι εταιρείες χρησιμοποιούν τα δικά τους μοντέλα, αλλά είναι πιο αμφιλεγόμενη όταν περιλαμβάνει τη χρήση ενός ανταγωνιστικού συστήματος. Ο Γκροκ δεν μπορεί να νικήσει ούτε τα μοντέλα στα οποία προπονείται.
Στην εκδοχή του που απευθύνεται στον καταναλωτή, ο Γκροκ είναι εσκεμμένα δυσάρεστος. Ο Musk έχει περιγράψει το chatbot ως μια λιγότερο προκατειλημμένη, λιγότερο λογοκριμένη εναλλακτική λύση σε εργαλεία όπως το ChatGPT, αλλά αυτό μεταφράζεται σε ένα προϊόν με χαλαρά πρότυπα αποδεικτικών στοιχείων, μια ανθυγιεινή εμμονή με τον Musk και ένα μακρύ ρεκόρ προσβλητικών, συνωμοσιολογικών και σεξιστικών αποτελεσμάτων. Ακόμα κι αν τα προστατευτικά κιγκλιδώματα του χώρου εργασίας είναι διαφορετικά, μπορεί να μην είναι το είδος που καλωσορίζει η εταιρεία. Το περίφημο ιστορικό της Grok περιλαμβάνει τον έπαινο του Αδόλφου Χίτλερ, την αμφισβήτηση του αριθμού των νεκρών στο Ολοκαύτωμα, τη συλλογή εκατομμυρίων μη συναινετικών σεξουαλικών ψεύτικα σε όλη τη διάρκεια και ας μην ξεχνάμε την εποχή που αποκαλούσε τον εαυτό της «Μίκαχτλερ». Εάν το κουτάβι σας είναι ανθρώπινος υπάλληλος, πιστεύω ότι το HR δεν θα αργήσει να εμπλακεί.
Το SpaceX φαίνεται να κατανοεί το πρόβλημα. Στην κατάθεσή της, η εταιρεία προειδοποίησε ότι οι «καυτές» ή «προβληματικές» μέθοδοι του Grok ενέχουν «αυξημένους κινδύνους», συμπεριλαμβανομένης της βλάβης της φήμης, του ρυθμιστικού ελέγχου και των αγωγών. Σε εταιρική ομιλία: Αυτό το chatbot θα οδηγήσει σε αγωγή εναντίον μας.
Σε εταιρική ομιλία: Αυτό το chatbot θα οδηγήσει σε αγωγή εναντίον μας.
Το Grok πήρε το όνομά του από τον Robert A. Heinlein Ένας ξένος σε μια ξένη χώραόπου σημαίνει χονδρικά μια βαθιά και βαθιά κατανόηση κάτι. Αυτό που πρέπει να καταλάβουμε εδώ δεν είναι ιδιαίτερα περίπλοκο: ο Μασκ έχει ξοδέψει δισεκατομμύρια για την κατασκευή ενός chatbot που δεν είναι πολύ καλό, δεν είναι πολύ δημοφιλές και είναι κατά κάποιο τρόπο το κλειδί για να δικαιολογήσει την αστρονομική αποτίμηση του SpaceX. Καλή τύχη με αυτό.




.png?trim=0,0,0,0&width=1200&height=800&crop=1200:800&w=100&resize=100,75&ssl=1)


