Ο επικεφαλής του τμήματος αυτόνομης οδήγησης της Nvidia μιλά για το σχέδιό του να αντιμετωπίσει την Waymo και την Tesla

Κάθε έξι μήνες περίπου, ο επικεφαλής αυτοκινήτων της Nvidia, Xinzhou Wu, προσκαλεί τον διευθύνοντα σύμβουλο Jensen Huang να πάει μια βόλτα με ένα αυτοκίνητο εξοπλισμένο με το σύστημα αυτόνομης οδήγησης της εταιρείας hands-free. Αλλά μόνο όταν ο Γου έχει «καλή εμπιστοσύνη» στις ηγετικές ικανότητες του καθεστώτος.

Πρόσφατα, οι δυο τους πήγαν με το αυτοκίνητο από το Woodside, στην Καλιφόρνια, στο κέντρο του Σαν Φρανσίσκο με ένα Mercedes CLA sedan με MB.Drive Assist Pro, ένα σύστημα υποστήριξης οδηγού χωρίς χέρια, σχεδιασμένο εν μέρει από τη Nvidia και παρόμοιο με το πλήρες σύστημα αυτόματης οδήγησης της Tesla. Η διάθεση ήταν ελαφριά, ακόμα κι αν η κίνηση ήταν πολύ απασχολημένη.

«Ενημερώστε με όταν είναι σε αυτόνομη λειτουργία», είπε ο Huang Luo, σύμφωνα με ένα βίντεο από το ταξίδι που του παρασχέθηκε. Ακρη«Τότε μπορεί να ανησυχώ λιγότερο για την ασφάλειά μου».

Κατά τη διάρκεια του βίντεο διάρκειας 22 λεπτών, η Mercedes των Huang και Wu περιηγείται σε μια σειρά από καθημερινά εμπόδια, όπως εργοτάξια, διπλοπαρκαρισμένα αυτοκίνητα και στενές λωρίδες περνώντας από σειρές πορτοκαλί κώνων. Το σύστημα Nvidia φαίνεται αρκετά ικανό, παρόλο που το βίντεο είναι επεξεργασμένο και δεν αποδίδεται σε πραγματικό χρόνο. (Η εκπρόσωπος της Nvidia Τζέσικα Σοάρες είπε αργότερα ότι δεν υπήρξαν αποδεσμεύσεις κατά τη διάρκεια της πτήσης.)

Ωστόσο, δεν φαίνεται και τόσο διαφορετικό από τη δική μου εμπειρία πέρυσι όταν οδηγώ κυνηγετικό όπλο με στελέχη της Nvidia σε Mercedes με ενεργοποιημένο το σύστημα οδήγησης hands-free. Εντυπωσιάστηκα με την ικανότητα του συστήματος να χειρίζεται τα φανάρια, τις στάσεις τεσσάρων κατευθύνσεων, τα δύο παρκαρισμένα αυτοκίνητα, τις απροστάτευτες αριστερές στροφές και όλους τους πεζούς, τους ποδηλάτες και τα σκούτερ που μπορεί να σας πετάξει το Σαν Φρανσίσκο. Εάν η Tesla μπορεί να το κάνει με λίγο πυρίτιο και ένα σωρό κάμερες, είναι λογικό ότι η πιο πολύτιμη εταιρεία του κόσμου μπορεί να το καταλάβει επίσης.

“Στιγμή ChatGPT για πραγματική τεχνητή νοημοσύνη”

Μετά από χρόνια δουλειάς στα παρασκήνια, η Nvidia προσπαθεί να κερδίσει μια πιο εξέχουσα ηγετική θέση στον χώρο της αυτόνομης οδήγησης. Όχι μόνο προμηθεύει τσιπ σε εταιρείες όπως η Tesla, αλλά προσφέρει επίσης τις δικές της δυνατότητες οδήγησης με AI σε συνεργάτες όπως η Mercedes, η Jaguar Land Rover και η Lucid. Στην CES νωρίτερα φέτος, ο Huang παρουσίασε το Alpamayo, ένα σύνολο μοντέλων AI, σχεδιαγράμματα προσομοίωσης και σύνολα δεδομένων που θα μπορούσαν να δώσουν στα οχήματα ένα τέταρτο επίπεδο αυτονομίας, επιτρέποντάς τους να οδηγούν μόνοι τους κάτω από συγκεκριμένες συνθήκες. Ο Huang περιέγραψε την ανακοίνωση ως «η στιγμή του ChatGPT για φυσική τεχνητή νοημοσύνη».

Στο αυτοκίνητο με τον Wu, ο Huang ήταν λιγότερο καυχησιάρης και πιο εσωστρεφής, αλλά όχι λιγότερο αισιόδοξος για το μέλλον της τεχνολογίας. «Νομίζω ότι η πρόκληση, φυσικά, είναι ο Alpamayo, παρά την εκπληκτική του νοημοσύνη – και την ικανότητά του να σκέφτεται τις περιστάσεις – δεν ξέρουμε τι δεν μπορεί να κάνει», είπε. “Αυτή είναι η πρόκληση και γι’ αυτό η Classic Συλλογή μας είναι τόσο απίστευτα σημαντική.”

Μετά από χρόνια δουλειάς στα παρασκήνια, η Nvidia προσπαθεί να κερδίσει μια πιο εξέχουσα ηγετική θέση στον χώρο αυτόνομης οδήγησης

Η Hwang υπερηφανεύεται ότι η προσέγγιση της Nvidia στην αυτόνομη οδήγηση είναι «μοναδική» επειδή συνδυάζει ένα μοντέλο τεχνητής νοημοσύνης από άκρο σε άκρο με μια παραδοσιακή, «κλασική» σουίτα σχεδιασμένη από τον άνθρωπο. Πιστεύεται ότι είναι δύσκολο να επαληθευτεί η ακεραιότητα των ολοκληρωμένων μοντέλων. Αντίθετα, η κλασική στοίβα ακολουθεί καθιερωμένα πρωτόκολλα μηχανικής και διαδικασίες που διευκολύνουν την επαλήθευση ότι ορισμένες συμπεριφορές είναι αρκετά ασφαλείς. Συνδυάζοντας και τις δύο προσεγγίσεις, το σύστημα της Nvidia μπορεί να αξιοποιήσει ένα ανθρώπινο στυλ οδήγησης, διατηρώντας παράλληλα ένα πλαίσιο ασφαλείας που βασίζεται στους παραδοσιακούς κανόνες του δρόμου.

Ο ισχυρισμός του Huang για μια μοναδική προσέγγιση στον κλάδο δεν ισχύει. Άλλοι χειριστές αυτόνομων οχημάτων χρησιμοποιούν επίσης ολοκληρωμένα νευρωνικά δίκτυα μαζί με σαφείς κανόνες ασφαλείας που διέπουν την απόκριση του οχήματος. Αλλά σίγουρα η μάθηση από άκρο σε άκρο, η οποία τείνει να είναι περισσότερο ανθρώπινη στην ηγεσία της και λιγότερο αυτοματοποιημένη, γίνεται πιο δημοφιλής. Η Waymo βασίζεται σε ένα υβριδικό σύστημα, ενώ η Tesla βασίζεται αποκλειστικά σε νευρωνικά δίκτυα από άκρο σε άκρο.

Σε συνέντευξή του, ο Wu είπε ότι τα μοντέλα all-in-one είναι καλύτερα σε θέση να ανταποκρίνονται σε πράγματα όπως τα χτυπήματα ταχύτητας ή οι αλλαγές λωρίδας χωρίς να αισθάνονται υπερβολικά μηχανικά ή ρομποτικά. «Γι’ αυτό είναι πραγματικά μια στιγμή ChatGPT», είπε. “Είναι σαν το αυτοκίνητό σας να οδηγεί με πραγματική σιγουριά…τότε οι πελάτες θα αισθάνονται βασικά πιο πρόθυμοι να το χρησιμοποιήσουν.”

Η Tesla και το αυξανόμενο κόστος της αυτοοδήγησης

Ρώτησα τον Wu τι πιστεύει για την προσέγγιση της Nvidia σε σύγκριση με το πλήρες σύστημα αυτοοδήγησης της Tesla, το οποίο έχει διανύσει περισσότερα από 8,5 δισεκατομμύρια μίλια, αλλά έχει εμπλακεί σε ορισμένα ανησυχητικά περιστατικά ασφάλειας, συμπεριλαμβανομένων 23 τραυματισμών και τουλάχιστον δύο θανάτων. Τον περασμένο Δεκέμβριο, ένα στέλεχος της Nvidia μου είπε ότι η εταιρεία είχε δοκιμάσει τα δύο συστήματα μεταξύ τους. Είπε ότι ο αριθμός των εξαγορών προγραμμάτων οδήγησης του συστήματος Nvidia ήταν παρόμοιος, μερικές φορές προτιμούσε το ένα σύστημα, μερικές φορές το άλλο.

Ο Wu αρνήθηκε να σχολιάσει άμεσα το ιστορικό ασφάλειας της Tesla, αλλά εξήγησε ότι η Nvidia διαφοροποιείται μέσω της χρήσης πολλαπλών αισθητήρων, συμπεριλαμβανομένων καμερών, ραντάρ, αισθητήρων υπερήχων και — σε υψηλότερες διαμορφώσεις — lidar. Η Nvidia πιστεύει ότι ο πλεονασμός και η ποικιλομορφία στις τεχνολογίες αισθητήρων είναι κρίσιμες για τον χειρισμό δύσκολων καταστάσεων και την επίτευξη υψηλότερων επιπέδων ασφάλειας, είπε ο Wu.

“Είναι σαν το αυτοκίνητό σας να οδηγεί με πραγματική σιγουριά…τότε οι πελάτες θα αισθάνονται βασικά πιο πρόθυμοι να το χρησιμοποιήσουν.”

– Shenzhou Wu

Οι πρόσθετοι αισθητήρες σημαίνουν πρόσθετο κόστος. Η συμπερίληψη της τεχνολογίας lidar, ειδικότερα, υποδηλώνει ότι το ασφαλέστερο σύστημα της Nvidia θα είναι διαθέσιμο μόνο σε πλούσιους ιδιοκτήτες Mercedes. Ωστόσο, ο Wu πιστεύει ότι η κάθετα ολοκληρωμένη προσέγγιση της Nvidia της επιτρέπει να προσφέρει την απαιτούμενη απόδοση ασφάλειας με το χαμηλότερο δυνατό κόστος.

Η πλατφόρμα DRIVE Hyperion της Nvidia έχει σχεδιαστεί με γνώμονα πολλαπλές διαμορφώσεις. Η βασική έκδοση χρησιμοποιεί μια απλούστερη και πιο οικονομική ρύθμιση αισθητήρα, βασισμένη κυρίως σε κάμερες και ραντάρ. Αυτοί οι αισθητήρες έχουν γίνει σημαντικά φθηνότεροι την τελευταία δεκαετία λόγω της μαζικής παραγωγής. Οι αισθητήρες υπερήχων είναι ήδη πολύ φθηνοί. Για υψηλότερα επίπεδα αυτονομίας, η πλατφόρμα μπορεί να προσθέσει αισθητήρες lidar και δεδομένου του χαμηλού κόστους του lidar, ο Wu είπε ότι πιστεύει ότι τα οχήματα με τιμές από 40.000 έως 50.000 $ θα μπορούσαν ρεαλιστικά να περιλαμβάνουν την πλήρη σειρά αισθητήρων που απαιτείται για προηγμένη αυτονομία.

Πλεονεκτήματα και μειονεκτήματα των δεδομένων

Ρώτησα τον Wu σχετικά με τα πρόσφατα περιστατικά ασφάλειας που αφορούν οχήματα Waymo, όπως το ρομποτικό μηχανισμό της εταιρείας που μπλοκάρει διασταυρώσεις κατά τη διάρκεια διακοπών ρεύματος στο Σαν Φρανσίσκο. Η Nvidia εκτελούσε ήδη παρόμοιες περιπτώσεις άκρων μέσω των δικών της προσομοιωτών, είπε. Στην πραγματικότητα, η εταιρεία βασίζεται σε μεγάλο βαθμό σε συνθετικά δεδομένα οδήγησης για να εξηγήσει τις ελλείψεις της στις πραγματικές δοκιμές. Η Tesla διανύει δισεκατομμύρια μίλια σε πραγματικό κόσμο, χάρη στον τεράστιο στόλο αυτοκινήτων πελατών της. Η Waymo έχει καταγράψει σχεδόν 200 εκατομμύρια μίλια με πλήρη αυτοοδήγηση σε δημόσιους δρόμους. Πώς μπορεί η Nvidia να ελπίζει ότι θα προλάβει;

«Το μεγάλο παιχνίδι υποδομής είναι στην πραγματικότητα μια προσομοίωση», είπε ο Wu. Η Nvidia ακολουθεί δύο προσεγγίσεις σε αυτό. Το ένα είναι η νευρωνική ανακατασκευή, ή NuRec, στην οποία οι μηχανικοί της εταιρείας αναδημιουργούν σενάρια οδήγησης σε πραγματικό κόσμο χρησιμοποιώντας δεδομένα αισθητήρων που συλλέγονται από οχήματα στο πεδίο. Το άλλο είναι η αύξηση, η οποία προσαρμόζει στοιχεία εντός της ανακατασκευασμένης σκηνής για να εξερευνήσει διαφορετικά πιθανά αποτελέσματα. Αυτό επιτρέπει στους μηχανικούς να διερευνήσουν πώς συμπεριφέρεται το αυτόνομο σύστημα υπό ελαφρώς διαφορετικές συνθήκες και να εντοπίσουν σπάνιες περιπτώσεις που μπορεί να υπάρχουν στο αρχικό σύνολο δεδομένων.

«Μπορούμε να κάνουμε τους πεζούς να βγαίνουν πιο γρήγορα και πιο αργά σε διαφορετική τοποθεσία», είπε. “Αυτό είναι αυτό που ονομάζουμε θόλωση του συνόλου δεδομένων.”

Η Nvidia αποκτά πλάνα dashcam από τους συνεργάτες της για να την τροφοδοτήσει με δεδομένα που χρησιμοποιεί σε προσομοιώσεις. Επίσης, αναδημιουργεί ακραίες περιπτώσεις από αυτά τα περιστατικά Waymo, όπως διακοπές ρεύματος, και εκπαιδεύει το σύστημά του να ανταποκρίνεται χωρίς να εμποδίζει τις διασταυρώσεις.

Αλλά ο απώτερος στόχος είναι να δημιουργηθεί ένα σύστημα που χρησιμοποιεί τη λογική για να αποφύγει αυτές τις παγίδες, αποφεύγοντας έτσι την ανάγκη για δεδομένα οδήγησης σε πραγματικό κόσμο. Η ομάδα του Wu εργάζεται πάνω σε αυτό που αποκαλεί επιχειρηματικό μοντέλο γλώσσας οράματος, το οποίο θα κάνει πράξη αυτή τη θεωρία. Αυτά τα μοντέλα συνδυάζουν την οπτική αντίληψη, τη γλωσσική κατανόηση και τη φυσική δράση σε μια ενοποιημένη αρχιτεκτονική, βασιζόμενη σε μεγάλα υποκείμενα μοντέλα που έχουν ήδη εκπαιδευτεί σε σύνολα δεδομένων κλίμακας Διαδικτύου. Ο Γου τον παρομοιάζει με τον Εντ τον οδηγό.

«Όταν διδάσκουμε σε ένα παιδί πώς να οδηγεί, διαβάζει το βιβλίο κανόνων και στη συνέχεια εξασκείται για 20 ώρες πίσω από το τιμόνι», είπε ο Γου. “Συνήθως, δεν είναι κακοί οδηγοί στην αρχή – αν και προφανώς χρειάζεται εμπειρία για να βελτιωθεί. Τελικά, θέλουμε το μοντέλο να λειτουργεί με τον ίδιο τρόπο: στο μέλλον, μόνο με ένα βιβλίο κανόνων και 20 ώρες δεδομένων εκπαίδευσης, θα μάθει πώς να οδηγεί.”

Ακολουθήστε θέματα και συγγραφείς Από αυτήν την ιστορία για να δείτε περισσότερα παρόμοια στην εξατομικευμένη ροή της αρχικής σας σελίδας και να λαμβάνετε ενημερώσεις μέσω email.



Σύνδεσμος πηγής: www.theverge.com