Συγνώμη Ξεκινήσαμε με ένα κλισέ οικονομικών όρων που έχουν βρει τον δρόμο τους στο λεξικό της τεχνολογίας τον τελευταίο καιρό, αλλά δυστυχώς πρέπει να μιλήσουμε για «τάφρους». Ο όρος, που διαδόθηκε πριν από δεκαετίες από τον Warren Buffett για να αναφέρεται στο ανταγωνιστικό πλεονέκτημα μιας εταιρείας, έχει διαποτίσει τα pitch decks της Silicon Valley, σύμφωνα με ένα σημείωμα. Διέρρευσε από την Googleμε τίτλο «Δεν έχουμε τάφρο, ούτε και το OpenAI», ανησυχούσε ότι η τεχνητή νοημοσύνη ανοιχτού κώδικα θα λεηλατούσε το κάστρο της Big Tech.

Χρόνια αργότερα, τα τείχη της πόλης παραμένουν ασφαλή. Εκτός από μια σύντομη στιγμή πανικού όταν πρωτοεμφανίστηκε το DeepSeek, τα μοντέλα τεχνητής νοημοσύνης ανοιχτού κώδικα δεν έχουν ξεπεράσει σημαντικά τα ιδιόκτητα μοντέλα. Ωστόσο, τα συνοριακά εργαστήρια όπως το OpenAI, το Anthropic και η Google δεν έχουν τάφρους για να μιλήσουν.

Η εταιρεία που έχει στην πραγματικότητα μια τάφρο είναι η Nvidia. Ο Διευθύνων Σύμβουλος Jensen Huang αποκαλεί αυτόν τον πιο πολύτιμο «θησαυρό» μας. Αυτό δεν είναι ένα κομμάτι υλικού όπως φαντάζονται οι εταιρείες τσιπ. Λέγεται CUDA. Αυτό που φαίνεται να είναι μια ένωση που έχει απαγορευτεί από το FDA μπορεί να είναι η μόνη πραγματική τάφρο στην τεχνητή νοημοσύνη.

Το CUDA είναι τεχνικά ανώτερο Όπως και με το Compute Unified Device Architecture, λέιζερ ή καταδύσειςκανείς δεν μπαίνει στον κόπο να επεκτείνει το ακρωνύμιο. Λέμε απλώς, «Τόσο και έτσι». Σε τι χρησιμεύει λοιπόν αυτός ο πολύ σημαντικός θησαυρός; Αν έπρεπε να απαντήσω μονολεκτικά, θα ήταν παραλληλισμός.

Ακολουθεί ένα απλό παράδειγμα: Ας υποθέσουμε ότι αναθέτετε σε μια μηχανή να συμπληρώσει έναν πίνακα πολλαπλασιασμού 9×9. Και οι 81 λειτουργίες εκτελούνται μία προς μία με πιστότητα χρησιμοποιώντας έναν υπολογιστή ενός πυρήνα. Αλλά σε μια GPU με 9 πυρήνες, σε κάθε πυρήνα μπορούν να ανατεθούν εργασίες για να χειριστεί μια διαφορετική στήλη (1×1 έως 1×9, άλλη 2×1 έως 2×9, κ.λπ.), με αποτέλεσμα 9x επιτάχυνση. Οι σύγχρονες GPU μπορούν να γίνουν ακόμα πιο έξυπνες. Για παράδειγμα, ο προγραμματισμός για την αναγνώριση της εναλλαγής (7×9 = 9×7) αποφεύγει την διπλή εργασία και μειώνει τις 81 λειτουργίες σε 45, μειώνοντας σχεδόν στο μισό το φόρτο εργασίας. Όταν ένα μόνο τρέξιμο προπόνησης κοστίζει εκατοντάδες εκατομμύρια δολάρια, κάθε βελτιστοποίηση μετράει.

Οι GPU της Nvidia κατασκευάστηκαν αρχικά για την απόδοση γραφικών βιντεοπαιχνιδιών. Στις αρχές της δεκαετίας του 2000, ο Ian Buck, ένας διδακτορικός φοιτητής στο Πανεπιστήμιο του Στάνφορντ που άρχισε να ενδιαφέρεται για τις GPU ως gamer, συνειδητοποίησε ότι η αρχιτεκτονική θα μπορούσε να επαναχρησιμοποιηθεί για γενικούς υπολογιστές υψηλής απόδοσης. Δημιούργησε μια γλώσσα προγραμματισμού που ονομάζεται Brook και προσλήφθηκε από την Nvidia για να ηγηθεί της ανάπτυξης του CUDA με τον John Nickolls. Αν η τεχνητή νοημοσύνη φέρνει μια μόνιμη κατώτερη κατηγορία και μια εποχή αυτόνομων όπλων, να ξέρετε ότι όλα είναι επειδή κάποιος, κάπου, παίζει. μοίρα Πιστεύαμε ότι το όσχεο του διαβόλου θα έπρεπε να τρέμει με 60 καρέ ανά δευτερόλεπτο.

Η CUDA δεν είναι μια γλώσσα προγραμματισμού καθεαυτή, αλλά μια «πλατφόρμα». Χρησιμοποιώ αυτές τις νυφίτσες λέξεις επειδή, όπως οι New York Times είναι και εφημερίδα και εταιρεία παιχνιδιών, η CUDA είναι εδώ και καιρό μια ένθετη δέσμη βιβλιοθηκών λογισμικού για AI. Κάθε συνάρτηση μειώνει μια μεμονωμένη μαθηματική πράξη σε νανοδευτερόλεπτα. Προσθέστε τα μαζί για να εκτελέσετε αυτό που είναι γνωστό στον κλάδο ως GPU. Μπουρούρου.

σύγχρονα γραφικά Μια κάρτα είναι κάτι περισσότερο από μια πλακέτα κυκλώματος γεμάτη με μάρκες, μνήμη και ανεμιστήρες. Είναι ένας περίτεχνος συνδυασμός ιεραρχιών κρυφής μνήμης και εξειδικευμένων μονάδων που ονομάζονται «πυρήνες tensor» και «πολυεπεξεργαστές ροής». Υπό αυτή την έννοια, αυτό που πωλούν οι εταιρείες τσιπ είναι σαν μια επαγγελματική κουζίνα, όπου περισσότεροι πυρήνες ισοδυναμούν με περισσότερους σταθμούς ψησίματος. Αλλά ακόμη και μια κουζίνα με 30 σταθμούς ψησίματος δεν θα λειτουργεί πιο γρήγορα χωρίς έναν ικανό αρχιμάγειρα που αναθέτει επιδέξια εργασίες όπως κάνει το CUDA στους πυρήνες GPU.

Επεκτείνοντας αυτή τη μεταφορά, μια χειροκίνητη βιβλιοθήκη CUDA βελτιστοποιημένη για μια λειτουργία μεμονωμένης μήτρας ισοδυναμεί με ένα εργαλείο κουζίνας σχεδιασμένο για μια μεμονωμένη εργασία, όχι περισσότερο. Πράγματα όπως τα πίτερ κερασιών και οι αποφλοιωτές γαρίδων είναι πολυτέλεια για τους οικιακούς μάγειρες, αλλά όχι όταν κόβετε 10.000 γαρίδες. Τώρα πίσω στο DeepSeek. Οι μηχανικοί της εταιρείας πήγαν κάτω από αυτό το ήδη βαθύ στρώμα αφαίρεσης και εργάστηκαν απευθείας σε PTX, έναν τύπο γλώσσας συναρμολόγησης για τις GPU της Nvidia. Ας πούμε ότι η δουλειά σας είναι να ξεφλουδίζετε το σκόρδο. Με μια μη βελτιστοποιημένη GPU, είναι σαν να “ξεφλουδίζετε το δέρμα σας με τα νύχια σας”. Το CUDA μπορεί να σας πει να «συνθλίψετε τα γαρίφαλα με το μαχαίρι σας». Το PTX σάς επιτρέπει να κατευθύνετε όλες τις υποεντολές. «Σηκώστε τη λεπίδα 2,35 ίντσες πάνω από το ξύλο κοπής, παράλληλα με τον ισημερινό του γαρύφαλλου, και χτυπήστε την με την παλάμη σας με δύναμη 36,2 newtons».

Σύνδεσμος πηγής