Το νέο σχέδιο παιχνιδιών «super Intelligence» της Microsoft περιστρέφεται γύρω από τις επιχειρήσεις

Ο Μουσταφά Σουλεϊμάν προετοιμάζεται για τη νέα περιγραφή της θέσης του εδώ και πολύ καιρό. Ο Σουλεϊμάν ήταν ο πρώτος Διευθύνων Σύμβουλος του τμήματος τεχνητής νοημοσύνης της Microsoft, αλλά αφού η εταιρεία υποβλήθηκε σε ευρεία αναδιάρθρωση στα μέσα Μαρτίου, αποχώρησε από ορισμένα καθήκοντα και στράφηκε στην καταδίωξη της υπερευφυΐας. Αν και η είδηση έγινε γνωστό μόλις τον περασμένο μήνα, λέει ΑκρηΠροετοιμαζόταν για τη μετακόμιση για έως και εννέα μήνες – και παρόλο που η επαναδιαπραγμάτευση του συμβολαίου της Microsoft με το OpenAI είναι το πράγμα που «απελευθερώθηκε επίσημα η ικανότητα (της Microsoft) να επιδιώκει την υπερευφυΐα», σχεδίαζε ακόμη και πριν στεγνώσει το μελάνι.

«Αυτό ήταν ένα μακροπρόθεσμο σχέδιο», είπε, προσθέτοντας ότι η επίτευξη της υπερευφυΐας ήταν «καθαρά το επίκεντρό μου».

Η υπερευφυΐα — μαζί με την τεχνητή γενική νοημοσύνη (AGI) ή την τεχνητή γενική νοημοσύνη — έχει έναν ασαφή και μεταβαλλόμενο ορισμό στον κλάδο της τεχνητής νοημοσύνης. Για τον Σουλεϊμάν, όλα έχουν να κάνουν με τις επιχειρήσεις και την παραγωγικότητα. «Η υπερευφυΐα έχει να κάνει με: Είναι αυτά τα μοντέλα ικανά να προσφέρουν αξία προϊόντων σε εκατομμύρια εταιρείες που βασίζονται σε εμάς για την παράδοση γλωσσικών μοντέλων παγκόσμιας κλάσης;» είπε ο Σόλιμαν. “Αυτό είναι πραγματικά το επίκεντρό μας. Θέλουμε να εξυπηρετήσουμε προγραμματιστές, επιχειρήσεις και πολλούς καταναλωτές.” Οι εταιρείες τεχνητής νοημοσύνης αντιμετωπίζουν αυξανόμενη πίεση να δημιουργήσουν περισσότερα έσοδα και τα σχέδια της Microsoft αντικατοπτρίζουν μια νέα στρατηγική και στο OpenAI.

Η αναδιοργάνωση της Microsoft συγκέντρωσε ομάδες επιχειρήσεων και καταναλωτών κάτω από το σήμα Copilot AI. Ενώ ο Solomon θα συνεχίσει να εργάζεται στη στρατηγική μεγάλων εικόνων, ο Jacob Andrew, ο οποίος ήταν προηγουμένως εταιρικός αντιπρόεδρος προϊόντων και ανάπτυξης στη Microsoft AI, θα γίνει εκτελεστικός αντιπρόεδρος, κορυφαίος πρωτοβουλίες μηχανικής, ανάπτυξης, προϊόντων και σχεδίασης για τις νέες ομάδες. Αυτή η αλλαγή άφησε περιθώριο στον Solomon να αφιερώσει το χρόνο του στην επιδίωξη της υπερευφυΐας και στην ανάπτυξη νέων μοντέλων τεχνητής νοημοσύνης για τη Microsoft σε μια εποχή που ο ανταγωνισμός μεταξύ των κορυφαίων εταιρειών τεχνητής νοημοσύνης – και η πίεση για προσέλκυση νέων καταναλωτών και εταιρικών πελατών – είναι πιο έντονος από ποτέ.

Την Πέμπτη, η Microsoft παρουσίασε ένα νέο μοντέλο αντιγραφής που ελπίζει ότι θα κάνει ακριβώς αυτό – και δεδομένου ότι είναι “το μισό κόστος GPU από άλλα σύγχρονα μοντέλα”, σύμφωνα με τον Solomon, είναι μια “τεράστια εξοικονόμηση κόστους” για τη Microsoft.

Η εταιρεία περιγράφει το MAI-Transcribe-1 ως «σπρώχνει τα όρια της αναγνώρισης ομιλίας» με την ικανότητά του να μεταγράφει συσκέψεις, να υπογράφει βίντεο και να αναλύει τις ανταλλαγές τηλεφωνικών κέντρων σε 25 γλώσσες. Οι αναρτήσεις ιστολογίου της Microsoft που ανακοινώνουν το μοντέλο αναφέρουν ότι σχεδιάστηκε για «δυσκολητικές» συνθήκες εγγραφής, συμπεριλαμβανομένου του θορύβου παρασκηνίου, του ήχου χαμηλής ποιότητας και της αλληλοεπικαλυπτόμενης ομιλίας, και εκπαιδεύτηκε σε ένα συνδυασμό μεταγραφών «ανθρώπινης επιμέλειας» και μηχάνημα γραμμένων μεταγραφών. Οι ηχογραφήσεις πηγής είναι ένας συνδυασμός δεδομένων ελεγχόμενων θαλάμων ήχου και εργολάβων που έχουν επιφορτιστεί να ηχογραφούν τους εαυτούς τους μέσα σε θόρυβο φόντου, από πολυσύχναστους δρόμους μέχρι παιδιά που τρέχουν, καθώς και «τεράστιες ποσότητες δεδομένων από τον ανοιχτό ιστό», είπε ο Soliman.

Μαζί με τα υπάρχοντα μοντέλα παραγωγής ήχου και βίντεο MAI-Voice-1 και MAI-Image-2, το νέο μοντέλο μεταγραφής είναι πλέον διαθέσιμο στο Microsoft Foundry και ως μέρος του νέου Microsoft AI Playground. Αυτή είναι η πρώτη φορά που αυτά τα μοντέλα είναι “ευρέως διαθέσιμα για εμπορική χρήση”, σύμφωνα με τη Microsoft. Το MAI-Transcribe-1 μπορεί να χειριστεί αρχεία ήχου σε μορφές MP3, WAV και FLAC.

Ο Sulaiman αποδίδει τις επιδόσεις του νέου μοντέλου στις δοκιμές σε μια μικρή ομάδα 10 ατόμων. Η ομάδα μοντελοποίησης «απαλλαγεί από κάθε γραφειοκρατία», λέει, καθώς έχει μια περιμετρική ομάδα υπεύθυνη για τη διαχείριση προμηθευτών, την εύρεση δεδομένων για λήψη και πολλά άλλα. Η Microsoft έχει χρησιμοποιήσει παρόμοια στρατηγική για τη δημιουργία ήχου και βίντεο και άλλες εταιρείες έχουν κάνει παρόμοια βήματα – η Meta, η Amazon και η Google πειραματίζονται με την ισοπέδωση των οργανισμών τους και η Anthropic είπε επίσης ότι πειραματίζεται δίνοντας σε μικρές ομάδες λίγων προγραμματιστών δωρεάν πρόσβαση σε ορισμένα επίπεδα υπολογιστών για να δουν τι μπορούν να επιτύχουν.

Το νέο μοντέλο αντιγραφής αποτελεί μέρος του στόχου του Solomon να προσφέρει «ανθρωποκεντρική» τεχνητή νοημοσύνη (μια μορφή της ευνοημένης τεχνητής νοημοσύνης της Microsoft, «υπερανθρώπινη νοημοσύνη») που είναι χρήσιμη στον μέσο άνθρωπο. «Ο καθένας θα έχει έναν βοηθό τεχνητής νοημοσύνης στην τσέπη του που θα είναι πραγματικά παγκόσμιας κλάσης, θα είναι υπόλογος απέναντί τους, θα είναι υπόλογος απέναντί τους, θα ευθυγραμμίζεται με τα συμφέροντά τους και θα εργάζεται για λογαριασμό τους», είπε.

Ακολουθήστε θέματα και συγγραφείς Από αυτήν την ιστορία για να δείτε περισσότερα παρόμοια στην εξατομικευμένη ροή της αρχικής σας σελίδας και να λαμβάνετε ενημερώσεις μέσω email.

Χέιντενφιλντ

Σύνδεσμος πηγής: www.theverge.com

Δ	Τ	Τ	Π	Π	Σ	Κ
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30