Είναι όμορφο, έτσι δεν είναι; Ένα καθαρό απόγευμα στο πάρκο Dolores του Σαν Φρανσίσκο, τραγουδάω τραγούδια γενεθλίων σε προϊστορικούς δεινόσαυρους. Μετά τη σερενάτα, ένα cupcake με ένα ροζ κερί θα εμφανιστεί μαγικά στο ελεύθερο χέρι σας. Όταν σβήνετε τις φλόγες, τα πλάσματα που μοιάζουν με CGI αποπνέουν μια αίσθηση ήρεμης ικανοποίησης.
Ο άντρας σε αυτό το βίντεο με τεχνητή νοημοσύνη μοιάζει και ακούγεται σαν εμένα, αλλά το κλιπ δημιουργήθηκε με τη χρήση Avatars, μιας από τις νέες δυνατότητες που είναι διαθέσιμες στην εφαρμογή Gemini της Google. Αυτές οι ψηφιακές αναψυχές είναι παρόμοιες με τις βασικές λειτουργίες της πλέον ανενεργής εφαρμογής Sora του OpenAI. Αυτός είναι ένας ψηφιακός κλώνος σας που μπορεί να εισαχθεί στο βίντεό σας με AI. Το Avatar χρησιμοποιεί το νέο μοντέλο omni-video της εταιρείας, μια δυνατότητα που είναι διαθέσιμη μόνο σε συνδρομητές.
Πληρώνω 20$ το μήνα Το σχέδιο AI Pro της Google Και μεγιστοποίησα γρήγορα το όριο χρήσης του Gemini, το οποίο επαναφέρει κάθε 5 ώρες. Απλώς έκανα μερικές ερωτήσεις και δημιούργησα δύο κλιπ 10 δευτερολέπτων με το avatar μου, αλλά μου είπαν να περιμένω αργότερα.
Βίντεο: Reece Rogers
Η πρώτη μου γεύση για το τι θα μπορούσε να κάνει ο Omni με την ομοιότητά μου ήταν στο Σαν Φρανσίσκο τραγουδώντας σε δεινόσαυρους και σερφάροντας κάτω από τη γέφυρα Golden Gate. Εντυπωσιάστηκα και εξέπληξα ταυτόχρονα. Το περιεχόμενο ήταν αηδιαστικό και περιλάμβανε μερικές ακατάστατες στιγμές και ανόητα ρούχα, αλλά ο άντρας στο βίντεο ήμουν εγώ. Χρησιμοποίησα τα δάχτυλά μου για να μεγεθύνω το πρόσωπό του και να παρακολουθώ πραγματικά το στόμα του να κινείται. Έλειπαν μερικά δόντια, αλλά εκτός από αυτό, είναι ο Ρις, μέχρι το λίπος στο πηγούνι του.
Σε αντίθεση με το OpenAI, το οποίο προηγουμένως επέτρεπε στους χρήστες να αποφασίζουν αν θα δημιουργήσουν άλλους βίντεο με τεχνητή νοημοσύνη χρησιμοποιώντας την ομοιότητα τους, η Google επιτρέπει πλέον μόνο σε ενήλικες χρήστες να δημιουργούν βίντεο με τα δικά τους avatars.
Χρειάστηκαν περίπου 5 λεπτά Ορίστε το avatar μου Μέσω της εφαρμογής Gemini. Η διαδικασία περιλάμβανε το να καθίσω σε ένα φωτεινό δωμάτιο, να δείξω την κάμερα του τηλεφώνου μου στο πρόσωπό μου και να διαβάσω μια σειρά από διψήφιους αριθμούς. Μετά κοίταξα αργά προς τα δεξιά, κούνησα το κεφάλι μου προς τα αριστερά και όλα τελείωσαν. Το Reece 2.0 γεννήθηκε και είναι έτοιμο να γίνει το deepfake αστέρι μου. (Να προσέχετε τι φοράτε κατά τη διάρκεια αυτής της διαδικασίας, καθώς η εφαρμογή είναι πιθανό να είναι ένας παράγοντας στη γενιά της AI, την οποία θα συζητήσουμε αργότερα.)
Για να ξεδιαλύνω πραγματικά τα συναισθήματά μου εδώ, ας αναλύσουμε καρέ-καρέ το κλιπ γενεθλίων. Πλήρης προτροπή: Παράγει ένα βίντεο τραγουδώντας Happy Birthday σε έναν παλιό δεινόσαυρο σε έναν λόφο στο Dolores Park.
Κλιπ που δημιουργήθηκε από AI από τον Reece Rogers
Στα δύο πρώτα δευτερόλεπτα, Παύση χιλιετίας Επειδή το AI Reece έχει επίσης βαθιά ριζωμένες συνήθειες. Το πρώτο και πιο εντυπωσιακό είναι το φωτορεαλιστικό σκηνικό. Αντί να τοποθετώ το avatar μου σε έναν μεγάλο λόφο σε ένα πάρκο, τα φόντο βίντεο AI της Google μοιάζουν εντυπωσιακά με τοποθεσίες της πραγματικής ζωής. Από τα μονοπάτια με φοίνικες μέχρι το Salesforce που υψώνεται στο βάθος, είναι εύκολο να ξεχωρίσετε ποιο πάρκο απεικονίζεται εδώ, ακόμα κι αν η απόδοση δεν είναι τέλεια. Είναι λογικό ότι μια εταιρεία γνωστή για την παγκόσμια χαρτογράφηση θα μπορούσε να το πετύχει.
Οι πρώτες μπάρες φάνηκαν φυσικές όταν η τεχνητή νοημοσύνη άρχισε να τραγουδά σε χαμηλότερο βαρύτονο από ό,τι μπορούσα να τραγουδήσω. Αναπήδησε τα χέρια μου πάνω-κάτω στο ρυθμό σαν μίνι μαέστρος. Έπειτα τραύλισα στη λέξη “να” και ο Δίδυμος έκοψε σε μια ευρεία βολή καθώς άρχισε η πραγματική σύγχυση. Τα cupcakes βανίλιας εμφανίζονται τυχαία και εκπνέω καπνό για να σβήσω τα εορταστικά κεριά. (Ειλικρινά, πόσο αγενής εκ μέρους σου AI Reece. Σήμερα δεν είναι η ιδιαίτερη μέρα σου.)










