Πέρυσι προσποιήθηκα το λούτρινο ζωάκι του μωρού μου για να φαίνεται ότι το βελούδινο ελάφι του ήταν σε διακοπές.
Ήταν ένα πείραμα για να δω αν μπορούσα να αναδημιουργήσω τα γεγονότα που απεικονίζονται στη διαφήμιση Gemini που έτρεχε η Google και δεν είχα δείξει ποτέ στο τετράχρονο παιδί μου τα βίντεο του Μπάντι του ελαφιού από τις περιπέτειές του. Αλλά ήταν μια αποκαλυπτική άσκηση που με έκανε να σκεφτώ πολύ τη διαφορά μεταξύ κάποιας ακίνδυνης διασκέδασης με γενετική τεχνητή νοημοσύνη και της πλήρους παλινδρόμησης. Ίσως αυτό το διάγραμμα Venn είναι ένας τέλειος κύκλος! Ίσως όχι. Αλλά αυτό που ξέρω σίγουρα είναι ότι τα εργαλεία για τη δημιουργία ρεαλιστικών βίντεο είναι εκπληκτικά καλά και απαιτούν πολύ λίγη προσπάθεια και γνώση. Αυτή η τάση συνεχίζεται στην εποχή Omni στους Διδύμους.
Το Omni είναι μια νέα οικογένεια μοντέλων παραγωγής που μια μέρα θα μπορεί να μετατρέψει οποιοδήποτε είδος εισόδου — εικόνες, βίντεο, κείμενο — σε οτιδήποτε άλλο. Αλλά για αρχή, είναι απλώς η δημιουργία ενός βίντεο. Το Omni Flash είναι το πρώτο από αυτά τα μοντέλα που κυκλοφόρησε από την Google και είναι πλέον διαθέσιμο στην πλατφόρμα δημιουργίας και επεξεργασίας βίντεο AI της εταιρείας, Flow. Μπορείτε ακόμα να χρησιμοποιήσετε το προηγούμενο μοντέλο, το Veo, αν θέλετε, αλλά το Omni βελτιώνει το Veo με διάφορους τρόπους.
Με το Omni, μπορείτε να ανεβάσετε ένα βίντεο και να το χρησιμοποιήσετε μαζί με ένα μήνυμα κειμένου ως σημείο εκκίνησης για τη δημιουργικότητα που δημιουργείται από την τεχνητή νοημοσύνη. Η Google ισχυρίζεται επίσης ότι το Omni ενσωματώνει περισσότερη γνώση του πραγματικού κόσμου κατά την παραγωγή βίντεο και μπορεί να κάνει καλύτερη δουλειά στο να διατηρεί τους χαρακτήρες συνεπείς σε όλο το βίντεο ως αποτέλεσμα. Υπήρχε μόνο ένας τρόπος για να μάθετε αν αυτοί οι ισχυρισμοί ήταν πραγματικά αληθινοί: Έφερα τον AI Buddy για να ετοιμάσει τα σακίδια που δημιουργήθηκαν από την τεχνητή νοημοσύνη για μια άλλη περιπέτεια.
Τα αποτελέσματα είναι τόσο μπερδεμένα που προκαλούν σύγχυση. Κάποια από αυτά ήταν πολύ καλά και ήταν πιο συνεπή και πιστή στους ισχυρισμούς μου από ό,τι όταν δοκίμαζα το Veo πέντε μήνες νωρίτερα. Αλλά ακόμη και τα καλύτερα κλιπ που ετοίμασε για μένα η Omni εξακολουθούν να περιέχουν τρόμους άλματος AI, όπως όταν ο Buddy αλλάζει ξαφνικά κατεύθυνση ενώ κάνει αλεξίπτωτο.
Σε ένα άλλο βίντεο, έδωσα στο Omni κάποια καλλιτεχνική ελευθερία. “Δημιουργήστε ένα μοντάζ με τον Buddy που ετοιμάζει τα πράγματα για διακοπές και πηγαίνει σε ένα κρουαζιερόπλοιο για τροπικές διακοπές. Η διάθεση είναι χαριτωμένη και διασκεδαστική. Ο Buddy ετοιμάζει κάτι αστείο στη βαλίτσα του που παίζει αργότερα στο κλιπ.” Είχε τον Buddy να συσκευάζει ένα βάζο με μέλι. Αργότερα στο κλιπ, το πιάνει σαν να ήταν ένα μπουκάλι αντηλιακό. «Α», λέει ο χαρακτήρας καθώς ραντίζει μέλι την οπλή του.
Ειλικρινά, δεν είναι και λίγο κακό. Ωστόσο, το μπουκάλι μελιού αλλάζει συνεχώς σε όλο το βίντεο, από ένα βάζο σε ένα διαυγές μπουκάλι ψεκασμού γεμάτο με νερό και μετά σε ένα μπουκάλι με στύψιμο γεμάτο με μέλι. Και δεν μπορώ καν να αρχίσω να περιγράφω πώς το μοντέλο κατέληξε στο τελικό καρέ του βίντεο – σχεδόν σαν να συγκέντρωσε ένα σωρό στοιχεία της σειράς που μόλις είχε δημιουργήσει.
Μπορείτε να χρησιμοποιήσετε μηνύματα προτροπής κειμένου για να προτείνετε τροποποιήσεις στα βίντεό σας και θα δώσω τα εύσημα στην Google: Αυτό λειτουργεί καλύτερα με το Omni από ό,τι όταν δοκίμασα το Veo 3. Αλλά τα αποτελέσματα ήταν… κακός Με το Veo – τόσο κακό που μου ήταν πιο εύκολο να αποδώσω ένα νέο βίντεο από την αρχή κάθε φορά που ήθελα να αλλάξω κάτι. Το Omni θα λάβει υπόψη τις προσαρμογές σας, αλλά τα αποτελέσματα δεν είναι πάντα ορατά.
Την έβαλα να τονίσει τις αντιδράσεις του προσώπου του Μπάντι στα κλιπ των διακοπών του και τα αποτελέσματα κατέληξαν να φαίνονται περίεργα. Θα δίνει επίσης κέρατα στο Buddy κατά καιρούς, τα οποία δεν έχει. Φίλος είναι παιδίΕυχαριστώ πολύ. Όταν του ζήτησα να αφαιρέσει τα κέρατα που εμφανίζονταν σε μια σκηνή, υποχρέωσε και μετά πρόσθεσε τα κέρατα σε όλες τις άλλες σκηνές.
Το θέμα είναι ότι τίποτα από αυτά δεν είναι δωρεάν. Η δημιουργία βίντεο κοστίζει από 15 έως 40 μονάδες, ανάλογα με τη διάρκεια της σκηνής και τα “συστατικά” με τα οποία ξεκινάτε. Ένας γύρος τροποποιήσεων κοστίζει 40 μονάδες. Έχω το πρόγραμμα AI Pro $20/μήνα που συνοδεύεται από 1.000 πόντους κάθε μήνα. Μετά από περίπου 20 κλιπ που δημιουργήθηκαν και κάποιες μικροαλλαγές, έφτασα τα 145 κλιπ. Εάν έχετε συγκεκριμένες ιδέες σχετικά με το βίντεο που θέλετε να δημιουργήσει η Omni, μπορεί να εξετάζετε πολλές δαπανηρές αλλαγές με το μοντέλο για να αποκτήσετε ένα βίντεο που να είναι κοντά στο όραμά σας.
Μπορώ να πω ειλικρινά ότι δεν ήμουν προετοιμασμένος για αυτό που είδα
Ένα από τα υποτιθέμενα πλεονεκτήματα της Omni είναι η προσθήκη αντικειμένων που δημιουργούνται από AI σε πραγματικά βίντεο, έτσι έδωσα στον Buddy ένα διάλειμμα και έκανα μόνος μου το deepfake. Ξεκινώντας με ένα βίντεο selfie με ουδέτερη έκφραση, έβαλα την Omni να δημιουργήσει βίντεο με εμένα να τρώω ένα πιάτο μακαρόνια, να κάθομαι σε ένα κάθισμα αεροπλάνου, να στέκομαι μπροστά στον Πύργο του Άιφελ και να τσιμπάω μια μπαγκέτα. Και μπορώ να πω ειλικρινά ότι δεν ήμουν προετοιμασμένος για αυτό που είδα.
Υπάρχουν ιστορίες τεχνητής νοημοσύνης στα ψεύτικα βίντεό μου. Ο ήχος του πιρουνιού που χτυπά το μπολ με τα ζυμαρικά είναι λίγο κατασκευασμένος. Υπάρχει μια γυναίκα στο παρασκήνιο του βίντεο του αεροπλάνου που εμφανίζεται δύο φορές. Αλλά εκτός από αυτά τα μικρά λάθη και την αόριστα αόριστη αίσθηση του, είναι πολύ συναρπαστικό.
Έδειξα στον άντρα μου το κλιπ ζυμαρικών. Ήξερε ότι δοκίμαζα ένα εργαλείο βίντεο AI, αλλά δεν του είπα τι είχε δημιουργήσει το AI στη σκηνή. Χωρίς να ξέρει τι είχε δημιουργήσει η τεχνητή νοημοσύνη για αυτό, πίστεψε ότι καθόμουν μπροστά στην κάμερα και τρώω ζυμαρικά και είπε ότι η μόνη του ένδειξη ότι κάτι είχε συμβεί ήταν ότι το μπολ φαινόταν άγνωστο. Η κατανάλωση ζυμαρικών από μόνη της φαινόταν αρκετά αληθινή για να τον πείσει ο άντρας μου. Ο τύπος που βασικά με κοίταξε στην πραγματική ζωή Κάθε μέρα την τελευταία δεκαετία.
Άλλα deepfakes έχουν διαφορετικά επίπεδα “αρκετά καλά για να ξεγελάσουν τους ανθρώπους στα μέσα κοινωνικής δικτύωσης”. Μερικά από τα κλιπ του Πύργου του Άιφελ φαίνονται λίγο καρτούν, αλλά ένα είναι αρκετά πειστικό ότι ίσως χρειαστεί να το ξαναδείτε μερικές φορές για να βεβαιωθείτε ότι είναι AI. εγώ Ξέρω ότι δεν είμαι εγώ όταν η τεχνητή νοημοσύνη γυρίζει το κεφάλι της και αποκαλύπτει τα μαλλιά της τραβηγμένα σε αλογοουρά. Αλλά δεν είμαι σίγουρος ότι κάποιος άλλος θα ήξερε τη διαφορά και με κάνει να νιώθω περίεργα.
Είμαστε σίγουρα βαθιά στην παράξενη κοιλάδα
Είμαι λίγο εξαντλημένος με όλα αυτά, για να είμαι ειλικρινής. Όταν δοκίμασα το Veo 3, συγκλονίστηκα από τον ρεαλισμό που μπορεί να παράγει. Έχω σοκαριστεί με το πόσο εύκολο είναι να φωτογραφίζεις ψεύτικους ανθρώπους σε ψεύτικες φωτογραφίες ξανά και ξανά τα τελευταία χρόνια. Μάλλον έχω σοκαριστεί και με το Omni, και νομίζω ότι είμαι, αλλά η άκρη έχει φθαρεί.
Δεν είναι ακόμα τόσο εύκολο να δημιουργήσετε ένα κινηματογραφικό αριστούργημα που δημιουργείται από AI, όπως θα ήθελε να πιστεύετε η Google. Αλλά το Omni βελτιώνει το Veo με γνωστούς τρόπους. Εάν διαθέτετε λογαριασμό Google και πιστωτική κάρτα, μπορείτε να τραβήξετε ένα βίντεο με τον εαυτό σας να κάθεστε στο σπίτι και να φαίνεται ότι βρίσκεστε σε ένα ταξίδι στο Maui με λίγη προσπάθεια. Δεν νομίζω ότι βρισκόμαστε ακριβώς στους «πρόποδες της μοναδικότητας», αλλά σίγουρα βρισκόμαστε βαθιά στην παράξενη κοιλάδα.
Όλες οι εικόνες και τα βίντεο σε αυτήν την ιστορία δημιουργήθηκαν από το Google Gemini.







