Ένα νέο μοντέλο γενιάς βίντεο έρχεται προφανώς στους Gemini, με το “Omni” να παράγει μερικά αρκετά εντυπωσιακά πρώιμα αποτελέσματα.
Η δημιουργία βίντεο είναι ίσως η πιο συναρπαστική, αλλά και η πιο πολωτική πτυχή της γενετικής τεχνητής νοημοσύνης. Η Google έχει δημιουργήσει το Veo ως μοντέλο παραγωγής βίντεο εδώ και λίγο καιρό, αλλά φαίνεται ότι υπάρχει κάτι νέο στα σκαριά.
Τουλάχιστον ένας χρήστης Gemini ζητήθηκε “Build with Gemini Omni”, το οποίο η Google περιγράφει ως εξής:
Γνωρίστε τα νέα μας μοντέλα γενιάς βίντεο. Ανακατέψτε το βίντεό σας, επεξεργαστείτε σε ζωντανή συνομιλία, δοκιμάστε ένα πρότυπο και πολλά άλλα.
Δεν είναι απολύτως σαφές σε αυτό το σημείο πώς το “Omni” ταιριάζει στο ευρύτερο πλαίσιο των Gemini και VO, αλλά τα μεταδεδομένα συμβουλεύει Το “Omni” είναι μια επέκταση της Veo. Αλλά, ανεξάρτητα, η έξοδος εδώ φαίνεται αρκετά εντυπωσιακή. Μια επίδειξη χρησιμοποίησε την είσοδο “Ένας καθηγητής γράφει μια μαθηματική απόδειξη για μια τριγωνομετρική ταυτότητα σε έναν παραδοσιακό πίνακα κιμωλίας, εξηγώντας το βήμα που βρίσκεται αυτήν τη στιγμή στην εξίσωση” και το τελικό αποτέλεσμα λέει ακόμα κάτι προφανές, βίντεο Κάνει εξαιρετική δουλειά στο χειρισμό κειμένου ενώ αποδίδει ένα αρκετά ρεαλιστικό βίντεο.
Εν τω μεταξύ, μια δεύτερη προτροπή ζήτησε μια σκηνή με δύο άτομα να τρώνε μακαρόνια – ως αναφορά Στο Πείραμα του Γουίλ Σμιθ – και πάλι με αρκετά ρεαλιστικά αποτελέσματα. Δεν είναι κάτι εντελώς πρωτοποριακό, αλλά η απόδοση είναι αρκετά καλή.
Εδώ είναι η προτροπή ήταν: “Μπορείς να δημιουργήσεις μια σκηνή δίπλα στη θάλασσα σε ένα υπαίθριο κατάστρωμα σε ένα πολυτελές εστιατόριο. Βρίσκονται σε ένα στρογγυλό τραπέζι με ένα όμορφο λευκό τραπεζομάντιλο και όλα τα φανταχτερά αξεσουάρ, όλα τα κουτάλια, τα πιρούνια και τα μαχαίρια, φανταχτερές χαρτοπετσέτες, κεντρικά κομμάτια. Ο ένας είναι ντυμένος με ένα εκλεπτυσμένο κοστούμι, ο άλλος είναι φίλοι, και οι δύο κάνουν κουβεντούλα με σπα. άρχισε να τρώει ήρεμα τα μακαρόνια ανάμεσα σε μπουκιές συνομιλίας.
Μια καρτέλα “Χρήση”. Επίσης εμφανίζεται Για αυτόν τον χρήστη, αυτές οι δύο προτροπές κατέλαβαν το 86% της καθημερινής χρήσης σε ένα πρόγραμμα AI Pro (αν και ο χρήστης είπε κάποια χρήση στο Gemini Flash την ίδια ημέρα).
Πρόσφατα ανακαλύψαμε την πρόθεση της Google να προσθέσει σαφέστερα όρια χρήσης.
Η Google δεν έχει ανακοινώσει ακόμη το Gemini “Omni”, αλλά προηγουμένως είχε δηλώσει ότι έχει δεσμευτεί στην τεχνολογία “το βίντεο είναι εδώ για να μείνει”, μετά την ανακοίνωση ότι το OpenAI θα σταματήσει να δημιουργεί βίντεο μέσω του μοντέλου Sora νωρίτερα φέτος. Με το I/O 2026 προ των πυλών, πιθανότατα εδώ θα ακούσουμε περισσότερα για τα σχέδια της Gemini και της Google για τη δημιουργία βίντεο.
Περισσότερα για το Gemini:
Ακολουθήστε τον Ben: Twitter/x, νήμα, BlueskyΚαι Instagram
FTC: Χρησιμοποιούμε αυτόματους συνδέσμους συνεργατών για να δημιουργήσουμε εισόδημα. Περισσότερο








