Η Google ανακοίνωσε ότι χρησιμοποιώντας το μοντέλο Lyria 3 που παρουσιάστηκε πρόσφατα, οι χρήστες Gemini θα μπορούν να δημιουργήσουν ένα μουσικό κομμάτι διάρκειας 30 δευτερολέπτων με βάση μια προτροπή ή να κάνουν remix ενός υπάρχοντος κομματιού σύμφωνα με τις προτιμήσεις τους. Το νέο μοντέλο βασίζεται στην προϋπάρχουσα ικανότητα του Gemini να δημιουργεί κείμενο, εικόνες και βίντεο και θα είναι επίσης διαθέσιμο στη λειτουργία “Dream Tracks” του YouTube, όπου μπορεί να χρησιμοποιηθεί για τη δημιουργία λεπτομερών κομματιών υποστήριξης για Shorts.
Όπως και με άλλα εργαλεία δημιουργίας μουσικής, η προτροπή στο Gemini δεν απαιτεί πολλές λεπτομέρειες για αποτελεσματικά αποτελέσματα. Το παράδειγμα προτροπής της Google είναι “ένα funky R&B slow jam για να βρεις το ταίρι τους σε μια κάλτσα”, αλλά αφού παίξεις με το Lyria 3, σίγουρα μπορείς να κατανοήσεις καλύτερα τα μεμονωμένα στοιχεία ενός κομματιού — αλλάζοντας το τέμπο ή το στυλ τύμπανα, για παράδειγμα — αν θέλεις. Πέρα από το κείμενο, το Gemini μπορεί επίσης να δημιουργήσει μουσική με βάση μια φωτογραφία ή ένα βίντεο και τα κομμάτια μπορούν να συνδυαστούν με εξώφυλλο άλμπουμ που δημιουργήθηκε από το μοντέλο εικόνας Nano Banana της Google.
Η Google λέει ότι το Lyria 3 βελτιώνει τα προηγούμενα μοντέλα της γενιάς ήχου ως προς την ικανότητά του να δημιουργεί πιο «ρεαλιστικά και μουσικά περίπλοκα» κομμάτια, δίνοντας στους υποστηρικτές περισσότερο έλεγχο σε μεμονωμένα στοιχεία ενός τραγουδιού και δημιουργώντας αυτόματα τραγούδια. Οι έξοδοι του Gemini περιορίζονται σε κλιπ διάρκειας 30 δευτερολέπτων προς το παρόν, αλλά δεν είναι δύσκολο να φανταστεί κανείς ότι αυτά τα κλιπ θα μακραίνουν ή το μοντέλο να ενσωματώνεται σε άλλες εφαρμογές όπως το Google Messages, όπως φαίνεται η λειτουργία διαφημιστικού βίντεο της Google.
Όπως και τα άλλα αποτελέσματα του Gemini που δημιουργούνται από την τεχνητή νοημοσύνη, τα τραγούδια που δημιουργούνται με το Lyria 3 έχουν υδατογραφηθεί με το SynthID της Google, επομένως ένα κλιπ Gemini δεν μπορεί εύκολα να περάσει ως άνθρωπος. Η Google άρχισε να λανσάρει τον ανιχνευτή SynthID για να ανιχνεύει περιεχόμενο που δημιουργείται από AI στο Google I/O 2025. Τα δείγματα κομματιών που περιλαμβάνονται στην ανακοίνωση της Google είναι πειστικά, αλλά η εταιρεία σας μπορεί να μην χρειάζεται τα εργαλεία για να παρατηρήσει τις μηχανικές ιδιότητές τους. Τα μέρη στα κλιπ του Gemini ακούγονται συχνά υπέροχα, αλλά η σύνθεση τραγουδιών του Lyria 3 δημιουργεί έναν εναλλάξ βρώμικο και περίεργο ήχο.
Αν ενδιαφέρεστε να δοκιμάσετε μόνοι σας το Lyria 3, η Google λέει ότι μπορείτε να ζητήσετε κομμάτια στο Gemini από σήμερα, αν είστε 18 ετών και άνω και μιλάτε Αγγλικά, Ισπανικά, Γερμανικά, Γαλλικά, Χίντι, Ιαπωνικά, Κορεάτικα ή Πορτογαλικά.
Σύνδεσμος πηγής: www.engadget.com