Όταν η Google κυκλοφόρησε το Gemini 3 Pro στα τέλη του περασμένου έτους, ήταν ένα σημαντικό βήμα προς τα εμπρός για τα ιδιόκτητα μοντέλα μεγάλης γλώσσας της εταιρείας. Τώρα, η εταιρεία φέρνει μερικές από την ίδια τεχνολογία και έρευνα που κατέστησαν δυνατά αυτά τα μοντέλα στην κοινότητα ανοιχτού κώδικα με την κυκλοφορία της νέας οικογένειας μοντέλων ανοιχτού βάρους Gemma 4.
Η Google προσφέρει τέσσερις διαφορετικές εκδόσεις του Gemma 4, που διαφοροποιούνται από τον αριθμό των προσφερόμενων παραμέτρων. Για συσκευές αιχμής, συμπεριλαμβανομένων των smartphone, η εταιρεία διαθέτει 2 δισεκατομμύρια και 4 δισεκατομμύρια μοντέλα «εργαζομένων». Για πιο ισχυρά μηχανήματα, υπάρχουν 26 δισεκατομμύρια “έμπειρα μείγματα” και 31 δισεκατομμύρια “πυκνά” συστήματα. Για όσους δεν είναι εξοικειωμένοι, οι παράμετροι είναι ρυθμίσεις που ένα μοντέλο μεγαλύτερης γλώσσας μπορεί να τροποποιήσει για να παράγει μια έξοδο. Γενικά, τα μοντέλα με περισσότερες παραμέτρους παρέχουν καλύτερες απαντήσεις από εκείνα με λιγότερες, αλλά απαιτούν πιο ισχυρό υλικό για να εκτελεστούν.
Με το Gemma 4, η Google ισχυρίζεται ότι κατάφερε να κατασκευάσει συστήματα με «πρωτοφανή ευφυΐα ανά παράμετρο». Για να υποστηρίξει αυτόν τον ισχυρισμό, η εταιρεία επισημαίνει την απόδοση των παραλλαγών των 31 δισεκατομμυρίων και των 26 δισεκατομμυρίων του Gemma 4, οι οποίες διεκδίκησαν την τρίτη και την έκτη θέση αντίστοιχα στον πίνακα κορυφαίων κειμένου του Arena AI, ξεπερνώντας τα μοντέλα 20 φορές το μέγεθός τους.
Όλα τα μοντέλα μπορούν να επεξεργάζονται βίντεο και εικόνες, καθιστώντας τα ιδανικά για εργασίες όπως η οπτική αναγνώριση χαρακτήρων. Δύο μικρότερα μοντέλα είναι ικανά να επεξεργάζονται την είσοδο ήχου και να κατανοούν την ομιλία. Ξεχωριστά, η Google λέει ότι η οικογένεια Gemma 4 είναι σε θέση να δημιουργεί κώδικα εκτός σύνδεσης, που σημαίνει ότι μπορείτε να τα χρησιμοποιήσετε για να κωδικοποιήσετε το Vibe χωρίς σύνδεση στο Διαδίκτυο. Η Google έχει εκπαιδεύσει μοντέλα σε περισσότερες από 140 γλώσσες.
Η Google κυκλοφορεί την οικογένεια Gemma 4 υπό την άδεια Apache 2.0. Η εταιρεία διέθεσε προηγούμενα μοντέλα GEMA μέσω της δικής της άδειας GEMA. Αυτή η κίνηση θα δώσει στους ανθρώπους περισσότερη ελευθερία να τροποποιήσουν τα νέα συστήματα για να ταιριάζουν στις ανάγκες τους.
“Αυτή η άδεια ανοιχτού κώδικα παρέχει τη βάση για πλήρη ευελιξία προγραμματιστή και ψηφιακή κυριαρχία, παρέχοντάς σας πλήρη έλεγχο των δεδομένων, της υποδομής και των μοντέλων σας.” είπε η Google. “Σας επιτρέπει να δημιουργείτε και να αναπτύσσετε ελεύθερα με ασφάλεια σε οποιοδήποτε περιβάλλον, είτε εντός εγκατάστασης είτε στο cloud.”
Εάν θέλετε να δοκιμάσετε ένα από τα συστήματα μόνοι σας, τα βάρη μοντέλων είναι διαθέσιμα μέσω των Hug Face, Kaggle και Ollama.
Σύνδεσμος πηγής: www.engadget.com
