Το Gemma 4 12B είναι σχεδόν εξίσου ικανό με την έκδοση με 26 δισεκατομμύρια παραμέτρους.
Πίστωση: Google
Η Google λέει ότι το νέο μοντέλο είναι ικανό για πολύπλοκη λογική πολλαπλών βημάτων και πρακτικές ροές εργασίας που προηγουμένως απαιτούσαν μεγαλύτερες παραλλαγές Gemma. Παρά τον μικρό υπολογισμό των παραμέτρων, το Gemma 4 12B συνοδεύεται από νέα σχεδιαστικά προγράμματα πρόβλεψης πολλαπλών σημείων (MTP), τα οποία εκμεταλλεύονται τους αχρησιμοποίητους κύκλους επεξεργασίας για τον υπολογισμό πιθανών μελλοντικών κουπονιών. Το αποτέλεσμα είναι μεγαλύτερη ταχύτητα και αποτελεσματικότητα. Η Google έχει κυκλοφορήσει προαιρετικές εκδόσεις MTP άλλων μοντέλων Gemma 4, αλλά αυτή είναι η πρώτη που υπερβαίνει το MTP.
Το Gemma 4 12B είναι πιο αποτελεσματικό χάρη σε μια νέα προσέγγιση στην πολυτροπικότητα. Η οικογένεια Gemma 4 δέχεται εγγενώς multimodal, κείμενο, ήχο ή εικόνα ως είσοδο. Τα περισσότερα μοντέλα τεχνητής νοημοσύνης Zen – συμπεριλαμβανομένων άλλων παραλλαγών του Gemma 4 – χρησιμοποιούν αποκλειστικούς κωδικοποιητές για την επεξεργασία εισαγωγών εκτός κειμένου και τη μεταβίβαση αυτών των δεδομένων στο LLM. Αυτό λειτουργεί αρκετά καλά, αλλά αυξάνει τον λανθάνοντα χρόνο και τη χρήση μνήμης.
Με το νέο μοντέλο μεσαίου βάρους, η Google έχει εφαρμόσει μια βελτιωμένη μονάδα ενσωμάτωσης για την όραση, που διαθέτει πολλαπλασιασμό μονής μήτρας και ενσωμάτωση θέσης, επιτρέποντας την αποστολή δεδομένων στο LLM με ακριβή χωρική επίγνωση. Αυτό εξαλείφει την ανάγκη για έναν ογκώδη κωδικοποιητή μεσάζοντα. Για τον ήχο, δεν υπάρχει κωδικοποίηση. Οι προγραμματιστές ανέπτυξαν μια μέθοδο για την προβολή του πρωτογενούς ηχητικού σήματος στα ίδια διανύσματα που χρησιμοποιούνται για διακριτικά κειμένου.
Εάν θέλετε να δείτε το νέο μοντέλο Gemma 4, είναι προσβάσιμο χωρίς λήψη μέσω εργαλείων όπως π.χ. LM Studio, Γκαλερί Google AI EdgeΚαι περισσότερο, αλλά η όλη ιδέα του Gemma 4 12B είναι ότι μπορείτε να το εκτελέσετε τοπικά και με τους δικούς σας όρους. Εάν έχετε μνήμη RAM, τα βάρη μοντέλων είναι διαθέσιμα για άμεση λήψη Kaggle Και πρόσωπο αγκαλιάς. Είναι απλά 18 GB.








