Μετά την ανακοίνωση του Gemini Automation σήμερα, η Google περιγράφει λεπτομερώς πώς λειτουργεί όλο αυτό κάτω από την κουκούλα του Android.
Η Google εισάγει “δυνατότητες προγραμματιστών σε αρχικό στάδιο που γεφυρώνουν το χάσμα μεταξύ της εφαρμογής σας και εξατομικευμένων βοηθών όπως οι Agentic Apps και το Google Gemini”.
Ενώ βρισκόμαστε στα πρώτα στάδια beta αυτού του ταξιδιού, σχεδιάζουμε αυτές τις λειτουργίες έχοντας κατά νου το απόρρητο και την ασφάλεια ως το πρώτο μας βήμα για την εξερεύνηση αυτής της αλλαγής παραδείγματος ως οικοσύστημα εφαρμογών.
Λειτουργία εφαρμογής
Το Android έχει δύο προσεγγίσεις, ξεκινώντας από τις λειτουργίες εφαρμογών. Ανακοινώθηκε αθόρυβα πέρυσι και τώρα είναι πλήρως λεπτομερής.
Λειτουργία εφαρμογής Πρόκειται για μια λειτουργία πλατφόρμας Android 16 και μια συνοδευτική βιβλιοθήκη Jetpack που επιτρέπει στις εφαρμογές να έχουν πρόσβαση και να εκτελούν λειτουργίες που αφορούν τον καλούντα, όπως εφαρμογές αντιπροσώπων σε συσκευές.
Οι προγραμματιστές περιγράφουν λεπτομερώς τις δυνατότητες της εφαρμογής τους ως εργαλεία που μπορούν να χρησιμοποιήσουν οι πράκτορες και οι βοηθοί τεχνητής νοημοσύνης (όπως οι Gemini). Η Google εξισώνει τις AppFunctions με το Model Context Protocol (MCP) που είναι δημοφιλές για εργαλεία agent και server. Ωστόσο, αυτές οι λειτουργίες εμφανίζονται εγγενώς σε συσκευές Android. Παραδείγματα περιπτώσεων χρήσης είναι:
- Διαχείριση εργασιών και παραγωγικότητα
- Αίτημα χρήστη:”Υπενθύμισέ μου να παραλάβω το πακέτο μου από τη δουλειά σήμερα στις 5 το απόγευμα“
- Ενέργεια λειτουργίας εφαρμογής: Ο καλών καλεί μια συνάρτηση για τη δημιουργία μιας εργασίας προσδιορίζοντας τη σχετική εφαρμογή διαχείρισης εργασιών και συμπληρώνοντας αυτόματα τα πεδία τίτλου, ώρας και τοποθεσίας με βάση τις προτροπές των χρηστών.
- ΜΜΕ και ψυχαγωγία
- Αίτημα χρήστη:”Δημιουργήστε μια νέα λίστα αναπαραγωγής με τα καλύτερα άλμπουμ τζαζ φέτος“
- Ενέργεια λειτουργίας εφαρμογής: Ο καλών εκτελεί μια λειτουργία δημιουργίας λίστας αναπαραγωγής μέσα σε μια εφαρμογή μουσικής, περνώντας ένα πλαίσιο όπως “Καλύτερα άλμπουμ τζαζ για το 2026” ως ερώτημα για να δημιουργήσει και να ξεκινήσει άμεσα περιεχόμενο.
- Ροή εργασίας μεταξύ εφαρμογών
- Αίτημα χρήστη:”Βρείτε συνταγές για noodle από το email της Lisa και προσθέστε συστατικά στη λίστα αγορών μου“
- Ενέργεια λειτουργίας εφαρμογής: Αυτό το αίτημα χρησιμοποιεί πολλές λειτουργίες εφαρμογής. Αρχικά, ο καλών χρησιμοποιεί τη λειτουργία αναζήτησης μιας εφαρμογής email για να ανακτήσει το περιεχόμενο. Στη συνέχεια, εξάγει τα σχετικά στοιχεία και καλεί μια λειτουργία εφαρμογής λίστας αγορών για να δημιουργήσει τη λίστα του χρήστη.
- Ημερολόγιο και Πρόγραμμα
- Αίτημα χρήστη:”Προσθέστε το πάρτι γενεθλίων της μαμάς στο ημερολόγιό μου την επόμενη Δευτέρα στις 6 μ.μ“
- Ενέργεια λειτουργίας εφαρμογής: Η εξουσιοδοτημένη εφαρμογή αντιπροσώπων επικαλείται τη λειτουργία “Δημιουργία συμβάντος” της εφαρμογής Ημερολόγιο, αναλύοντας σχετικό πλαίσιο όπως “επόμενη Δευτέρα” και “6 μ.μ.” για τη δημιουργία καταχωρίσεων χωρίς να απαιτείται από τον χρήστη να ανοίξει με μη αυτόματο τρόπο το ημερολόγιο.
Παρακάτω είναι ένα παράδειγμα AppFunctions που χρησιμοποιούν την εφαρμογή Samsung Gallery στο Galaxy S26. Έρχεται επίσης σε συσκευές Samsung με OneUI 8.5 και νεότερη έκδοση.
Αντί να κάνετε μη αυτόματη κύλιση στα άλμπουμ φωτογραφιών, μπορείτε τώρα απλώς να πείτε στο Gemini να “Εμφάνιση φωτογραφιών της γάτας μου από τη Γκαλερί Samsung”. Το Gemini λαμβάνει ερωτήσεις χρηστών, εντοπίζει έξυπνα και ενεργοποιεί τη σωστή λειτουργία και παρουσιάζει φωτογραφίες που επιστρέφονται από το Samsung Gallery απευθείας στην εφαρμογή Gemini, ώστε οι χρήστες να μην χρειάζεται να φύγουν ποτέ. Αυτή η εμπειρία είναι πολυτροπική και μπορεί να γίνει μέσω φωνής ή κειμένου. Οι χρήστες μπορούν να χρησιμοποιήσουν τις επιστρεφόμενες φωτογραφίες σε επακόλουθες συνομιλίες, όπως να τις στείλουν σε φίλους σε ένα μήνυμα κειμένου.
Εν τω μεταξύ, η Google λέει ότι η εφαρμογή Gemini χρησιμοποιεί ήδη τις Λειτουργίες εφαρμογής για να ενσωματώσει το ημερολόγιο, τις σημειώσεις και τις εργασίες της στις προεπιλογές των Εφαρμογών Google και OEM.
Αυτοματισμός διεπαφής χρήστη
Με το Gemini Automation που ανακοινώθηκε σήμερα το πρωί για τις σειρές Galaxy S26 και Pixel 10, το Android εργάζεται επίσης σε μια δεύτερη μέθοδο.
Ενώ οι AppFunctions παρέχουν ένα δομημένο πλαίσιο και περισσότερο έλεγχο για την αλληλεπίδραση των εφαρμογών με πράκτορες και βοηθούς τεχνητής νοημοσύνης, γνωρίζουμε ότι δεν έχει ακόμη κάθε αλληλεπίδραση αποκλειστική ενσωμάτωση.
Η Google “αναπτύσσει ένα πλαίσιο αυτοματισμού διεπαφής χρήστη για πράκτορες και βοηθούς τεχνητής νοημοσύνης ώστε να εκτελούν έξυπνα γενικές εργασίες στις εγκατεστημένες εφαρμογές των χρηστών”.
Είναι η πλατφόρμα που κάνει τη βαριά ανύψωση, ώστε οι προγραμματιστές να μπορούν να φτάσουν στο Agentic με μηδενικό κωδικό. Αυτήν τη στιγμή, είναι ένας τρόπος χαμηλής προσπάθειας για να επεκτείνετε την εμβέλειά τους χωρίς σημαντικό μηχανικό ανελκυστήρα.
Η Google λέει ότι το Android 17 «θα επεκτείνει αυτές τις δυνατότητες για να προσεγγίσει περισσότερους χρήστες, προγραμματιστές και κατασκευαστές συσκευών».
Αυτήν τη στιγμή χτίζουμε την εμπειρία με ένα μικρό σύνολο προγραμματιστών εφαρμογών, εστιάζοντας στην εμπειρία χρήστη υψηλής ποιότητας κατά την ανάπτυξη του οικοσυστήματος. Σκοπεύουμε να μοιραστούμε περισσότερες λεπτομέρειες αργότερα φέτος σχετικά με τον τρόπο χρήσης των AppFunctions και του UI Automation για να ενεργοποιήσετε την ενσωμάτωση πρακτόρων για την εφαρμογή σας. Μείνετε συντονισμένοι για ενημερώσεις.
FTC: Χρησιμοποιούμε αυτόματους συνδέσμους συνεργατών για να δημιουργήσουμε εισόδημα. Περισσότερο
Σύνδεσμος πηγής: 9to5google.com