Το Google Pixel κατέστρεψε τη φωνή σε κείμενο για μένα, αυτή η εφαρμογή το διορθώνει

Υπάρχουν πολλοί λόγοι που μου αρέσει να χρησιμοποιώ τηλέφωνα Google Pixel, αλλά η αναβάθμιση φωνής σε κείμενο μπορεί να είναι η πιο υποτιμημένη αναβάθμιση σε αυτές τις συσκευές. Κάθε φορά που χρησιμοποιώ το Pixel, χωρίς αποτυχία, κυριολεκτικά παλεύω να επιστρέψω σε οποιαδήποτε άλλη συσκευή Android, επειδή η εμπειρία φωνής σε κείμενο είναι τόσο κακή. Όμως, επιτέλους, υπάρχει ένα λαμπρό μέλλον.

Το Gboard είναι η κύρια προσφορά πληκτρολογίου του Android και έχει ενσωματωμένη υπαγόρευση φωνής σε κείμενο. Λειτουργεί αρκετά καλά, αλλά υπερφορτίζεται σε ένα Pixel. Η Google έκανε για πρώτη φορά αυτήν την αλλαγή πριν από μισή δεκαετία, με μια βελτιωμένη εμπειρία στο Pixel που όχι μόνο είναι πολύ πιο γρήγορη, αλλά και πιο ακριβής. Μεταξύ της σωστής λήψης των λέξεων και της δυνατότητας συμπερίληψης σημείων στίξης, παράγει φωνή σε κείμενο σε ένα μόνο pixel. απότομα Καλύτερο από οποιαδήποτε άλλη συσκευή Android.

Και ανεξάρτητα από το αν χρησιμοποιείτε πληκτρολόγιο. Το Gboard σε ένα Pixel έναντι του Gboard σε ένα Samsung Galaxy είναι δύο απίστευτα διαφορετικές εμπειρίες. Η έκδοση που βρίσκεται σε άλλες συσκευές Android δεν υποστηρίζει σημεία στίξης (εκτός αν λέτε τα σημεία στίξης δυνατά), συχνά χρειάζεται περισσότερος χρόνος για να φορτώσει και σπάνια είναι ακριβής. Μην με παρεξηγείτε, θα μπορούσε να είναι χειρότερο – η φωνή σε κείμενο του πληκτρολογίου Samsung είναι μια πραγματική παρωδία – αλλά θα ήθελα πραγματικά η Google να κάνει κάποιες βελτιώσεις εδώ.

Ωστόσο, μια λύση σε αυτό φαίνεται στον ορίζοντα.

Διαφήμιση – Κάντε κύλιση για περισσότερο περιεχόμενο

Είναι AI.

Εξακολουθώ να ανησυχώ για τις περισσότερες εφαρμογές της τεχνητής νοημοσύνης, αλλά αν υπάρχει ένα πράγμα στο οποίο είναι καλοί οι LLM, αυτό είναι το κείμενο – τελικά, είναι στο όνομα. Έτσι, η μετατροπή φωνής σε κείμενο έχει γίνει μια πολύ δημοφιλής χρήση της τεχνητής νοημοσύνης και μια από τις πιο χρήσιμες για τον τελικό χρήστη. Τεχνικά, η Google ήταν πολύ μπροστά από την καμπύλη εδώ με τη βελτιωμένη φωνητική πληκτρολόγηση του Gboard στο Pixel χάρη στη μηχανική εκμάθηση. Τα νέα μοντέλα απλώς υπερτροφοδοτούνται

Ένα από τα πρώτα μέρη που συνάντησα ήταν το “Wispr Flow”, μια υπηρεσία υπαγόρευσης φωνής σε κείμενο με τεχνητή νοημοσύνη που κυκλοφόρησε στο Android νωρίτερα φέτος και το χρησιμοποιώ από τότε.

Νομίζω ότι υπάρχουν δύο βασικά πράγματα σε αυτό.

Πρώτα και κύρια, το Flow δεν αντικαθιστά το πληκτρολόγιο ή οποιοδήποτε άλλο πληκτρολόγιο που μπορεί να θέλετε να χρησιμοποιήσετε. Αντίθετα, λειτουργεί ως αιωρούμενο κουμπί/αναδυόμενο παράθυρο πάνω από την άλλη εφαρμογή που προσπαθείτε να χρησιμοποιήσετε. Χρειάζεται λίγη μυϊκή μνήμη για να σταματήσετε να πατάτε το κουμπί του μικροφώνου του Gboard και να χρησιμοποιήσετε το Flow, αλλά είναι τόσο καλή λύση όσο μπορώ να σκεφτώ. Δεν θα μπορούσατε να μου αφαιρέσετε το Gboard και δεν νομίζω ότι είμαι μόνος εκεί – το Gboard είναι ίσως ένα από τα καλύτερα λογισμικά της Google στο Android. Το αιωρούμενο κουμπί δεν εμφανίζεται συνεχώς, αλλά μάλλον εμφανίζεται κάπως έξυπνα με βάση την εφαρμογή που χρησιμοποιείτε και το τι πραγματικά κάνετε. Λέω «κάπως» γιατί το έχω δει τόσο συχνά που δεν το χρειάζομαι. Το Flow φαίνεται να εστιάζει στον εντοπισμό της εφαρμογής και όχι στην απλή μέθοδο, βλέποντας απλώς ότι ενεργοποιείται το πληκτρολόγιο.

Ωστόσο, είναι μια από τις καλύτερες υλοποιήσεις που έχω δει. Πατώντας το κουμπί ξεκινά το Voice-to-Text και πατώντας το σημάδι επιλογής το επεξεργάζεται και το επικολλά στο ενεργό πλαίσιο κειμένου σας. Μακάρι να έδειχνε μια προεπισκόπηση του κειμένου αλλά λειτουργεί αρκετά καλά.

Αυτά δεν είναι τα μόνα συμβιβασμούς, φυσικά. Πρέπει να εκχωρήσετε στο Wispr Flow ορισμένα πρόσθετα δικαιώματα, όπως εμφάνιση πάνω από άλλες εφαρμογές, καθώς και πρόσβαση προσβασιμότητας. Ως αποτέλεσμα, η εφαρμογή εμφανίζει ειδοποιήσεις στο δίσκο. Δεν υπάρχουν εικονίδια γραμμής κατάστασης και είναι σε σίγαση από προεπιλογή, αλλά αν θέλετε πραγματικά να τα αποκρύψετε, θα πρέπει να τα απενεργοποιήσετε χειροκίνητα μέσω των Ρυθμίσεων Android. Απενεργοποίησα γρήγορα τη μόνιμη ειδοποίηση μέσω των ρυθμίσεων του Android, αλλά είναι λίγο απογοητευτικό να έχεις μια συνεχή ειδοποίηση όταν οι εφαρμογές έχουν πλέον τη δυνατότητα να εμφανίζονται πάνω από άλλες. Καταλαβαίνω γιατί υπάρχει – είναι εύκολο να γίνει κατάχρηση αυτής της λειτουργικότητας – αλλά, φίλε, είναι ένα κόλπο σε αυτήν την εμπειρία. Αυτό είναι το κύριο πράγμα που ώθησε τον Flo στο καθεστώς “έλα και πήγαινε”. Εξακολουθώ να το χρησιμοποιώ κατά καιρούς, αλλά το έχω αναβάλει πολύ γιατί μου αρέσει.

Πρέπει επίσης να εμπιστευτείτε τη Wispr όσον αφορά το απόρρητο των πραγμάτων εδώ. Η εφαρμογή έχει μια “Private Mode” που λέει ότι “θα αποθηκεύει δεδομένα μόνο στη συσκευή σας”.

Είπαμε, η πραγματική απόδοση περισσότερο παρά να το αναπληρώσεις.

Το χρησιμοποιούσα στο Galaxy Z Fold 7 μου — το καθημερινό μου πρόγραμμα οδήγησης και το σωστό τηλέφωνο που μου θυμίζει συνεχώς πόσο κακό είναι το Gboard voice-to-text στο Pixel — και εκπλήσσομαι με το πόσο καλά λειτουργούν όλα. Το μοντέλο φωνής σε κείμενο εδώ είναι τρελά ακριβές, ικανό να μεταγράψει ακριβώς αυτό που λέω ανεξάρτητα από το πλαίσιο. Είτε είναι ένα ήσυχο δωμάτιο είτε γεμάτο δυνατή μουσική, παίρνει τη φωνή μου και καρφώνει το κείμενο. Δεν είναι αλάνθαστο, με περιστασιακά ορθογραφικά λάθη ή παρεξηγήσεις, αλλά είναι τόσο ακριβές όσο η εμπειρία Pixel. Εισάγει αρκετά καλά σημεία στίξης. Νομίζω ότι η εμπειρία της Google στο Pixel είναι ακόμα λίγο καλύτερη εδώ, αλλά το Flow κάνει πολύ καλή δουλειά.

Το σημείο που βλέπω το Flow να ξεπερνά το Gboard στο Pixel είναι κατανοητό. Όπου μπορείτε να μεταγράψετε μέσω του Pixel και να καταλήξετε με λέξεις όπως “cuz” όπου δεν είναι το πιο κατάλληλο πράγμα, το Flow διορθώνει αυτόματα για τέτοιες φράσεις. Η εφαρμογή θα υποστηρίξει τελικά ένα προσαρμοσμένο λεξικό και άλλους τρόπους προσαρμογής της εξόδου, αλλά μου αρέσει πολύ.

Αλλά, όπως αναφέρθηκε, το μεγάλο πρόβλημα με το Flow είναι ότι δεν είναι εγγενές.

Εδώ έρχεται το επόμενο βήμα. Αυτή είναι η τεχνολογία που μπορώ εύκολα να δω περισσότερες επωνυμίες Android που θέλουν να εκμεταλλευτούν. Τίποτα δεν ξεκίνησε τη μπάλα αυτή την εβδομάδα με την κυκλοφορία του “Essential Voice”, ουσιαστικά ενός εγγενούς Whisper Flow για το τηλέφωνο Nothing. Αυτό μειώνει την επιβάρυνση, ενώ επίσης ενσωματώνει καλύτερα τη φωνητική πληκτρολόγηση στην κανονική σας εμπειρία, καθώς λειτουργεί και με τα βασικά φυσικά πλήκτρα (και με το πληκτρολόγιο επίσης).

Αισθάνομαι κάπως αναπόφευκτο ότι θα ακολουθήσουν περισσότερες επωνυμίες Android Καθώς όλοι προσπαθούν να ωθήσουν την τεχνητή νοημοσύνη σε όλα, οι βελτιώσεις φωνής σε κείμενο είναι σχεδόν μια εγχώρια εκτέλεση στο βιβλίο μου. Είναι ένα χαρακτηριστικό που χρησιμοποιούμε όλοι με κάποια ιδιότητα, και ένα είναι το AI πράγματι καλός


Τα κορυφαία νέα αυτής της εβδομάδας

Το πρόγραμμα παρακολούθησης φυσικής κατάστασης της Google χωρίς οθόνη είναι το “Fitbit Air”

Αναφέραμε ότι το πρόγραμμα παρακολούθησης γυμναστικής χωρίς οθόνη της Google θα ονομάζεται “Fitbit Air”, με πρόσθετες αναφορές να αποκαλύπτουν ότι η συσκευή πιθανότατα θα κοστίζει περίπου 100 $ και θα διατίθεται σε διάφορα χρώματα. Είναι επίσης πιθανό να κυκλοφορήσει τις επόμενες δύο ή τρεις εβδομάδες.

Android 17 QPR1 Beta 1

Πριν από την κυκλοφορία του πρώτου σταθερού Android 17, η Google έχει ήδη κυκλοφορήσει την πρώτη beta του Android 17 QPR1. είναι πολύ Μικρό, ίσως το πιο αξιοσημείωτο είναι το σετ ταπετσαρίας για το Pixel 11 Pro Fold.

Περισσότερα κορυφαία νέα


Τα υπόλοιπα είναι από 9 έως 5

9to5Mac: Η κάμερα του iPhone 18 Pro Max είναι πιο παχιά, η εικονική μονάδα iPhone Ultra σε σύγκριση με το iPad mini

9 έως 5 παιχνίδια: Η Nintendo μόλις κυκλοφόρησε το νέο παιχνίδι Switch 2 και λεπτομέρειες για το Yoshi and the Mysterious Book

Electrek: Το πρωτότυπο Tesla Model YL έχει εντοπιστεί στους δρόμους των ΗΠΑ για πρώτη φορά


Ακολουθήστε τον Ben: Twitter/xThread, Bluesky και Instagram

FTC: Χρησιμοποιούμε αυτόματους συνδέσμους συνεργατών για να δημιουργήσουμε εισόδημα. Περισσότερο


Σύνδεσμος πηγής: 9to5google.com

Σχολιάστε