Το Gemini Live αποκτά νέες δυνατότητες

Η Google φέρνει νέες δυνατότητες στο Gemini Live με εικόνα και πιο φυσική φωνή
Η Google ανακοίνωσε σημαντικές αναβαθμίσεις στο Gemini Live, τον βοηθό τεχνητής νοημοσύνης που προσφέρει συνομιλίες σε πραγματικό χρόνο. Οι νέες δυνατότητες φέρνουν το chatbot ακόμη πιο κοντά στην καθημερινότητα των χρηστών, συνδυάζοντας εικόνα, ήχο και αλληλεπίδραση με εφαρμογές.
Οπτική καθοδήγηση μέσω κάμερας
Από την επόμενη εβδομάδα, το Gemini Live θα μπορεί να επισημαίνει αντικείμενα απευθείας στην οθόνη, εφόσον ο χρήστης του δώσει πρόσβαση στην κάμερα. Για παράδειγμα, εάν κοιτάζετε μια συλλογή εργαλείων, το AI θα “κυκλώνει” εκείνο που χρειάζεστε.
Η λειτουργία θα κάνει πρεμιέρα στα νέα Pixel 10 στις 28 Αυγούστου, ενώ σταδιακά θα επεκταθεί σε άλλες συσκευές Android και, μέσα στις επόμενες εβδομάδες, στο iOS.
Ενσωμάτωση σε εφαρμογές
Σύντομα, το Gemini Live θα μπορεί να συνεργάζεται με βασικές εφαρμογές, όπως τα Messages, το Phone και το Clock.
Ένα παράδειγμα: αν συνομιλείτε με το Gemini για οδηγίες διαδρομής, μπορείτε να πείτε «Στείλε μήνυμα στον Αλέξη ότι θα καθυστερήσω 10 λεπτά» και το chatbot θα συντάξει το κείμενο για εσάς.
Επιπλέον, θα βοηθά στην πραγματοποίηση τηλεφωνικών κλήσεων και στη σύνταξη SMS, φέρνοντας το AI πιο κοντά στις καθημερινές συνήθειες.
Νέο μοντέλο ήχου
Η Google παρουσιάζει και ένα βελτιωμένο μοντέλο φωνής που υπόσχεται πιο φυσική επικοινωνία.
Το Gemini Live θα μπορεί να προσαρμόζει επιτονισμό, ρυθμό και τόνο ανάλογα με το θέμα συζήτησης: πιο ήρεμη φωνή σε αγχωτικά θέματα ή πιο δραματική αφήγηση όταν το ζητήσετε.
Οι χρήστες θα έχουν και τη δυνατότητα να ρυθμίζουν πόσο γρήγορα ή αργά μιλάει το chatbot, ενώ σε ειδικές περιπτώσεις θα μπορεί να υιοθετεί ακόμη και προφορά, για μια πιο “ζωντανή” εμπειρία αφήγησης.
Με τις νέες δυνατότητες, το Gemini Live κάνει ένα ακόμη βήμα προς έναν ψηφιακό βοηθό που βλέπει, ακούει και μιλάει σαν άνθρωπος.