Résultat : l’expérience ressemble davantage à travailler avec un éditeur IA qu’à dicter du texte mot par mot.
Google apporte une approche similaire à Google Keep, son application de prise de notes.
L’utilisateur peut simplement commencer à parler — ce que Google décrit comme un « brain dump » — et Gemini se charge de transformer cette parole en notes structurées. L’IA peut notamment :
L’objectif est de transformer des pensées spontanées ou désordonnées en notes claires et exploitables, sans avoir à les retravailler manuellement après coup .
Dans Gmail, la nouveauté consiste à pouvoir poser des questions à propos des informations déjà présentes dans votre boîte mail.
Au lieu de rechercher manuellement un message, un utilisateur pourrait demander à Gemini par exemple :
Gemini analyse alors les e‑mails concernés et fournit une réponse directement dans la conversation vocale, transformant la boîte de réception en base de connaissances accessible à la voix .
Selon Google, la voix est particulièrement adaptée pour interagir avec les assistants IA.
Lorsque les utilisateurs tapent un prompt, ils ont tendance à raccourcir leurs demandes ou à les découper en plusieurs étapes. À l’inverse, les requêtes parlées sont souvent plus longues, plus naturelles et plus détaillées, ce qui aide les modèles d’IA à comprendre l’intention globale en une seule fois .
Les progrès récents des modèles audio et linguistiques permettent aussi à Gemini de :
Ainsi, si un utilisateur modifie son instruction pendant qu’il parle — par exemple en changeant le ton d’un document ou en ajoutant une contrainte — Gemini peut ajuster le résultat final en conséquence .
Google indique que ces nouvelles fonctions vocales conversationnelles pour Docs, Gmail et Keep commenceront à être déployées durant l’été 2026.
Les premiers utilisateurs concernés seront :
Les premières versions devraient être disponibles en anglais sur Android et iOS, avant une extension progressive à d’autres régions et langues .
Ces nouveautés illustrent une évolution plus large des logiciels de productivité. Plutôt que de passer d’une application à l’autre et d’exécuter des actions manuellement, les utilisateurs interagissent de plus en plus avec une couche d’IA capable de naviguer entre documents, e‑mails et notes.
Avec Gemini intégré partout, Google semble parier sur un futur où parler à ses outils de travail pourrait devenir aussi naturel que taper sur un clavier.
Comments
0 comments