النتيجة أقرب إلى التعاون مع محرر ذكي بدلاً من مجرد تحويل الكلام إلى نص.
تطبيق Google Keep سيحصل أيضاً على تجربة صوتية جديدة تركز على التقاط الأفكار بسرعة.
يمكن للمستخدم ببساطة أن يبدأ في التحدث بما يدور في ذهنه—ما تصفه غوغل بأنه "تفريغ أفكار"—وسيتولى Gemini تحويل الحديث إلى ملاحظات منظمة.
يمكن للنظام أن:
هذا يعني أن التسجيلات الصوتية غير المنظمة يمكن أن تتحول مباشرة إلى ملاحظات واضحة وقابلة للاستخدام دون الحاجة إلى تحرير يدوي لاحقاً .
الميزة الصوتية تمتد أيضاً إلى Gmail، حيث يمكن للمستخدم طرح أسئلة حول المعلومات الموجودة داخل بريده الإلكتروني.
بدلاً من البحث يدوياً في الرسائل، يمكن ببساطة سؤال Gemini أشياء مثل:
يقوم Gemini بالبحث في الرسائل ذات الصلة داخل صندوق البريد ثم يقدم الإجابة بطريقة محادثية، ما يحول البريد الإلكتروني إلى قاعدة معلومات يمكن الوصول إليها بالصوت .
ترى غوغل أن الصوت مناسب بشكل خاص للتعامل مع أنظمة الذكاء الاصطناعي.
عند الكتابة، يميل المستخدمون غالباً إلى اختصار التعليمات أو تقسيمها إلى عدة أوامر. أما عند التحدث، فيكون الطلب عادة أطول وأكثر طبيعية وتفصيلاً، وهو ما يسهل على نماذج الذكاء الاصطناعي فهمه دفعة واحدة .
كما تسمح النماذج الصوتية واللغوية الحديثة في Gemini بما يلي:
على سبيل المثال، يمكن للمستخدم أن يبدأ طلباً لإنشاء مستند ثم يغير النبرة أو يضيف متطلبات جديدة أثناء الحديث، وسيقوم النظام بتطبيق التوجيه النهائي بشكل صحيح .
تقول غوغل إن الميزات الصوتية الجديدة في Docs وGmail وKeep ستبدأ بالوصول خلال صيف 2026.
وستتوفر أولاً لـ:
ومن المتوقع أن تبدأ باللغة الإنجليزية على أجهزة Android وiOS قبل أن تتوسع إلى لغات ومناطق أخرى لاحقاً .
تشير هذه التحديثات إلى تحول أوسع في طريقة استخدام برامج العمل. فبدلاً من التنقل بين التطبيقات وكتابة الأوامر يدوياً، يمكن للمستخدم التفاعل مع طبقة ذكاء اصطناعي واحدة تتحرك بين المستندات والبريد والملاحظات وتنفذ المهام عبر الحوار.
وبحسب رؤية غوغل، قد يصبح التحدث مع أدوات العمل—بدلاً من الكتابة إليها—جزءاً طبيعياً من طريقة إنجاز المهام اليومية في المستقبل القريب.
Comments
0 comments