उत्तरप्रकाशित2 माह पहलेLast edited पिछला माह34 स्रोत

Sesame AI का iOS लॉन्च: वॉइस-फर्स्ट एजेंट, $250 मिलियन की फंडिंग, और स्मार्ट ग्लास की होड़

Sesame ने 28 मई, 2026 को अपना वॉइस फर्स्ट iOS ऐप लॉन्च किया, जिसमें टाइप किए गए प्रॉम्प्ट की जगह जीवंत बोली जाने वाली बातचीत को प्राथमिकता दी गई है, और 2027 तक इसी AI को हल्के स्मार्ट ग्लास में शामिल करने की दीर्घकालि... कंपनी का 'कन्वर्सेशनल स्पीच मॉडल' (CSM) भावनात्मक संदर्भ, स्वाभाविक ठहराव और रियल टाइम लहजे के अ...

Studio Global AI के साथ खोजें और तथ्यों की जांच करें और ट्रेंडिंग पेज देखें

Sesame AI iOS app voice-first interface concept — What features does Sesame AI's new iOS app offer, how does its voice agent technology work, what privacy options are available, what are itsSesame AI's iOS app launched May 28, 2026, prioritizing voice-first conversation over text input.
AI संकेत
Create a landscape editorial hero image for this Studio Global article: What features does Sesame AI's new iOS app offer, how does its voice agent technology work, what privacy options are available, what are its. Article summary: Here is a comprehensive overview based on the available evidence.. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "Home **›** Articles **›** **Sesame AI – A New Voice for AI Assistants**. # Sesame AI – A New Voice for AI Assistants. Voice AI start-up Sesame is tackling this challenge head-on, p" source context "Sesame AI - A New Voice for AI Assistants |" Reference image 2: visual subject "# Sesame, the conversational AI startup from Oculus founders, raises $250M and launches beta. Sesame, a conversational AI startup and smart glasses maker, has raised a $250 million" source co
openai.com

Oculus और Meta के पूर्व अधिकारियों ब्रेंडन इरिबे और अंकित कुमार द्वारा स्थापित कन्वर्सेशनल AI स्टार्टअप Sesame ने 28 मई, 2026 को अपने iOS ऐप के सार्वजनिक लॉन्च के साथ एक स्क्रीन-रहित AI साथी की अपनी परिकल्पना की ओर एक बड़ा कदम बढ़ाया । जहाँ OpenAI, Google और Apple के अधिकांश AI असिस्टेंट अभी भी टेक्स्ट इनपुट पर केंद्रित हैं, वहीं Sesame एक ऐसे वॉइस-फर्स्ट अनुभव पर ज़ोर दे रहा है जो एक मालिकाना स्पीच मॉडल द्वारा संचालित है। कंपनी का दावा है कि यह मॉडल भावनात्मक संकेतों के जवाब में बातचीत के दौरान बीच में टोक सकता है, हंस सकता है और अपना लहज़ा बदल सकता है।

यह ऐप लॉन्च एकदम नया है, जबकि पिछले साल ही कंपनी ने $250 मिलियन की सीरीज़ B फंडिंग जुटाई थी। इस फंडिंग ने स्टार्टअप की पहनने योग्य हार्डवेयर की महत्वाकांक्षी योजनाओं को लेकर उम्मीदें और जांच दोनों को बढ़ा दिया है।

iOS ऐप असल में क्या करता है?

Sesame का ऐप आपके द्वारा टाइप किए जाने वाले चैटबॉट के बजाय एक बोले जाने वाले वार्तालाप साथी के रूप में डिज़ाइन किया गया है। इसकी मुख्य कार्यक्षमता ओपन-एंडेड वॉयस डायलॉग पर केंद्रित है, जो Sesame को माइक्रोफ़ोन वाले सर्च इंजन के बजाय एक मौखिक सहयोगी के रूप में स्थापित करती है।

ऐप स्टोर लिस्टिंग में साधारण प्रश्न-उत्तर के आदान-प्रदान से परे कई क्षमताओं पर प्रकाश डाला गया है :

वॉइस-फर्स्ट प्राकृतिक बातचीत – उपयोगकर्ता बोलते हैं, और AI बिना किसी टाइपिंग के सुनता और जवाब देता है।
किसी भी फोटो के बारे में बात करें – एक इमेज अपलोड करने (एक हस्तलिखित नोट, पोशाक, स्क्रीनशॉट) पर उपयोगकर्ता एजेंट के साथ मौखिक रूप से इस पर चर्चा कर सकता है।
इमेज परिणामों के साथ सर्च कार्ड – AI बोले गए उत्तरों के पूरक के लिए दृश्य सहायता प्रस्तुत कर सकता है।
नोट्स – किसी चर्चा से मुख्य निष्कर्षों को कैप्चर करने के लिए एक अंतर्निहित सुविधा।
टेक्स्टिंग मोड – जब ज़ोर से बोलना असुविधाजनक हो तो टाइप किए गए टेक्स्ट पर स्विच करने का विकल्प।
डीप डाइव सपोर्ट – अधिक विवरण के अनुरोध पर गहन अनुवर्ती प्रतिक्रियाएं मिलती हैं।
रीयल-टाइम वेब ग्राउंडिंग – Sesame का दावा है कि उसने तेज़ खोज और पुनर्प्राप्ति प्रणाली बनाई है जो AI को वर्तमान जानकारी प्राप्त करने और यहाँ तक कि नया डेटा आने पर बातचीत के बीच में ही अपनी बात बदलने की अनुमति देती है, ठीक वैसे ही जैसे एक इंसान बोलने वाला अपनी दिशा बदल सकता है ।

इस ऐप के उपयोग के लिए एक प्रीमियम सब्सक्रिप्शन की आवश्यकता होती है ।

इसे शक्ति देने वाला वॉइस मॉडल

इसके केंद्र में Sesame का कन्वर्सेशनल स्पीच मॉडल (CSM) है, जो 2024 से 2026 तक विकसित एक न्यूरल टेक्स्ट-टू-स्पीच प्रणाली है । पारंपरिक TTS प्रणालियों के विपरीत, जो सपाट स्वर में टेक्स्ट को ज़ोर से पढ़ती हैं, CSM पूरे संवाद संदर्भ को प्रोसेस करता है — जिसमें हाल के वार्तालाप मोड़ शामिल हैं — और रीयल-टाइम में समय, लहज़े और भावनात्मक उतार-चढ़ाव को शामिल करते हुए सीधे ऑडियो उत्पन्न करता है ।

Sesame का सार्वजनिक शोध कई डिज़ाइन प्राथमिकताओं का वर्णन करता है :

भावनात्मक बुद्धिमत्ता – मॉडल भावनात्मक संदर्भ को पढ़ता है और उस पर प्रतिक्रिया देता है, पिच और मॉड्यूलेशन को गतिशील रूप से समायोजित करता है।
संवादात्मक गतिशीलता – प्राकृतिक समय, ठहराव, रुकावटें, ज़ोर और यहाँ तक कि हंसी।
प्रासंगिक जागरूकता – सिस्टम हाल के वार्तालाप इतिहास को याद रखता है और तदनुसार अपनी प्रस्तुति बदलता है।
लगातार व्यक्तित्व – सामान्य आवाज़ों के घूमने वाले समूह की तरह लगने के बजाय एक सुसंगत उपस्थिति बनाए रखने के लिए डिज़ाइन किया गया।

एक निवेशक, Sequoia Capital ने कहा कि यह मॉडल "सिर्फ LLM आउटपुट को ऑडियो में अनुवाद नहीं करता है — यह सीधे भाषण उत्पन्न करता है, वास्तविक संवाद की लय, भावना और अभिव्यंजना को कैप्चर करता है" ।

यह मॉडल 1 बिलियन से 8 बिलियन पैरामीटर तक के आकार में आता है, एक जानबूझकर किया गया विकल्प ताकि इसे अंततः उपभोक्ता-ग्रेड और पहनने योग्य हार्डवेयर पर चलाने के लिए पर्याप्त हल्का रखा जा सके । एक ओपन-सोर्स 1B-पैरामीटर संस्करण Apache 2.0 लाइसेंस के तहत GitHub पर जारी किया गया था, जिसके चेकपॉइंट Hugging Face पर होस्ट किए गए हैं ।

Sesame वर्तमान में CSM पर निर्मित दो नामित वॉयस एजेंट प्रदान करता है: Maya और Miles ।

प्राइवेसी: सीमित विवरणों के साथ एक "प्राइवेसी फर्स्ट" लेबल

Sesame ऐप को "प्राइवेसी फर्स्ट" के रूप में वर्णित करता है, ऐप स्टोर की कॉपी में कहा गया है कि बातचीत उपयोगकर्ता और Sesame के बीच रहती है और "डिज़ाइन द्वारा सुरक्षित और निजी" है । कंपनी की औपचारिक गोपनीयता नीति, जिसे अंतिम बार 7 मई, 2026 को अपडेट किया गया था, बताती है कि उपयोगकर्ता डेटा को इसकी वेबसाइट, ऐप और सेवाओं, जिसमें इसके वर्चुअल संवादी एजेंट शामिल हैं, में कैसे एकत्र और संसाधित किया जाता है ।

सार्वजनिक रूप से उपलब्ध दस्तावेज़ यह नहीं बताते हैं कि कई गोपनीयता के प्रति जागरूक उपयोगकर्ता जिन विस्तृत उपयोगकर्ता नियंत्रणों की तलाश करते हैं — जैसे मैन्युअल बातचीत हटाना, मॉडल प्रशिक्षण से ऑप्ट-आउट, या बारीक डेटा प्रतिधारण सेटिंग्स। गोपनीयता नीति व्यक्तिगत जानकारी को नष्ट करने या गुमनाम करने की प्रक्रियाओं का संदर्भ देती है जब इसकी आवश्यकता नहीं रह जाती है, लेकिन यह समयसीमा या हटाने का अनुरोध करने के लिए उपयोगकर्ता-सामना करने वाले नियंत्रणों को निर्दिष्ट नहीं करती है ।

यह देखते हुए कि वॉइस डेटा स्वाभाविक रूप से संवेदनशील और संभावित रूप से बायोमेट्रिक है, यह अंतर संभवतः जांच को आकर्षित करेगा क्योंकि Sesame का विस्तार होता है और नियामक AI डेटा हैंडलिंग के आसपास के नियमों को सख्त करना जारी रखते हैं। सटीक शर्तों की तलाश करने वाले उपयोगकर्ताओं के लिए, पूरी नीति sesame.com/privacy पर उपलब्ध है।

हार्डवेयर पर दांव : 2027 तक स्मार्ट ग्लास

Sesame का ऐप एक साध्य का साधन है। कंपनी की दीर्घकालिक रणनीति पूरे दिन पहनने के लिए डिज़ाइन किए गए मालिकाना हल्के स्मार्ट ग्लासों में अपने वॉयस एजेंटों को एम्बेड करने के इर्द-गिर्द घूमती है, जिसका लक्ष्य लॉन्च 2027 है ।

इसका तर्क तकनीकी और व्यावसायिक दोनों है। तकनीकी पक्ष पर, CSM की छोटी पैरामीटर संख्या (1B–8B) जानबूझकर ऑन-डिवाइस तैनाती के लिए आकार दी गई है, जिसका अर्थ है कि चश्मा क्लाउड राउंड-ट्रिप पर निर्भर होने के बजाय स्थानीय रूप से वॉइस मॉडल चला सकता है । व्यावसायिक पक्ष पर, Sesame सॉफ्टवेयर और हार्डवेयर दोनों को नियंत्रित करने को एक ही उपयोगकर्ता से सब्सक्रिप्शन शुल्क और उच्च-मार्जिन वाली डिवाइस बिक्री हासिल करने के एक तरीके के रूप में देखता है ।

यह "हार्डवेयर-फर्स्ट" रणनीति Sesame को पूरे अनुभव को नियंत्रित करने देती है — माइक्रोफ़ोन व्यवहार, वेक वर्ड, विलंबता, बैटरी लाइफ और सब्सक्रिप्शन बंडल — बजाय इसके कि किसी तीसरे पक्ष के ऐप इकोसिस्टम के अंदर प्रतिस्पर्धा करे । Oculus और Meta में संस्थापक टीम का ट्रैक रिकॉर्ड, जहाँ उन्होंने उपभोक्ता VR/AR हार्डवेयर बनाने में मदद की, इस हार्डवेयर महत्वाकांक्षा को वह विश्वसनीयता देता है जिसकी एक शुद्ध-सॉफ्टवेयर स्टार्टअप में कमी हो सकती है ।

सार्वजनिक बयान "उच्च-गुणवत्ता वाले ऑडियो" और एक AI साथी वाले चश्मे का वादा करते हैं जो "आपके साथ दुनिया का निरीक्षण कर सकता है" । रिपोर्टों में नेत्र-ट्रैकिंग एकीकरण और रीयल-टाइम संवादी प्रतिक्रिया का उल्लेख है, हालाँकि तकनीकी विनिर्देश अभी भी कम हैं ।

$250 मिलियन का भरोसे का प्रमाण

21 अक्टूबर, 2025 को, Sesame ने Andreessen Horowitz से पहले के समर्थन के बाद, $250 मिलियन का सीरीज़ B राउंड हासिल किया । निवेशकों में Sequoia Capital शामिल है, जिसने एक विस्तृत भागीदार लेख प्रकाशित किया जिसमें फर्म की इस थीसिस को रेखांकित किया गया कि वॉइस-फर्स्ट AI मानव-कंप्यूटर संपर्क में एक मौलिक बदलाव का प्रतिनिधित्व करता है ।

यह पूंजी वॉइस मॉडल को आगे बढ़ाने, इंजीनियरिंग टीम का विस्तार करने, और — महत्वपूर्ण रूप से — साथी पहनने योग्य हार्डवेयर के विकास में तेजी लाने के लिए निर्धारित है । इस राउंड ने Sesame को लगभग $1 बिलियन के मूल्यांकन की ओर धकेल दिया ।

भीड़ भरे वॉइस AI बाज़ार में Sesame की जगह

Sesame एक ऐसे क्षेत्र में प्रवेश कर रहा है जहाँ Apple, Google, Amazon और OpenAI के पास पहले से ही विशाल इंस्टॉल्ड बेस वाले वॉइस असिस्टेंट मौजूद हैं। इसके अलग होने का रास्ता तीन दांवों पर टिका हुआ है:

एक सुरक्षात्मक खाई के रूप में संवादी गुणवत्ता – Sesame का तर्क है कि भावनात्मक अभिव्यंजना, प्राकृतिक छंदशास्त्र और रीयल-टाइम संवादी गतिशीलता (रुकावटें, हंसी, वाक्य के बीच में बात बदलना) एक ऐसा अनुभव बनाते हैं जिसका मुकाबला टेक्स्ट-फर्स्ट चैटबॉट और पुराने असिस्टेंट नहीं कर सकते ।
वॉइस-फर्स्ट, न कि वॉइस-ऐडेड – ChatGPT या Gemini के विपरीत, जहाँ वॉइस टेक्स्ट मॉडल के ऊपर एक सुविधा है, Sesame बोली जाने वाली बातचीत को प्राथमिक इंटरफ़ेस मानता है ।
हार्डवेयर एकीकरण – स्मार्ट ग्लास रोडमैप एक भौतिक संपर्क बिंदु बनाता है जो Sesame को शुद्ध-सॉफ्टवेयर AI साथियों से अलग करता है। हार्डवेयर के मालिक होने का मतलब है रिश्ते को नियंत्रित करना, न कि केवल फ़ोन के ऐप ग्रिड पर जगह किराए पर लेना ।

जोखिम वास्तविक हैं। अच्छी तरह से वित्त पोषित स्थापित कंपनियाँ समय के साथ आवाज़ में सुधार जोड़ सकती हैं। ऑडियो हार्डवेयर को बड़े पैमाने पर डिजाइन और निर्माण करना बेहद मुश्किल है, खासकर पूरे दिन पहनने के लिए पर्याप्त हल्का और उपभोक्ता अपनाने के लिए पर्याप्त स्टाइलिश। और वॉइस डेटा हैंडलिंग के आसपास की गोपनीयता की कमियाँ ठीक उसी समय नियामक और उपयोगकर्ता प्रतिक्रिया को आमंत्रित कर सकती हैं जब Sesame विश्वास बनाने की कोशिश कर रहा है।

क्या Sesame की संवादी गर्मजोशी और हार्डवेयर महत्वाकांक्षा एक सुरक्षात्मक स्थिति बना सकती है, यह एक खुला प्रश्न बना हुआ है — जिसका उत्तर iOS ऐप लॉन्च और आने वाले ग्लास रिलीज़ से मिलना शुरू हो जाएगा।

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AI के साथ खोजें और तथ्यों की जांच करें

लोग पूछते भी हैं