शोध पत्र का मुख्य दावा यह है कि इन दोनों लीवरों (हार्नेस और वेट) को मिलाकर उपयोग करना, परीक्षण किए गए हर बेंचमार्क पर केवल स्कैफोल्ड अपडेट की तुलना में बेहतर प्रदर्शन करता है ।
महत्वपूर्ण बिंदु: उपलब्ध पत्र स्रोत LawBench के परिणाम को 56.6% के लाभ के रूप में रिपोर्ट करते हैं, न कि एक अलग अंतिम पूर्ण सटीकता आँकड़े के रूप में । 91.9% रनटाइम कमी और 502% डिनोइसिंग लाभ का डेटा भी arXiv के विभिन्न संस्करणों से लिया गया है
।
कंपनी की सार्वजनिक घोषणा में SIA को एक ओपन-सोर्स स्व-सुधार AI बताया गया है जो सुपरइंटेलिजेंस (अतिमानवीय बुद्धिमत्ता) की ओर बढ़ने की गति को तेज़ करता है । एक विशिष्ट “350×” बेंचमार्क दावा, जो कुछ समाचारों में आया है, उद्धृत अकादमिक स्रोतों द्वारा स्थापित नहीं होता, जिन्होंने केवल ऊपर दिए गए तीन डोमेन बेंचमार्क की रिपोर्ट की है
। इसलिए पाठकों को सार्वजनिक दावों और शोध पत्र के ठोस आँकड़ों के बीच अंतर समझना चाहिए।
SIA की मुख्य विशेषता यह है कि यह हार्नेस और मॉडल वेट दोनों को अपडेट करता है। शोध पत्र की तुलना केवल स्कैफोल्ड पुनरावृत्ति से की गई है, और परिणाम बताते हैं कि दोनों का संयोजन हर बेंचमार्क पर बेहतर है ।
हर्मीस एजेंट के दस्तावेज़ बताते हैं कि इसमें एक अंतर्निहित शिक्षण लूप है जो अनुभव से ‘कौशल’ (skills) बनाता है, उपयोग के दौरान उन्हें सुधारता है, ज्ञान को संजोता है, और सत्र-दर-सत्र एक गहरा होता मॉडल बनाता है । हर्मीस का सुधार का ढाँचा ‘कौशल निर्माण’ और ‘सत्र-दर-सत्र सीखने’ पर केंद्रित है, जबकि SIA एक कार्य-विशिष्ट एजेंट के लिए हार्नेस और वेट अपडेट के संयुक्त लूप पर ध्यान देता है
।
हेक्सो लैब्स ने SIA को “दुनिया का पहला एजेंट जो इंसानी कार्यों के बजाय खुद से सीखता है” बताया है । पत्र में नवीनता का दावा इसी दोहरे अपडेट तंत्र पर टिका है: कार्य-विशिष्ट एजेंट के हार्नेस और वेट दोनों में सुधार
।
Comments
0 comments