एंथ्रोपिक का कहना है कि इसका नवीनतम मॉडल ‘मिथोस-लेवल’ है, लेकिन सख्त सुरक्षा उपायों के साथ



अप्रैल में वापस, एंथ्रोपिक ने अपना “माइथोस” मॉडल दुनिया के सामने पेश किया. कथित तौर पर मिथोस पूर्वावलोकन ऐसा है यह एक शक्तिशाली मॉडल है जो सभी प्रकार के सॉफ़्टवेयर में सुरक्षा खामियाँ ढूंढ सकता है। गलत हाथों में, बुरे कलाकार कार्यक्रमों, सेवाओं और साइटों में कमजोरियों को खोजने के लिए मॉडल का दुरुपयोग कर सकते हैं, जिन पर हममें से अधिकांश लोग आधुनिक डिजिटल जीवन के लिए भरोसा करते हैं। वास्तव में, मिथोस इतिहास में सबसे बड़ा हैकिंग अवसर खोल सकता है। क्या पिच है.

जैसे, एंथ्रोपिक ने मिथोस पर ब्रेक लगा दिया। हालाँकि इसने यह सुनिश्चित किया कि यह अंततः मॉडल को जनता के लिए जारी करेगा, लेकिन पहले इसकी आवश्यकता थी विश्वसनीय परीक्षकों के सीमित समूह के साथ इसका परीक्षण करेंजिसे इसे “प्रोजेक्ट ग्लासविंग” कहा जाता है। शुरुआत करने के लिए, इसका मतलब इस मॉडल को अमेरिका और अन्य सरकारों के लिए खोलना था। जबकि मिथोस अभी भी आप या मेरे जैसे लोगों के लिए उपलब्ध नहीं है, एंथ्रोपिक है एक नया मॉडल जारी करना जो साइबर सुरक्षा जोखिमों के बिना, मिथोस की कई क्षमताओं का वादा करता है।

एंथ्रोपिक की कल्पित कहानी 5 और मिथोस 5 क्या हैं?

मंगलवार को एंथ्रोपिक ने अपने नवीनतम मॉडल की घोषणा की, क्लाउड कल्पित 5जिसे यह “माइथोस-क्लास मॉडल” कहता है जो “सामान्य उपयोग के लिए सुरक्षित है।” कंपनी का कहना है कि Fable 5 उसके किसी भी अन्य सार्वजनिक मॉडल की तुलना में बेहतर और अधिक सक्षम है। एंथ्रोपिक का दावा है कि सॉफ्टवेयर इंजीनियरिंग, ज्ञान कार्य, दृष्टि कार्य और अनुसंधान सहित अधिकांश बेंचमार्क के शीर्ष पर फैबल 5 स्कोर है। कंपनी तो यहां तक ​​कहती है कि “कार्य जितना लंबा और जटिल होगा, फैबल 5 हमारे अन्य मॉडलों पर उतना ही आगे होगा।” मिथोस 5 भी है, जो बिना किसी सीमा के कल्पित 5 प्रतीत होता है, लेकिन आम जनता के लिए उपलब्ध नहीं है।

एंथ्रोपिक की बेंचमार्किंग के अनुसार, निम्नलिखित श्रेणियों में फैबल 5 और माइथोस 5 समान रूप से माइथोस प्रीव्यू, ओपस 4.8, ओपनएआई के जीपीटी-5.5 और गूगल के जेमिनी 3.1 प्रो से बेहतर प्रदर्शन करते हैं: एजेंटिक कोडिंग, ज्ञान कार्य, स्थानिक तर्क, उपकरण का उपयोग, कानूनी, बहु-विषयक तर्क (उपकरण के बिना), जीव विज्ञान, साइबर सुरक्षा और स्वास्थ्य। माइथोस प्रीव्यू ने कंप्यूटर के उपयोग और बहु-विषयक तर्क (उपकरणों के साथ) में जीत हासिल की है, लेकिन यह अन्य सभी मॉडलों पर क्लीन स्वीप है।

अन्य मॉडलों की तुलना में फैबल 5 का प्रदर्शन चार्ट


श्रेय: मानवशास्त्रीय

एंथ्रोपिक का कहना है कि फ़ेबल 5 एक कोडिंग प्रोजेक्ट को पूरा करने में सक्षम था जिसे केवल एक दिन में पूरा करने में एक टीम को दो महीने से अधिक का समय लग जाता। यह केवल स्क्रीनशॉट से वेब ऐप के सोर्स कोड को फिर से बना सकता है। यह हरा सकता है पोकेमॉन फायररेड “न्यूनतम, दृष्टि-मात्र हार्नेस” के साथ, जबकि अन्य क्लाउड मॉडलों को खेलने के लिए बिल्कुल भी संघर्ष करना पड़ा। यह खेलने में सक्षम था शिखर को मार डालो और ओपस 4.8 की तुलना में तीन गुना अधिक बार अंतिम कार्य तक पहुंचा, मिथोस 5 अपनी अनुसंधान क्षमताओं पर आधारित है, जिसमें दवा डिजाइन में बेहतर आंकड़े, साथ ही आणविक जीव विज्ञान के प्रश्नों के संबंध में नई परिकल्पनाएं और जीनोमिक्स में नए शोध का उत्पादन करने की क्षमता है।

एन्थ्रोपिक फ़ेबल 5 को कैसे सुरक्षित रख रहा है?

यह बड़ा सवाल है: यदि फ़ेबल 5 मिथोस-क्लास है, तो आप यह कैसे सुनिश्चित कर सकते हैं कि इसे आम जनता के लिए रिलीज़ करना सुरक्षित है? क्या कोई ख़राब अभिनेता फ़ेबल 5 की क्षमताओं का फ़ायदा नहीं उठा सकता और उसे सुरक्षा कमजोरियों को खोजने और प्रकट करने के लिए मजबूर नहीं कर सकता?

एन्थ्रोपिक का कहना है कि उसने इसका पता लगा लिया है। जबकि फ़ेबल 5 कई मायनों में मिथोस-स्तर का हो सकता है, कंपनी का कहना है कि उसके प्रोजेक्ट ग्लासविंग परीक्षण ने सार्वजनिक रिलीज़ के लिए उचित सुरक्षा उपायों के साथ एक मॉडल तैयार किया है। कल्पित 5 “क्लासिफ़ायर” या अत्यधिक संवेदनशील विषयों की तलाश करता है, जिसका वह जानता है कि उसे उत्तर नहीं देना चाहिए। इसका मतलब यह है: जब फ़ेबल 5 को एक अनुरोध प्राप्त होता है जिसके बारे में उसे लगता है कि इसका संबंध साइबर सुरक्षा, जीव विज्ञान, रसायन विज्ञान या आसवन से है, तो वह स्वयं प्रश्न का उत्तर नहीं देता है। इसके बजाय, यह क्वेरी को एंथ्रोपिक के “अगले-सबसे सक्षम” मॉडल ओपस 4.8 पर भेज देता है। मॉडल अभी भी सटीक उत्तर देने के लिए पर्याप्त शक्तिशाली होना चाहिए, लेकिन दुर्भावनापूर्ण उपयोगकर्ताओं को दूसरों का शोषण करने के लिए आवश्यक उपकरण प्रदान करने में सक्षम नहीं होना चाहिए।

अब तक आपका क्या ख्याल है?

एंथ्रोपिक का कहना है कि इसकी नई रेलिंग सतर्क और रूढ़िवादी हैं, और अत्यधिक हो सकती हैं। सौम्य अनुरोध गलती से फ़ेबल 5 के सुरक्षा अलार्म को ख़राब कर सकते हैं, लेकिन माना जाता है कि ऐसा लगभग 5% बार होता है। जैसे, एंथ्रोपिक का कहना है कि फ़ेबल 5 लगभग 95% मामलों में स्वयं अनुरोधों को संभालने में सक्षम है। इसके अलावा, कंपनी ने पाया कि बग बाउंटी प्रोग्राम के बाद, कोई भी व्हाइट हैट हैकर 1,000 घंटे के परीक्षण के बाद यूनिवर्सल जेलब्रेक (या सुरक्षा प्रोटोकॉल को बायपास करने का एक फायदा) नहीं ढूंढ सका। जबकि एक संगठन ने एक जेलब्रेक को खोजने में प्रगति की है, एंथ्रोपिक का कहना है कि उसे विश्वास है कि उसके प्रोटोकॉल हैकरों के लिए कंपनी से पहले जेलब्रेक की खोज करना अव्यावहारिक बनाते हैं।

जीव विज्ञान और रसायन विज्ञान के लिए अनुरोध क्यों छोड़ें? एंथ्रोपिक का कहना है कि मिथोस जीन थेरेपी अनुसंधान और विकास में सहायता करने में भी बहुत अच्छा है, जो वैज्ञानिकों के लिए फायदेमंद हो सकता है, लेकिन गलत हाथों में एक बड़ा जोखिम हो सकता है। इसके अलावा, एंथ्रोपिक को पता है कि वहां ऐसे अभिनेता हैं जो क्लॉड मॉडल की क्षमताओं को “डिस्टिल” करने की कोशिश कर रहे हैं ताकि वे अपने स्वयं के मॉडल को जो चाहें करने के लिए प्रशिक्षित कर सकें। इस प्रकार, इनमें से कोई भी अनुरोध निम्न-प्रदर्शन वाले मॉडल पर बूट किया जाता है।

एंथ्रोपिक फैबल 5 और मिथोस 5 के लिए अपनी डेटा प्रतिधारण नीति में भी बदलाव कर रहा है। इन मॉडलों के साथ, कंपनी आपके डेटा को 30 दिनों तक रखेगी – प्रशिक्षण के लिए नहीं, बल्कि भविष्य के साइबर हमलों और जेलब्रेक से बचाने में मदद करने के लिए। फ़ेबल 5 और मिथोस 5 दोनों की कीमत समान है: $10 प्रति मिलियन इनपुट टोकन, और $50 प्रति मिलियन आउटपुट टोकन, जिसके बारे में एंथ्रोपिक का कहना है कि यह मिथोस प्रीव्यू की कीमत के आधे से भी कम है।





Source link

Leave a Comment