तकनीकी जगत को अब इस ऐतिहासिक सच्चाई का एहसास हो रहा है कि व्यापार प्रतिबंधों का इस्तेमाल करके विकास को रोकना मुश्किल है।

तकनीकी जगत को तब झटका लगा जब एक छोटी-सी चीनी कंपनी ने डीपसीक (DeepSeek) नाम की एक एआई (कृत्रिम बुद्धिमत्ता) मॉडल जारी किया जो ओपनएआई के सबसे उन्नत मॉडलों से मेल खाता है और इसकी लागत का एक छोटा सा हिस्सा खर्च होता है। पिछले महीने से तकनीकी जगत में इस बात को लेकर चर्चा हो रही है कि पहले एनवीडिया (Nvidia) के प्रदर्शन का बेसब्री से अनुसरण करने वाले अमेरिकी तकनीकी निवेशकों का नेतृत्व किया जा रहा है और फिर इस बात पर शोक व्यक्त किया जा रहा है कि एआई के स्पुतनिक मोमेंट- डीपसीक के एआई मॉडल- ने अग्रणी तकनीकी कंपनियों के लगभग एक ट्रिलियन डॉलर को खत्म कर दिया है।

दिलचस्प बात यह है कि उच्च-स्तरीय ग्राफिक प्रोसेसिंग यूनिट (जीपीयू) बनाने वाली एनवीडिया को सबसे बड़ा झटका लगा जिसने एक दिन में लगभग 600 मिलियन डॉलर का नुकसान उठाया। GPU मूल रूप से इमेज डेटा के पैरलल प्रोसेसिंग के लिए विकसित किए गए थे, इसलिए इसका नाम “GPU” (Graphics Processing Unit) रखा गया, लेकिन अब इन्हें सभी प्रकार के समानातंर गणना कार्यों के लिए इस्तेमाल किया जा रहा है, जिनमें AI मॉडल भी शामिल हैं।

चीन के इस किफायती इनोवेशन की चौंकाने वाली प्रगति में दूसरी विशेषता यह नहीं है कि इसने अपने सबसे उन्नत मॉडल OpenAI, Anthropic, Google, Meta, आदि द्वारा किए गए खर्च के 3-5% पर बनाए हैं। हालांकि, चीन की यह प्रगति अमेरिका द्वारा (द्विपक्षीय समर्थन के साथ) उन्नत चिप्स पर लगाए गए कड़े प्रतिबंधों के बावजूद हुई है, जिन्हें अमेरिका से चीन को निर्यात किया जा सकता है।

चीन की AI प्रगति को कमजोर करने के लिए खास लक्ष्य यह था कि उन उन्नत GPUs को अनुमति न दी जाए, जिन्हें किसी भी बड़े AI विकास के लिए आवश्यक माना जाता था। OpenAI के मौजूदा प्रमुख सैम आल्टमैन ने पिछले साल भारत यात्रा के दौरान यह खारिज कर दिया था कि अमेरिकी बड़ी तकनीकी कंपनियों के AI विकास को प्रतिस्पर्धा देने की कोई कोशिश “पूरी तरह से निराशाजनक” होगी, क्योंकि ऐसे गणनाओं के लिए आवश्यक बुनियादी ढांचे की लागत उनके लिए पहुंच से बाहर थी। लगभग इसी तरह, भारत के तकनीकी गुरु नंदन नीलेकणी ने कहा था कि भारत को बुनियादी AI मॉडल नहीं बनाने चाहिए, बल्कि उन्हें केवल अपने काम में इस्तेमाल करना चाहिए, जिससे तकनीक की कमान पूरी तरह से अमेरिका को सौंप दी जाए, इस राय का AI कंपनी Perplexity के सह-संस्थापक और CEO ने कड़ा विरोध किया।

आल्टमैन जाहिर तौर पर गलत थे। डीपसीक ने न केवल कम बजट में एक मॉडल बनाया, जो सैकड़ों मिलियन डॉलर खर्च करने वाली कंपनियों के साथ प्रतिस्पर्धा कर सकता है, बल्कि इसने ऐसा हार्डवेयर का इस्तेमाल करके भी किया है जिसे इस तरह की प्रगति को रोकने के लिए “डिज़ाइन” किया गया था। Nvidia द्वारा विशेष रूप से चीनी बाजार के लिए विकसित H-800 चिप्स को इस तरह की AI प्रगति को रोकना था, क्योंकि उन्होंने GPU और मॉडल के प्रशिक्षण के बीच संचार की गति को कम कर दिया था। तकनीकी दुनिया इस साधारण ऐतिहासिक सत्य को देर से समझ रही है कि केवल व्यापार प्रतिबंधों का इस्तेमाल करके प्रगति को रोकना मुश्किल है।

हम यहां जिन AI मॉडल पर चर्चा कर रहे हैं, वे ChatGPT या DeepSeek चैटबॉट नहीं हैं जो आपके सवालों का जवाब देते हैं, कुछ शोध के निष्कर्ष बनाते हैं और यहां तक कि अच्छे निष्कर्ष भी बनाते हैं, जिन्हें Google Search या Amazon के Alexa के बेहतर वर्जन के रूप में देखा जा सकता है। लगभग सभी इंटरनेट कंटेंट को “चट करने” (खिलाने) के बाद, ChatGPT टूल्स नई जानकारी पैदा करने के लिए बहुत कुछ नहीं कर सकते हैं।

नए मॉडल ChatGPT और उनके समकक्षों के आधार पर लार्ज लैंग्वेज मॉडल का इस्तेमाल करते हैं, लेकिन इसमें रीजनिंग मॉडल भी जोड़े गए हैं, जिसे तकनीक विशेषज्ञ रिइन्फोर्स्ड लर्निंग कहते हैं। यह भी तर्क दिया गया है कि कृत्रिम सामान्य बुद्धिमत्ता के पवित्र लक्ष्य, जो जैविक बुद्धिमत्ता का मशीनी प्रतिरूप है, के लिए रीजनिंग मॉडल ही एकमात्र रास्ता है, भले ही लक्ष्य उतना करीब न हो, जितना कि आल्टमैन और उनके एआई समूह हमें विश्वास दिलाना चाहते हैं।

हम जिन नई प्रगति के बारे में बात कर रहे हैं, वे रीजनिंग मॉडल में हैं, और डीपसीक अमेरिकी डिजिटल दिग्गजों की तुलना में आगे या बराबर मॉडल बनाने में सक्षम है। डीपसीक टूल्स पर एक खबर में कहा गया है क्या चीन ने अमेरिका के एआई को पीछे छोड़ दिया है?

जो चीज तकनीकी दुनिया को चौंका चुकी है, वह यह नहीं है कि चीन ने अमेरिकी तकनीकी दिग्गजों के AI विकास को मात दी है, बल्कि यह है कि एक कंपनी जिसकी कीमत केवल 8 बिलियन डॉलर है, और जिसका कोई बड़ा तकनीकी उपलब्धि नहीं था, उसने एक छोटे हिस्से की लागत में यह कारनामा किया है: उन्होंने केवल दो महीने और 6 मिलियन डॉलर से कम खर्च करके Nvidia के H800 चिप्स का इस्तेमाल करते हुए, जो चीन को हार्डवेयर निर्यात पर अमेरिकी प्रतिबंधों के अनुरूप थे, एक AI मॉडल तैयार किया जो OpenAI के मॉडल के बराबर है। जो लोग किसी भी चीनी दावे पर संदेह करते हैं, उनके लिए बता दें कि डीपसीक ने न केवल मॉडल को ओपन-सोर्स किया है, बल्कि अपनी टीम द्वारा किए गए कार्यों का विस्तृत दस्तावेज भी प्रकाशित किया है।

तो, डीपसीक के पीछे कौन सी कंपनी है और वे कौन हैं? डीपसीक के पीछे के लोग वित्तीय दुनिया में “क्वांट्स” कहे जाने वाले लोगों का एक समूह हैं। क्वांट्स गणित, मॉडलिंग और प्रोग्रामिंग के लोग हैं जो वित्तीय दुनिया में काम करते हैं। उन्हें 2008 में वॉल स्ट्रीट को तबाह करने के लिए जिम्मेदार ठहराया जाता है, जो वैश्विक बाजारों के लिए सबप्राइम आपदा थी। हालांकि 2008 के बाजार मंदी के बाद क्वांट आंशिक रूप से बदनाम हो गए थे, लेकिन वित्त की दुनिया उनके बिना नहीं चल सकती। चीन में, उन पर ज्यादा कड़ा नियंत्रण है।

डीपसीक तैयार करने वाले क्वांट लिआंग वेनफ़ेंग हैं, जिन्होंने 2012 में अपने फंड के 12 बिलियन डॉलर की कीमत का लगभग एक तिहाई खोने के बाद, अपने कुछ पैसे और क्वांट के साथ AI में निवेश करने का फैसला किया।

ऐसा नहीं है कि डीपसीक को AI की समस्या को हल करने के लिए कोई नई जानकारी मिली। समस्या पर सिर्फ पैसा और कंप्यूटिंग शक्ति झोंकने के बजाय, उन्होंने दो नए मॉडल बनाने और जारी करने के लिए कुछ चालाकी भरा इंजीनियरिंग करने का फैसला किया। इन मॉडलों का विश्लेषण जेफरी इमानुएल (और अन्य भी) द्वारा किया गया है, जो इस क्षेत्र से परिचित एक प्रसिद्ध तकनीकी विशेषज्ञ हैं, जो लिखते हैं, “मूल रूप से OpenAI और Anthropic के सर्वश्रेष्ठ मॉडलों के बराबर विश्व-प्रतिस्पर्धी प्रदर्शन स्तर हैं (मेटा लामा3 मॉडल और मिस्ट्रल जैसे अन्य छोटे ओपन सोर्स मॉडल प्लेयर्स को पीछे छोड़ते हुए)। इन मॉडलों को डीपसीक-V3 (GPT-4o और क्लाउड 3.5 सॉनेट का जवाब) और डीपसीक-R1 (OpenAI के O1 मॉडल का जवाब) कहा जाता है।” कीमत? दूसरों ने जो खर्च किया है या खर्च किया होगा, उसका अधिकतम 5%, इमानुएल का अनुमान है कि डीपसीक अन्य अत्याधुनिक प्लेटफ़ॉर्म की तुलना में 45 से 50 गुना ज्यादा कुशल है।

न केवल इन मॉडलों को सार्वजनिक डोमेन में जारी किया गया है, बल्कि इन्हें MIT लाइसेंस (1980 के दशक के अंत में मैसाचुसेट्स इंस्टीट्यूट ऑफ टेक्नोलॉजी द्वारा विकसित) के तहत मुफ्त और ओपन-सोर्स सॉफ्टवेयर के रूप में भी जारी किया गया है, जिसका कोड GitHub पर उपलब्ध है। उन्होंने दो विस्तृत तकनीकी रिपोर्ट भी जारी की हैं, जिसमें उन्होंने जो कुछ किया है, उसके प्रत्येक चरण की व्याख्या की है। इसलिए, कोड, सिद्धांत, और उन्होंने समस्याओं का विश्लेषण और समाधान कैसे किया, यह सब इस तरह से निर्धारित किया गया है कि लोग न केवल उनके द्वारा किए गए कार्यों को ट्रैक और इस्तेमाल कर सकते हैं, बल्कि यदि वे चाहें तो अपने कोड के साथ इसे फिर से प्रस्तुत कर सकते हैं।

डीपसीक मार्केट शॉक के साथ हम सभी के लिए तीन प्रमुख निहितार्थ हैं। एक यह है कि एनवीडिया, जो एआई बूम का प्रमुख लाभार्थी है, अपने स्टॉक मूल्य में बड़े सुधार के लिए तैयार है। यह पहले से ही दिखाई दे रहा है। दूसरा यह है कि अब कई और कंपनी एआई दौड़ में प्रवेश करने के लिए तैयार होंगे, यह जानते हुए कि प्रवेश करने की कीमत उतना ज्यादा नहीं है जितना कि दिग्गजों ने उन्हें बताया था, और दौड़ जरूरी नहीं कि सबसे बड़ी कंपनी से जीती जाए; जैसा कि जानवरों के विकास में हुआ था! आखिर में यह है कि प्रौद्योगिकी प्रतिबंध काम नहीं करते हैं। यह भारत के खिलाफ परमाणु और अंतरिक्ष क्षेत्रों में काम नहीं आया; न ही यह चीन के एआई विकास के खिलाफ काम आया है।

जैसा कि एक प्रसिद्ध दार्शनिक ने कहा: “कुछ दशक ऐसे होते हैं जब कुछ भी नहीं बदलता; और कुछ हफ्ते ऐसे होते हैं जब दशकों जितना बदलाव हो जाता है।” ऐसा लगता है कि यह उन क्षणों में से एक है।

 

Source: News Click