आर्टिफिशल इन्टेलिजन्स के हो ? एआई सबै थोक गर्न सक्षम होलाः यी प्रश्नको सरल जवाफ

July 28, 2023July 28, 2023 by Jandesh Daily

जनादेश टेकवाच।

तपाईँले आर्टिफिशल इन्टेलिजन्सबारे कति बुझ्नुभएको छ?

विगत छ महिनामा च्याटजीपीटीजस्ता च्याटबट र मिड्जर्नीजस्ता इमेज जेनरेटरहरू अत्यन्त लोकप्रिय भएका छन्। तर आर्टिफिशल इन्टेलिजन्स (एआई) वा “मशीन लर्निङ” मोडलहरू विगत केही समयदेखि प्रचलनमै छन्।

यो सामग्रीमा हामी च्याटबटबाहेक एआईका अन्य प्रकार र तिनले हाम्रो जीवनमा खेलेका भूमिकाबारे पनि कुरा गर्ने छौँ।

एआईले कसरी सिक्छ?
मशीन लर्निङको केन्द्रमा प्रशिक्षण को एउटा प्रक्रिया हुन्छ। यसमा कम्प्युटर प्रोग्र्यामलाई ठूलो मात्रामा डेटा र त्यसको प्रयोगसम्बन्धी निर्देशन उपलब्ध गराइन्छ। कहिलेकाहीँ उक्त डेटाको अर्थ के हो भनी अझ विस्तृतमा खुलाउन ‘लेबल’ गरिन्छ।

प्रयोगसम्बन्धी निर्देशन यस्तो हुन सक्छ : “अनुहार भएका सबै तस्बिरहरू पत्ता लगाऊ” अथवा “यी ध्वनिहरूको वर्गीकरण गर।”

त्यसपछि उक्त प्रोग्र्यामले तथ्याङ्कभित्र आफूले पूरा गर्नुपर्ने लक्ष्य प्राप्त गर्न उपयुक्त ‘प्याटर्न’ अर्थात् ढाँचा खोज्छ।

यस क्रममा प्रोग्र्यामलाई थप घच्घच्याउनुपर्ने हुनसक्छ। उदाहरणका लागि, तपाईँले “त्यो अनुहार होइन” वा “यी दुई ध्वनिहरू छुट्टै हुन्” भनेर बताउनुपर्छ। प्रोग्र्यामले यी तथ्याङ्कबाट सिकेका कुरा र पाएका निर्देशनलाई एआई मोडल भनिन्छ। यसरी प्रशिक्षणमा प्रयुक्त सामग्रीले प्रोग्र्यामको क्षमता परिभाषित गर्छ।

फरक प्रकारका एआई बनाउने प्रशिक्षण प्रक्रिया बुझ्नका लागि विभिन्न जनावरको उदाहरण प्रयोग गर्न सकिन्छ।

विगत लाखौँ वर्षभरि प्राकृतिक वातावरणले जीवजन्तुहरूलाई छुट्टाछुट्टै क्षमता दिएको छ। त्यसैगरी तालिममा प्रयोग गरिने डेटाहरूबीच लाखौँ चक्रमा गुज्रिँदा एआईमा पनि विशिष्ट कार्यक्षमता विकास हुन्छ।

त्यसोभए हामीले आजसम्म एआईलाई केकस्तो तालिम दिएका छौँ र केके सीप तथा क्षमता विकास भएका छन् त?

च्याटबट के हो?

च्याटबटलाई एउटा सुगाजस्तै सोच्नुहोस्। यसले आफूले सुनेका शब्दहरूलाई तिनको पूरा अर्थ थाहा नपाईकनै पनि केही हदसम्म सन्दर्भ बुझेर मान्छेको बोलीको अनुकरण गर्दै ती शब्द दोहोर्‍याउन सक्छ।

च्याटबटले पनि त्यही गर्ने हो, तर थप सुझबुझसहित। च्याटबटहरू लिखित शब्दसँगको हाम्रो सम्बन्धलाई बदल्ने तहमा पुगेका छन्।

तर कसरी लेख्ने भनेर चाहिँ च्याटबटहरूलाई कसरी थाहा हुन्छ?

यिनीहरू ‘लार्ज ल्याङ्विज मोडल’ वा एलएलएम भनेर चिनिन्छन्। यस प्रकारको एआईलाई अत्यधिक ठूलो परिमाणको पाठ्य सामग्रीसहित तालिम दिइएको हुन्छ।

एलएलएमले शब्द मात्र नभई पूर्ण वाक्य पनि बुझ्छ र एउटा पाठ्यांशमा प्रयुक्त पद तथा पदावलीलाई आफ्नो तथ्याङ्क सङ्ग्रहभित्रको अन्य पाठ्यांशसँग तुलना गर्छ।

अर्बौँ पटक यस्तो तुलना गर्दा यसले प्रश्‍न पढ्न र उत्तर लेख्न सक्छ। च्याटबट पनि तपाईँको फोनमा तपाईँको आशय सुहाउँदो वैकल्पिक उत्तर लेखिदिने सुविधा (प्रिडिक्टिभ टेक्स्ट मेसिजिङ) जस्तै नै हो, तर यसले बृहत् तहमा काम गर्छ।

लार्ज ल्याङ्विज मोडल’को सबैभन्दा गज्जबको कुरा भनेको तिनले मानव सहायताबिनै व्याकरण सिक्न र शब्दको अर्थ पहिल्याउन सक्छन्।

के म एआईसँग कुरा गर्न सक्छु?
तपाईँले एलेक्सा, सिरी वा यस्तै अन्य आवाज चिन्ने साधन प्रयोग गरिसक्नुभएको छ भने तपाईँले एआईको प्रयोग गर्न थालिसक्नुभएको छ।

ध्वनिमा हुने सूक्ष्म भिन्नता पहिचान गर्नका लागि तयार गरिएको ठूला आँखा भएको एउटा खरायो कल्पना गर्नुहोस्।

एआईले तपाईँको बोलीलाई त्यसमा भएको पृष्ठभूमिको होहल्ला हटाएर रेकर्ड गर्न सक्छ। त्यसपछि त्यसलाई बोलिने प्रत्येक शब्दभित्रका ध्वनिका एकाइ वा ध्वनिशास्त्रीय एकाइमा विभक्त गर्छ। त्यसपछि आफ्नो सङ्ग्रहमा रहेको ध्वनिसँग त्यसलाई मिलाएर बुझ्छ।

त्यसपछि तपाईँको बोली शब्दमा बदलिन्छ। यस क्रममा उत्तर दिनुअघि नै सुन्दा भएको गल्ती पनि सच्याइन्छ।

यस प्रकारको एआईलाई ‘न्याचरल ल्याङ्ग्विज प्रोसेसिङ’ भनिन्छ।

फोनमा ब्याङ्किङ कारोबार स्वीकृत गर्न तपाईँले ‘हुन्छ’ भन्नेदेखि तपाईँ जान लाग्नुभएको सहरको आगामी दिनको मौसमबारे फोनलाई सोध्ने लगायतका कामका पछाडि यही प्रविधि छ।

के एआईले चित्र पनि बुझ्छ?

केे तपाईँको फोनले कहिल्यै तपाईँका तस्बिरलाई कुनै फोल्डरमा सङ्कलन गरी ‘समुद्री किनारमा’ वा ‘नाइट्स आउट’ भनेर नाम दिएको छ?

यदि छ भने तपाईँले थाहा नपाईकनै एआईको प्रयोग गरिसक्नुभएको छ। एआईको नियम वा एल्गरिदमले तपाईँको तस्बिरमा भएका प्याटर्नहरू खुट्ट्याई तपाईँका लागि तिनलाई विभिन्न वर्गमा राखिदिएको हो।

सामान्य विवरणसहित राखिएका तस्बिरहरूका थानैथान हेर्न लगाएर यस्ता प्रोग्र्यामहरूलाई तालिम दिइएको छ।

यदि तपाईँले तस्बिर चिन्ने एआईलाई ‘साइकल’ नाम दिएर पर्याप्त तस्बिरहरू दिनुभयो भने यसले साइकल कस्तो देखिने रहेछ अनि डुङ्गा वा कारभन्दा यो कसरी फरक हुने रहेछ भनेर बुझ्न थाल्छ।

कहिलेकाहीँ एआईलाई उस्तै देखिने तस्बिरहरूबीचको सूक्ष्म भिन्नता खुट्ट्याउन तालिम दिइएको हुनसक्छ।

फेशल रेकग्निशन’ अर्थात् अनुहार चिन्ने प्रविधिले यसरी नै काम गर्ने हो। यसले तपाईँको अनुहारका विशेषताहरूबीचको सूक्ष्म सम्बन्ध पत्ता लगाई तपाईँको अनुहार यस संसारमा रहेका अरूको भन्दा कसरी फरक छ भन्ने थाहा पाउँछ।

चिकित्सकीय प्रयोजनका लागि हुने स्क्यानहरूमा जीवन जोखिममा पार्ने ट्यूमर चिन्नका लागि पनि यस्तै एल्गरिदमलाई प्रशिक्षित गरिएको हुन्छ। एउटा बिरामीको अध्ययन गर्न एक परामर्शदाता चिकित्सकलाई लाग्ने समयमा यस्तो प्रणालीले हजारौँ बिरामीको स्क्यान गरिदिन सक्छ।

एआईले नयाँ चित्र कसरी बनाउँछ?

हालसालै चित्र चिन्ने क्षमता वा ‘इमेज रेकग्निशन’लाई छेपाराको जस्तो स्वरूप र रङ्ग फेर्ने क्षमता भएका एआई मोडलमा ढालिएको छ।

यस्तो एआईले सङ्कलन गरेका लाखौँ तस्बिर तथा चित्रहरूका जटिल स्वरूप तथा प्याटर्न (संरचना) लाई पूर्णत: नयाँ तस्बिरमा विकास गर्न सक्छन्।

त्यसैले तपाईँले एआईलाई मङ्गल ग्रहको सतहमा मानिस हिँडेको जस्तो आजसम्म नभएको घटनाको पनि तस्बिर बनाउन लगाउन सक्नुहुन्छ।

अथवा तपाईँ अझ सिर्जनात्मक तरिकाले तस्बिरको शैलीका लागि निर्देशन दिन सक्नुहुन्छ : “पिकासोको शैलीमा बनाइएको इङ्ग्ल्यान्ड फुटबल प्रशिक्षकको चित्र बनाइदेऊ।”

एआईका सबैभन्दा पछिल्लो संस्करणहरूले यस्तो नयाँ चित्र बनाउनका लागि कुनै नियमबिना छानिएका पिक्सल अर्थात् रङ्गीन टुक्राहरूको प्रयोग गर्छ।

तालिमका क्रममा आफूले सिकेको ढाँचाबारे बुझ्नका लागि यसले कुनै नियमबिना छानिएका बिन्दुहरूलाई पनि हेर्छ।

यी बिन्दुहरूमाथि थप तहहरू जोडिन्छन् र क्रमश: विकसित गरिन्छन्। बिस्तारै प्रयोग नहुने अन्य बिन्दुहरूलाई हटाइन्छ। आफूले खोजेजस्तो चित्र नबनेसम्म यो क्रम जारी रहन्छ।

“मङ्गल ग्रहको सतह”, “अन्तरिक्षयात्री” र “हिँडाइ” लगायत आवश्यक अवयवहरूको ढाँचा विकसित गरेपछि नयाँ चित्र बनिहाल्यो।

बिनानियम छानिएका पिक्सलहरूको तहबाट नयाँ चित्र विकसित भएको हुनाले आजसम्म कहिल्यै अस्तित्वमा नरहे जस्तो नतिजा देखिन्छ। तर पनि यो चित्र तालिमका क्रममा एआईले प्रयोग गरेका मौलिक चित्रहरूका अर्बौँ ढाँचा र स्वरूपमा आधारित हुन्छ।

तर समाज आज वास्तविक कलाकार, डिजाइनर तथा फोटोग्राफरले मेहनत गरी बनाएका कलात्सामक मग्रीको प्रतिलिपि अधिकार र तिनमा आधारित भई हुने सिर्जनाको नैतिकताका विषयमा सङ्घर्षरत छ।

स्वचालित कार कसरी चल्छ?
आफैँ कुद्ने वा सेल्फ-ड्राइभिङ कार पनि एआईबारे हुने छलफलको अङ्ग बनेको दशकौँ भइसकेको छ। विज्ञानकथाले तिनलाई सर्वसाधारण मानिसको कल्पनाको विषयवस्तु बनाइदिएका छन्।

स्वचालित कारमा प्रयोग हुने एआईलाई ‘अटोनमस ड्राइभिङ’ भनिन्छ। यसमा क्यामरा, रेडार र दूरी थाहा पाउने लेजर प्रयोग गरिएको हुन्छ।

सबैतिर देख्ने क्षमता र पखेटामा गति तथा दिशालगायतको नियन्त्रणका लागि सेन्सर भएको झ्यालिन्चाको कल्पना गर्नुहोस्।

त्यसै गरी एआई मोडलले पनि आफ्नो सेन्सरको प्रयोग गरी वस्तु पत्ता लगाउँछ। साथै ती गतिमा छन् वा छैनन् भनेर पनि थाहा पाउँछ। यदि गतिमा भएमा ती अर्को कार, साइकल, पैदलयात्रु वा अन्य केही हुन् भनेर पनि पत्ता लगाउँछ।

राम्रो ड्राइभिङ कस्तो हुन्छ भनेर हजारौँ घण्टा तालिम लिइसकेपछि एआई वास्तविक संसारमै कार चलाउन र ठोक्किनबाट जोगिन आवश्यक निर्णय लिन र त्यसलाई कार्यान्वयन गर्न सक्षम भइसकेको छ।

प्रिडिक्टिभ एल्गरिदमले मानव चालकको प्राय: पूर्वानुमान गर्न नसकिने स्वभावसँग काम गर्न धेरै वर्ष सङ्घर्ष गरेको हुनसक्छ। तर चालकबिनाका कारहरूले अब वास्तविक सडकका कोसौँ लामा खण्डहरूको तथ्याङ्क सङ्कलन गरिसकेका छन्। सान फ्र्यान्सिस्कोमा तिनीहरूले पैसा लिएर यात्रु बोक्न थालिसकेका छन्।

नयाँ प्रविधिले प्राविधिकबाहेक अन्य प्रकारका व्यवधान पनि पार गर्नुपर्छ भन्ने पुष्टि गर्न पनि ‘अटोनमस ड्राइभिङ’ एउटा सार्वजिनक उदाहरण हो।

हामीले कारको नियन्त्रण कृत्रिम यन्त्रलाई सुम्पिदिँदा के होला भन्ने गहिरो चिन्ताका अतिरिक्त सरकारी कानुन तथा सुरक्षासम्बन्धी नियम पनि सडकको पूर्ण स्वचालित भविष्यका सम्भाव्य व्यवधान हुन्।

एआईलाई मेरो बारेमा के थाहा हुन्छ?

कतिपय एआईले अङ्कलाई मात्रै जोड दिन्छन् र त्यसलाई धेरै मात्रामा सङ्कलन गरेर सूचनाको थुप्रो बनाउँछन्। तिनको उत्पादन अति नै मूल्यवान् हुन्छ।

विशेषत: पहिल्यै अनलाइन उपलब्ध हुने तपाईँका आर्थिक र सामाजिक गतिविधिका कैयौँ प्रोफाइलहरू प्रयोग गरी तपाईँको बानीव्यवहारबारे भविष्यवाणी गर्न सकिन्छ।

तपाईँको सुपरमार्केट सदस्यता कार्डले साप्ताहिक किनमेलबाट तपाईँको बानी र स्वाद निगरानी गरिरहेको छ। ऋण दिने एजेन्सीहरूले तपाईँको ब्याङ्कमा र क्रेडिट कार्डमा कति छ भनेर निगरानी गर्छन्।

नेटफ्लिक्स र एमजनले तपाईँले गत रात कति घण्टा उनीहरूको सामग्री हेर्नुभयो भनेर निगरानी गरिरहेका हुन्छन्। तपाईँको सामाजिक सञ्जालका खाताहरूले कतिवटा भिडिओमा तपाईँले टिप्पणी गर्नुभयो भनेर थाहा पाउँछन्।

अनि त्यो तपाईँको मात्रै होइन। यस्ता अङ्कहरू सबैका हुन्छन् र त्यसले एआईलाई सामाजिक ट्रेन्ड हेर्नका लागि मन्थन गर्न सबल बनाउँछन्।

यस्ता एआई मोडलहरूले तपाईँको जीवनलाई आफ्नो बाटोमा डोर्‍याउन सुरु गरिसकेका छन्। यिनीहरूले तपाईँलाई ऋण लिने निर्णय गर्नदेखि अनलाइनमा देखेका विज्ञापनका आधारमा तपाईँले के किन्नुहुन्छ भन्नेसम्मका काम प्रभावित गर्छन्।

एआई सबै थोक गर्न सक्षम होला?

यसलाई मल्टिमोडल एआई भनिन्छ र यसले एउटा मोडललाई तस्बिर, शब्द, श्रव्य र दृश्यजस्ता भिन्न प्रकारका डेटामा पहुँच दिन्छ र तिनीहरूबीचका नयाँ प्याटर्न पत्ता लगाउन सहयोग गर्छ।

यो मल्टिमोडल शैलीलाई च्याटजीपीटीले आफ्नो क्षमतामा ठूलो फड्को मार्नुको एउटा कारण मानिन्छ। च्याटजीपीटीको मोडल जीपीटी ३.५ मा स्तरोन्नति हुँदा यसलाई शब्दहरूका लागि मात्रै प्रशिक्षित गरिएकोमा जीपीटी ४ मा भएको स्तरोन्नतिमा तस्बिरहरूका लागि पनि प्रशिक्षित गरियो।

एउटै एआई मोडलबाट कुनै पनि प्रकारका तथ्याङ्क प्रशोधन गरेर भाषाहरूको उल्थादेखि नयाँ औषधिको डिजाइन गर्नेसम्मका कुनै पनि प्रकारका काम गर्न सक्ने उपायलाई आर्टिफिशल जेनरल इन्टेलिजन्स वा एजीआई भनेर चिनिन्छ।

कतिपयका लागि यो आर्टिफिशल इन्टेलिजन्स खोजको अन्तिम लक्ष्य हो। अरूका लागि विज्ञानकथाले परिकल्पना गरेको नारकीय संसारको मार्ग नै त्यही हो, जहाँ हामीले हाम्रो समझ नै हाम्रो नियन्त्रणभन्दा बाहिर गइसकेको हुनेछ।

एआईले कसरी आफैँ सिक्छ?
सुपरभाइज्ड लर्निङ’ अर्थात् कसैको रेखदेखमा गरिने शिक्षण निकै शक्तिशाली विधि हो। तर बिनारेखदेख गरिने शिक्षणबाट एआईको क्षेत्रमा नयाँ उपलब्धिहरू हात परेका छन्।

सामान्य भाषामा भन्नुपर्दा जटिल एल्गरिदम र ठूलो डेटासेटबाट एआईले मानिसको मार्गनिर्देशनबिनै सिक्न सक्छ।

च्याटजीपीटी एउटा त्यस्तो उदाहरण हो।

इन्टरनेट र डिजिटाइज्ड पुस्तकहरूमा यति धेरै पाठ छ कि तिनको सहयोगमा च्याटजीपीटीले धेरै महिना लगाएर अर्थपूर्ण रूपमा शब्दहरू मिलाउन सिक्यो। त्यसपछि मानिसले त्यसको प्रतिक्रियालाई निखार्न सघाए।

मान्नुहोस् तपाईँसँग कुनै विदेशी भाषामा प्रकाशित पुस्तकहरूको ठूलो चाङ छ। तीमध्ये केहीमा तस्बिरहरू पनि हुन सक्छन्।

अन्ततः तपाईँले कुनै पन्नामा छापिएको चित्र वा रूखको तस्बिरसँगै उही शब्द र घरको तस्बिर भएको ठाउँमा अर्को शब्द प्रयोग भएको छुट्ट्याउन सक्नुभयो।

अनि ती शब्दनजिकै प्रायः अर्को एउटा शब्द पनि देख्न सक्नुहुन्छ। त्यसको अर्थ एउटा वा यो वा अरू त्यस्तै केही हुन सक्छ।

च्याटजीपीटीले शब्दहरूबीच हुने सम्बन्ध विश्लेषण गर्‍यो र एउटा विशाल तथ्याङ्कीय मोडल बनायो। त्यो मोडलको सहयोगमा च्याटजीपीटले अनुमान गर्न र नयाँ वाक्यहरू लेख्न सक्छ।

यो विशाल कम्प्युटिङ शक्तिमा भर पर्छ जसले एआईलाई एउटा मात्रै, समूहमा, वाक्यमा वा पन्नाहरूमा भएका शब्दहरू स्मरण गर्न दिन्छ। अनि तिनलाई पढ्न र एकछिनमै ती कसरी बारम्बार प्रयोग भएका छन् त्यो तुलना गर्न दिन्छ।

गत वर्ष डीप लर्निङ मोडलहरूले गरेको तीव्र विकासले आर्टिफिशल इन्टेलिजन्सको शक्तिबारे नयाँ खालको जिज्ञासा र चासो उत्पन्न गरायो। त्यो अहिले पनि ज्यूँका त्यूँ छ।

विज्ञानकथाले देखाउने सम्भावना र दिने चेतावनी अकस्मात् हामीमाथि बर्सिए। अनि एआईले उजागर गर्न थालेको आफ्नो आश्‍चर्यजनक मानवेतर क्षमतायुक्त संसारमा हामीले आफूलाई पायौँ।

बीबीसीबाट साभार