कॉन्टेंट पर जाएं

इसकी व्याख्या: मशीन लर्निंग से जुड़े सवाल-जवाब

हम में से बहुतों को, मशीन लर्निंग लगभग अत्याधुनिक लगती है. हालांकि, आजकल यह हमारे जीवन के हर पहलू में दिखाई दे रही है — चाहे शानदार गो खेल खेलता Google का कंप्यूटर हो या Gmail के Inbox में खुद जवाब देने की सुविधा. ये सब सुनने में बहुत अच्छा लगता है लेकिन फिर भी बहुत से लोग यह जानना चाहते हैं कि मशीन लर्निंग आखिर है क्या. या यह क्यों मायने रखता है. या क्यों फ़ोटो में एक पालतू जानवर की पहचान करना उतना आसान नहीं, जितना लगता है. इसे समझने के लिए हमने Google में मशीन लर्निंग की शोध वैज्ञानिक (रिसर्च साइंटिस्ट) माया गुप्ता के साथ बातचीत की.

आइए बुनियादी बातों से शुरुआत करते हैं. मशीन लर्निंग आखिर है क्या?

मशीन लर्निंग कुछ उदाहरणों को लेकर उनके पैटर्न को समझता है अौर फिर उस पैटर्न का इस्तेमाल करके नए उदाहरणों के बारे में पहले से अनुमान लगाता है.

एक फ़िल्म का उदाहरण लें. मान लीजिए कि एक अरब लोग अपनी दस मनपसंद फ़िल्में बताते हैं. इन उदाहरणों का इस्तेमाल करके कंप्यूटर यह जान सकता है कि लोगों को पसंद आई फ़िल्मों में क्या समानता है. फिर कंप्यूटर इन उदाहरणों को समझाने वाले पैटर्न पेश करता है जैसे, “डरावनी फ़िल्में पसंद करने वाले लोग आमतौर पर रोमांस पसंद नहीं करते, लेकिन लोगों को किसी एक अभिनेता की फ़िल्में पसंद आती हैं.” फिर अगर आप कंप्यूटर को बताते हैं कि आपको जैक निकोल्सन की फ़िल्म 'द शाइनिंग' पसंद आई, तो यह एक अनुमान लगा सकता है कि जैक निकोल्सन की ही 'समथिंग्स गोटा गिव' भी आपको पसंद आएगी या नहीं, और YouTube पर आपको कौन से वीडियो सुझाने चाहिए.

ठीक है. समझ में आया. लेकिन यह असल में काम कैसे करता है?

असल में मशीन जिन पैटर्न को सीखती है वह बहुत जटिल हो सकते हैं और उन्हें शब्दों में समझाना बहुत मुश्किल हो सकता है. जैसे Google फ़ोटो, जो आपको अपनी सारी फ़ोटो में से कुत्तों वाली फ़ोटो खोजने देता है. Google ऐसा कैसे करता है? सबसे पहले हम “कुत्ता” के लेबल वाली फ़ोटो के उदाहरण इकट्ठे करते हैं (इंटरनेट की मेहरबानी!). हम “बिल्ली” के लेबल वाली और अन्य लाखों लेबल वाली फ़ोटो भी जमा करते हैं, लेकिन मैं यहां उनकी बात नहीं करूंगी :).

फिर कंप्यूटर, पिक्सेल के पैटर्न और रंगों के पैटर्न की मदद से ये अनुमान लगाता है कि यह बिल्ली है या कुत्ता (या कुछ और). सबसे पहले कंप्यूटर यह अनुमान लगाता है कि कुत्तों की पहचान के लिए कौन से पैटर्न अच्छे हो सकते हैं. फिर यह उदाहरण में इस्तेमाल हुई कुत्ते की फ़ोटो को देखकर जांचता है कि क्या उसके पैटर्न ठीक से काम कर रहे हैं. अगर यह गलती से बिल्ली को कुत्ता समझ रहा है तो इस्तेमाल किए गए पैटर्न में छोटे-मोटे बदलाव कर देता है. फिर यह बिल्ली की फ़ोटो को देखता है और सही पैटर्न पाने के लिए इसमें फिर से सुधार करता है. और यही प्रक्रिया अनगिनत बार दोहराई जाती है - एक उदाहरण पर नज़र डालें और अगर यह सही नहीं लगे तो उस उदाहरण को बेहतर बनाने के लिए इस्तेमाल किए गए पैटर्न में सुधार लाएं.

इसके बाद पैटर्न से मशीन-लर्निंग के मॉडल बनते हैं, जैसे डीप न्यूरल नेटवर्क, जो कुत्ते, बिल्ली, फ़ायर फ़ाइटर और ऐसी बहुत सी चीज़ों को सही ढंग से (ज़्यादातर) पहचान सकते हैं.

ये वाकई बहुत अत्याधुनिक लगता है. Google के और कौन से उत्पाद हैं जो फ़िलहाल मशीन लर्निंग का इस्तेमाल करते हैं?

मशीन लर्निंग से Google बहुत सारी नई चीज़ें कर रहा है, जैसे Google अनुवाद सड़क पर लगे संकेत बोर्ड या किसी भाषा में लिखे मेन्यू की फ़ोटो लेकर उसमें मौजूद शब्दों और भाषा का पता लगाता है और उसका आपकी भाषा में वहीं के वहीं अनुवाद कर देता है.

आप Google अनुवाद से तकरीबन कुछ भी बोल सकते हैं और मशीन लर्निंग के ज़रिए काम करने वाली स्पीच रेकॉगनिशन यानी बोली को पहचानने वाली तकनीक अपना काम शुरू कर देगी. बोली को पहचानने वाली तकनीक का इस्तेमाल और उत्पादों में भी होता है, जैसे Google ऐप में आपकी वॉइस क्वेरी यानी बोलकर पूछे गए सवाल को समझना और YouTube वीडियो को और आसानी से खोजने लायक बनाना.

चिह्नों, मेन्यू वगैरह के लिए, बस अपने कैमरे को उनकी ओर करें और तुरंत अनुवाद पाएं. इसके लिए आपको इंटरनेट कनेक्शन की भी ज़रूरत नहीं है. *लेंस शब्द अंग्रेज़ी और दो दर्जन से अधिक भाषाओं में उपलब्ध है.
दूसरी भाषा बोलने वाले किसी व्यक्ति से बात करें.
उन वर्णों और शब्दों को आसानी से हाथ से लिखें, जो आपके कीबोर्ड से नहीं लिखे जा सकते.
बस वे शब्द लिखें जिनका आप अनुवाद करना चाहते हैं.

Google मशीन लर्निंग को अभी अचानक इतनी अहमियत क्यों दे रहा है?

मशीन लर्निंग कोई नई चीज़ नहीं है बल्कि इसकी जड़ें 18वीं सदी के आंकड़ों में पाई जा सकती है. लेकिन आप सही हैं कि हाल ही में इस पर काफ़ी ध्यान दिया जा रहा है और जिसकी तीन वजहें हैं.

सबसे पहले, हमें बहुत सारे उदाहरण जुटाने पड़ेंगे ताकि कंप्यूटर को बेहतर अनुमान लगाना सिखाया जा सके. फिर चाहे वो उन कामों के लिए ही क्यों न हों, जिन्हें आप या मैं बहुत आसानी से कर सकते हैं (जैसे किसी फ़ोटो में कुत्ते को ढूंढना). इंटरनेट पर बढ़ती गतिविधियों की वजह से, अब हमारे पास उदाहरणों का बहुत बड़ा स्रोत है जिनसे कंप्यूटर सीख सकते हैं. मसलन, अब दुनिया भर की वेबसाइटों पर, हर भाषा में, “कुत्ते” के लेबल वाले लाखों फ़ोटो हैं.

लेकिन बहुत सारे उदाहरण होना ही काफ़ी नहीं है. अब एक वेबकैम को कुत्तों की कुछ फ़ोटो दिखा कर तो उससे कुछ सीखने की उम्मीद नहीं कर सकते न — कंप्यूटर को एक लर्निंग प्रोग्राम की ज़रूरत होती है. हाल ही में इस क्षेत्र में Google समेत कुछ और कंपनियों और लोगों ने ऐसे हौसला बढ़ाने वाले काम किए हैं, जो बताते हैं कि मशीन लर्निंग प्रोग्राम कितने जटिल और कितने ताकतवर हो सकते हैं.

अभी हमारे प्रोग्राम ऐसे नहीं हैं कि उन पर पूरा भरोसा किया जा सके, साथ ही कंप्यूटरों के लिए भी अभी काफ़ी कुछ सीखना बाकी है, इसलिए सही पहचान करने के लिए अगर पैटर्न में मामूली सा बदलाव भी करना हो तो हमें बहुत सारे उदाहरणों को बार-बार देखना पड़ता है. इन सब के लिए बहुत ज़्यादा कंप्यूटिंग पावर और साथ में चलने वाली आधुनिक प्रोसेसिंग की ज़रूरत पड़ती है. हालांकि, सॉफ़्टवेयर और हार्डवेयर के क्षेत्र में इतना विकास हो चुका है कि ऐसा करना मुमकिन है.

ऐसी कोई एक चीज़ जो कंप्यूटर आज नहीं कर पाते, लेकिन मशीन लर्निंग की मदद से जल्द ही कर पाएंगे?

अभी कुछ दिन पहले तक ही, बोली को पहचानने वाली तकनीक को फ़ोन पर आपके क्रेडिट कार्ड के दस नंबर पहचानने में भी परेशानी होती थी. पिछले पांच साल में मशीन लर्निंग के चलते, बोली को पहचानने वाली तकनीक ने बहुत विकास किया है अौर अब आप इसका इस्तेमाल Google सर्च के लिए कर सकते हैं. और यह इससे भी बेहतर और तेज़ होती जा रही है.

मैं तो ये भी मानती हूं कि मशीन लर्निंग के ज़रिए हम बेहतर दिख भी सकते हैं. आपके बारे में नहीं पता, लेकिन मुझे कपड़े खरीदने से पहले उन्हें पहनकर देखना बिल्कुल पसंद नहीं है! इसी के चलते मुझे जैसे ही कोई सही फ़िटिंग वाली जींस का ब्रैंड मिलता है, मैं उसके पांच जींस खरीद लेती हूं. लेकिन मशीन लर्निंग से हम इस्तेमाल किए हुए बढ़िया फ़िटिंग वाले ब्रांड के उदाहरण देखकर पता लगा सकेंगे कि हम और कौन से ब्रांड खरीद सकते हैं. मेरी इस दिक्कत से Google का कोई लेना-देना नहीं है लेकिन मुझे उम्मीद है कि कोई, कहीं तो, इस पर काम कर रहा होगा!

मशीन लर्निंग का रूप दस साल में कैसा होगा?

एक चीज़ जिस पर इस फ़ील्ड के सभी लोग काम कर रहे हैं, वह है कम उदाहरणों से तेज़ी से कैसे सीखा जाए. इसके लिए एक तरीका (जिस पर Google खास तौर से काफी मेहनत कर रहा है) ये है कि हम अपनी मशीनों को ज़्यादा कॉमन सेंस दें, जिसे फ़ील्ड में “रेग्यूलराइज़ेशन” कहा जाता है.

मशीन को कॉमन सेंस देने से क्या मतलब है? इसका एक मतलब ये है कि यूं ही अगर कोई उदाहरण थोड़ा बदल जाए, तो मशीन अपना फ़ैसला पूरी तरह से नहीं बदल ले. उदाहरण के लिए, काउबॉय हैट पहने हुए कुत्ते की फ़ोटो को भी कुत्ते के लेबल वाले फ़ोटो में ही रखे.

लर्निंग प्रोग्राम में कॉमन सेंस डालने के लिए हम मशीन लर्निंग को छोटे, गैर महत्वपूर्ण बदलावों जैसे काउबॉय हैट, की अनदेखी करना सिखा रहे हैं. ये बात कहने में आसान लगती है, लेकिन अगर आपने इसमें गलती कर दी, तो मशीन अहम बदलावों की तरफ़ भी पूरा ध्यान नहीं देगी! इसलिए यह संतुलन बनाने जैसा काम है, जिसे हम समझने की कोशिश कर रहे हैं.

मशीन लर्निंग के बारे में ऐसा क्या है जो आपको सबसे ज़्यादा उत्साहित करता है? कौन सी चीज़ आपको इस पर काम करने के लिए प्रेरित करती है?

मैं सीएटल में पली-बढ़ी हूं, जहां मैंने अमेरिकन वेस्ट के शुरुआती खोजकर्ताओं जैसे लुईस और क्लार्क के बारे में बहुत कुछ जाना. मशीन लर्निंग पर शोध करने के पीछे भी वही भावना काम करती है जो उन लोगों की खोज के पीछे थी — चीज़ों को पहली बार देखना और उनसे एक शानदार भविष्य बनाने की कोशिश करना.

अगर आप Google मशीन लर्निंग के लिए एक बंपर स्टिकर नारा दे सकें, तो वह क्या होगा?

ज़रूरी नहीं कि पहली बार में कामयाबी मिल ही जाए, अनगिनत कोशिशें करते रहें.

अौर देखें:

शीर्ष पर वापस जाएं