आज आपण कृत्रिम बुद्धिमत्ता (Artificial Intelligence - AI) आणि मशीन लर्निंग (Machine Learning - ML) या शब्दांनी वेढलेलो आहोत. आपल्या स्मार्टफोनपासून ते ऑनलाइन शॉपिंगपर्यंत सर्वत्र या तंत्रज्ञानाचा वापर होत आहे. पण या क्रांतीची मुळे खूप खोलवर, अगदी १९५० च्या दशकात रुजलेली आहेत. या प्रवासातील एक महत्त्वाचे आणि आदरणीय नाव म्हणजे आर्थर सॅम्युअल (Arthur Samuel). त्यांना अनेकदा 'मशीन लर्निंगचे जनक' म्हटले जाते. त्यांनी बनवलेला एक साधा वाटणारा पण क्रांतिकारी प्रोग्राम हा या क्षेत्रातील मैलाचा दगड ठरला.
आर्थर सॅम्युअल: एक द्रष्टा संशोधक
आर्थर सॅम्युअल हे एक अमेरिकन संगणक शास्त्रज्ञ होते. त्यांनी आपल्या कारकिर्दीचा मोठा काळ आयबीएम (IBM) या प्रसिद्ध कंपनीत घालवला. सॅम्युअल यांचा विश्वास होता की संगणक केवळ दिलेल्या आज्ञांचे पालन करणारी यंत्रे नाहीत, तर त्यांना अनुभवातून शिकवून अधिक बुद्धिमान बनवता येते. ही त्या काळासाठी एक अत्यंत पुढारलेली कल्पना होती. हीच कल्पना प्रत्यक्षात आणण्यासाठी त्यांनी एका खेळाची निवड केली - चेकर्स (Checkers).
चेकर्सच्या खेळाची निवड का?
सॅम्युअल यांनी मशीनला शिकवण्यासाठी बुद्धीबळासारख्या (Chess) अत्यंत गुंतागुंतीच्या किंवा टिक-टॅक-टो (Tic-Tac-Toe) सारख्या अगदी सोप्या खेळाची निवड केली नाही. त्यांनी चेकर्स निवडले कारण त्याचे नियम स्पष्ट आणि तुलनेने सोपे असले तरी, जिंकण्यासाठी रणनीती आणि दूरदृष्टीची आवश्यकता असते. यात संभाव्य चालींची संख्या अफाट होती, पण ती संगणकाला हाताळता येण्यासारखी होती. त्यामुळे, मशीनला 'शिकवण्यासाठी' हा एक उत्तम मध्यम मार्ग होता.
प्रोग्राम कसा 'शिकला'?
सॅम्युअल यांच्या प्रोग्रामचे खरे वैशिष्ट्य त्याच्या शिकण्याच्या पद्धतीत होते. त्यांनी प्रोग्रामला केवळ चेकर्स कसे खेळायचे हे शिकवले नाही, तर हरलेल्या डावांमधून शिकून स्वतःच्या खेळात सुधारणा कशी करायची हे देखील शिकवले. या प्रोग्रामने मुख्यत्वे दोन पद्धती वापरून स्वतःला प्रशिक्षित केले.
पहिली पद्धत होती पाठांतर (Rote Learning). या पद्धतीत, प्रोग्राम आपल्या प्रत्येक डावातील पटाची स्थिती (board position) आणि त्या स्थितीनंतर खेळाचा काय निकाल लागला, हे लक्षात ठेवत असे. जेव्हा भविष्यात तशीच स्थिती पुन्हा निर्माण होई, तेव्हा प्रोग्राम आपल्या स्मरणातून सर्वोत्तम चाल निवडत असे. हे एखाद्या विद्यार्थ्याने पाढे पाठ करण्यासारखे होते.
पण खरी जादू दुसऱ्या पद्धतीत होती, जिला अनुभवातून शिकणे (Learning by Generalization) म्हटले जाते. सॅम्युअल यांनी एक 'मूल्यांकन फंक्शन' (Evaluation Function) तयार केले होते. हे फंक्शन पटावरील स्थिती किती चांगली किंवा वाईट आहे, हे काही निकषांच्या आधारे ठरवत असे. या निकषांमध्ये पटावर कोणाच्या सोंगट्या जास्त आहेत, कोणाच्या राजा झालेल्या सोंगट्या (Kings) जास्त आहेत, आणि पटावर कोणाचे नियंत्रण अधिक आहे, अशा गोष्टींचा समावेश होता.
सुरुवातीला या सर्व निकषांना समान महत्त्व दिले गेले होते. पण प्रोग्राम जसजसा खेळू लागला, तसतसा तो शिकू लागला. प्रोग्राम स्वतःच्याच दुसऱ्या प्रतीसोबत हजारो डाव खेळायचा. प्रत्येक डावानंतर, तो जिंकण्यासाठी कोणत्या निकषांना अधिक महत्त्व देणे फायद्याचे ठरले आणि कोणत्या निकषांमुळे पराभव झाला, याचे विश्लेषण करायचा. उदाहरणार्थ, जर केवळ सोंगट्यांची संख्या जास्त ठेवण्याच्या नादात खेळात पराभव होत असेल, तर प्रोग्राम त्या निकषाचे महत्त्व (weight) कमी करायचा आणि पटावरील नियंत्रणासारख्या दुसऱ्या निकषाचे महत्त्व वाढवायचा. ही प्रक्रिया सतत चालू राहायची. जणू काही तो प्रोग्राम अनुभवातून शहाणा होत होता आणि आपली जिंकण्याची रणनीती स्वतःच अधिक परिपक्व करत होता.
या शोधाचे महत्त्व आणि परिणाम
१९५९ साली आर्थर सॅम्युअल यांनी 'मशीन लर्निंग' हा शब्दप्रयोग आपल्या एका शोधनिबंधात वापरला आणि तो जगभर प्रसिद्ध झाला. त्यांच्या प्रोग्रामने हे सिद्ध केले की मशीनला केवळ आज्ञावली देऊन चालवता येत नाही, तर त्याला अनुभवातून शिकण्याची क्षमता देखील देता येते. १९६० च्या दशकात त्यांच्या या प्रोग्रामने अमेरिकेतील एका चांगल्या दर्जाच्या चेकर्स खेळाडूला हरवून सर्वांना आश्चर्यचकित केले.
आर्थर सॅम्युअल यांच्या या कार्यामुळे कृत्रिम बुद्धिमत्तेच्या संशोधनाला एक नवी दिशा मिळाली. त्यांनी घातलेला पाया इतका भक्कम होता की आज विकसित झालेले अत्याधुनिक AI मॉडेल्स, जसे की बुद्धीबळ खेळणारा डीप ब्लू (Deep Blue) किंवा गो (Go) खेळणारा अल्फागो (AlphaGo), कुठेतरी सॅम्युअल यांच्या त्याच मूळ कल्पनेवर आधारित आहेत.
थोडक्यात सांगायचे तर, आर्थर सॅम्युअल यांनी एका साध्या चेकर्सच्या खेळाद्वारे मशीनला 'विचार' करायला आणि 'शिकायला' शिकवले. त्यांचे हे योगदान केवळ एका गेमिंग प्रोग्रामपुरते मर्यादित नव्हते, तर ते एका अशा तंत्रज्ञानाची सुरुवात होती जे आज आपल्या जीवनाचा अविभाज्य भाग बनले आहे.
(आधारित)
--- तुषार भ. कुटे
आर्थर सॅम्युअल हे एक अमेरिकन संगणक शास्त्रज्ञ होते. त्यांनी आपल्या कारकिर्दीचा मोठा काळ आयबीएम (IBM) या प्रसिद्ध कंपनीत घालवला. सॅम्युअल यांचा विश्वास होता की संगणक केवळ दिलेल्या आज्ञांचे पालन करणारी यंत्रे नाहीत, तर त्यांना अनुभवातून शिकवून अधिक बुद्धिमान बनवता येते. ही त्या काळासाठी एक अत्यंत पुढारलेली कल्पना होती. हीच कल्पना प्रत्यक्षात आणण्यासाठी त्यांनी एका खेळाची निवड केली - चेकर्स (Checkers).
चेकर्सच्या खेळाची निवड का?
सॅम्युअल यांनी मशीनला शिकवण्यासाठी बुद्धीबळासारख्या (Chess) अत्यंत गुंतागुंतीच्या किंवा टिक-टॅक-टो (Tic-Tac-Toe) सारख्या अगदी सोप्या खेळाची निवड केली नाही. त्यांनी चेकर्स निवडले कारण त्याचे नियम स्पष्ट आणि तुलनेने सोपे असले तरी, जिंकण्यासाठी रणनीती आणि दूरदृष्टीची आवश्यकता असते. यात संभाव्य चालींची संख्या अफाट होती, पण ती संगणकाला हाताळता येण्यासारखी होती. त्यामुळे, मशीनला 'शिकवण्यासाठी' हा एक उत्तम मध्यम मार्ग होता.
प्रोग्राम कसा 'शिकला'?
सॅम्युअल यांच्या प्रोग्रामचे खरे वैशिष्ट्य त्याच्या शिकण्याच्या पद्धतीत होते. त्यांनी प्रोग्रामला केवळ चेकर्स कसे खेळायचे हे शिकवले नाही, तर हरलेल्या डावांमधून शिकून स्वतःच्या खेळात सुधारणा कशी करायची हे देखील शिकवले. या प्रोग्रामने मुख्यत्वे दोन पद्धती वापरून स्वतःला प्रशिक्षित केले.
पहिली पद्धत होती पाठांतर (Rote Learning). या पद्धतीत, प्रोग्राम आपल्या प्रत्येक डावातील पटाची स्थिती (board position) आणि त्या स्थितीनंतर खेळाचा काय निकाल लागला, हे लक्षात ठेवत असे. जेव्हा भविष्यात तशीच स्थिती पुन्हा निर्माण होई, तेव्हा प्रोग्राम आपल्या स्मरणातून सर्वोत्तम चाल निवडत असे. हे एखाद्या विद्यार्थ्याने पाढे पाठ करण्यासारखे होते.
पण खरी जादू दुसऱ्या पद्धतीत होती, जिला अनुभवातून शिकणे (Learning by Generalization) म्हटले जाते. सॅम्युअल यांनी एक 'मूल्यांकन फंक्शन' (Evaluation Function) तयार केले होते. हे फंक्शन पटावरील स्थिती किती चांगली किंवा वाईट आहे, हे काही निकषांच्या आधारे ठरवत असे. या निकषांमध्ये पटावर कोणाच्या सोंगट्या जास्त आहेत, कोणाच्या राजा झालेल्या सोंगट्या (Kings) जास्त आहेत, आणि पटावर कोणाचे नियंत्रण अधिक आहे, अशा गोष्टींचा समावेश होता.
सुरुवातीला या सर्व निकषांना समान महत्त्व दिले गेले होते. पण प्रोग्राम जसजसा खेळू लागला, तसतसा तो शिकू लागला. प्रोग्राम स्वतःच्याच दुसऱ्या प्रतीसोबत हजारो डाव खेळायचा. प्रत्येक डावानंतर, तो जिंकण्यासाठी कोणत्या निकषांना अधिक महत्त्व देणे फायद्याचे ठरले आणि कोणत्या निकषांमुळे पराभव झाला, याचे विश्लेषण करायचा. उदाहरणार्थ, जर केवळ सोंगट्यांची संख्या जास्त ठेवण्याच्या नादात खेळात पराभव होत असेल, तर प्रोग्राम त्या निकषाचे महत्त्व (weight) कमी करायचा आणि पटावरील नियंत्रणासारख्या दुसऱ्या निकषाचे महत्त्व वाढवायचा. ही प्रक्रिया सतत चालू राहायची. जणू काही तो प्रोग्राम अनुभवातून शहाणा होत होता आणि आपली जिंकण्याची रणनीती स्वतःच अधिक परिपक्व करत होता.
या शोधाचे महत्त्व आणि परिणाम
१९५९ साली आर्थर सॅम्युअल यांनी 'मशीन लर्निंग' हा शब्दप्रयोग आपल्या एका शोधनिबंधात वापरला आणि तो जगभर प्रसिद्ध झाला. त्यांच्या प्रोग्रामने हे सिद्ध केले की मशीनला केवळ आज्ञावली देऊन चालवता येत नाही, तर त्याला अनुभवातून शिकण्याची क्षमता देखील देता येते. १९६० च्या दशकात त्यांच्या या प्रोग्रामने अमेरिकेतील एका चांगल्या दर्जाच्या चेकर्स खेळाडूला हरवून सर्वांना आश्चर्यचकित केले.
आर्थर सॅम्युअल यांच्या या कार्यामुळे कृत्रिम बुद्धिमत्तेच्या संशोधनाला एक नवी दिशा मिळाली. त्यांनी घातलेला पाया इतका भक्कम होता की आज विकसित झालेले अत्याधुनिक AI मॉडेल्स, जसे की बुद्धीबळ खेळणारा डीप ब्लू (Deep Blue) किंवा गो (Go) खेळणारा अल्फागो (AlphaGo), कुठेतरी सॅम्युअल यांच्या त्याच मूळ कल्पनेवर आधारित आहेत.
थोडक्यात सांगायचे तर, आर्थर सॅम्युअल यांनी एका साध्या चेकर्सच्या खेळाद्वारे मशीनला 'विचार' करायला आणि 'शिकायला' शिकवले. त्यांचे हे योगदान केवळ एका गेमिंग प्रोग्रामपुरते मर्यादित नव्हते, तर ते एका अशा तंत्रज्ञानाची सुरुवात होती जे आज आपल्या जीवनाचा अविभाज्य भाग बनले आहे.
(आधारित)
--- तुषार भ. कुटे
No comments:
Post a Comment
to: tushar.kute@gmail.com