आधुनिक तंत्रज्ञानाच्या आणि वेगाने बदलणाऱ्या व्यावसायिक जगात संवादाच्या पद्धती अत्यंत झपाट्याने बदलत आहेत. एकेकाळी आपण कार्यालयात किंवा शैक्षणिक क्षेत्रात माहितीची देवाणघेवाण करण्यासाठी लांबलचक ईमेल्सचा आधार घेत होतो. त्यानंतरचा काळ हा 'पॉवरपॉइंट प्रेझेंटेशन्स'चा किंवा स्लाईड्सचा आला, जिथे माहिती मुद्द्यांच्या स्वरूपात मांडली जाऊ लागली. पण आजच्या अत्यंत वेगवान आणि डिजिटल युगात लोकांकडे लांबलचक मजकूर वाचण्यासाठी किंवा कंटाळवाण्या स्लाईड्स पाहण्यासाठी पुरेसा वेळ आणि संयम उरलेला नाही. आजचा काळ हा 'व्हिडिओ'चा आहे. व्हिडिओच्या माध्यमातून कोणतीही गुंतागुंतीची माहिती अत्यंत सोप्या, आकर्षक आणि प्रभावी पद्धतीने समोरच्या व्यक्तीपर्यंत पोहोचवता येते. परंतु, व्हिडिओ तयार करणे हे कधीही सोपे काम नव्हते; त्यासाठी व्हिडिओ एडिटिंगचे तांत्रिक ज्ञान, महागडे सॉफ्टवेअर आणि प्रचंड वेळ लागण्याची गरज असायची. हीच सर्वात मोठी अडचण ओळखून, तंत्रज्ञान क्षेत्रातील महाकाय कंपनी असलेल्या 'गुगल'ने कृत्रिम बुद्धिमत्तेवर आधारित एक अत्यंत क्रांतिकारी साधन नुकतेच बाजारात आणले आहे, ज्याचे नाव आहे 'गुगल व्हिड्स'.
गुगल व्हिड्सचे सर्वात मोठे आणि खरे सामर्थ्य त्याच्या आत दडलेल्या 'जेमिनी' या कृत्रिम बुद्धिमत्तेमध्ये आहे. हे साधन वापरकर्त्यासाठी अक्षरशः एका दिग्दर्शकासारखे आणि लेखकासारखे काम करते. जेव्हा तुम्ही गुगल व्हिड्स उघडता, तेव्हा तुम्हाला 'हेल्प मी क्रिएट' (मला बनवण्यासाठी मदत करा) असा एक पर्याय दिसतो. तिथे तुम्ही केवळ एका साध्या वाक्यात किंवा परिच्छेदात (प्रॉम्प्टमध्ये) तुम्हाला कोणत्या विषयावर व्हिडिओ बनवायचा आहे, याची माहिती देऊ शकता. किंवा त्याहूनही सोपे म्हणजे, तुम्ही तुमचा एखादा आधीच तयार असलेला गुगल डॉक्युमेंटचा मसुदा या प्रणालीला जोडू शकता. माहिती मिळताच, जेमिनी एआय अत्यंत वेगाने कामाला लागते आणि काही सेकंदातच तुमच्या संपूर्ण व्हिडिओचा एक 'स्टोरीबोर्ड' (Storyboard) किंवा कच्चा आराखडा तयार करते. या आराखड्यात कोणत्या सेकंदाला काय दिसेल, कोणती माहिती स्क्रीनवर येईल आणि बॅकग्राउंडला कोणते दृश्य असेल, याची संपूर्ण आणि सुटसुटीत मांडणी कृत्रिम बुद्धिमत्तेद्वारे आपोआप केली जाते.
मशीन लर्निंग किंवा कोडिंगसारखे अत्यंत गुंतागुंतीचे आणि तांत्रिक विषय केवळ ब्लॅकबोर्डवर किंवा स्थिर स्लाईड्सच्या माध्यमातून शिकवणे बऱ्याचदा कंटाळवाणे आणि विद्यार्थ्यांच्या आकलनाबाहेर जाणारे ठरू शकते. अशा वेळी जर एखादा संकल्पनात्मक व्हिडिओ वापरला, तर तो विषय विद्यार्थ्यांच्या थेट डोक्यात आणि लक्षात राहतो. पण एक उत्तम मार्गदर्शक किंवा संशोधक हा काही व्हिडिओ एडिटर नसतो. स्वतःचे व्हिडिओ रेकॉर्ड करणे, ते कट करणे, त्याला योग्य ती चित्रे जोडणे यात एका शिक्षकाचा किंवा संशोधकाचा प्रचंड वेळ वाया जातो. गुगल व्हिड्सने हीच मोठी दरी अत्यंत हुशारीने भरून काढली आहे. आता एखादा प्रशिक्षक त्याच्या अभ्यासक्रमाचा मसुदा थेट गुगल व्हिड्समध्ये टाकू शकतो आणि कृत्रिम बुद्धिमत्ता त्या मसुद्याचे एका सुंदर आणि माहितीपूर्ण व्हिडिओमध्ये रूपांतर करते. हे तंत्रज्ञान शैक्षणिक आणि प्रशिक्षण क्षेत्रासाठी खऱ्या अर्थाने एक मोठे वरदान ठरणार आहे.
गुगल व्हिड्समध्ये केवळ आराखडा तयार होत नाही, तर कृत्रिम बुद्धिमत्ता त्या आराखड्यानुसार योग्य ते स्टॉक व्हिडिओ, उच्च दर्जाची छायाचित्रे आणि पार्श्वसंगीत गुगलच्या अवाढव्य लायब्ररीतून शोधून आपोआप व्हिडिओमध्ये समाविष्ट करते. याव्यतिरिक्त, यातील सर्वात प्रभावी वैशिष्ट्य म्हणजे 'व्हॉइसओव्हर' किंवा पार्श्वआवाज. जर तुम्हाला स्वतःचा आवाज व्हिडिओमध्ये द्यायचा नसेल, तर तुम्ही गुगल व्हिड्समध्ये उपलब्ध असलेल्या अनेक नैसर्गिक आणि मानवी वाटणाऱ्या 'एआय आवाजांची' निवड करू शकता. कृत्रिम बुद्धिमत्ता तुम्ही दिलेल्या स्क्रिप्टचे अत्यंत योग्य उच्चारात, चढउतारात आणि भावनिक लयीत वाचन करते. अर्थात, जर तुम्हाला तो व्हिडिओ अधिक वैयक्तिक आणि जिव्हाळ्याचा वाटायला हवा असेल, तर तुम्ही त्यात तुमचा स्वतःचा आवाज थेट तुमच्या लॅपटॉपच्या माईकवरून रेकॉर्ड करून जोडू शकता किंवा तुमचा स्वतःचा चेहरा (कॅमेरा फीड) व्हिडिओच्या एका कोपऱ्यात दाखवू शकता, ज्यामुळे सादरीकरणाला एक अत्यंत विश्वासार्ह आणि मानवी स्पर्श मिळतो.
गुगलच्या इतर साधनांप्रमाणेच 'कोलॅबोरेशन' म्हणजेच एकाच वेळी अनेक लोकांनी मिळून काम करणे, हे गुगल व्हिड्सचे आणखी एक अत्यंत मोठे आणि क्रांतिकारी वैशिष्ट्य आहे. एखाद्या मोठ्या संशोधन प्रकल्पावर किंवा व्यावसायिक प्रस्तावावर काम करताना संपूर्ण टीम जगाच्या वेगवेगळ्या कोपऱ्यात बसलेली असू शकते. आजवर एखाद्या व्हिडिओमध्ये बदल सुचवायचे असतील, तर व्हिडिओची मोठी फाईल डाउनलोड करावी लागायची, ती ई-मेलने पाठवावी लागायची आणि मग त्यावर चर्चा व्हायची. गुगल व्हिड्सने ही संपूर्ण आणि किचकट प्रक्रिया इतिहासजमा केली आहे. आता एकाच व्हिडिओच्या लिंकवर संपूर्ण टीम एकाच वेळी काम करू शकते. एक व्यक्ती स्क्रिप्टमध्ये बदल करत असताना, दुसरी व्यक्ती त्याच वेळी बॅकग्राउंडचे संगीत बदलू शकते आणि तिसरी व्यक्ती एखाद्या विशिष्ट दृश्यावर आपली प्रतिक्रिया लिहू शकते. अगदी गुगल डॉक्समध्ये आपण जसे एकत्र टायपिंग करतो, तसेच आता आपण एकत्र व्हिडिओ एडिटिंग करू शकतो. ही लवचिकता व्यावसायिक जगातील निर्णयप्रक्रिया आणि सादरीकरणाचा वेग प्रचंड वाढवणार आहे.
तंत्रज्ञान आणि कृत्रिम बुद्धिमत्ता यांसारखे विषय जेव्हा वैद्यकीय विज्ञान, कृषी क्षेत्र किंवा कायदा यांसारख्या पूर्णपणे बिगर-तांत्रिक क्षेत्रातील लोकांना शिकवायचे असतात, तेव्हा त्यांच्यासाठी तांत्रिक भाषा नेहमीच जड जाते. अशा वेळी कथा सांगण्याच्या (Storytelling) माध्यमातून किंवा दृश्यांच्या माध्यमातून (Visuals) विषय समजावून सांगणे सर्वात जास्त प्रभावी ठरते. गुगल व्हिड्ससारखे साधन अशा प्रकारच्या आंतरशाखीय ज्ञानाच्या देवाणघेवाणीसाठी एक अत्यंत मजबूत पूल बनू शकते. शेतीच्या नवीन तंत्रज्ञानाची माहिती शेतकऱ्यांपर्यंत पोहोचवण्यासाठी किंवा एखादी नवीन वैद्यकीय प्रणाली डॉक्टरांना समजावून सांगण्यासाठी आता तांत्रिक तज्ञांना व्हिडिओ बनवणाऱ्या एजन्सीवर अवलंबून राहण्याची गरज उरणार नाही. ते स्वतःचे विचार स्वतःच एका प्रभावी व्हिडिओच्या रूपात अत्यंत कमी वेळात मांडू शकतील.
अर्थात, हे तंत्रज्ञान कितीही प्रगत आणि आश्चर्यकारक असले, तरी त्याच्या काही अत्यंत स्पष्ट आणि नैसर्गिक मर्यादा आहेत, ज्या आपण समजून घेणे अत्यंत गरजेचे आहे. गुगल व्हिड्स हे तुमच्या कल्पनेतील प्रत्येक गोष्ट हुबेहूब निर्माण करेलच असे नाही. बऱ्याचदा कृत्रिम बुद्धिमत्ता चुकीचे किंवा संदर्भाहीन फोटो व्हिडिओमध्ये जोडू शकते. एआयने दिलेला आवाज हा मानवी भावनांची १०० टक्के बरोबरी करू शकत नाही. त्यामुळे हे साधन व्हिडिओ बनवण्याची संपूर्ण प्रक्रिया १०० टक्के स्वयंचलित करत नाही. मानवी दिग्दर्शन, मानवी बुद्धिमत्ता आणि सर्जनशीलतेची गरज या प्रक्रियेत अंतिम टप्प्यावर नेहमीच राहणार आहे. एआयने बनवलेला कच्चा आराखडा तपासून त्यात योग्य ते बदल करणे, चुकीचे शब्द किंवा चित्रे काढून टाकणे ही मानवी जबाबदारी आहे. हे साधन म्हणजे तुमचा 'मदतनीस' आहे, तुमचा 'बदली' (Replacement) नाही, ही जाणीव वापरकर्त्याने नेहमी ठेवली पाहिजे.
गुगल व्हिड्स हे केवळ एक नवीन ॲप नसून ती व्यावसायिक आणि शैक्षणिक संवादाच्या पद्धतीत होणाऱ्या एका मोठ्या बदलाची नांदी आहे. ज्या वेगाने आपण 'टाईप' करण्याकडून 'बोलण्याकडे' आणि 'वाचण्याकडून' 'पाहण्याकडे' वळत आहोत, त्या वेगाला सामावून घेण्यासाठी अशा प्रकारच्या अद्ययावत कृत्रिम बुद्धिमत्तेवर आधारित साधनांची नितांत आवश्यकता होती. जे व्यावसायिक, शिक्षक, संशोधक आणि कंपन्या या बदलत्या तंत्रज्ञानाचा आणि गुगल व्हिड्ससारख्या साधनांचा सकारात्मक आणि कल्पकतेने वापर करायला शिकतील, ते भविष्यातील स्पर्धेत नक्कीच अनेक पावले पुढे राहतील. तंत्रज्ञानाची भीती बाळगण्यापेक्षा त्याला आपला मित्र बनवून आपले काम अधिक सोपे आणि प्रभावी करणे, हाच या नव्या एआय युगाचा सर्वात मोठा आणि खरा मंत्र आहे.
लिंक : https://workspace.google.com/intl/en_in/products/vids
--- तुषार भ. कुटे










