शैक्षणिक तंत्रज्ञानाच्या क्षेत्रातील अनेक महत्त्वपूर्ण कामांपैकी  एक म्हणजे, कंटेंट सर्व वापरकर्त्यांना सहजपणे उपलब्ध होईल  आणि जलदपणे शोधता येईल असा बनवणे.ते करण्यासाठी,कंपन्या मानवी अनोटेटर्स, किंवा विषय तज्ञ नेमतात आणि ते कंटेंट संबंधित विषयांशी जोडतात, ज्यामुळे वापरकर्त्यास उत्पादनातील संपूर्ण माहिती एकत्र मिळवणे सोपे होते.

Embibe च्या ज्ञान-आलेखावर 74000+ नोड्स् आहेत, ज्यामध्ये प्रत्येक युनिट हे वेगळ्या माहितीचा संच आहे. याशिवाय त्यामध्ये 1,89,380 अंतर्गत जोडसंच आहेत.आणि 2,15,062 विविध क्षमता आहेत.  शेकडो अभ्यासक्रमांच्या हजारो परीक्षा असल्याने कंटेंटचा विस्तार फारच मोठा आहे, त्यामुळे टॅगिंगची प्रक्रिया महाग आणि वेळखाऊ बनते.तसेच यामध्ये मानवी टिप्पणी करण्यामुळे मानवी पक्षपात हळूच प्रवेश करतो, कारण एखाद्या डेटा सेटमध्ये वेगवेगळ्या विषयांवरील सबसेटवर काम करणारे, आणि त्यावर भाष्य करणारे लोक वेगवेगळे असतात.

मेटा टॅग रँकर हा, मानवी टॅगिंगच्या तुलनेत  समस्या कमी करण्यासाठी उत्तर उपाय आहे तो मानवी टिप्पणीऐवजी  मानवसहित सेमी अ‍ॅटोमेटीक टिप्पणीचा पर्याय देतो. मेटा टॅग रँकर हे एक टूल असून ते एखाद्या विशिष्ट प्रश्नाशी संबंधित, पाठ, उपपाठ, संकल्पना, यांच्याशी जोडून असलेल्या विषयातील अधिक माहिती मिळवण्यासाठी लागणारी पर्यायी सूचना, तज्ज्ञांकडून उपलब्ध करून देते, ज्यामुळे Embibe प्लॅटफॉर्मच्या सर्व उद्दिष्टांची पूर्तता होते. त्याचप्रमाणे,ते प्रश्नाची काठिण्य पातळी, सोडवण्यासाठीचा वेळ आणि गरज यानुसार सूचना देते.

ते कसे काम करते हे पाहण्यासाठी काही उदाहरणे पाहू.

मेटा टॅग रॅंकर हे अत्यंत मोठ्या वर्ग वैविध्य आणि त्यांच्या वर्गीकरणाच्या समस्येवर आधारलेले आहे (XMC)[1][2]. Embibe मध्ये, एखाद्या प्रश्नावर 74000 पेक्षा जास्त वर्ग आणि संकल्पना अभिप्रेत आहेत. वर्ग हे पूर्णतः वेगवेगळे नाहीत.उदाहरणार्थ काही संकल्पना या काही वर्गांमध्ये समान असतात तर काही ठिकाणी वर्ग आणि संकल्पना एकमेकांना पूरक असतात.

XMC चे दुसरे आव्हान म्हणजे माहितीसंचाचे वितरण. माहितीतील ठळक मुद्दे हे सर्व संकल्पना आणि सर्व वर्गांसाठी सारखे नसतात. काही वर्गांमध्ये बरेच ठळक मुद्दे असतात तर काहींमध्ये अगदीच कमी मुद्दे असतात. यामुळे संभाव्यता पाहताना काही वर्ग दुर्लक्षित केले जाऊ शकतात.

मेटा टॅग रॅंकर हे सामान्य तसेच विशेषरीत्या भाषिक कौशल्ये समजून शिकण्याची कला अवगत करून त्याचा फायदा करून देते. मानसिक तंत्रे वापरून ज्ञानाचा आलेख वाढविण्यासाठी सुद्धा  ते उपयोगी पडते[3]. मॉडेलद्वारे स्पष्टीकरण करण्यायोग्य आणि अर्थ लावता येण्याजोगे अंदाज उत्पादन सेटिंग्जमध्ये ही क्षमता उपयोजित करण्यास पालक शिक्षणतज्ज्ञांना विश्वास ठेवण्यास मदत करतात [4][5]. अशा प्रकारच्या समृद्ध कंटेंटमुळे स्वयं चाचणी निर्मिती[5][7] आणि शिकण्याचे परिणाम वितरीत करण्याची क्षमता सक्षम करते.

मेटा टॅग जनरेटरने पुस्तके, प्रश्न आणि शिकण्याच्या व्हिडिओंसाठी AI सह मानवी हस्तक्षेपाने केली जाणारी टॅग निर्मीती प्रक्रियेतील लागणाऱ्या हजारो तासांची बचत होती. यामुळे विविध इयत्ता आणि विषयांसाठी विषयातील कौशल्याची आवश्यकता देखील कमी झाली. Embibe व्हिडिओ आणि 3D अ‍ॅसेट निर्मितीसाठी स्पीच मेटाटॅग देखील विकसित करत आहे.

संदर्भ:

[1] चांग, वेई-चेंग, हसियांग-फू यू, काई झोंग, यिमिंग यांग आणि इंद्रजीत एस. ढिल्लॉन. “अत्यंत मल्टी-लेबल मजकूर वर्गीकरणासाठी पूर्वप्रशिक्षित ट्रान्सफॉर्मर टॅमिंग.” 26 व्या ACM SIGKDD इंटरनॅशनल कॉन्फरन्स ऑफ नॉलेज डिस्कव्हरी अँड डेटा मायनिंगच्या कार्यवाहीमध्ये, pp. 3163-3171. 2020.

[2] दहिया, कुणाल, दीपक सैनी, अंशुल मित्तल, अंकुश शॉ, कुशल दवे, अक्षय सोनी, हिमांशू जैन, सुमीत अग्रवाल, आणि माणिक वर्मा. ” DeepXML: लहान मजकूर दस्तऐवजांना लागू केलेली डीप एक्स्ट्रीम मल्टी-लेबल लर्निंग फ्रेमवर्क.” वेब शोध आणि डेटा मायनिंग वरील 14 व्या ACM आंतरराष्ट्रीय परिषदेच्या कार्यवाहीमध्ये, pp. 31-39. 2021.[arXiv]

[3] फाल्दू, केयूर, अमित शेठ, प्रशांत किकाणी आणि हेमांग अकबरी. “KI-BERT: उत्तम भाषा आणि डोमेन समजून घेण्यासाठी ज्ञानाचा संदर्भ अंतर्भूत करणे.” arXiv preprint arXiv:2104.08145 (2021).

[4] गौर, मानस, केयुर फालदू आणि अमित शेठ. “ब्लॅक-बॉक्सचे शब्दार्थ: ज्ञान आलेख सखोल शिक्षण प्रणालींना अधिक अर्थपूर्ण आणि स्पष्ट करण्यायोग्य बनविण्यात मदत करू शकतात?.” IEEE इंटरनेट संगणन 25, क्र. 1 (2021): 51-59.

[5] धवला, सोमा, चिराग भाटिया, जॉय बोस, केयूर फाल्दू आणि अदिती अवस्थी. “निदान मूल्यमापन आणि त्यांच्या गुणवत्ता मूल्यांकनाची स्वयं निर्मिती.” इंटरनॅशनल एज्युकेशनल डेटा मायनिंग सोसायटी (2020).

[6] फाल्दू, केयूर, अदिती अवस्थी आणि अचिंत थॉमस. “स्कोअर सुधारण्यासाठी आणि त्याच्या भागांसाठी अनुकूलन शिक्षण मशीन.” यू.एस. पेटंट 10,854,099, 1 डिसेंबर 2020 रोजी जारी केले.

[7] देसाई, निशित, केयुर फाल्दू, अचिंत थॉमस आणि अदिती अवस्थी. “मूल्यांकन पेपर तयार करण्यासाठी आणि त्याची गुणवत्ता मोजण्यासाठी प्रणाली आणि पद्धत.” यू.एस. पेटंट अर्ज 16/684,434, 1 ऑक्टोबर 2020 रोजी दाखल.

← AI होमवर परत जा