नॉलेज बडी: पढ़ाई में मदद करने वाला मित्र

Embibe, विद्यार्थियों की लर्निंग जर्नी को सशक्त बनाने के लिए प्रतिबद्ध है। ‘नॉलेज बडी’ आर्टिफिशियल इंटेलिजेंस पर आधारित चैटबॉट है। यह प्रश्नों के उत्तर देने और शंकाओं का समाधान कर विद्यार्थियों की लर्निंग को बेहतर बनाने में मदद करता है।

स्वत: प्रश्न निर्माण और उत्तर के​ लिए, डीप लर्निंग मॉडल के पूरक के तौर पर डोमेन का विस्तृत ज्ञान महत्वपूर्ण है। Embibe का नॉलेज ग्राफ, कॉन्टेंट इंटेलिजेंस की रीढ़ है। इसमें हजारों कांसेप्ट और दक्षताएं हैं, जो दस लाख से भी अधिक संबंधों का उपयोग करके परस्पर जुड़े हुए हैं।

नॉलेज बडी को संवादात्मक अर्टिफिशियल इंटेलिजेंस, स्टेट ऑफ द आर्ट लैंग्वेज और विज़न मॉडल का उपयोग करके बनाया गया है। यह बुद्धिमत्तापूर्ण संवाद के लिए, अकादमिक नॉलेज ग्राफ से मिले संदर्भित ज्ञान को डीप लर्निंग मॉडल में समाहित करता है।

नॉलेज बडी विद्यार्थियों को निम्नलिखित क्षमताएं प्रदान करता है:

  1. यह विद्यार्थियों के लर्निंग आउटकम के मूल्यांकन के लिए, उनके लर्निंग हिस्ट्री के आधार पर प्रश्नों को स्वत: निर्मित कर उनसे सवाल करता है। 
  2. विद्या​र्थी के लर्निंग के दौरान उसके सवालों का जवाब देता है।
  3. यूजर की पसंदीदा स्थानीय भाषा में प्रश्नों और उत्तर का स्वतः अनुवाद करता है।

नॉलेज बडी की क्षमताओं के उदाहरण चित्र 1 में दिखाए गए हैं।

प्रश्न को जेनरेट करना (QG)

प्रश्नों के स्वत: सृजन की क्षमता, विद्यार्थियों को जोड़े रखने और कांसेप्ट पर उनके महारत के आकलन का अवसर देते हैं। हमने T5, UniLM जैसे अत्याधुनिक भाषा मॉडलों का विस्तार किया है। साथ ही, उन्हें ARC, DROP, QASC, SciQ, SciTail, SQUAD, HotpotQA जैसे उपलब्ध शोधपरक डेटासेट के साथ प्रशिक्षित किया है। हम कई प्रकार के प्रश्न निर्माण के विभिन्न मॉडलों जैसे कि बूलियन, स्पैन-आधारित, रिक्त स्थान भरें, बहुविकल्पीय प्रश्न आदि का भी उपयोग करते हैं। हम KI-BERT [3] जैसे आर्किटेक्चर के साथ शैक्षणिक नॉलेज ग्राफ से नॉलेज इंफ्यूजन का लाभ उठाते हैं। हम यह भी सुनिश्चित करते हैं कि नॉलेज ग्राफ[4][6][7] की मदद से मॉडल बेहतर व्याख्या योग्य और बोधगम्य हो। हमारे मॉडल यूनिट अवेयर अटेंशन मैकेनिज्म की सहायता से मल्टी-हॉप प्रश्न भी उत्पन्न करते हैं। प्रश्न निर्माण मॉडल, लर्निंग संदर्भ को इनपुट के रूप में लेता है, वांछित प्रश्न प्रकार के लिए संकेत देता है, और अन्य प्रश्न प्रकार विशिष्ट मेटाडेटा इनपुट के रूप में लेता है। हम प्रश्न उत्पन्न करने के लिए बीम सर्च और न्यूक्लियस सैंपलिंग विधियों का उपयोग करते हैं।

प्रश्न का उत्तर देना (QA)

विद्यार्थियों की लर्निंग जर्नी तब ही सकारात्मक रूप से प्रभावित होती है, जब उन्हें व्यस्त रखने वाली त्वरित प्रश्न-उत्तर की क्षमता से युक्त प्रणाली हो। यह तभी संभव है जब उन्हें प्रश्नों का त्वरित उत्तर मिले। नॉलेज बडी, विद्यार्थियों को कोई भी प्रश्न पूछने का अधिकार देता है और जवाब के लिए प्रश्न-उत्तर मॉडल का उपयोग करता है। प्रश्न-उत्तर मॉडल को पूर्व-प्रशिक्षित भाषा मॉडल जैसे कि T5, UniLM आदि की मदद से प्रशिक्षित किया जाता है और पिछले अनुभागों में उल्लिखित रिसर्च डेटासेट, और Embibe के डेटासेट के साथ ठीक से ट्यून किया जाता है। यूजर, विभिन्न संदर्भ प्रकारों जैसे कि चयनित टेक्स्ट, अध्याय, किसी पुस्तक या पाठ्यक्रम से प्रश्न पूछ सकते हैं। हमारी प्रश्न-उत्तर प्रणाली गहन वेक्टर सिमेंटिक समानता का उपयोग करके, संदर्भ-प्रकारों के आधार पर प्रासंगिक संदर्भ का चयन करती है और उत्तर का अनुमान लगाने के लिए एक प्रश्न-उत्तर मॉडल को आमंत्रित करती है। फीडबैक लूप लगातार हमारे मॉडल को बेहतर बनाने में मदद करता है। हमारा प्रश्न-उत्तर मॉडल इतना उन्नत है कि यह NEET प्रवेश परीक्षा को स्वतः ही पास कर सकता है।

स्थानीय भाषाओं में अनुवाद (VT)

नॉलेज बडी कई भाषाओं का समर्थन करता है। यह यूजर की प्राथमिकताओं के आधार पर किसी भी स्थानीय भाषा में पूरा संवाद कर सकता है। यह किसी भी पूर्व-निर्धारित भाषा में स्वचालित रूप से प्रश्न पूछ सकता है, और उसी भाषा में उत्तरों का मूल्यांकन भी कर सकता है। हम मूल रूप से विकसित NMT मॉडल का उपयोग करते हैं जो सामान्य अनुवाद के लिए अन्य उपलब्ध ऑफ-द-शेल्फ मोड से बेहतर प्रदर्शन करता है। फिलहाल, हमारा चैटबॉट 11 भारतीय भाषाओं में काम करता है, जिसमें हिंदी, गुजराती, मराठी, तमिल, तेलुगु, बंगाली, कन्नड़, असमिया, उड़िया, पंजाबी और मलयालम शामिल हैं। हमारे मूल रूप से विकसित मॉडल, शैक्षणिक डोमेन विशिष्टता के कारण गूगल ट्रांसलेट जैसे तृतीय पक्ष API से बेहतर प्रदर्शन करते हैं।

हम तालिका 1 में कुछ उदाहरण देख सकते हैं, जहाँ हमारा अनुवाद Google ट्रांसलेट से बेहतर है:

अंग्रेजीGoogle ट्रांसलेट नॉलेज बडी अनुवाद 
which of the following law was given by Einstein:निम्नलिखित में से कौन सा कानून आइंस्टीन द्वारा दिया गया था:निम्नलिखित में से कौन सा नियम आइंस्टीन द्वारा दिया गया था:
which one of the following is not alkaline earth metal?निम्नलिखित में से कौन क्षारीय पृथ्वी धातु नहीं हैनिम्नलिखित में से कौन सा क्षारीय मृदा धातु नहीं है?
Endogenous antigens are produced by intra-cellular bacteria within a host cell.अंतर्जात प्रतिजन एक मेजबान कोशिका के भीतर इंट्रा-सेलुलर बैक्टीरिया द्वारा निर्मित होते हैं।अंतर्जात प्रतिजन एक परपोषी कोशिका के भीतर अंत: कोशिकीय जीवाणु द्वारा उत्पन्न किए जाते हैं।
तालिका 1: Embibe की अनुवाद क्षमताओं को प्रदर्शित करने वाले उदाहरण।

संक्षेप में, संवादात्मक AI आधारित चैटबॉट नॉलेज बडी, विद्यार्थियों के लर्निंग आउटकम में मदद करता है। इसमें विद्यार्थियों की लर्निंग जर्नी को सकारात्मक रूप से प्रभावित करने की क्षमता है। यह प्रत्येक लर्निंग सत्र के बाद विद्यार्थियों की मदद कर सकता है, जहां विद्यार्थी अपनी मूल भाषा में प्रश्न पूछ सकते हैं और अपनी शंकाओं का समाधान प्राप्त कर सकते हैं। नॉलेज बडी, हमारे NLU प्लेटफॉर्म मेधास द्वारा संचालित है, जो डोमेन की ज्ञानात्मकता, [3][4][6][7][8] विवेचना और व्याख्या के मूलभूत सिद्धांतों पर आधारित है।

सन्दर्भ:

[1] Raffel, Colin, Noam Shazeer, Adam Roberts, Katherine Lee, Sharan Narang, Michael Matena, Yanqi Zhou, Wei Li, and Peter J. Liu. “Exploring the limits of transfer learning with a unified text-to-text transformer.” arXiv preprint arXiv:1910.10683 (2019).

[2] Dong, Li, Nan Yang, Wenhui Wang, Furu Wei, Xiaodong Liu, Yu Wang, Jianfeng Gao, Ming Zhou, and Hsiao-Wuen Hon. “Unified language model pre-training for natural language understanding and generation.” arXiv preprint arXiv:1905.03197 (2019).

[3] Faldu, Keyur, Amit Sheth, Prashant Kikani, and Hemang Akabari. “KI-BERT: Infusing Knowledge Context for Better Language and Domain Understanding.” arXiv preprint arXiv:2104.08145 (2021).

[4] Gaur, Manas, Keyur Faldu, and Amit Sheth. “Semantics of the Black-Box: Can knowledge graphs help make deep learning systems more interpretable and explainable?.” IEEE Internet Computing 25, no. 1 (2021): 51-59.

[5] Zhu, Fengbin, Wenqiang Lei, Chao Wang, Jianming Zheng, Soujanya Poria, and Tat-Seng Chua. “Retrieving and reading: A comprehensive survey on open-domain question answering.” arXiv preprint arXiv:2101.00774 (2021).

[6] Gaur, Manas, Ankit Desai, Keyur Faldu, and Amit Sheth. “Explainable AI Using Knowledge Graphs.” In ACM CoDS-COMAD Conference. 2020.

[7] Sheth, Amit, Manas Gaur, Kaushik Roy, and Keyur Faldu. “Knowledge-intensive Language Understanding for Explainable AI.” IEEE Internet Computing 25, no. 5 (2021): 19-24.

[8] “[Tutorial] Explainable AI using Knowledge Graphs”, YouTube, ACM SIGKDD India Chapter, Jan 2021, https://www.youtube.com/watch?v=f1sahXYDjRI

[9] “#RAISE2020 – Embibe – AI-Powered learning outcomes platform for personalized education”, MyGov India, Oct 2020, https://www.youtube.com/watch?v=kuwFtHgN3qU               

← AI होम पर वापस जाएं