सवालों और शंकाओं का समाधान

हमारी प्रेरणा

देश भर में लाखों विद्यार्थी, Embibe का उपयोग रहे हैं और नई चीजों को सीखने के लिए कड़ी मेहनत कर रहे हैं। इस प्लेटफॉर्म पर प्रैक्टिस सेट को हल करने और खुद का मूल्यांकन करने की सुविधा उपलब्ध है, ताकि लक्ष्य को हासिल करने में आने वाली किसी भी परेशानी से वह समय रहते निपट सकें। इस प्रक्रिया में विद्यार्थियों के मन में सवालों और शंकाओं का पैदा होना अपेक्षित है। यही वजह है कि हमने अपने प्रोडक्ट में विद्यार्थियों की समस्याओं के समाधान का उपाय पहले से ही कर रखा है। हम, विद्यार्थियों में जिज्ञासा की प्रवृत्ति को प्रोत्साहित करने में विश्वास करते हैं।

इस लेख के शीर्षक से ही स्पष्ट है कि हमारे प्लेटफॉर्म का लक्ष्य विद्यार्थियों के सवालों और शंकाओं के समाधान में उनकी सहायता करना है। शंकाओं के समाधान का एक रास्ता है कि प्रत्येक विद्यार्थी, संबंधित विषय के विशेषज्ञ से संपर्क करे। हालांकि, व्यावहारिक तौर पर किसी भी अध्यापक या विषय विशेषज्ञ के लिए प्रत्येक विद्यार्थी के सवालों या शंकाओं को सुनने और समाधान देने में समय की अनावश्यक बर्बादी होगी। ऐसा करने पर सवालों की लंबी सूची बन जाएगी और समाधान के लिए विद्यार्थियों को लंबा इंतज़ार करना पड़ेगा।

अवसर का लाभ उठाना

अधिकांश शैक्षणिक सामग्री में ऐसी जानकारी शामिल होती है जो प्रतिबिंबों, समीकरणों और प्रतीकों में छिपी होती है। प्रतिबिंबों और टेक्स्ट से समझने योग्य जानकारी निकालना अभी भी एक डोमेन-निर्भर और कठिन कार्य है। इसके लिए बड़े डेटासेट, डोमेन का विशिष्ट ज्ञान, और प्राकृतिक भाषा तथा दृष्टि के लिए अत्याधुनिक गहन शिक्षण दृष्टिकोण की आवश्यकता होती है।

अधिकांश डाउट-रेजोलुशन प्रोडक्ट, पहले से मौजूद सामग्री के आधार पर प्रश्न बनाते हैं। इसके अलावा, प्रश्नों का उत्तर देने के लिए प्रश्न के आसपास उपलब्ध संदर्भ के आधार पर उत्तर देने वाली प्रणाली का निर्माण करते हैं। Embibe में, हमारे पास लाखों प्रश्नों का प्रश्न बैंक मौजूद है। हम स्टेट ऑफ द आर्ट मॉडल का प्रभावी ढंग से इस्तेमाल करते हैं, ताकि उपलब्ध शैक्षणिक सामग्री के आधार पर प्रश्नों और मौजूदा आरेख या आँकडों के बारे में संदर्भ के मुताबिक जानकारी हासिल की जा सके।

डाउट-रेजोलुशन प्रोडक्ट की मदद से 93% प्रश्नों का स्वचालित उत्तर प्राप्त होता है। इसके लिए, किसी तरह के मानवीय हस्तक्षेप की आवश्यकता नहीं पड़ती।

डाउट रेजोलुशन प्रणाली का निर्माण  

आकृति 1: डाउट रेजोलुशन प्रणाली का ब्लॉक आरेख

आरेख निष्कर्षण:

किसी भी प्रश्न के तुरंत समाधान के लिए ज़रूरी है कि प्रश्न के आसपास दी गई सभी जानकारी को इकट्ठा किया जाए। साथ ही, हम डायग्राम एक्स्ट्रैक्शन लेयर का भी इस्तेमाल करते हैं, ताकि आरेख के बीच समानताओं के आधार पर कंप्यूटिंग को सुनिश्चित किया जा सके। OCR मॉड्यूल के इनपुट में आरेख की उपस्थिति इसे भ्रमित कर सकती है। हम आरेख बाउंडिंग बॉक्स को हटाने के लिए प्रतिबिंब को प्रोसेस करते हैं, जो OCR प्रोसेसिंग को आसान बना देती है। अकादमिक-डोमेन के लिए हमने ‘आँकड़ा निष्कर्षण मॉडल’ का विकास किया है। यह YOLOv5 जैसे जटिल मॉडल में भी समान सटीकता के साथ परिणाम देती है।

ऑप्टिकल कैरेक्टर रिकग्निशन (OCR):

प्रतिबिम्ब में मौजूद आँकड़े निकालने के बाद, उसमें मौजूद टेक्स्ट को निकालने और पार्स करने के लिए OCR परत का उपयोग करते हैं ताकि, बाद के चरण में इसका उपयोग किया जा सके। OCR प्रदर्शन को बेहतर बनाने के लिए स्क्यू करेक्शन, रेमोविंग शैडो, एन्हान्सिंग रिज़ॉल्यूशन, और डिटेक्टिंग ब्लर जैसे प्रीप्रोसेसिंग चरण लागू किए जाते हैं।

प्रतिबिंब एन्कोडिंग:

हम प्रतिबिंबों में मौजूद अर्थ संबंधी जानकारी को कैप्चर करने वाले डेंस वेक्टर में आँकड़ों को एन्कोड करने के लिए ResNet, और EfficientNet जैसे अत्याधुनिक कंप्यूटर विज़न मॉडल का उपयोग करते हैं, ताकि शब्दार्थ रूप से समान प्रतिबिंब कुछ अलग प्रतिबिंबों की तुलना में एक-दूसरे के अधिक निकट हों।

टेक्स्ट एन्कोडिंग:

हम प्रश्न टेक्स्ट्, उत्तर और उनके विस्तृत स्पष्टीकरण से युक्त हमारे अकादमिक निगम पर मॉडल को प्रशिक्षित करके ट्रिपल लॉस और पारस्परिक सूचना अधिकतमकरण जैसी तकनीकों का लाभ उठाकर डेंस वेक्टर निरूपण सीखते हैं। हम BERT, और T5 जैसे पूर्व-प्रशिक्षित भाषा मॉडल का लाभ उठाते हैं। फिर हम इस एन्कोडर मॉडल का उपयोग OCR टेक्स्ट निष्कर्षण को डेंस वैक्टर में बदलने के लिए करते हैं, जिसका उपयोग आगे समानार्थक प्रश्नों को पुनः प्राप्त करने के लिए किया जाता है।

समान प्रकार के प्रश्नों को पुनः प्राप्त करना:

हम अपने प्रश्न बैंक में मौजूद सभी प्रश्नों से एन्कोडेड प्रतिबिंबों और टेक्स्ट की तुलना करते हैं और टॉप-k समान प्रश्नों को पुनः प्राप्त करते हैं। यदि किसी प्रश्न में प्रतिबिंब के महत्व के आधार पर टेक्स्ट और प्रतिबिंब दोनों मौजूद हैं तो हम भारित समानता लेने के लिए तकनीकों का भी उपयोग करते हैं। लाखों रिकॉर्ड से अधिक डेंस वैक्टर की कोज्या समानता करना कठिन है। इसलिए, हम अपने सिस्टम के प्रदर्शन को बेहतर बनाने के लिए शार्डिंग, बकेटिंग और क्लस्टरिंग दृष्टिकोण का इस्तेमाल करते हैं।

विषय विशिष्ट पोस्ट प्रोसेसिंग:

हम विषय विशिष्ट पोस्ट प्रोसेसिंग तकनीकों का उपयोग करते हैं, जैसे कि टेक्स्ट में मौजूद रासायनिक समीकरण, गणितीय व्यंजक को हल करना। टेक्स्ट में मौजूद रासायनिक समीकरण और रासायनिक तत्व जैसे शब्दार्थ समान प्रश्नों को पुनः प्राप्त करने में महत्वपूर्ण भूमिका निभाते हैं।

डेमो वीडियो

सन्दर्भ:

[1] Raffel, Colin, Noam Shazeer, Adam Roberts, Katherine Lee, Sharan Narang, Michael Matena, Yanqi Zhou, Wei Li, and Peter J. Liu. “Exploring the limits of transfer learning with a unified text-to-text transformer.” arXiv preprint arXiv:1910.10683  (2019).

[2] Devlin, Jacob, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova. “Bert: Pre-training of deep bidirectional transformers for language understanding.” arXiv preprint arXiv:1810.04805  (2018).

[3] Tan, Mingxing, and Quoc Le. “Efficientnet: Rethinking model scaling for convolutional neural networks.” In International Conference on Machine Learning , pp. 6105-6114. PMLR, 20

[4] Faldu, Keyur, Amit Sheth, Prashant Kikani, and Hemang Akabari. “KI-BERT: Infusing Knowledge Context for Better Language and Domain Understanding.” arXiv preprint arXiv:2104.08145 (2021).

[5] Gaur, Manas, Keyur Faldu, and Amit Sheth. “Semantics of the Black-Box: Can knowledge graphs help make deep learning systems more interpretable and explainable?.” IEEE Internet Computing 25, no. 1 (2021): 51-59.

[6] Gaur, Manas, Ankit Desai, Keyur Faldu, and Amit Sheth. “Explainable AI Using Knowledge Graphs.” In ACM CoDS-COMAD Conference. 2020.

[7] Sheth, Amit, Manas Gaur, Kaushik Roy, and Keyur Faldu. “Knowledge-intensive Language Understanding for Explainable AI.” IEEE Internet Computing 25, no. 5 (2021): 19-24.

[8] “#RAISE2020 – Embibe – AI-Powered learning outcomes platform for personalized education”, MyGov India, Oct 2020,   https://www.youtube.com/watch?v=kuwFtHgN3qU

[9] Faldu, Keyur, Aditi Avasthi, and Achint Thomas. “Adaptive learning machine for score improvement and parts thereof.” U.S. Patent 10,854,099, issued December 1, 2020.

← AI होम पर वापस जाएं