प्रेरणा

देशातील लाखो विद्यार्थी शैक्षणिक परिणाम प्राप्त करण्यासाठी Embibe चा वापर करून नियमितपणे बरेच काही शिकतात, खूपसराव करतात आणि स्वतःची परीक्षा घेतात. या प्रवासात त्यांना प्रश्न पडणे किंवा शंका उपस्थित होणे अपेक्षित आहे. म्हणून आम्ही शंका निरसन प्रोडक्ट बनवले आहे जेणेकरून हे सुनिश्चित होईल की विद्यार्थ्यांना नेहमीच प्रश्न विचारण्यासाठी प्रेरित केले जाते.

जसे की याचे नाव सूचित करते, हा असा प्लॅटफॉर्म आहे ज्याचे ध्येय विद्यार्थ्यांच्या शंका सोडवण्यात मदत करणे आहे. जरी ही मदत विषयामधील तज्ञाद्वारे प्रदान केली जात असली तरी, प्रत्यक्ष वेळेत, एकदम येणाऱ्या शंकांचे प्रमाण पाहता या तज्ञांना देखील सर्व शंकांचे निरसन वेळेत करणे खूप कठीण आहे. यामुळे प्रतीक्षेचा कालावधी वाढू शकतो आणि वापरकर्त्याला चांगल्या गुणवत्तेचा अनुभव मिळणार नाही.

संधी साधणे

शैक्षणिक सामग्रीमध्ये मोठ्या प्रमाणात प्रतिमा, समीकरणे आणि चिन्हे यांच्या स्वरुपात माहिती दिलेली असते. प्रतिमा आणि मजकूर या मधून अर्थपूर्ण माहिती मिळवणे आज ही डोमेनवर आधारित आणि कठीण कार्य आहे, ज्याच्यासाठी मोठ्या प्रमाणातील डेटासेट डोमेन विषयी ज्ञान आणि नैसर्गिक भाषा व उद्देशासाठी आधुनिक डीप लर्निंग दृष्टीकोन असणे आवश्यक आहे.

बहुतेक शंका-निरसन प्रोडक्ट समान प्रश्न प्रदान करण्यासाठी आणि प्रश्नासाठी उपलब्ध असलेल्या संदर्भाच्या आधारे प्रश्नांची उत्तरे देण्यास सक्षम सिस्टीम निर्माण करण्यासाठी उपलब्ध असलेल्या सामग्रीचा वापर करतात. Embibe मध्ये आमच्याकडे, प्रश्न संचांमध्ये लाखो प्रश्न आहेत. आम्ही प्रश्नाचा मजकूर, आकृत्या आणि चित्रे यांच्यामधील संदर्भित माहिती प्राप्त करण्यासाठी आमच्या शैक्षणिक सामग्रीसह फाईन-ट्यून केलेले अत्याधुनिक मॉडेल्स वापरतो.

शंका निरसन प्रोडक्टसह, कोणत्याही मानवी हस्तक्षेपाची गरज न भासत स्वयंचलितपणे 93% प्रश्नांची उत्तरे दिली जाऊ शकतात.

शंका निरसन सिस्टिम निर्माण करणे

आकृती 1: शंका निरसन सिस्टीमचा ब्लॉक डायग्राम

आकृती मिळवणे:

शंकेचे निरसन करण्यात मदत करण्यासाठी, प्रश्नात प्रदान केलेले सर्व तपशील मिळवणे अतिशय महत्वाचे आहे. म्हणून आम्ही आकृती वेगळी काढणाऱ्या स्तराची रचना केली आहे, जेणेकरून वेगळी काढलेल्या आकृत्यांचा देखील समावेश अर्थपूर्ण समानतेच्या गणनेमध्ये केला जाईल. OCR मॉड्यूलमध्ये आकृती इनपुट म्हणून दिल्यास त्याचा गोंधळ होऊ शकतो म्हणून आम्ही प्रतिमेमधून आकृतीचा चौकोन काढून टाकतो जेणेकरून OCR प्रक्रियेसाठी हे सुलभ होते. शैक्षणिक डोमेनसाठी आमचे स्थानिक पातळीवर तयार केलेले आकृती वेगळी करण्याचे मॉडेल समान अचूकता प्राप्त करून प्रलंबितपणाच्या बाबतीत YOLOv5 i सारख्या क्लिष्ट मॉडेल्सना सहजपणे मागे टाकते.

ऑप्टिकल कॅरेक्टर रेकग्नेशन (OCR):

प्रतिमेमध्ये असलेल्या आकृत्या वेगळ्या काढल्यानंतर, प्रतिमेमध्ये असलेला मजकूर वेगळा काढण्यासाठी आम्ही OCR स्तर वापरतो. OCR ची कामगिरी सुधारण्यासाठी स्क्यू सुधारणे, शॅडो दूर करणे, रिझोल्यूशन वाढवणे आणि ब्लरनेस शोधणे यासारखी पूर्व-प्रक्रिया केली जाते.

प्रतिमा एनकोड करणे:

आम्ही ResNet आणि EfficientNet सारख्या आधुनिक कॉम्प्युटर विजन मॉडेल्सचा वापर करून आकृतीला डेन्स वेक्टरमध्ये एनकोड करतो जो प्रतिमेमध्ये उपलब्ध असलेली अर्थपूर्ण माहिती मिळवतो ज्यामुळे अर्थपूर्णरित्या समान असलेल्या प्रतिमा इतर कोणत्याही वेगळ्या प्रतिमेच्या तुलनेत एकमेकांच्या जास्त जवळ असतील.

मजकूर एनकोड करणे:

आम्ही ट्रीपलेस लॉससारख्या तंत्रांचा वापर करून आणि डेन्स वेक्टरचे प्रतिनिधित्व शिकलो आणि प्रश्न, उत्तरे व त्यांचे सविस्तर स्पष्टीकरण समाविष्ट असलेल्या आमच्या शैक्षणिक सामग्रीसंबधी मॉडेलचे प्रशिक्षण देऊन परस्पर माहिती वाढवणे शिकलो. आम्ही BERT आणि T5 सारखी पूर्व-प्रशिक्षित भाषा मॉडेल्सचा वापर केला. नंतर माही या OCR द्वारे वेगळ्या केलेल्या मजकुर डेन्स वेक्टरमध्ये बदलण्यासाठी एनकोडर मॉडेलचा वापर केला जे या शिवाय अर्थपूर्णरित्या समान प्रश्न विचारण्यासाठी देखील वापरले जाते.

समान प्रश्न मिळवणे:

आम्ही एनकोड केलेल्या प्रतिमा आणि मजकूर आमच्या प्रश्न संचामध्ये उपलब्ध असलेल्या सर्व प्रश्नांसह जुळवून पाहतो आणि टॉप-k समान प्रश्न मिळवतो. एखाद्या प्रश्नामध्ये प्रतिमा किती महत्वाची आहे याच्या आधारे आम्ही मजकूर आणि प्रतिमा दोन्ही उपस्थित असल्याची महत्वपूर्ण समानता मिळवण्यासाठी आम्ही वेगळे तंत्र देखील वापरतो. उपलब्ध असलेल्या लाखो रेकॉर्ड्सवर डेन्स वेक्टरसाठी समानता शोधणे महाग असू शकते. म्हणून, आम्ही शार्डिंग, बकेटिंग आणि क्लस्टरिंग दृष्टीकोन वापरतो जेणेकरून आमची सिस्टीम जास्त प्रमाणात प्रकट आणि कार्यक्षम बनेल.

विषय निर्दिष्ट पोस्ट प्रक्रिया:

आम्ही विषय निर्दिष्ट पोस्ट प्रक्रिया तंत्र वापरतो, जसे की, मजकूरामधील रासायनिक समीकरणे, गणिती पदावली हाताळणे. मजकूरामधील रासायनिक समीकरणे आणि रासायनिक चिन्हे अर्थपूर्णदृष्ट्या समान समीकरणे प्राप्त करण्यात महत्वाची भूमिका निभावतात.

संदर्भ:

[1] राफेल, कॉलीन, नोएम शाझीर, ॲडम रॉबर्ट्स, कॅथरीन ली, शरण नारंग, मायकल, मटीना, यांकी झोऊ, वि ली आणि पीटर जे. ल्यू.

"Exploring the limits of transfer learning with a unified text-to-text transformer." arXiv preprint

arXiv:1910.10683 (2019).

[2] डेवलीन, जॅकब, मिंग-वी चँग, केंटोन ली, क्रिस्टीना टोऊटानोवा. "Bert: Pre-training of deep bidirectional

transformers for language understanding." arXiv preprint arXiv:1810.04805 (2018).

Embibe: AI Powered Personalised Adaptive Learning & Outcomes Platform 6

[3] टॅन, मिंगझिंग आणि क्युक ले. "Efficientnet: Rethinking model scaling for convolutional neural networks."

In International Conference on Machine Learning, pp. 6105-6114. PMLR, 20

[4] फाल्डू, केयूर, अमित शेठ, प्रशांत किकानी आणि हेमांग अकबरी. "KI-BERT: Infusing Knowledge Context for Better

Language and Domain Understanding." arXiv preprint arXiv:2104.08145 (2021).

[5] गौर, मानस, केयूर फाल्डू आणि अमित शेठ. "Semantics of the Black-Box: Can knowledge graphs help

make deep learning systems more interpretable and explainable?." IEEE Internet Computing 25,

no. 1 (2021): 51-59.

[6] गौर, मानस, अंकित देसाई, केयूर फाल्डू आणि अमित शेठ. "Explainable AI Using Knowledge Graphs." In ACM

CoDS-COMAD Conference. 2020.

[7] शेठ, अमित, मानस गौर, कौशिक रॉय आणि केयूर फाल्डू. "Knowledge-intensive Language Understanding for

Explainable AI." IEEE Internet Computing 25, no. 5 (2021): 19-24.

[8] "#RAISE2020 – Embibe – AI-Powered learning outcomes platform for personalized education",

MyGov India, Oct 2020, https://www.youtube.com/watch?v=kuwFtHgN3qU

[9] फाल्डू, केयूर, अदिती अवस्थी आणि अचिंत थॉमस. "Adaptive learning machine for score improvement and

parts thereof." U.S. Patent 10,854,099, 1 डिसेंबर, 2020 रोजी लागू केले.

← AI होमवर परत जा