Saas द्वारे AI अनलॉक करत आहे
प्रेरणा
देशातील लाखो विद्यार्थी शैक्षणिक परिणाम प्राप्त करण्यासाठी Embibe चा वापर करून नियमितपणे बरेच काही शिकतात, खूपसराव करतात आणि स्वतःची परीक्षा घेतात. या प्रवासात त्यांना प्रश्न पडणे किंवा शंका उपस्थित होणे अपेक्षित आहे. म्हणून आम्ही शंका निरसन प्रोडक्ट बनवले आहे जेणेकरून हे सुनिश्चित होईल की विद्यार्थ्यांना नेहमीच प्रश्न विचारण्यासाठी प्रेरित केले जाते.
जसे की याचे नाव सूचित करते, हा असा प्लॅटफॉर्म आहे ज्याचे ध्येय विद्यार्थ्यांच्या शंका सोडवण्यात मदत करणे आहे. जरी ही मदत विषयामधील तज्ञाद्वारे प्रदान केली जात असली तरी, प्रत्यक्ष वेळेत, एकदम येणाऱ्या शंकांचे प्रमाण पाहता या तज्ञांना देखील सर्व शंकांचे निरसन वेळेत करणे खूप कठीण आहे. यामुळे प्रतीक्षेचा कालावधी वाढू शकतो आणि वापरकर्त्याला चांगल्या गुणवत्तेचा अनुभव मिळणार नाही.
संधी साधणे
शैक्षणिक सामग्रीमध्ये मोठ्या प्रमाणात प्रतिमा, समीकरणे आणि चिन्हे यांच्या स्वरुपात माहिती दिलेली असते. प्रतिमा आणि मजकूर या मधून अर्थपूर्ण माहिती मिळवणे आज ही डोमेनवर आधारित आणि कठीण कार्य आहे, ज्याच्यासाठी मोठ्या प्रमाणातील डेटासेट डोमेन विषयी ज्ञान आणि नैसर्गिक भाषा व उद्देशासाठी आधुनिक डीप लर्निंग दृष्टीकोन असणे आवश्यक आहे.
बहुतेक शंका-निरसन प्रोडक्ट समान प्रश्न प्रदान करण्यासाठी आणि प्रश्नासाठी उपलब्ध असलेल्या संदर्भाच्या आधारे प्रश्नांची उत्तरे देण्यास सक्षम सिस्टीम निर्माण करण्यासाठी उपलब्ध असलेल्या सामग्रीचा वापर करतात. Embibe मध्ये आमच्याकडे, प्रश्न संचांमध्ये लाखो प्रश्न आहेत. आम्ही प्रश्नाचा मजकूर, आकृत्या आणि चित्रे यांच्यामधील संदर्भित माहिती प्राप्त करण्यासाठी आमच्या शैक्षणिक सामग्रीसह फाईन-ट्यून केलेले अत्याधुनिक मॉडेल्स वापरतो.
शंका निरसन प्रोडक्टसह, कोणत्याही मानवी हस्तक्षेपाची गरज न भासत स्वयंचलितपणे 93% प्रश्नांची उत्तरे दिली जाऊ शकतात.
शंका निरसन सिस्टिम निर्माण करणे
आकृती मिळवणे:
शंकेचे निरसन करण्यात मदत करण्यासाठी, प्रश्नात प्रदान केलेले सर्व तपशील मिळवणे अतिशय महत्वाचे आहे. म्हणून आम्ही आकृती वेगळी काढणाऱ्या स्तराची रचना केली आहे, जेणेकरून वेगळी काढलेल्या आकृत्यांचा देखील समावेश अर्थपूर्ण समानतेच्या गणनेमध्ये केला जाईल. OCR मॉड्यूलमध्ये आकृती इनपुट म्हणून दिल्यास त्याचा गोंधळ होऊ शकतो म्हणून आम्ही प्रतिमेमधून आकृतीचा चौकोन काढून टाकतो जेणेकरून OCR प्रक्रियेसाठी हे सुलभ होते. शैक्षणिक डोमेनसाठी आमचे स्थानिक पातळीवर तयार केलेले आकृती वेगळी करण्याचे मॉडेल समान अचूकता प्राप्त करून प्रलंबितपणाच्या बाबतीत YOLOv5 i सारख्या क्लिष्ट मॉडेल्सना सहजपणे मागे टाकते.
ऑप्टिकल कॅरेक्टर रेकग्नेशन (OCR):
प्रतिमेमध्ये असलेल्या आकृत्या वेगळ्या काढल्यानंतर, प्रतिमेमध्ये असलेला मजकूर वेगळा काढण्यासाठी आम्ही OCR स्तर वापरतो. OCR ची कामगिरी सुधारण्यासाठी स्क्यू सुधारणे, शॅडो दूर करणे, रिझोल्यूशन वाढवणे आणि ब्लरनेस शोधणे यासारखी पूर्व-प्रक्रिया केली जाते.
प्रतिमा एनकोड करणे:
आम्ही ResNet आणि EfficientNet सारख्या आधुनिक कॉम्प्युटर विजन मॉडेल्सचा वापर करून आकृतीला डेन्स वेक्टरमध्ये एनकोड करतो जो प्रतिमेमध्ये उपलब्ध असलेली अर्थपूर्ण माहिती मिळवतो ज्यामुळे अर्थपूर्णरित्या समान असलेल्या प्रतिमा इतर कोणत्याही वेगळ्या प्रतिमेच्या तुलनेत एकमेकांच्या जास्त जवळ असतील.
मजकूर एनकोड करणे:
आम्ही ट्रीपलेस लॉससारख्या तंत्रांचा वापर करून आणि डेन्स वेक्टरचे प्रतिनिधित्व शिकलो आणि प्रश्न, उत्तरे व त्यांचे सविस्तर स्पष्टीकरण समाविष्ट असलेल्या आमच्या शैक्षणिक सामग्रीसंबधी मॉडेलचे प्रशिक्षण देऊन परस्पर माहिती वाढवणे शिकलो. आम्ही BERT आणि T5 सारखी पूर्व-प्रशिक्षित भाषा मॉडेल्सचा वापर केला. नंतर माही या OCR द्वारे वेगळ्या केलेल्या मजकुर डेन्स वेक्टरमध्ये बदलण्यासाठी एनकोडर मॉडेलचा वापर केला जे या शिवाय अर्थपूर्णरित्या समान प्रश्न विचारण्यासाठी देखील वापरले जाते.
समान प्रश्न मिळवणे:
आम्ही एनकोड केलेल्या प्रतिमा आणि मजकूर आमच्या प्रश्न संचामध्ये उपलब्ध असलेल्या सर्व प्रश्नांसह जुळवून पाहतो आणि टॉप-k समान प्रश्न मिळवतो. एखाद्या प्रश्नामध्ये प्रतिमा किती महत्वाची आहे याच्या आधारे आम्ही मजकूर आणि प्रतिमा दोन्ही उपस्थित असल्याची महत्वपूर्ण समानता मिळवण्यासाठी आम्ही वेगळे तंत्र देखील वापरतो. उपलब्ध असलेल्या लाखो रेकॉर्ड्सवर डेन्स वेक्टरसाठी समानता शोधणे महाग असू शकते. म्हणून, आम्ही शार्डिंग, बकेटिंग आणि क्लस्टरिंग दृष्टीकोन वापरतो जेणेकरून आमची सिस्टीम जास्त प्रमाणात प्रकट आणि कार्यक्षम बनेल.
विषय निर्दिष्ट पोस्ट प्रक्रिया:
आम्ही विषय निर्दिष्ट पोस्ट प्रक्रिया तंत्र वापरतो, जसे की, मजकूरामधील रासायनिक समीकरणे, गणिती पदावली हाताळणे. मजकूरामधील रासायनिक समीकरणे आणि रासायनिक चिन्हे अर्थपूर्णदृष्ट्या समान समीकरणे प्राप्त करण्यात महत्वाची भूमिका निभावतात.
संदर्भ:
[1] राफेल, कॉलीन, नोएम शाझीर, ॲडम रॉबर्ट्स, कॅथरीन ली, शरण नारंग, मायकल, मटीना, यांकी झोऊ, वि ली आणि पीटर जे. ल्यू.
"Exploring the limits of transfer learning with a unified text-to-text transformer." arXiv preprint
arXiv:1910.10683 (2019).
[2] डेवलीन, जॅकब, मिंग-वी चँग, केंटोन ली, क्रिस्टीना टोऊटानोवा. "Bert: Pre-training of deep bidirectional
transformers for language understanding." arXiv preprint arXiv:1810.04805 (2018).
Embibe: AI Powered Personalised Adaptive Learning & Outcomes Platform 6
[3] टॅन, मिंगझिंग आणि क्युक ले. "Efficientnet: Rethinking model scaling for convolutional neural networks."
In International Conference on Machine Learning, pp. 6105-6114. PMLR, 20
[4] फाल्डू, केयूर, अमित शेठ, प्रशांत किकानी आणि हेमांग अकबरी. "KI-BERT: Infusing Knowledge Context for Better
Language and Domain Understanding." arXiv preprint arXiv:2104.08145 (2021).
[5] गौर, मानस, केयूर फाल्डू आणि अमित शेठ. "Semantics of the Black-Box: Can knowledge graphs help
make deep learning systems more interpretable and explainable?." IEEE Internet Computing 25,
no. 1 (2021): 51-59.
[6] गौर, मानस, अंकित देसाई, केयूर फाल्डू आणि अमित शेठ. "Explainable AI Using Knowledge Graphs." In ACM
CoDS-COMAD Conference. 2020.
[7] शेठ, अमित, मानस गौर, कौशिक रॉय आणि केयूर फाल्डू. "Knowledge-intensive Language Understanding for
Explainable AI." IEEE Internet Computing 25, no. 5 (2021): 19-24.
[8] "#RAISE2020 – Embibe – AI-Powered learning outcomes platform for personalized education",
MyGov India, Oct 2020, https://www.youtube.com/watch?v=kuwFtHgN3qU
[9] फाल्डू, केयूर, अदिती अवस्थी आणि अचिंत थॉमस. "Adaptive learning machine for score improvement and
parts thereof." U.S. Patent 10,854,099, 1 डिसेंबर, 2020 रोजी लागू केले.
← AI होमवर परत जा