हव्या असलेल्या जटिलतेच्या प्रश्नांची स्वयंचलित निर्मिती

हव्या असलेल्या जटिलतेच्या प्रश्नांची स्वयंचलित निर्मिती

Embibe म्हणजे शिक्षणाचे वैयक्तिकरण आहे आणि आमचे तंत्रज्ञान योग्य सामग्री, योग्य विद्यार्थ्याला आणि योग्य वेळी उपलब्ध करून देण्यास तत्पर आहे. याच कारणामुळे आमच्यासाठी वापरण्याजोगा  मोठा माहिती साठा वापरायला मिळणे आणि विशेषतः प्रश्न आमच्यासाठी खूपच महत्त्वाचे आहे. मागील काळामध्ये, Embibe चा प्रश्नाचा साठा मानवी माहिती प्रविष्ट करणाऱ्यांद्वारे तयार करण्यात आला होता.  

प्रश्न स्वयंचलित रित्या निर्माण करण्यामागील मूळ प्रेरणा विद्यार्थी शिक्षकांवर/मार्गदर्शकांवर अवलंबून असणे कमी करणे ही आहे. लाखो विद्यार्थ्यांपर्यंत शिक्षण पोहोचविण्यासाठी विद्यार्थी कोणतीही बाह्य मदत न घेता संकल्पना/धड्यांचा सराव करू शकले पाहिजेत आणि त्यांना त्यांची प्रगती मोजता आली पाहिजे. अमर्याद प्रश्न बुद्धिमत्ता मूल्यांकन निर्मिती [3], विद्यार्थी निदान करणे [4], किंवा शिकण्याच्या निष्पत्तीसाठी वैयक्तिकृत सामग्रीची सेवा देणे [5][6]. प्रश्न स्वयंचलित रित्या तयार करणे आणि विद्यार्थ्यांना सराव आणि त्यांची प्रगती स्वमूल्यांकीत करू देणे हे त्या दिशेने टाकलेले पाऊल आहे.

तसेच, आमच्या प्लॅटफॉर्मवर विद्यार्थ्यांना ज्या विषयामध्ये सुधारणा करायची आहे त्याचे प्रश्न कमी पडू नयेत याची खात्री करण्यासाठी Embibe असे AI विकसित करण्यामध्ये गुंतवणूक करत आहे जे नवीन प्रश्न आणि त्यांची उत्तरे स्वयंचलित रित्या निर्माण करेल. या कामासाठी कंटेंट क्लस्टरिंग, टॉपिक मॉडेलिंग, कटींग एज नॅचरल लँग्वेज जनरेशन(NLG) आणि सॉल्व्हर तंत्रज्ञान यांद्वारे कल्पना घेण्याचा समावेश आहे.

उद्देश

आम्ही Embibe येथे प्रॅक्टिसद्वारे शिकणे आणि प्रश्नांची उत्तरे देऊन कॉन्सेप्टवर प्रभुत्व मिळविणे यासाठी एक रचना मांडत आहोत जी कॉन्सेप्ट लक्षात ठेवत समजून घेण्याचा अप्रत्यक्ष मार्ग आहे. स्वयंचलित प्रश्न निर्माण करणे ही अशी एक प्रक्रिया आहे जी शिकण्याचा मजकूर इनपुट म्हणून घेते आणि त्यामधून प्रश्न निर्माण करते ज्यावर विद्यार्थी आपले ज्ञान सरावासाठी आणि शिकण्यासाठी अजमावू शकतात.

स्वयंचलित प्रश्न निर्माण हा नॅचरल लँग्वेज प्रोसेसिंग (NLP) कहा एक भाग आहे. हा संशोधनाचा एक भाग आहे जेथे अनेक संशोधकांनी त्यांचे काम प्रदर्शित केले आहे. याला अजून उच्च अचूकता गाठायची आहे. अनेक संशोधकांनी स्वयंचलित प्रश्न निर्मितीच्या क्षेत्रामध्ये NLP द्वारे काम केले आहे आणि अनेक विविध प्रकारचे प्रश्न स्वयंचलितपणे निर्माण करण्यासाठी मॉडेल्स ची रचना केली गेली आहे.

दृष्टिकोन

आकृती 1 मध्ये दर्शविलेली आकृति स्वयंचलित प्रश्न निर्मितीच्या स्थापत्त्याचा उच्च स्तरावरील दृष्टिकोन दर्शवते. स्वयंचलित प्रश्न निर्माण NLP तंत्रासह ट्रान्सफॉर्मर मॉडेल्स चे अत्याधुनिक रूप वापरते. हे मजकुरच्या सिंटॅक्टीक आणि सिमॅंटिक समजुतीवरील संशोधनाला निर्मित प्रश्नांची गुणवत्ता आणि जटिलता वाढविण्यासाठी चालना देते.   

आकृती 1. स्वयंचलित प्रश्न निर्मितीचे उच्च स्तरीय स्थापत्त्य

स्वयंचलित प्रश्न निर्मितीमध्ये अनेक घटक अंतर्भूत आहेत जसे की मजकूर प्रक्रिया, वैशिष्ट्ये बाजूला काढणे आणि इंजिनिअरिंग, मॉडेल निर्मिती आणि प्रशिक्षण, मॉडेल मूल्यांकन, अ‍ॅनोटेशन आणि काही सामान्य ML तंत्रे.

आम्ही 20+ विविध ओपन सोर्स माहिती स्त्रोत जसे की ARC, DROP, QASC, SciQ, SciTail, SQuAD and Google NQ Embibe च्या मालकीचे माहिती संच आमच्या QA मॉडेलला प्रशिक्षित करण्यासाठी वापरले आहेत. आम्ही विविध प्रकारचे प्रश्न जसे की द्विपर्यायी, विस्तारीत, रिकाम्या जागा भरा, बहूपर्यायी प्रश्न, इत्यादी वापरले आहेत. प्रश्नांचे काठीण्य प्रश्नाची सिंटॅक्टीक रचना, उत्तर काढण्यासाठी गरजेचा मल्टी-हॉप तर्क, आणि अधोरेखित संकल्पनेची जटिलता यावरून काढलेले असते. आम्ही संबंधित ज्ञान KI-BERT[1] द्वारे प्रेरित QG मॉडेल मध्ये भरण्यासाठी ज्ञान आलेखसुद्धा वापरत आहोत. आम्ही प्रश्न निर्मिती कामगिरी सुधारण्यासाठी आमच्याकडे बनवलेल्या नॅचरल लँग्वेज अंडरस्टॅण्डिंग टेक्निक्स देऊ करतो.  

मजकूर निर्माण करण्यासाठी आम्ही जनरेटीव्ह मॉडेल्स जसे की T5[2], जे दिलेल्या संदर्भ आणि उत्तरपासून प्रश्न निर्माण करू शकते. याचा प्रवाह कसा दिसेल ते येथे दिलेले आहे.

आकृती 2. QG मॉडेल वर्कफ्लो

आऊटकम

Embibe AI प्लॅटफॉर्म मध्ये पाठ्यपुस्तकांमधून विद्यार्थ्यांसाठी शक्य होतील तितके प्रश्न निर्माण करण्यासाठी उद्युक्त करते. सर्व इयत्ता, ध्येये, परीक्षा, राज्य मंडळे यांचा विचार करता आम्ही 6 वी ते 12 वी च्या NCERT पुस्तकांमधून ~125 हजार प्रश्न निर्माण केले आहेत. आमच्याकडे कोणत्याही मुक्त स्वरूपातील अध्ययन मजकुरामधून प्रश्न निर्माण करण्याची क्षमता आहे.

ही प्रणाली वास्तविक जीवनामधील कोणत्याही विषयासाठी आणि लक्षाला जीवन आणि शिकण्याचे परिणाम मिळविण्यासाठी पुरवली जाऊ शकते. आपण मॉडेल आणि प्रणाली प्रगत NLPच्या क्षेत्रामध्ये अधिकाधिक प्रगत बनविण्याच्या आणि तिला अधिक विषय आधारित बनविण्याच्या मार्गावर आहोत.

येथे, आम्ही काही विषय विशिष्ट इनपुट आणि निर्माण केलेल्या प्रश्नांचा सेट यांची उदाहरणे दिली आहेत.

शैक्षणिक मजकूर:

आकृती 3. निवडलेला परिच्छेद आणि अधोरेखित ADPE म्हणजेच शैक्षणिक दृष्ट्‍या महत्त्वाचे शब्द

निर्माण केलेले प्रश्न:

आकृती 4. निवडलेल्या परिच्छेदामधून QG मॉडेल तर्फे निर्माण केलेले प्रश्न 

संदर्भ

[1] फाल्दु, कीर, अमित शेठ, प्रशांत किकानी, आणि हेमांग अकबारी. “KI-BERT: Infusing Knowledge Context for Better Language and Domain Understanding.” arXiv preprint arXiv:2104.08145 (2021).

[2] कोलिन राफेल, नोम शाझा, ॲडम रॉबर्ट्स, कॅथरिन ली, शारन नारंग, मायकेल मेटेना, यानुकी झोउ, वेई लि लि, पीटर जे लीयू “Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer”

[3] देसाई, निशिट, कीर फाल्दु, अचिंट थॉमस आणि आदित्य अवस्थि. “System and method for generating an assessment paper and measuring the quality thereof.” U.S. Patent Application 16/684,434, filed October 1, 2020.

[4] “Autogeneration of Diagnostic Test and Their Quality Evaluation – EDM:2020”, EDM 2020 presentation, Jul 2020, https://www.youtube.com/watch?v=7wZz0ckqWFs

[5] थॉमस, अचिंट, केयूर फाल्दु आणि आदिती एवस्थी. “System and method for personalized retrieval of academic content in a hierarchical manner.” U.S. Patent Application 16/740,223, filed October 1, 2020.

[6] फाल्डू, केयूर, अचिंट थॉमस आणि आदिती एवस्थी. “System and method for recommending personalized content using contextualized knowledge base.” U.S. Patent Application 16/586,512, filed October 1, 2020.