விரும்பிய கடின நிலையில் தானியக்க கேள்வி உருவாக்கம்

விரும்பிய கடின நிலையில் தானியக்க கேள்வி உருவாக்கம்

Embibe-யின் நோக்கம் கற்றலை தனிப்பயனாக்குவதைப் பற்றியது. சரியான நேரத்தில், சரியான மாணவர்களுக்கு சரியான கருத்தை வழங்குவதில் எங்கள் தொழில்நுட்பம் தலை சிறந்தது. இதனால் பயன்படுத்தக்கூடிய உள்ளடக்கத்தின் பெரிய தரவுத்தொகுப்புகள், குறிப்பாக கேள்விகள் எங்களுக்கு மிகவும் முதன்மையானதாக இருக்கிறது. வரலாற்று ரீதியாக, Embibe தளத்தில் உள்ள கேள்விகளின் தரவுத் தொகுப்பு தரவு உள்ளீட்டாளர்களால் நேரடியாக தயாரிக்கப்பட்டது. அவை இணையத்தில் பல்வேறு கேள்வித் தொகுப்புகளிலிருந்து கிடைக்கும் அல்லது எங்கள் கூட்டணி நிறுவனங்களுடனான உடன்படிக்கை மூலமாகவோ கிடைக்கும் கேள்விகளைக் கொண்டிருக்கலாம்.

கேள்விகளை தானியக்க முறையில் உருவாக்குதலின் முக்கிய நோக்கம், மாணவர்கள்அவர்களது ஆசிரியர்கள்/வழிகாட்டிகளை சார்ந்து இருப்பதை குறைப்பதே. இலட்சக்கணக்கான மாணவர்களின் கற்றலை அளவிட, உண்மையிலேயே அவர்களுக்கு வேறு எவரது உதவியும் தேவையில்லை. கருத்துக்கள்/தலைப்புகளை பயிற்சி செய்து அவர்களின் முன்னேற்றத்தை அவர்களாலேயே மதிப்பிட முடியும். அறிவார்ந்த மதிப்பீடு உருவாக்கம்[3], மாணவர்களைக் கண்டறிதல் [4] அல்லது கற்றல் வெளிப்பாடுகளை  வழங்குவதற்கான தனிப்பயனாக்கப்பட்ட உள்ளடக்கத்தை வழங்குதல் [5][6] போன்றவற்றிற்கு வரம்பற்ற கேள்விகளை அணுகுதலுக்கான அங்கீகாரம் உதவுகிறது. கேள்விகள் தானியக்கமாக உருவாதல் மற்றும் மாணவர்களை பயிற்சி செய்து அவர்களின் முன்னேற்றத்தை மதிப்பிட அனுமதிப்பது அதற்கான ஒரு படியாகும்.

இருப்பினும், எங்கள் தளத்தில் உள்ள மாணவர்களுக்கு அவர்கள் மேம்படுத்திக்கொள்ள விரும்பும் தலைப்பில், கேள்வி பற்றாக்குறை ஏற்படாமல் இருக்க, புதிய கேள்விகளையும் அது தொடர்பான பதில்களையும் தானாகவே உருவாக்கக்கூடிய AI ஐ உருவாக்க Embibe முதலீடு செய்துள்ளது என்பது குறிப்பிடத்தக்கது.

இந்த பணி, உள்ளடக்க தொகுப்பாக்கம், தலைப்பிற்கான மாதிரியமைத்தல், அதிநவீன மொழி உருவாக்கம் NLG மற்றும் தீர்வி தொழில்நுட்பம் (solver technology) ஆகியவற்றிலிருந்து கருத்துக்களைப் பெறுவதை உள்ளடக்கியது.

குறிக்கோள்

நாங்கள், Embibe-யில், கருத்துகளை நினைவுகூறவும், புரிந்துகொள்ளவும் ஒரு தந்திரமான வழியை பயன்படுத்துகிறோம். அதாவது தொடர்ந்து கேள்விகளுக்கு பதிலளிப்பதன் மூலம் பயிற்சித்தல் மற்றும் கருத்துக்களில் சிறந்த விளங்குதல் போன்ற கட்டமைப்பை உருவாக்கியுள்ளோம். தானியக்க கேள்வி உருவாக்கம் என்பது டிஜிட்டல் மயமாக்கப்பட்ட புத்தகங்களை உள்ளீடாக கொண்டு, அதிலிருந்து கேள்விகளை உருவாக்குகிறது. இதில் மாணவர்கள் அவர்களுது அறித்திறனை பயன்படுத்தி பயிற்சி பெறலாம்.

தானியக்க கேள்வி உருவாக்கம், இயற்கை மொழி செயலாக்கத்தின் (NLP) ஒரு பகுதியாகும்.

பல ஆராய்ச்சியாளர்கள், தங்கள் படைப்புகளை வழங்கிய ஒரு ஆராய்ச்சி பகுதி இது.  எனினும், இது இன்னும் அதிகபட்ச துல்லியத்தை பெரும் நிலையை அடையவில்லை.

பல ஆராய்ச்சியாளர்கள் NLP மூலம் தானியக்க கேள்வி உருவாக்கம் பகுதியில் பணியாற்றியுள்ளனர் மற்றும் பல்வேறு வகையான கேள்விகளை தானாக உருவாக்க ஏராளமான நுட்பங்கள் மற்றும் மாதிரிகள் உருவாக்கப்பட்டுள்ளன.

அணுகுமுறை

பின்வரும் வரைபடம் தானியக்க கேள்வி உருவாக்க கட்டமைப்பிற்கான மிக உயர் நிலை அணுகுமுறையைக் காட்டுகிறது.

தானியக்க கேள்வி உருவாக்கம், டிரான்ஸ்பார்மர் மாதிரிகளின் அதிநவீன மாறுபாடுகளுடன் NLP நுட்பங்களை பயன்படுத்துகிறது.

உருவாக்கப்படும் கேள்விகளின் தரம் மற்றும் கடின நிலையை அதிகரிக்க இலக்கணம் மற்றும் சொற்பொருளியல் பற்றிய ஆராய்ச்சிப் பணிகளையும் இது மேம்படுத்துகிறது.

படம் 1: தானியக்க கேள்வி உருவாக்கத்தின் உயர் தர கட்டமைப்பு

தானியக்க கேள்வி உருவாக்கம் என்பது உரை செயலாக்கம், அம்சங்களை பிரித்தெடுத்தல் மற்றும் உருவாக்குதல்(இன்ஜினீரிங்), மாதிரி கட்டமைத்தல் மற்றும் பயிற்சித்தல், மாதிரி மதிப்பாய்வு, குறிப்பிடுதல் மற்றும் சில நிலையான ML நுட்பங்கள் போன்ற பல கூறுகளை உள்ளடக்கியது.

எங்கள் QA மாடலைப் பயிற்றுவிக்க ARC, DROP, QASC, SciQ, SciTail, SQuAD மற்றும் Google NQ மற்றும் Embibe க்கு சொந்தமான தரவுத்தொகுப்புகள் போன்ற 20+ வெவ்வேறு திறந்த மூல தரவுத்தொகுப்புகளைப் பயன்படுத்தியுள்ளோம். பூலியன், ஸ்பான் அடிப்படையிலான, கோடிட்ட இடங்களை நிரப்புதல், பல தேர்வு கேள்விகள் போன்ற பல்வேறு வகையான கேள்விகளையும் நாங்கள் பயன்படுத்தியுள்ளோம். தொடர் கேள்வி உருவாக்கத்தை அடிப்படையாக வைத்து கடின தன்மையை வரையறுக்கப்படுகிறது, மல்டி-ஹாப் ரீசனிங் என்பது பதில் மற்றும் கருத்திலிருக்கும் கடினத்தன்மையை வரையறுக்க வேண்டும். KI-BERT ஐ வைத்து உருவாக்கப்பட்ட QG மாதிரிகளில் தொடர்புடைய அறிவைப் புகுத்துவதற்கு கற்றல் அரித்திரன் வரைபடங்களைப் பயன்படுத்துகிறோம்[1]. கேள்வி உருவாக்கத்தின் செயல்திறனை மேம்படுத்த, சொந்தமாக உருவாக்கப்பட்ட இயற்கை மொழி புரிதல் நுட்பங்களை நாங்கள் பயன்படுத்துகிறோம்.

உரையை உருவாக்க, T5[2] போன்ற உருவாக்க மாதிரிகளைப் பயன்படுத்தலாம், இதனால் கொடுக்கப்பட்ட கருத்துக்கள் மற்றும் பதில்களில் இருந்து கேள்வியை உருவாக்க முடியும். அதன் போக்கு எப்படி இருக்கும் என்பதற்கான உதாரணம் பின்வருமாறு.

படம் 2. QG மாதிரி பணிப்பாய்வு

இலக்கு

Embibe AI தளம்,  மாணவர்களுக்கு அதனால் முடிந்தவரை பாடப் புத்தகங்களிலிருந்து பல கேள்விகளை உருவாக்கவே இந்த பணிகளை செய்கிறது.

அனைத்து வகுப்புகளையும், இலட்சியங்களையும், தேர்வுகளையும், மாநில வாரியங்களையும் கருத்தில் கொண்டு, இதுவரை 6 முதல் 12 ஆம் வகுப்பு வரை உள்ள NCERT புத்தகங்களிலிருந்து ~ 125k கேள்விகளை உருவாக்கியுள்ளோம். எத்தகைய கற்றல் உரைக்கும் எளிதில் கேள்விகளை உருவாக்கும் திறன் எங்களிடம் உள்ளது என்பதில் பெருமிதம் கொள்கிறோம்.

எந்த களமாக இருந்தாலும், எப்பேற்பட்ட இலட்சியமாக இருந்தாலும், நிஜ உலக சூழ்நிலைகளில் மூலாதாரமாக இருக்கும் வாழ்க்கை மற்றும் கற்றல் வெளிப்பாடுகளை அடைய இந்த அமைப்பை பயன்படுத்தலாம்.

மேம்பட்ட NLP பகுதியில், மாதிரி மற்றும் அமைப்பை புத்தம்புதிய ஒன்றாக மாற்றவும், அதை குறிப்பிட்ட களம் சார்ந்ததாக மாற்றவும் நாங்கள் செயல்பட்டு வருகிறோம்.

இங்கே, எங்களின் சில படைப்புகளும் இறுதி முடிவுகளும் கொடுக்கப்பட்டுள்ளது.

கல்வி உரை:

படம் 3: தேர்வு செய்யப்பட்ட பேராகிராப்(பத்தி) மற்றும் குறிப்பிட்டுள்ள ADPE அதாவது கற்றல் சார்ந்த வார்த்தைகள்.

உருவாக்கப்பட்ட கேள்விகள்:

படம் 4: தேர்வுசெய்யப்பட்ட பத்தியிலிருந்து QG மாதிரியினால் உருவாக்கப்பட்ட கேள்விகள்

பரிந்துரைகள் 

[1] Faldu, Keyur, Amit Sheth, Prashant Kikani, and Hemang Akabari. “KI-BERT: Infusing Knowledge Context for Better Language and Domain Understanding.” arXiv preprint arXiv:2104.08145 (2021).

[2] Colin Raffel, Noam Shazeer, Adam Roberts, Katherine Lee, Sharan Narang, Michael Matena, Yanqi Zhou, Wei Li, Peter J. Liu. “Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer”

[3] Desai, Nishit, Keyur Faldu, Achint Thomas, and Aditi Avasthi. “System and method for generating an assessment paper and measuring the quality thereof.” U.S. Patent Application 16/684,434, filed October 1, 2020.

[4] “Autogeneration of Diagnostic Test and Their Quality Evaluation – EDM:2020”, EDM 2020 presentation, Jul 2020, https://www.youtube.com/watch?v=7wZz0ckqWFs

[5] Thomas, Achint, Keyur Faldu, and Aditi Avasthi. “System and method for personalized retrieval of academic content in a hierarchical manner.” U.S. Patent Application 16/740,223, filed October 1, 2020.

[6] Faldu, Keyur, Achint Thomas, and Aditi Avasthi. “System and method for recommending personalized content using contextualized knowledge base.” U.S. Patent Application 16/586,512, filed October 1, 2020.