கற்றல் அறித்திறன் மற்றும் வரைபட இணைப்பின் இடையே உள்ள தொடர்புகளின் தானியக்க வகைப்பாடு
Embibe தளத்தின் அறித்திறன் கற்றல் வரைபடம், பாடத்திட்டத்தை சார்ந்த 75,000+க்கும் மேற்பட்ட பல பரிமாண வரைபட இணைப்புகளை கொண்டது. இதன் ஒவ்வொரு இணைப்புகளும் கற்றல் அறிவின் தனித்துவமான அலகை குறிக்கிறது. இதை கருத்துகள் என்றும் அழைக்கலாம்.
கற்றல் அறித்திறன் வரைபடத்தில் உள்ள தொடர்புகளுக்கு இடையே நூறாயிரகணக்கான இணைப்புகள் உள்ளன. கருத்துகள் எப்படி தனித்துவமாக இல்லாமல் ஒன்றுக்கு ஒன்று தொடர்புடையதாக இருக்கிறது என்று இந்த வரைபடம் நமக்கு தெளிவாக காட்டுகிறது.
இணைப்புகளுக்கு இடையேயான தொடர்புகள் அவற்றுக்கிடையே இருக்கும் தொடர்பு வகையின் அடிப்படையில் வகைப்படுத்தப்படுகிறது.
முழுமைபெறாத கற்றல் அறித்திறன் வரைபடங்கள் மற்றும் விடுபட்ட தொடர்புகள் ஆகியவை ஆராய்ச்சியாளர்களுக்கு ஏற்படும் பெரும்பாண்மையான பிரச்சனைகளில் ஒன்றாகும். இருப்பினும், Embibe அதன் உள்ளடக்கத்தை விரிவுபடுத்துவதால், இந்த செயல்முறையை தானியக்கமாக்க வேண்டிய அவசியத்திற்கு தள்ளப்பட்டுள்ளது.
கடந்த 8 வருடங்களாக லட்சக்கணக்கான மாணவர்களால் பயன்படுத்தப்பட்ட KG கருத்துகளின் தரவு, வரைபட கோட்பாட்டினால் அவற்றை பிரித்தெடுக்கும் தொழில்நுட்பம் மற்றும் இயற்கையான மொழி புரிதல் ஆகியவற்றின் மூலம் ஒரு N வகுப்புகளில் இருக்கும் தொடர்புகளை தானியக்கமாக வகைப்பாடு செய்யமுடியும்.
தொடர்புகளின் வகைப்பாடுகள்:
Embibe-யின் KGயில், எங்களிடம் கருத்துக்களுக்கு இடையே 16 வெவ்வேறு தொடர்புகள் உள்ளன. முற்தேவை தொடர்பும் இந்த தொடர்புகளில் ஒன்றாகும். ஒரு குறிப்பிட்ட கருத்தை கற்றுக்கொள்வதற்கு முன் கற்றுக்கொள்ள வேண்டிய எல்லா முற்தேவைகளும் இந்த தொடர்பின் மூலம் எங்கள் KG இல் கொடுக்கப்பட்டுள்ளன. பொதுவாக, ஒரு மாணவர் எந்தவொரு கருத்தையும் கற்றுக்கொள்வதற்கு முன் முற்தேவைகளை முதலில் கற்றுக்கொள்கிறார். இது அவர்கள் கருத்தை நன்கு புரிந்துகொள்ள உதவுகிறது. கோடிக்கணக்கான மாணவர்களின் பயிற்சி மற்றும் தேர்வு முயற்சிகளை நாங்கள் பகுப்பாய்வு செய்கிறோம்.
இந்த பேட்டர்ன்கள் கருத்துக்களுக்குரிய அனுபவப்பூர்வமான காரணங்களை நிறுவ பயன்படுத்தப்படுகின்றன. தரவுகளின் இந்த மறைக்கப்பட்ட பண்பு, மாணவரது இலக்கை அடைவதில் பின்பற்றும் பொதுவான கற்றல் பாதையைக் கண்டறிய எங்களுக்கு உதவியது. மதிப்பெண் முறையின் அடிப்படையில் முற்தேவைபடும் கருத்துக்களைக் கண்டறிய இந்தப் பொதுவான கற்றல் பாதைகளைப் பயன்படுத்தினோம்.
ஆய்வு அணுகுமுறைகள்:
மாணவர்களுக்கான கருத்துத் தேர்ச்சியைக் கணிக்க, கற்றல் அறித்திறன் வரைபடங்களிலிருந்து அறிவு உட்செலுத்துதல் மூலம் ஆழ்ந்த அறிவைக் கண்டறியும் அதிநவீன மொழியை நாங்கள் விரிவுபடுத்துகிறோம். வரலாற்று முன்னோடிகளின் அடிப்படையில் நிபந்தனைக்குட்பட்ட கருத்து தேர்ச்சிகளை உருவாக்குவதன் மூலம் ஏற்படும் சிக்கலையும் நாங்கள் கையாளுகிறோம். மாணவர்களின் ஒழுக்கநெறி மதிப்பீடு மற்றும் கற்றல் அறித்திறன் வரைபடக் கருத்துகளில் அதன் பிரதிபலிப்பு ஆகியவற்றின் காரணமாக Embibe தனித்துவமாக நிலைநிறுத்தப்பட்டுள்ளது. கருத்துக்களுக்கு இடையிலான தொடர்பை வகைப்படுத்துவதில் கருத்துகளின் இந்த ஒழுக்கநெறி பண்புகளும் பயன்படுத்தப்படுகின்றன.
அறிவு வரைபடங்களை விரிவுபடுத்துதல்:
கருத்துக்களுக்கிடையில் நமக்கு ஏற்கனவே பல தொடர்புகள் உள்ளன. ஒரு வரைபடத்தில் புதிய கருத்து அறிமுகப்படுத்தப்படும் போதெல்லாம், மற்ற கருத்துக்களுடன் அதன் தொடர்புகளை நாம் வரையறுக்க வேண்டும். இந்த பணியின் சிக்கலான தன்மை காரணமாக இது மிகவும் முக்கியமான வேலையாகிறது. எந்தவொரு தவறான தொடர்பு குறியிடுதலும் மாணவர்களை தவறான திசைக்கு வழிவகுக்கலாம்.
Embibe-யில், எங்கள் தயாரிப்புகளை வெவ்வேறு மொழிகளிலும் வெவ்வேறு பாடத்திட்டங்களிலும் வெளியிட விரும்புகிறோம். இந்தப் புதிய கருத்தாக்கங்களுக்காக நமது KG-யினை விரிவுபடுத்த வேண்டும். இன்றுவரை, புதிய கருத்துக் கண்டுபிடிப்பு மற்றும் பிற கருத்துக்களுடன் அவற்றின் தொடர்பை கண்டறிதல் மற்றும் ஏற்கனவே உள்ள தொடர்பை சரிபார்த்தல் போன்றவைக்காக நாங்கள் ஆசிரியர்களையே முற்றிலும் சார்ந்து இருந்தோம். இந்த பணிகள் மிக கடினமாக இருப்பது மட்டுமின்றி நேர விரயமானதும் கூட. தரவுகளின் அளவு அதிவேகமாக அதிகரித்து வருவதால், இது மிகந்த சவாலாக உள்ளது. முழுத் தரவு தயாரிப்பு செயல்முறையும் துறை சார்ந்த வல்லுநர்களை சார்ந்தது.
எந்தவொரு கருத்திற்கும் மாணவர்கள், அதற்கேற்ற முற்தேவைகளை கற்றுக்கொள்வதற்கு முன்பே கற்பதை பார்த்தோம். எனவே, மாணவர்கள் பதிலளித்த கேள்விகளின் வரிசை (Attempted Question Sequence) என்பது அவர்களின் முற்தேவை கருத்துகளுக்குப் பிறகு தேவைப்படும் கருத்துகளைக் கொண்டிருக்கும். மாணவர்களின் துல்லியத்தன்மையின் முன்னேற்றத்தை பாதிக்கும் பொது பண்பை அறிய, நாங்கள் மாணவரின் பதிலளித்த கேள்விகளின் வரிசை முறையை நாங்கள் கண்டறிகிறோம். இதைத் திறம்படத் தீர்க்க, DKT (ஆழ்ந்த கற்றல் கண்காணிப்பு),(LSTM) பயனர் முயற்சிக்கும் தரவு மற்றும் துல்லியத்தன்மை பயன்படுத்தப்படுகிறது. இதன் மூலம் வரிசை வகைப்பாடு சிக்கலாக, எந்த கருத்துகள்/முயற்சி முறை துல்லியத்தன்மையில் அதிக மாற்றத்தை ஏற்படுகிறது என்பதை பார்க்க முடியும். இறுதியாக பயிற்சியளிக்கப்பட்ட DKT மாதிரியானது புதிய கருத்துகளுக்கான தொடர்பை தரவரிசைப்படுத்த உபயோகிக்கப்பட்டது. பின்னர் இந்த தரவரிசை கற்றல் அறித்திறன் வரைபட இணைப்புகளுக்கு இடையே இருக்கும் புதிய தொடர்பு பரிந்துரை பயன்படுத்தப்படுகிறது.
சுருக்கம்:
Embibe-யின் அனைத்து தயாரிப்புகளுக்கும் கற்றல் அறித்திறன் வரைபடத்தின் முதுகெலும்பாக உள்ளது. எனவே கற்றல் அறித்திறன் வரைபடத்தை நிறைவு செய்வது நமது முதன்மையான பணியாகும். இந்த வேலை கற்றல் அறித்திறன் வரைபடத்தை பராமரிக்கவும், மிகக் குறைந்த மனித தலையீடுகளுடன் விரைவாக விரிவாக்கவும் எங்களுக்கு உதவியது.
இறுதியாக, கருத்துக்களுக்கு இடையே இருக்கும் புதிய தொடர்புகளை ஆராய்வதற்கான பிரச்சனை இது. வெவ்வேறு மூலங்களிலிருந்து கொடுக்கப்பட்ட டெக்ஸ்ட்த் தரவிலிருந்து கருத்துக் கண்டறியும் செயல்முறையை நாங்கள் தானியக்கமாக்கி உள்ளோம். இந்த நுட்பத்தைப் பயன்படுத்தி தற்போதுள்ள கருத்துக்களுடன் புதிதாகக் கண்டறியப்பட்ட கருத்துகளின் தொடர்புகளை பின்னர் காணலாம். எதிர்காலத்தில், கற்றல் அறித்திறன் வரைபடத்தை சரி பார்ப்பதற்கும் இந்த முறை மேம்படுத்தபடுலாம்.
பரிந்துரைகள்:
- Chris Piech, Jonathan Spencer, Jonathan Huang, Surya Ganguli, Mehran Sahami, Leonidas J. Guibas, andJascha Sohl-Dickstein. Deep knowledge tracing.CoRR, abs/1506.05908, 2015. URLhttp://arxiv.org/abs/1506.05908.
- K. Greff, R. K. Srivastava, J. Koutník, B. R. Steunebrink and J. Schmidhuber, “LSTM: A Search Space Odyssey,” in IEEE Transactions on Neural Networks and Learning Systems, vol. 28, no. 10, pp. 2222-2232, Oct. 2017, doi: 10.1109/TNNLS.2016.2582924.
- Faldu, Keyur, Amit Sheth, Prashant Kikani, and Hemang Akabari. “KI-BERT: Infusing Knowledge Context for Better Language and Domain Understanding.” arXiv preprint arXiv:2104.08145 (2021).
- Sheth, Amit, Manas Gaur, Kaushik Roy, and Keyur Faldu. “Knowledge-intensive Language Understanding for Explainable AI.” IEEE Internet Computing 25, no. 5 (2021): 19-24.