ആമുഖം:
75,000-ത്തിലധികം നോഡുകൾ ഉൾക്കൊള്ളുന്ന ഒരു പാഠ്യപദ്ധതി ബഹുമുഖ ഗ്രാഫാണ് Embibe ന്റെ നോളജ് ഗ്രാഫ്. ആശയങ്ങൾ എന്നും വിളിക്കപ്പെടുന്ന ഈ നോഡുകളില് ഓരോന്നും അക്കാദമിക അറിവിന്റെ ഒരു പ്രത്യേക യൂണിറ്റിനെ പ്രതിനിധീകരിക്കുന്നു. അവയ്ക്കിടയിലുള്ള ലക്ഷക്കണക്കിന് പരസ്പര ബന്ധങ്ങൾ, ഈ ആശയങ്ങളൊന്നും സ്വതന്ത്രമല്ലെന്നും പകരം മറ്റ് ആശയങ്ങളുമായി എങ്ങനെ ബന്ധപ്പെട്ടിരിക്കുന്നുവെന്നും കാണിക്കുന്നു.
നോഡുകൾ നിലനിൽക്കുന്ന ബന്ധത്തെ അടിസ്ഥാനമാക്കി അവ തമ്മിലുള്ള പരസ്പര ബന്ധങ്ങളുടെ ഒരു തരം ക്രമീകരിച്ചു. അപൂർണ്ണമായ നോളജ് ഗ്രാഫുകളും നഷ്ടപ്പെട്ട ബന്ധങ്ങളും ഗവേഷകർക്കിടയിൽ അറിയപ്പെടുന്ന പ്രശ്നങ്ങളിലൊന്നാണ്. എന്നിരുന്നാലും, Embibe അതിന്റെ ഉള്ളടക്കം വിപുലീകരിക്കുന്നതിനാൽ, ആ പ്രക്രിയ ഓട്ടോമേറ്റ് ചെയ്യേണ്ടത് ആവശ്യമാണ്. കഴിഞ്ഞ 8 വർഷമായി ദശലക്ഷക്കണക്കിന് വിദ്യാർത്ഥികൾക്ക് KG ആശയങ്ങളെക്കുറിച്ചുള്ള ഇടപെടല് ഡാറ്റയുടെ ലഭ്യതയും ഗ്രാഫ് സിദ്ധാന്തം, സ്വാഭാവിക ഭാഷാ ധാരണ എന്നിവയിൽ നിന്നുള്ള സാങ്കേതിക വിദ്യകൾ പ്രയോജനപ്പെടുത്തുന്നതിലൂടെയും N ക്ലാസുകളിൽ ഒന്നായി ബന്ധങ്ങളെ സ്വയമേവ വർഗ്ഗീകരിക്കാൻ സാധിക്കും.
ബന്ധങ്ങളുടെ തരങ്ങൾ:
Embibe ന്റെ KG യിൽ, ആശയങ്ങൾ തമ്മിൽ 16 വ്യത്യസ്ത ബന്ധങ്ങളുണ്ട്. ഈ ബന്ധങ്ങളിൽ ഒന്നാണ് ഒരു മുൻവ്യവസ്ഥ ബന്ധം. ഒരു പ്രത്യേക ആശയം പഠിക്കുന്നതിന് മുമ്പ് തന്നെ അറിഞ്ഞിരിക്കേണ്ട എല്ലാ വിവരങ്ങളും ഈ ബന്ധത്തിലൂടെ നമ്മുടെ KG യിൽ നൽകിയിരിക്കുന്നു. സാധാരണയായി, ഏതെങ്കിലും ആശയം പഠിക്കുന്നതിന് മുമ്പ് ഒരു വിദ്യാർത്ഥി ആദ്യം മുമ്പ് തന്നെ അറിഞ്ഞിരിക്കേണ്ട വിവരങ്ങള് പഠിക്കുന്നു. ആശയം നന്നായി മനസ്സിലാക്കാൻ ഇത് അവരെ സഹായിക്കുന്നു. ആശയ വൈദഗ്ധ്യത്തിന്റെയും പഠന പാതകളുടെയും പാറ്റേണുകൾ നേടുന്നതിന് ദശലക്ഷക്കണക്കിന് വിദ്യാർത്ഥികളിൽ നിന്നുള്ള ശതകോടിക്കണക്കിന് പരിശീലനങ്ങളും പരീക്ഷണ ശ്രമങ്ങളും ഞങ്ങൾ വിശകലനം ചെയ്യുന്നു. ആശയങ്ങൾക്കിടയിലെ അനുഭവപരമായ കാരണങ്ങളെ സ്ഥാപിക്കാൻ ഈ പാറ്റേണുകൾ ഉപയോഗിക്കുന്നു. ഡാറ്റയുടെ ഈ മറഞ്ഞിരിക്കുന്ന സ്വഭാവം വിദ്യാർത്ഥി അവരുടെ ലക്ഷ്യം നേടുന്നതിന് പിന്തുടരുന്ന പൊതുവായ പഠന പാത കണ്ടെത്താൻ ഞങ്ങളെ സഹായിച്ചു. ഒരു സ്കോറിംഗ് രീതിയെ അടിസ്ഥാനമാക്കിയുള്ള മുൻവ്യവസ്ഥകൾ കണ്ടെത്തുന്നതിന് ഞങ്ങൾ ഈ പൊതുവായ പഠന പാതകൾ ഉപയോഗിച്ചു.
ഗവേഷണ സമീപനങ്ങൾ:
വിദ്യാർത്ഥികളുടെ ആശയ വൈദഗ്ധ്യം പ്രവചിക്കുന്നതിനായി നോളജ് ഗ്രാഫുകളിൽ നിന്നുള്ള അറിവ് പകരല് ഉപയോഗിച്ച് ആഴത്തിലുള്ള വിജ്ഞാന ശേഖരത്തിന്റെ അത്യാധുനിക സാങ്കേതിക വിദ്യകൾ ഞങ്ങൾ വിപുലീകരിക്കുന്നു. പൂര്വാനുഭവങ്ങളെ അടിസ്ഥാനമാക്കി സോപാധികമായ ആശയ വൈദഗ്ധ്യം ജനകീയമാക്കി തുടക്കത്തിലുണ്ടാകുന്ന പ്രശ്നവും ഞങ്ങൾ കൈകാര്യം ചെയ്യുന്നു. വിദ്യാർത്ഥികളുടെ പെരുമാറ്റ കാലിബ്രേഷനും നോളജ് ഗ്രാഫ് ആശയങ്ങളിലുള്ള അതിന്റെ പ്രതിഫലനത്തിന്റെയും ഫലമായി Embibe അദ്വിതീയമായി സ്ഥാപിച്ചിരിക്കുന്നു. ആശയങ്ങൾ തമ്മിലുള്ള ബന്ധം വർഗ്ഗീകരിക്കുന്നതിൽ അവയുടെ ഇത്തരം സ്വഭാവ സവിശേഷതകള് സ്വാധീനം ചെലുത്തുന്നു.
നോളജ് ഗ്രാഫുകളുടെ വിപുലീകരണം:
ഇതിനകം തന്നെ ആശയങ്ങൾക്കിടയിൽ നിരവധി ബന്ധങ്ങളുണ്ട്. ഗ്രാഫിൽ ഏതെങ്കിലും ഒരു പുതിയ ആശയം അവതരിപ്പിക്കപ്പെടുമ്പോഴെല്ലാം, മറ്റ് ആശയങ്ങളുമായുള്ള അതിന്റെ ബന്ധം നാം നിർവചിക്കേണ്ടതുണ്ട്. ഈ പ്രക്രിയയുടെ സങ്കീർണ്ണത കാരണം ഇത് വളരെ പ്രധാനപ്പെട്ട ഒരു എക്സർസൈസായി മാറുന്നു. ഏതെങ്കിലും തെറ്റായ ബന്ധം ടാഗ് ചെയ്യുന്നത് വിദ്യാര്ത്ഥികളെ തെറ്റായ ദിശയിലേക്ക് നയിക്കുന്നതിന് കാരണമായേക്കും.
Embibe ൽ, ഞങ്ങളുടെ പ്രവര്ത്തനഫലം വ്യത്യസ്ത ഭാഷകളിലും വ്യത്യസ്ത പാഠ്യപദ്ധതികളിലും അവതരിപ്പിക്കാൻ ഞങ്ങൾ ആഗ്രഹിക്കുന്നു. ഈ പുതിയ ആശയങ്ങൾക്കായി നമ്മുടെ KGയും വിപുലീകരിക്കേണ്ടതുണ്ട്. ഇന്നുവരെ, പുതിയ ആശയം കണ്ടെത്തുന്നതിനും മറ്റ് ആശയങ്ങളുമായുള്ള അവരുടെ ബന്ധം കണ്ടെത്തുന്നതിനും നിലവിലുള്ള ബന്ധ സാധൂകരണത്തിനും ഞങ്ങൾ അധ്യാപകരെയാണ് പൂർണ്ണമായും ആശ്രയിച്ചിരുന്നത്. എന്നാല് ഈ ജോലികൾ വളരെയധികം മടുപ്പുളവാക്കുന്നതും മന്ദഗതിയിലുള്ളതുമാണ്. ഡാറ്റയുടെ അളവ് ക്രമാതീതമായി വർദ്ധിച്ചുകൊണ്ടിരിക്കുന്നതിനാൽ ഇത് ഞങ്ങൾക്ക് ഒരു വലിയ വെല്ലുവിളിയായി മാറുന്നു. കൂടാതെ, മുഴുവൻ ഡാറ്റ തയ്യാറാക്കൽ പ്രക്രിയയ്ക്കും മനുഷ്യ പക്ഷപാതിത്വവുമുണ്ട്.
Insert image here
ഏതെങ്കിലും ആശയം പഠിക്കുന്നതിന് മുമ്പ് വിദ്യാർത്ഥികൾ ആശയങ്ങള്ക്കനുസരിച്ചു മുമ്പേ അറിഞ്ഞിരിക്കേണ്ട വസ്തുതകള് പഠിക്കുന്നത് ഞങ്ങൾ കണ്ടിട്ടുണ്ട്. അതിനാൽ വിദ്യാർത്ഥികള് അറ്റെംമ്പ്റ്റ് ചെയ്ത ചോദ്യ ക്രമത്തിന് (അറ്റംപ്റ്റഡ് ക്വസ്റ്റ്യൻ സീക്വൻസ്) അവരുടെ മുൻകൂട്ടി അറിഞ്ഞിരിക്കേണ്ടവക്ക് ശേഷമുള്ള ആശയങ്ങൾ ഉണ്ടായിരിക്കും. വിദ്യാർത്ഥിയുടെ കൃത്യതയിലെ പുരോഗതിയെ സ്വാധീനിക്കുന്ന വിദ്യാർത്ഥിയുടെ പൊതുവായ സ്വഭാവം ലഭിക്കാൻ ഞങ്ങൾ അറ്റെംമ്പ്റ്റ് ചെയ്ത ചോദ്യക്രമം കണ്ടെത്തുകയാണ്. ഇത് ഫലപ്രദമായി പരിഹരിക്കുന്നതിന്, ഒരു ശ്രേണീ വര്ഗീകരണ പ്രശ്നമെന്ന നിലയിൽ, ഏത് ആശയക്രമം/ അറ്റെംമ്പ്റ്റ് ക്രമം ആണ് കൃത്യതയിൽ കൂടുതൽ സ്വാധീനം ചെലുത്തുന്നതെന്ന് മനസ്സിലാക്കാന് യൂസര് അറ്റെംമ്പ്റ്റ് ചെയ്ത ഡാറ്റക്കും കൃത്യതക്കുമൊപ്പം DKT (ഡീപ് നോളജ് ട്രെയ്സിംഗ്) (LSTM) യും ഉപയോഗിക്കുന്നു. അവസാനം പരിശീലനം ലഭിച്ച DKT മോഡൽ പുതിയ ആശയങ്ങൾക്കായുള്ള റിലേഷൻഷിപ്പ് റാങ്കിംഗിനായി ഉപയോഗിച്ചു. പിന്നീട് ഈ റാങ്കിംഗ്, നോളജ് ഗ്രാഫ് നോഡുകൾ തമ്മിലുള്ള പുതിയ ബന്ധ നിർദ്ദേശങ്ങൾക്കായി ഉപയോഗിക്കുന്നു.
സംഗ്രഹം:
Embibe ന്റെ എല്ലാ പ്രവര്ത്തനഫലങ്ങളുടേയും നട്ടെല്ലാണ് നോളജ് ഗ്രാഫ്. അതിനാൽ നോളജ് ഗ്രാഫ് പൂർത്തീകരണം ഞങ്ങളുടെ പ്രാഥമിക ദൗത്യമാണ്. നോളജ് ഗ്രാഫ് നിലനിർത്താനും വളരെ കുറഞ്ഞ മാനുവൽ ഇടപെടലുകളോടെ അത് അതിവേഗം വിപുലീകരിക്കാനും ഈ ടാസ്ക് ഞങ്ങളെ സഹായിച്ചു.
അവസാനമായി, ആശയങ്ങൾക്കിടയിൽ മറഞ്ഞിരിക്കുന്ന പുതിയ ബന്ധങ്ങൾ കണ്ടെത്തുന്നതിനുള്ള ഒരു തുറന്ന പ്രശ്നമാണിത്. വ്യത്യസ്ത ഉറവിടങ്ങളിൽ നിന്ന് നൽകിയിരിക്കുന്ന പാഠ പുസ്തക ഡാറ്റയിൽ നിന്ന് ആശയം കണ്ടെത്തുന്ന പ്രക്രിയ ഞങ്ങൾ സ്വയമേവയാക്കി. പിന്നീട് ഈ സാങ്കേതികവിദ്യ ഉപയോഗിച്ച് നിലവിലുള്ള ആശയങ്ങളുമായി പുതുതായി കണ്ടെത്തിയ ആശയങ്ങളുടെ ബന്ധം ഞങ്ങൾ കണ്ടെത്തുന്നു. നോളജ് ഗ്രാഫ് മൂല്യനിർണ്ണയത്തിനും ഈ രീതി വിപുലീകരിക്കാവുന്നതാണ്.
References:
- Chris Piech, Jonathan Spencer, Jonathan Huang, Surya Ganguli, Mehran Sahami, Leonidas J. Guibas, andJascha Sohl-Dickstein. Deep knowledge tracing.CoRR, abs/1506.05908, 2015. URLhttp://arxiv.org/abs/1506.05908.
- K. Greff, R. K. Srivastava, J. Koutník, B. R. Steunebrink and J. Schmidhuber, “LSTM: A Search Space Odyssey,” in IEEE Transactions on Neural Networks and Learning Systems, vol. 28, no. 10, pp. 2222-2232, Oct. 2017, doi: 10.1109/TNNLS.2016.2582924.
- Faldu, Keyur, Amit Sheth, Prashant Kikani, and Hemang Akabari. “KI-BERT: Infusing Knowledge Context for Better Language and Domain Understanding.” arXiv preprint arXiv:2104.08145 (2021).
- Sheth, Amit, Manas Gaur, Kaushik Roy, and Keyur Faldu. “Knowledge-intensive Language Understanding for Explainable AI.” IEEE Internet Computing 25, no. 5 (2021): 19-24.