ആവശ്യപ്പെടുന്ന സങ്കീർണ്ണതക്കനുസരിച്ചുള്ള ചോദ്യങ്ങളുടെ ഓട്ടോ-ജനറേഷന്‍

Embibe വിദ്യാഭ്യാസത്തെ വ്യക്തിഗതമാക്കുന്നു. , ആവശ്യമുള്ള സമയത്ത് ആവശ്യക്കാരന്  ആവശ്യാനുസരണം  ഉള്ളടക്കം നൽകുന്നതിൽ ഞങ്ങളുടെ സാങ്കേതികവിദ്യ വളരെ മികച്ചതാണ്. ഈ കാരണത്താലാണ് ഉപയോഗയോഗ്യമായ ഉള്ളടക്കത്തിൻ്റെ, പ്രത്യേകിച്ച് ചോദ്യങ്ങളുടെ ഒരു വലിയ ഡാറ്റാസെറ്റിലേക്കുള്ള പ്രവേശനം  ലഭ്യമാക്കുകയെന്നത് ഞങ്ങളെ സംബന്ധിച്ച് വളരെ പ്രധാനപ്പെട്ടതാണ്. കാലങ്ങളായി , Embibe ൻ്റെ ചോദ്യങ്ങളുടെ ഡാറ്റാസെറ്റ് തയ്യാറാക്കുന്നത്  ഹ്യൂമൻ ഡാറ്റാ എൻട്രി ഓപ്പറേറ്റർമാരാണ്. അവർ ഇൻ്റർനെറ്റിൽ സൗജന്യമായി ലഭ്യമായ വിവിധ ചോദ്യ സെറ്റുകളിൽ നിന്നോ ഞങ്ങളുടെ പങ്കാളി സ്ഥാപനങ്ങളുമായുള്ള ബന്ധം വഴിയോ ചോദ്യങ്ങൾ തയ്യാറാക്കുന്നു .

വിദ്യാർത്ഥികള്‍ അധ്യാപകരെ/മെൻറ്റർമാരെ  ആശ്രയിക്കുന്നത് കുറയ്ക്കുക എന്നതാണ് ചോദ്യങ്ങളുടെ ഓട്ടോ ജനറേറ്റ് ചെയ്യുന്നതിനുള്ള പ്രധാന പ്രചോദനം. ലക്ഷക്കണക്കിന് വിദ്യാർത്ഥികൾക്ക് യഥാർത്ഥ വിദ്യാഭ്യാസം നൽകുന്നതിന്, ബാഹ്യ സഹായമില്ലാതെ തന്നെ അവർക്ക് ആശയങ്ങൾ/വിഷയങ്ങൾ പരിശീലിക്കാനും അവരുടെ പുരോഗതി സ്വയം അളക്കാനും കഴിയണം. പരിധിയില്ലാത്ത ചോദ്യങ്ങളിലേക്കുള്ള പ്രവേശനം ലഭ്യമാക്കുന്നതിലൂടെ ബുദ്ധിപരമായ മൂല്യനിർണ്ണയ സൃഷ്ടിയെ ഇത് പ്രാപ്‌തമാക്കുന്നു[3], വിദ്യാർത്ഥികളെ പരീക്ഷകളിലൂടെ വിലയിരുത്തുന്നതിന്[4] പഠന ഫലങ്ങൾ നൽകുന്നതിന് വ്യക്തിഗതമാക്കിയ ഉള്ളടക്കം പ്രദാനം ചെയ്യുന്നു[5][6]. ചോദ്യങ്ങള്‍ സ്വയമേവ  സൃഷ്ടിച്ച് സ്വയം പരിശീലിക്കാനും  പുരോഗതി വിലയിരുത്താനും വിദ്യാർത്ഥികളെ പ്രാപ്തമാക്കുന്നതും അതിലേക്കുള്ള ഒരു ചുവടുവെപ്പാണ്.

എന്നിരുന്നാലും, ഞങ്ങളുടെ പ്ലാറ്റ്‌ഫോമിലെ വിദ്യാർത്ഥികൾക്ക് അവർ മെച്ചപ്പെടുത്തേണ്ട വിഷയങ്ങളിലുള്ള ചോദ്യങ്ങൾ ഒരിക്കലും തീരുന്നില്ലെന്ന് ഉറപ്പാക്കാൻ, പുതിയ ചോദ്യങ്ങളും അവയുമായി ബന്ധപ്പെട്ട ഉത്തരങ്ങളും സ്വയ൦  സൃഷ്ടിക്കാൻ കഴിയുന്ന AI വികസിപ്പിക്കുന്നതിൽ Embibe നിക്ഷേപം നടത്തുന്നു. ഈ പ്രവൃത്തി ഉള്ളടക്ക ക്ലസ്റ്ററിംഗ്, വിഷയ മോഡലിംഗ്, അത്യാധുനിക നാച്ചുറൽ ലാംഗ്വേജ് ജനറേഷൻ (NLG), സോൾവർ സാങ്കേതികവിദ്യ എന്നിവയിൽ നിന്ന് ആശയങ്ങൾ കടമെടുക്കുന്നു.

ലക്ഷ്യം

ആശയങ്ങൾ ഓർമ്മിക്കുന്നതിനും മനസ്സിലാക്കുന്നതിനുമുള്ള പരോക്ഷ മാർഗമായ ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകിക്കൊണ്ട് ആശയങ്ങൾ പരിശീലിപ്പിക്കുന്നതിലൂടെയും അവയിൽ പ്രാവീണ്യം നേടുന്നതിലൂടെയും ഞങ്ങൾ Embibe ൽ ഒരു പഠന ചട്ടക്കൂട് നിർദ്ദേശിക്കുന്നു. പാഠത്തെ ഒരു ഇൻപുട്ടായി എടുക്കുകയും അതിൽ നിന്ന് ചോദ്യങ്ങൾ സൃഷ്ടിക്കുകയും ചെയ്യുന്ന പ്രക്രിയയാണ് ഓട്ടോമാറ്റിക് ക്വസ്റ്റ്യൻ ജനറേഷൻ.

നാച്ചുറൽ ലാംഗ്വേജ് പ്രോസസ്സിംഗിൻ്റെ(NLP) ഭാഗമാണ് ഓട്ടോമാറ്റിക് ക്വസ്റ്റ്യൻ ജനറേഷൻ. നിരവധി ഗവേഷകർ അവരുടെ സൃഷ്ടികൾ അവതരിപ്പിച്ചിട്ടുള്ള ഒരു ഗവേഷണ മേഖലയാണിത്. ഉയർന്ന കൃത്യത കൈവരിക്കാൻ ഇനിയും കഴിഞ്ഞിട്ടില്ല. NLP വഴി ഓട്ടോമാറ്റിക് ക്വസ്റ്റ്യൻ ജനറേഷൻ മേഖലയിൽ നിരവധി ഗവേഷകർ പ്രവർത്തിച്ചിട്ടുണ്ട്, കൂടാതെ വ്യത്യസ്ത തരത്തിലുള്ള ചോദ്യങ്ങൾ സ്വയ൦  സൃഷ്ടിക്കുന്നതിന് നിരവധി സാങ്കേതിക വിദ്യകളും മോഡലുകളും വികസിപ്പിച്ചെടുത്തിട്ടുണ്ട്.

സമീപനം

ചിത്രം 1-ൽ കാണിച്ചിരിക്കുന്ന ഡയഗ്രം, ഓട്ടോ ക്വസ്റ്റ്യൻ ജനറേഷൻ്റെ ആർക്കിടെക്ചറിലേക്ക് വളരെ ഉയർന്ന തലത്തിലുള്ള സമീപനം കാണിക്കുന്നു. NLP സാങ്കേതികതകൾക്കൊപ്പം ട്രാൻസ്‌ഫോർമർ മോഡലുകളുടെ കട്ടിംഗ് എഡ്ജ് വേരിയൻ്റുകളാണ് ഓട്ടോ ക്വസ്റ്റ്യൻ ജനറേഷൻ ഉപയോഗിക്കുന്നത്. ജനറേറ്റുചെയ്ത ചോദ്യങ്ങളുടെ ഗുണനിലവാരവും സങ്കീർണ്ണതയും വർദ്ധിപ്പിക്കുന്നതിന് വാചകത്തിൻ്റെ വാക്യഘടനയിലും അർത്ഥപരമായ ധാരണയിലും നടക്കുന്ന ഗവേഷണ പ്രവർത്തനങ്ങളെ ഇത് പ്രയോജനപ്പെടുത്തുന്നു.

ചിത്രം 1. ഓട്ടോ ക്വസ്റ്റ്യൻ ജനറേഷൻ്റെ ഹൈ ലെവൽ ആർക്കിടെക്ചർ

ഒരു പൈപ്പ്‌ലൈനെന്ന നിലയിൽ ഓട്ടോമാറ്റിക് ക്വസ്റ്റ്യൻ ജനറേഷനിൽ ടെക്‌സ്‌റ്റ് പ്രോസസ്സിംഗ്, ഫീച്ചർ എക്‌സ്‌ട്രാക്‌ഷൻ, എഞ്ചിനീയറിംഗ്, മോഡൽ ബിൽഡിംഗ്, ട്രെയിനിംഗ്, മോഡൽ മൂല്യനിർണ്ണയം, വ്യാഖ്യാനം, കൂടാതെ ചില സ്റ്റാൻഡേർഡ് ML ടെക്‌നിക്കുകൾ എന്നിങ്ങനെ ധാരാളം ഘടകങ്ങൾ ഉൾപ്പെടുന്നു.

ഞങ്ങളുടെ QA മോഡലിനെ പരിശീലിപ്പിക്കാൻ ARC, DROP, QASC, SciQ, SciTail, SQuAD, Google NQ, Embibe-ൻ്റെ ഉടമസ്ഥതയിലുള്ള ഡാറ്റാസെറ്റുകൾ എന്നിങ്ങനെ 20+ വ്യത്യസ്ത ഓപ്പൺ സോഴ്‌സ് ഡാറ്റാസെറ്റുകൾ ഞങ്ങൾ ഉപയോഗിച്ചു. ബൂളിയൻ, സ്പാൻ അധിഷ്ഠിതം, വിട്ട ഭാഗം പൂരിപ്പിക്കൽ, മൾട്ടിപ്പിൾ ചോയ്‌സ് ചോദ്യങ്ങൾ തുടങ്ങിയ വ്യത്യസ്ത തരത്തിലുള്ള ചോദ്യങ്ങളും ഞങ്ങൾ ഉപയോഗിച്ചിട്ടുണ്ട്. ചോദ്യത്തിൻ്റെ വാക്യഘടന രൂപീകരണത്തെ അടിസ്ഥാനമാക്കിയാണ് ചോദ്യ ആയാസതലം ഉരിതിരിച്ചെടുത്തിട്ടുള്ളത്. KI-BERT[1] ൽ നിന്ന് പ്രചോദനം ഉൾക്കൊണ്ട QG മോഡലുകളിലേക്ക് പ്രസക്തമായ അറിവ് സന്നിവേശിപ്പിക്കുന്നതിന് ഞങ്ങൾ നോളജ് ഗ്രാഫുകളും ഉപയോഗിക്കുന്നു. ചോദ്യോൽപ്പാദനത്തിൻ്റെ പ്രകടനം മെച്ചപ്പെടുത്തുന്നതിന് ഞങ്ങൾ തദ്ദേശീയമായി നിർമ്മിച്ച സ്വാഭാവിക ഭാഷാ ധാരണ ടെക്നിക്കുകൾ പ്രയോജനപ്പെടുത്തുന്നു.

ടെക്‌സ്‌റ്റ് സൃഷ്‌ടിക്കാൻ T5[2] പോലെയുള്ള ജനറേറ്റീവ് മോഡലുകൾ ഉപയോഗിക്കാം.  അതിന്, നൽകിയിരിക്കുന്ന സന്ദർഭത്തിൽ നിന്നും ഉത്തരത്തിൽ നിന്നും ചോദ്യം ജനറേറ്റ് ചെയ്യാൻ കഴിയും. ഫ്ലോ എങ്ങനെയായിരിക്കുമെന്ന് ഇതാ.

Fig 2. QG മോഡൽ വർക്ക്ഫ്ലോ

ഫലം

പാഠപുസ്തകങ്ങളിൽ നിന്ന് വിദ്യാർത്ഥികൾക്ക് കഴിയുന്നത്ര ചോദ്യങ്ങൾ സൃഷ്ടിക്കുന്നതിന് Embibe AI പ്ലാറ്റ്ഫോം ഈ സൃഷ്ടിയെ പ്രയോജനപ്പെടുത്തുന്നു. എല്ലാ ഗ്രേഡുകൾ, ലക്ഷ്യങ്ങൾ, പരീക്ഷകൾ, സംസ്ഥാന ബോർഡുകൾ എന്നിവ  കണക്കിലെടുക്കുമ്പോൾ, 6 മുതൽ 12 വരെയുള്ള ഗ്രേഡുകളിലെ NCERT ബുക്കുകളിൽ നിന്ന് ഇതുവരെ ഏകദേശം 125k ചോദ്യങ്ങൾ ഞങ്ങൾ സൃഷ്ടിച്ചിട്ടുണ്ട്. സ്വതന്ത്രമായി നിർമ്മിക്കപ്പെട്ട ഏത് പാഠത്തിൽ നിന്നും ചോദ്യങ്ങൾ സൃഷ്ടിക്കാൻ ഞങ്ങൾക്ക് കഴിയുന്നു.

ഈ സംവിധാനത്തെ ഏത് വിഷയത്തിലേക്ക്  പ്രയോജനപ്പെടുത്താനും യഥാർത്ഥ ലോക സാഹചര്യങ്ങളിലെ ജീവിതവും പഠന ഫലങ്ങളും കൈവരിക്കാൻ ലക്ഷ്യമിടുന്നതുമാണ്. നൂതന NLP-യുടെ മേഖലയിൽ മോഡലും സിസ്റ്റവും കൂടുതൽ മികച്ചതാക്കാനും അത് വിഷയ  നിർദ്ദിഷ്‌ടമാക്കാനുമുള്ള പാതയിലാണ് ഞങ്ങൾ.

ഇവിടെ, നൽകിയിരിക്കുന്ന വിഷയ  നിർദ്ദിഷ്ട ഇൻപുട്ടിൻ്റെയും ജനറേറ്റഡ് ചോദ്യങ്ങളുടെ സെറ്റിൻ്റെയും ചില ഉദാഹരണങ്ങൾ ഞങ്ങൾ നൽകിയിട്ടുണ്ട്.

അക്കാദമിക് ടെക്സ്റ്റ്:

ചിത്രം 3. തിരഞ്ഞെടുത്ത ഖണ്ഡികയും ഹൈലൈറ്റ് ചെയ്ത ADPE-യും അതായത് അക്കാദമികമായി പ്രസക്തമായ വാക്കുകൾ

സൃഷ്ടിച്ച ചോദ്യങ്ങൾ:

ചിത്രം 4. തിരഞ്ഞെടുത്ത ഖണ്ഡികയിൽ നിന്ന് QG മോഡൽ സൃഷ്ടിച്ച ചോദ്യങ്ങൾ

References

[1] Faldu, Keyur, Amit Sheth, Prashant Kikani, and Hemang Akabari. “KI-BERT: Infusing Knowledge Context for Better Language and Domain Understanding.” arXiv preprint arXiv:2104.08145 (2021).

[2] Colin Raffel, Noam Shazeer, Adam Roberts, Katherine Lee, Sharan Narang, Michael Matena, Yanqi Zhou, Wei Li, Peter J. Liu. “Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer”

[3] Desai, Nishit, Keyur Faldu, Achint Thomas, and Aditi Avasthi. “System and method for generating an assessment paper and measuring the quality thereof.” U.S. Patent Application 16/684,434, filed October 1, 2020.

[4] “Autogeneration of Diagnostic Test and Their Quality Evaluation – EDM:2020”, EDM 2020 presentation, Jul 2020, https://www.youtube.com/watch?v=7wZz0ckqWFs

[5] Thomas, Achint, Keyur Faldu, and Aditi Avasthi. “System and method for personalized retrieval of academic content in a hierarchical manner.” U.S. Patent Application 16/740,223, filed October 1, 2020.

[6] Faldu, Keyur, Achint Thomas, and Aditi Avasthi. “System and method for recommending personalized content using contextualized knowledge base.” U.S. Patent Application 16/586,512, filed October 1, 2020.