ફ્રી ટેક્સ્ટ જવાબ આધારિત પ્રશ્નોનું સ્વચાલિત મૂલ્યાંકન
મોટાભાગની સ્પર્ધાત્મક પરીક્ષાઓમાં સહભાગીઓને ઓબ્જેક્ટિવ પ્રકારના પ્રશ્નો હલ કરવાની જરૂર પડે છે, જેમ કે પ્રશ્નો કે જેના માટે આપેલ જવાબ પસંદગીના સમૂહમાંથી એક અથવા વધુ સાચા જવાબો પસંદ કરવા જરૂરી હોય છે અથવા પ્રશ્નો કે જેના માટે સહભાગીઓએ સંખ્યાત્મક મૂલ્ય દાખલ કરવું પડે છે. ટેસ્ટનું મૂલ્યાંકન જે ઓબ્જેક્ટિવ પ્રકારના પ્રશ્નો પર આધારિત છે તે એકદમ સીધું છે.
જો કે, ઘણી પરીક્ષાઓ છે, જેમ કે બોર્ડની પરીક્ષાઓ, જેમાં મફત ટેક્સ્ટ જવાબો સાથેના પ્રશ્નોનો સમાવેશ થાય છે. નિબંધ સ્કોરિંગને લક્ષ્યાંકિત કરતા કેટલાક સફળ ઉકેલો સાથે મફત ટેક્સ્ટ જવાબોનું મૂલ્યાંકન હજી પણ એક ખુલ્લી સંશોધન સમસ્યા છે. Embibe સ્કેલ [7] પર લર્નિંગ આઉટકમને પહોંચાડવા માટે એક AI પ્લેટફોર્મ છે, અને આવી ક્ષમતા ફ્રી-ટેક્સ્ટ જવાબ આધારિત પ્રશ્નો સાથે વ્યક્તિગત ટેસ્ટ બનાવવામાં અને સંદર્ભિત નોલેજ ગ્રાફ [6][8]માં વિદ્યાર્થીઓના કોન્સેપ્ટની નિપુણતાનું મૂલ્યાંકન કરવામાં મદદ કરી શકે છે. એક સામાન્ય મૂલ્યાંકનકર્તા વિકસાવવા જે વિવિધ શૈક્ષણિક ડોમેન પર વિવિધ શૈલીઓના મફત ટેક્સ્ટ જવાબો સ્કોર કરી શકે તે માટે અદ્યતન NLP/NLU નો ઉપયોગ કરવાની જરૂર છે અને તે Embibe માટે રુચિનું ક્ષેત્ર છે.
આપણે સમસ્યાને બે પેટા-સમસ્યાઓમાં વિભાજિત કરી શકીએ છીએ.
- એન્ટિટી લિંકિંગ
- અર્થપૂર્ણ સમાનતા
એન્ટિટી લિંકિંગ
એન્ટિટી લિંકિંગમાં, અમે શોર્ટ ફોર્મ/સંક્ષિપ્ત શબ્દો અને ઉર્ફ (તે તરીકે પણ ઓળખાય છે) પ્રકારનો સમાવેશ કરી શકીએ છીએ. ઉદાહરણ તરીકે, ટૂંકા અક્ષરો
“PMC”: “પોલેન મધર સેલ”,
“MMC”: “મેગાસ્પોર મધર સેલ”,
“PEN”: “પ્રાઈમરી એન્ડોસ્પર્મ ન્યુક્લિયસ”,
“PEC”: “પ્રાઈમરી એન્ડોસ્પર્મ સેલ”,
“LH”: “લ્યુટિનાઇઝિંગ હોર્મોન”,
“FSH”: “ફોલિકલ સ્ટિમ્યુલેટિંગ હોર્મોન”
અને જેમ કે,
“મશરૂમ”: “ટોડસ્ટૂલ”,
“જર્મ્સ”: “સૂક્ષ્મજીવાણુઓ”,
“બેક્ટેરિયા”: “સૂક્ષ્મજીવાણુઓ”,
“યીસ્ટ”: “સૂક્ષ્મજીવાણુઓ”,
“નવીનીકરણીય”: “અખૂટ”,
“લક્ષણો”: “લક્ષણો”,
અમે રાસાયણિક નામની સંસ્થાઓને પણ મેપ કરી શકીએ છીએ જેમ કે,
‘(NH4)(NO3)’ : ‘એમોનિયમ નાઈટ્રેટ’,
‘(NH4)2C2O4’ : ‘એમોનિયમ ઓક્સાલેટ’,
‘Ag2O’ : ‘સિલ્વર ઓક્સાઇડ’,
‘Ag2SO4’ : ‘સિલ્વર સલ્ફેટ’,
‘Al(NO3)3’ : ‘એલ્યુમિનિયમ નાઈટ્રેટ’,
આ મેપિંગનો ઉપયોગ કરીને, અમે ટૂંકા અક્ષરો અને સમાન શબ્દોનો મેપ બનાવી શકીએ છીએ અને પછી તેમને વાસ્તવિક જવાબો સાથે મેચ કરી શકીએ છીએ.
સિમેન્ટીક સમાનતા
બે વાક્યોનો અર્થ સમાન હોઈ શકે. અમે ડોમેન-ઇન્ફ્યુઝ્ડ નોલેજનો ઉપયોગ કરીને સિમેન્ટીક સમાનતા સ્થાપિત કરીએ છીએ અને પ્રાકૃતિક ભાષાની સમજણ અને નોલેજ ઇન્ફ્યુઝ્ડ લર્નિંગ [3][4][5]ના અમારા અદ્યતન સંશોધનનો ઉપયોગ કરીને ભાષાના મોડેલની સંભાવનાઓને અનુમાનિત કરીએ છીએ.
અમે વિદ્યાર્થીના જવાબનું એમ્બેડિંગ મેળવી શકીએ છીએ અને તેની વાસ્તવિક જવાબને એમ્બેડિંગ સાથે તુલના કરી શકીએ છીએ. જો તેમની વચ્ચે કોસાઇનનું અંતર ચોક્કસ થ્રેશોલ્ડ કરતા ઓછું હોય, તો આપણે તેમને સમાન ગણી શકીએ અને જવાબને સાચા તરીકે ચિહ્નિત કરી શકીએ.
અમે BERT[1] અને RoBERTa[2] જેવા સ્વ-ધ્યાન આધારિત મોડલનો ઉપયોગ વિદ્યાર્થીના જવાબ અને સાચા જવાબના એમ્બેડિંગ મેળવવા માટે કરી શકીએ છીએ અને તેમની વચ્ચે સમાનતા મેળવવા માટે તેમની વચ્ચેના કોસાઇન અંતરની ગણતરી કરી શકીએ છીએ.
સંદર્ભ
[3] ફાલદુ, કેયુર, અમિત શેઠ, પ્રશાંત કિકાણી અને હેમાંગ અકબરી. “KI-BERT: વધુ સારી ભાષા અને ડોમેન સમજણ માટે જ્ઞાન સંદર્ભનો સમાવેશ.” arXiv preprint arXiv:2104.08145 (2021).
[4] ગૌર, માનસ, અંકિત દેસાઈ, કેયુર ફાલદુ અને અમિત શેઠ. “નોલેજ ગ્રાફ્નો ઉપયોગ કરીને સમજાવી શકાય તેવું AI.” ACM CoDS-COMAD કોન્ફરન્સમાં. 2020.
[5] ગૌર, માનસ, કેયુર ફાલદુ અને અમિત શેઠ. “બ્લેક-બોક્સના અર્થશાસ્ત્ર: શું જ્ઞાન ગ્રાફ ડીપ લર્નિંગ સિસ્ટમ્સને વધુ અર્થઘટન અને સમજાવી શકાય તેવું બનાવવામાં મદદ કરી શકે છે?.” IEEE ઇન્ટરનેટ કમ્પ્યુટિંગ 25, નં. 1 (2021): 51-59.
[6] ધવલા, સોમા, ચિરાગ ભાટિયા, જોય બોઝ, કેયુર ફાલદુ અને અદિતિ અવસ્થી. “ડાયગ્નોસ્ટિક એસેસમેન્ટ અને તેમની ગુણવત્તા મૂલ્યાંકનનું સ્વતઃ નિર્માણ.” ઇન્ટરનેશનલ એજ્યુકેશનલ ડેટા માઇનિંગ સોસાયટી (2020).
[7] “#RAISE2020 – Embibe – વ્યક્તિગત શિક્ષણ માટે AI-સંચાલિત શિક્ષણ પરિણામોનું પ્લેટફોર્મ”, MyGov India, ઑક્ટો 2020, https://www.youtube.com/watch?v=kuwFtHgN3qU
[8] ફાલદુ, કેયુર, અચિંત થોમસ અને અદિતિ અવસ્થી. “સંદર્ભિત જ્ઞાન આધારનો ઉપયોગ કરીને વ્યક્તિગત મટીરીયલની ભલામણ કરવા માટેની સિસ્ટમ અને પદ્ધતિ.” યુ.એસ.પેટન્ટ એપ્લિકેશન 16/586,512, ઑક્ટોબર 1, 2020 ફાઇલ કરવામાં આવી.