ફ્રી ટેક્સ્ટ જવાબ આધારિત પ્રશ્નોનું સ્વચાલિત મૂલ્યાંકન

મોટાભાગની સ્પર્ધાત્મક પરીક્ષાઓમાં સહભાગીઓને ઓબ્જેક્ટિવ પ્રકારના પ્રશ્નો હલ કરવાની જરૂર પડે છે, જેમ કે પ્રશ્નો કે જેના માટે આપેલ જવાબ પસંદગીના સમૂહમાંથી એક અથવા વધુ સાચા જવાબો પસંદ કરવા જરૂરી હોય છે અથવા પ્રશ્નો કે જેના માટે સહભાગીઓએ સંખ્યાત્મક મૂલ્ય દાખલ કરવું પડે છે. ટેસ્ટનું મૂલ્યાંકન જે ઓબ્જેક્ટિવ પ્રકારના પ્રશ્નો પર આધારિત છે તે એકદમ સીધું છે.

જો કે, ઘણી પરીક્ષાઓ છે, જેમ કે બોર્ડની પરીક્ષાઓ, જેમાં મફત ટેક્સ્ટ જવાબો સાથેના પ્રશ્નોનો સમાવેશ થાય છે. નિબંધ સ્કોરિંગને લક્ષ્યાંકિત કરતા કેટલાક સફળ ઉકેલો સાથે મફત ટેક્સ્ટ જવાબોનું મૂલ્યાંકન હજી પણ એક ખુલ્લી સંશોધન સમસ્યા છે. Embibe સ્કેલ [7] પર લર્નિંગ આઉટકમને પહોંચાડવા માટે એક AI પ્લેટફોર્મ છે, અને આવી ક્ષમતા ફ્રી-ટેક્સ્ટ જવાબ આધારિત પ્રશ્નો સાથે વ્યક્તિગત ટેસ્ટ બનાવવામાં અને સંદર્ભિત નોલેજ ગ્રાફ [6][8]માં વિદ્યાર્થીઓના કોન્સેપ્ટની નિપુણતાનું મૂલ્યાંકન કરવામાં મદદ કરી શકે છે. એક સામાન્ય મૂલ્યાંકનકર્તા વિકસાવવા જે વિવિધ શૈક્ષણિક ડોમેન પર વિવિધ શૈલીઓના મફત ટેક્સ્ટ જવાબો સ્કોર કરી શકે તે માટે અદ્યતન NLP/NLU નો ઉપયોગ કરવાની જરૂર છે અને તે Embibe માટે રુચિનું ક્ષેત્ર છે.

આપણે સમસ્યાને બે પેટા-સમસ્યાઓમાં વિભાજિત કરી શકીએ છીએ.

એન્ટિટી લિંકિંગ
અર્થપૂર્ણ સમાનતા

એન્ટિટી લિંકિંગ

એન્ટિટી લિંકિંગમાં, અમે શોર્ટ ફોર્મ/સંક્ષિપ્ત શબ્દો અને ઉર્ફ (તે તરીકે પણ ઓળખાય છે) પ્રકારનો સમાવેશ કરી શકીએ છીએ. ઉદાહરણ તરીકે, ટૂંકા અક્ષરો

“PMC”: “પોલેન મધર સેલ”,

“MMC”: “મેગાસ્પોર મધર સેલ”,

“PEN”: “પ્રાઈમરી એન્ડોસ્પર્મ ન્યુક્લિયસ”,

“PEC”: “પ્રાઈમરી એન્ડોસ્પર્મ સેલ”,

“LH”: “લ્યુટિનાઇઝિંગ હોર્મોન”,

“FSH”: “ફોલિકલ સ્ટિમ્યુલેટિંગ હોર્મોન”

અને જેમ કે,

“મશરૂમ”: “ટોડસ્ટૂલ”,

“જર્મ્સ”: “સૂક્ષ્મજીવાણુઓ”,

“બેક્ટેરિયા”: “સૂક્ષ્મજીવાણુઓ”,

“યીસ્ટ”: “સૂક્ષ્મજીવાણુઓ”,

“નવીનીકરણીય”: “અખૂટ”,

“લક્ષણો”: “લક્ષણો”,

અમે રાસાયણિક નામની સંસ્થાઓને પણ મેપ કરી શકીએ છીએ જેમ કે,

‘(NH4)(NO3)’ : ‘એમોનિયમ નાઈટ્રેટ’,

‘(NH4)2C2O4’ : ‘એમોનિયમ ઓક્સાલેટ’,

‘Ag2O’ : ‘સિલ્વર ઓક્સાઇડ’,

‘Ag2SO4’ : ‘સિલ્વર સલ્ફેટ’,

‘Al(NO3)3’ : ‘એલ્યુમિનિયમ નાઈટ્રેટ’,

આ મેપિંગનો ઉપયોગ કરીને, અમે ટૂંકા અક્ષરો અને સમાન શબ્દોનો મેપ બનાવી શકીએ છીએ અને પછી તેમને વાસ્તવિક જવાબો સાથે મેચ કરી શકીએ છીએ.

સિમેન્ટીક સમાનતા

બે વાક્યોનો અર્થ સમાન હોઈ શકે. અમે ડોમેન-ઇન્ફ્યુઝ્ડ નોલેજનો ઉપયોગ કરીને સિમેન્ટીક સમાનતા સ્થાપિત કરીએ છીએ અને પ્રાકૃતિક ભાષાની સમજણ અને નોલેજ ઇન્ફ્યુઝ્ડ લર્નિંગ [3][4][5]ના અમારા અદ્યતન સંશોધનનો ઉપયોગ કરીને ભાષાના મોડેલની સંભાવનાઓને અનુમાનિત કરીએ છીએ.

અમે વિદ્યાર્થીના જવાબનું એમ્બેડિંગ મેળવી શકીએ છીએ અને તેની વાસ્તવિક જવાબને એમ્બેડિંગ સાથે તુલના કરી શકીએ છીએ. જો તેમની વચ્ચે કોસાઇનનું અંતર ચોક્કસ થ્રેશોલ્ડ કરતા ઓછું હોય, તો આપણે તેમને સમાન ગણી શકીએ અને જવાબને સાચા તરીકે ચિહ્નિત કરી શકીએ.

અમે BERT[1] અને RoBERTa[2] જેવા સ્વ-ધ્યાન આધારિત મોડલનો ઉપયોગ વિદ્યાર્થીના જવાબ અને સાચા જવાબના એમ્બેડિંગ મેળવવા માટે કરી શકીએ છીએ અને તેમની વચ્ચે સમાનતા મેળવવા માટે તેમની વચ્ચેના કોસાઇન અંતરની ગણતરી કરી શકીએ છીએ.

સંદર્ભ

1] જેકબ ડેવલિન, મિંગ-વેઇ ચાંગ, કેન્ટન લી, ક્રિસ્ટીના ટૌટાનોવા. “BERT: ભાષાની સમજ માટે ડીપ બાયડાયરેક્શનલ ટ્રાન્સફોર્મર્સની પૂર્વ-તાલીમ”

[2] યિનહાન લિયુ, માયલે ઓટ, નમન ગોયલ, જિંગફેઈ ડુ, મંદાર જોશી, ડાંગી ચેન, ઓમર લેવી, માઈક લેવિસ, લ્યુક ઝેટલમોયર, વેસેલિન સ્ટોયાનોવ. “રોબર્ટા: એક મજબૂત રીતે ઑપ્ટિમાઇઝ BERT પ્રીટ્રેનિંગ અભિગમ”

[3] ફાલદુ, કેયુર, અમિત શેઠ, પ્રશાંત કિકાણી અને હેમાંગ અકબરી. “KI-BERT: વધુ સારી ભાષા અને ડોમેન સમજણ માટે જ્ઞાન સંદર્ભનો સમાવેશ.” arXiv preprint arXiv:2104.08145 (2021).

[4] ગૌર, માનસ, અંકિત દેસાઈ, કેયુર ફાલદુ અને અમિત શેઠ. “નોલેજ ગ્રાફ્નો ઉપયોગ કરીને સમજાવી શકાય તેવું AI.” ACM CoDS-COMAD કોન્ફરન્સમાં. 2020.

[5] ગૌર, માનસ, કેયુર ફાલદુ અને અમિત શેઠ. “બ્લેક-બોક્સના અર્થશાસ્ત્ર: શું જ્ઞાન ગ્રાફ ડીપ લર્નિંગ સિસ્ટમ્સને વધુ અર્થઘટન અને સમજાવી શકાય તેવું બનાવવામાં મદદ કરી શકે છે?.” IEEE ઇન્ટરનેટ કમ્પ્યુટિંગ 25, નં. 1 (2021): 51-59.

[6] ધવલા, સોમા, ચિરાગ ભાટિયા, જોય બોઝ, કેયુર ફાલદુ અને અદિતિ અવસ્થી. “ડાયગ્નોસ્ટિક એસેસમેન્ટ અને તેમની ગુણવત્તા મૂલ્યાંકનનું સ્વતઃ નિર્માણ.” ઇન્ટરનેશનલ એજ્યુકેશનલ ડેટા માઇનિંગ સોસાયટી (2020).

[7] “#RAISE2020 – Embibe – વ્યક્તિગત શિક્ષણ માટે AI-સંચાલિત શિક્ષણ પરિણામોનું પ્લેટફોર્મ”, MyGov India, ઑક્ટો 2020, https://www.youtube.com/watch?v=kuwFtHgN3qU

[8] ફાલદુ, કેયુર, અચિંત થોમસ અને અદિતિ અવસ્થી. “સંદર્ભિત જ્ઞાન આધારનો ઉપયોગ કરીને વ્યક્તિગત મટીરીયલની ભલામણ કરવા માટેની સિસ્ટમ અને પદ્ધતિ.” યુ.એસ.પેટન્ટ એપ્લિકેશન 16/586,512, ઑક્ટોબર 1, 2020 ફાઇલ કરવામાં આવી.

ફ્રી ટેક્સ્ટ જવાબ આધારિત પ્રશ્નોનું સ્વચાલિત મૂલ્યાંકન