ઇચ્છિત જટિલતાના પ્રશ્નોનું ઓટો જનરેશન

ઇચ્છિત જટિલતાના પ્રશ્નોનું ઓટો જનરેશન

Embibe એ શિક્ષણના વ્યક્તિગતકરણ વિશે છે અને અમારી ટેક્નોલોજી યોગ્ય સમયે, યોગ્ય વિદ્યાર્થીને યોગ્ય કોન્ટેન્ટ પૂરું કરવામાં ખૂબ જ સારી છે. આ કારણોસર જ ઉપયોગી કોન્ટેન્ટના વિશાળ ડેટાસેટના એક્સેસ અને ખાસ કરીને પ્રશ્નો, અમારા માટે ખૂબ જ મહત્વપૂર્ણ છે. ઐતિહાસિક રીતે, Embibe ના પ્રશ્નોનો ડેટાસેટ માનવ ડેટા એન્ટ્રી ઓપરેટરો દ્વારા તૈયાર કરવામાં આવ્યો હતો. તેઓ ઇન્ટરનેટ પર મુક્તપણે ઉપલબ્ધ વિવિધ પ્રશ્નોના સેટમાંથી અથવા અમારી ભાગીદાર સંસ્થાઓ સાથે જોડાણ દ્વારા પ્રશ્નોને પ્રાપ્ત કરશે.

પ્રશ્નોના સ્વતઃઉત્પાદનની મુખ્ય પ્રેરણા વિદ્યાર્થીઓની તેમના શિક્ષકો/માર્ગદર્શકો પર નિર્ભરતા ઘટાડવાની છે. લાખો વિદ્યાર્થીઓને ખરેખર શિક્ષણ આપવા માટે, તેઓ કોઈપણ બાહ્ય મદદ વિના કોન્સેપ્ટ/વિષયોનો અભ્યાસ કરવા અને તેમની પ્રગતિને જાતે માપવા સક્ષમ હોવા જોઈએ. અમર્યાદિત પ્રશ્નોના એક્સેસ બુદ્ધિશાળી મૂલ્યાંકન સર્જન[3], વિદ્યાર્થીઓનું નિદાન [4] અથવા લર્નિંગ આઉટકમ [5][6] પહોંચાડવા માટે વ્યક્તિગત કોન્ટેન્ટ પ્રદાન કરે છે. પ્રશ્નોનું સ્વતઃ-ઉત્પાદન અને વિદ્યાર્થીઓને પ્રેક્ટિસ કરવા અને તેમની પ્રગતિનું મૂલ્યાંકન કરવાની મંજૂરી આપવી એ તે તરફનું એક પગલું છે.

જો કે, અમારા પ્લેટફોર્મ પર વિદ્યાર્થીઓએ જેમાં તેમને સુધારવાની જરૂર હોય તેવા કોઈપણ વિષય પરના પ્રશ્નો ક્યારેય સમાપ્ત ન થાય તે સુનિશ્ચિત કરવા માટે, Embibe AI વિકસાવવામાં રોકાણ કરી રહ્યું છે જે નવા પ્રશ્નો અને તેમના સંબંધિત જવાબો આપમેળે જનરેટ કરી શકે છે. આ કાર્યમાં કોન્ટેન્ટ ક્લસ્ટરિંગ, ટોપિક મોડેલિંગ, અત્યાધુનિક નેચરલ લેંગ્વેજ જનરેશન (NLG) અને સોલ્વર ટેક્નોલોજીમાંથી વિચારો લેવાનો સમાવેશ થાય છે.

ઉદ્દેશ્ય

Embibe પર અમે, પ્રશ્નોના જવાબો આપીને કોન્સેપ્ટની પ્રેક્ટિસ અને માસ્ટરિંગ દ્વારા શીખવાનું એક માળખાની રજુઆત કરીએ છીએ જે કોન્સેપ્ટને યાદ રાખવા અને સમજવાની પરોક્ષ રીત છે. સ્વયંસંચાલિત નોલેજ જનરેશન એ એક પ્રક્રિયા છે જે શીખવાના લખાણને ઇનપુટ તરીકે લે છે અને તેમાંથી પ્રશ્નો પેદા કરે છે જેના આધારે વિદ્યાર્થીઓ તેમના નોલેજને પ્રેક્ટિસ અને શીખવા માટે લાગુ કરી શકે છે.

ઓટોમેટિક પ્રશ્ન જનરેશન એ નેચરલ લેંગ્વેજ પ્રોસેસિંગ (NLP) નો એક ભાગ છે. તે સંશોધનનું ક્ષેત્ર છે જ્યાં ઘણા સંશોધકોએ તેમનું કાર્ય રજૂ કર્યું છે. તેમાં હજુ પણ ઉચ્ચ ચોકસાઈ હાંસલ કરવાની બાકી છે. ઘણા સંશોધકોએ NLP દ્વારા ઓટોમેટિક પ્રશ્ન જનરેશનના ક્ષેત્રમાં કામ કર્યું છે અને વિવિધ પ્રકારના પ્રશ્નો આપોઆપ તૈયાર કરવા માટે અસંખ્ય ટેકનિક અને મોડેલો વિકસાવવામાં આવ્યા છે.

અભિગમ

આકૃતિ 1 માં દર્શાવેલ આલેખ, ઓટો પ્રશ્ન જનરેશનના આર્કિટેક્ચર માટે ખૂબ જ ઉચ્ચ સ્તરીય અભિગમ દર્શાવે છે. ઓટો પ્રશ્ન જનરેશન NLP ટેકનિક સાથે ટ્રાન્સફોર્મર મોડલના કટીંગ એજ વેરિઅન્ટનો ઉપયોગ કરે છે. તે બનાવેલા પ્રશ્નોની ગુણવત્તા અને જટિલતાને વધારવા માટે લખાણની સિન્ટેક્ટિક અને સિમેન્ટીક સમજણ પર કરવામાં આવતા સંશોધન કાર્યનો પણ લાભ લે છે.

આકૃતિ 1. ઓટો પ્રશ્ન જનરેશનના ઉચ્ચ સ્તરનું આર્કિટેક્ચર

પાઈપલાઈન તરીકે ઓટોમેટિક પ્રશ્ન જનરેશનમાં ટેક્સ્ટ પ્રોસેસિંગ, ફીચર એક્સ્ટ્રક્શન અને એન્જિનિયરિંગ, મોડલ નિર્માણ અને તાલીમ, મોડલ મૂલ્યાંકન, ટીકા અને કેટલીક માનક ML ટેકનિક જેવા પુષ્કળ ઘટકોનો સમાવેશ થાય છે.

અમે અમારા QA મોડલને તાલીમ આપવા માટે ARC, DROP, QASC, SciQ, SciTail, SQuAD અને Google NQ અને Embibe ની માલિકીના ડેટાસેટ જેવા 20+ વિવિધ ઓપન-સોર્સ ડેટાસેટનો ઉપયોગ કર્યો છે. અમે બુલિયન, સ્પાન-આધારિત, ખાલી જગ્યાઓ ભરો, બહુવિધ પસંદગીના પ્રશ્નો વગેરે જેવા વિવિધ પ્રકારના પ્રશ્નોનો પણ ઉપયોગ કર્યો છે. પ્રશ્નની મુશ્કેલી એ પ્રશ્નની સિન્ટેક્ટિક રચના, જવાબ મેળવવા માટે જરૂરી મલ્ટી-હોપ રિઝનિંગ અને જટિલતાને આધારે લેવામાં આવે છે. અમે KI-BERT[1] દ્વારા પ્રેરિત QG મોડલમાં સંબંધિત નોલેજ ઉમેરવા માટે નોલેજ ગ્રાફનો પણ ઉપયોગ કરી રહ્યા છીએ. અમે પ્રશ્ન જનરેશનની કામગીરીમાં સુધારો કરવા માટે મૂળ બિલ્ટ નેચરલ લેંગ્વેજ અન્ડરસ્ટેન્ડિંગ ટેકનિકનો લાભ લઈએ છીએ.

ટેક્સ્ટ જનરેટ કરવા માટે અમે T5[2] જેવા જનરેટિવ મોડલનો ઉપયોગ કરી શકીએ છીએ, જે આપેલ સંદર્ભ અને જવાબમાંથી પ્રશ્ન જનરેટ કરી શકે છે. ફ્લો કેવો દેખાશે તે અહીં છે.

આકૃતિ 2. QG મોડેલ વર્કફ્લો

આઉટકમ

Embibe AI પ્લેટફોર્મ વિદ્યાર્થીઓ માટે પાઠ્ય પુસ્તકોમાંથી શક્ય તેટલા વધુ પ્રશ્નો પેદા કરવા માટે આ કાર્યનો લાભ લે છે. તમામ ગ્રેડ, ધ્યેયો, પરીક્ષાઓ, રાજ્ય બોર્ડને ધ્યાનમાં લેતા, અત્યાર સુધીમાં અમે ધોરણ 6 થી 12 ની NCERT બુકમાંથી ~125k પ્રશ્નો જનરેટ કર્યા છે. અમારી પાસે કોઈપણ ફ્રી-ફોર્મ લર્નિંગ ટેક્સ્ટમાંથી પ્રશ્નો જનરેટ કરવાની ક્ષમતા છે.

વાસ્તવિક દુનિયાના સંજોગોમાં જીવન અને શિક્ષણના પરિણામોને હાંસલ કરવા માટે આ સિસ્ટમને કોઈપણ ડોમેન અને લક્ષ્યમાં લઈ શકાય છે. અમે અદ્યતન NLP ના ક્ષેત્રમાં મોડલ અને સિસ્ટમને વધુ અદ્યતન બનાવવા અને તેને ડોમેન વિશિષ્ટ બનાવવાના માર્ગ પર છીએ.

અહીં, અમે ડોમેન વિશિષ્ટ ઇનપુટ અને જનરેટ થયેલા પ્રશ્નોના સેટના કેટલાક ઉદાહરણો આપ્યા છે.

શૈક્ષણિક લખાણ:

આકૃતિ 3. પસંદ કરેલ પેરેગ્રાફ અને હાઇલાઇટ કરેલ ADPE એટલે કે શૈક્ષણિક રીતે સંબંધિત શબ્દો

જનરેટ કરેલ પ્રશ્નો:

આકૃતિ 4. પસંદ કરેલ પેરેગ્રાફ QG મોડેલ દ્વારા જનરેટ કરાયેલા પ્રશ્નો છે

સંદર્ભ

[1] ફાલદુ, કેયુર, અમિત શેઠ, પ્રશાંત કિકાની અને હેમાંગ અકબરી. “KI-BERT: વધુ સારી ભાષા અને ડોમેન સમજણ માટે જ્ઞાન સંદર્ભનો સમાવેશ.” arXiv preprint arXiv:2104.08145 (2021).

[2] કોલિન રાફેલ, નોઆમ શેઝીર, એડમ રોબર્ટ, કેથરીન લી, શરણ નારંગ, માઈકલ માટેના, યાન્કી ઝોઉ, વેઈ લી, પીટર જે. લિયુ. “એક યુનિફાઇડ ટેક્સ્ટ-ટુ-ટેક્સ્ટ ટ્રાન્સફોર્મર સાથે ટ્રાન્સફર લર્નિંગની મર્યાદાઓનું અન્વેષણ કરવું”

[3] દેસાઈ, નિશિત, કેયુર ફાલદુ, અચિંત થોમસ અને અદિતિ અવસ્થી. “એસેસમેન્ટ પેપર બનાવવા અને તેની ગુણવત્તા માપવા માટેની સિસ્ટમ અને પદ્ધતિ.” યુ.એસ. પેટન્ટ એપ્લિકેશન 16/684,434, ઑક્ટોબર 1, 2020 ના રોજ ફાઇલ કરવામાં આવી.

[4] “ડાયગ્નોસ્ટિક ટેસ્ટ અને તેમની ગુણવત્તા મૂલ્યાંકનનું સ્વયંસંચાલિતકરણ – EDM:2020”, EDM 2020 પ્રસ્તુતિ, જુલાઈ 2020, https://www.youtube.com/watch?v=7wZz0ckqWFs

[5] થોમસ, અચિંત, કેયુર ફાલદુ અને અદિતિ અવસ્થી. “અધિક્રમિક રીતે શૈક્ષણિક કોન્ટેન્ટની વ્યક્તિગત પુનઃપ્રાપ્તિ માટેની સિસ્ટમ અને પદ્ધતિ.” યુ.એસ. પેટન્ટ એપ્લિકેશન 16/740,223, ઑક્ટોબર 1, 2020 ના રોજ ફાઇલ કરવામાં આવી.

[6] ફાલદુ, કેયુર, અચિંત થોમસ અને અદિતિ અવસ્થી. “સંદર્ભિત જ્ઞાન આધારનો ઉપયોગ કરીને વ્યક્તિગત કોન્ટેન્ટની ભલામણ કરવા માટેની સિસ્ટમ અને પદ્ધતિ.” યુ.એસ. પેટન્ટ એપ્લિકેશન 16/586,512, ઑક્ટોબર 1, 2020 ફાઇલ કરવામાં આવી.