ઇચ્છિત જટિલતાના પ્રશ્નોનું ઓટો જનરેશન
Embibe એ શિક્ષણના વ્યક્તિગતકરણ વિશે છે અને અમારી ટેક્નોલોજી યોગ્ય સમયે, યોગ્ય વિદ્યાર્થીને યોગ્ય કોન્ટેન્ટ પૂરું કરવામાં ખૂબ જ સારી છે. આ કારણોસર જ ઉપયોગી કોન્ટેન્ટના વિશાળ ડેટાસેટના એક્સેસ અને ખાસ કરીને પ્રશ્નો, અમારા માટે ખૂબ જ મહત્વપૂર્ણ છે. ઐતિહાસિક રીતે, Embibe ના પ્રશ્નોનો ડેટાસેટ માનવ ડેટા એન્ટ્રી ઓપરેટરો દ્વારા તૈયાર કરવામાં આવ્યો હતો. તેઓ ઇન્ટરનેટ પર મુક્તપણે ઉપલબ્ધ વિવિધ પ્રશ્નોના સેટમાંથી અથવા અમારી ભાગીદાર સંસ્થાઓ સાથે જોડાણ દ્વારા પ્રશ્નોને પ્રાપ્ત કરશે.
પ્રશ્નોના સ્વતઃઉત્પાદનની મુખ્ય પ્રેરણા વિદ્યાર્થીઓની તેમના શિક્ષકો/માર્ગદર્શકો પર નિર્ભરતા ઘટાડવાની છે. લાખો વિદ્યાર્થીઓને ખરેખર શિક્ષણ આપવા માટે, તેઓ કોઈપણ બાહ્ય મદદ વિના કોન્સેપ્ટ/વિષયોનો અભ્યાસ કરવા અને તેમની પ્રગતિને જાતે માપવા સક્ષમ હોવા જોઈએ. અમર્યાદિત પ્રશ્નોના એક્સેસ બુદ્ધિશાળી મૂલ્યાંકન સર્જન[3], વિદ્યાર્થીઓનું નિદાન [4] અથવા લર્નિંગ આઉટકમ [5][6] પહોંચાડવા માટે વ્યક્તિગત કોન્ટેન્ટ પ્રદાન કરે છે. પ્રશ્નોનું સ્વતઃ-ઉત્પાદન અને વિદ્યાર્થીઓને પ્રેક્ટિસ કરવા અને તેમની પ્રગતિનું મૂલ્યાંકન કરવાની મંજૂરી આપવી એ તે તરફનું એક પગલું છે.
જો કે, અમારા પ્લેટફોર્મ પર વિદ્યાર્થીઓએ જેમાં તેમને સુધારવાની જરૂર હોય તેવા કોઈપણ વિષય પરના પ્રશ્નો ક્યારેય સમાપ્ત ન થાય તે સુનિશ્ચિત કરવા માટે, Embibe AI વિકસાવવામાં રોકાણ કરી રહ્યું છે જે નવા પ્રશ્નો અને તેમના સંબંધિત જવાબો આપમેળે જનરેટ કરી શકે છે. આ કાર્યમાં કોન્ટેન્ટ ક્લસ્ટરિંગ, ટોપિક મોડેલિંગ, અત્યાધુનિક નેચરલ લેંગ્વેજ જનરેશન (NLG) અને સોલ્વર ટેક્નોલોજીમાંથી વિચારો લેવાનો સમાવેશ થાય છે.
ઉદ્દેશ્ય
Embibe પર અમે, પ્રશ્નોના જવાબો આપીને કોન્સેપ્ટની પ્રેક્ટિસ અને માસ્ટરિંગ દ્વારા શીખવાનું એક માળખાની રજુઆત કરીએ છીએ જે કોન્સેપ્ટને યાદ રાખવા અને સમજવાની પરોક્ષ રીત છે. સ્વયંસંચાલિત નોલેજ જનરેશન એ એક પ્રક્રિયા છે જે શીખવાના લખાણને ઇનપુટ તરીકે લે છે અને તેમાંથી પ્રશ્નો પેદા કરે છે જેના આધારે વિદ્યાર્થીઓ તેમના નોલેજને પ્રેક્ટિસ અને શીખવા માટે લાગુ કરી શકે છે.
ઓટોમેટિક પ્રશ્ન જનરેશન એ નેચરલ લેંગ્વેજ પ્રોસેસિંગ (NLP) નો એક ભાગ છે. તે સંશોધનનું ક્ષેત્ર છે જ્યાં ઘણા સંશોધકોએ તેમનું કાર્ય રજૂ કર્યું છે. તેમાં હજુ પણ ઉચ્ચ ચોકસાઈ હાંસલ કરવાની બાકી છે. ઘણા સંશોધકોએ NLP દ્વારા ઓટોમેટિક પ્રશ્ન જનરેશનના ક્ષેત્રમાં કામ કર્યું છે અને વિવિધ પ્રકારના પ્રશ્નો આપોઆપ તૈયાર કરવા માટે અસંખ્ય ટેકનિક અને મોડેલો વિકસાવવામાં આવ્યા છે.
અભિગમ
આકૃતિ 1 માં દર્શાવેલ આલેખ, ઓટો પ્રશ્ન જનરેશનના આર્કિટેક્ચર માટે ખૂબ જ ઉચ્ચ સ્તરીય અભિગમ દર્શાવે છે. ઓટો પ્રશ્ન જનરેશન NLP ટેકનિક સાથે ટ્રાન્સફોર્મર મોડલના કટીંગ એજ વેરિઅન્ટનો ઉપયોગ કરે છે. તે બનાવેલા પ્રશ્નોની ગુણવત્તા અને જટિલતાને વધારવા માટે લખાણની સિન્ટેક્ટિક અને સિમેન્ટીક સમજણ પર કરવામાં આવતા સંશોધન કાર્યનો પણ લાભ લે છે.

પાઈપલાઈન તરીકે ઓટોમેટિક પ્રશ્ન જનરેશનમાં ટેક્સ્ટ પ્રોસેસિંગ, ફીચર એક્સ્ટ્રક્શન અને એન્જિનિયરિંગ, મોડલ નિર્માણ અને તાલીમ, મોડલ મૂલ્યાંકન, ટીકા અને કેટલીક માનક ML ટેકનિક જેવા પુષ્કળ ઘટકોનો સમાવેશ થાય છે.
અમે અમારા QA મોડલને તાલીમ આપવા માટે ARC, DROP, QASC, SciQ, SciTail, SQuAD અને Google NQ અને Embibe ની માલિકીના ડેટાસેટ જેવા 20+ વિવિધ ઓપન-સોર્સ ડેટાસેટનો ઉપયોગ કર્યો છે. અમે બુલિયન, સ્પાન-આધારિત, ખાલી જગ્યાઓ ભરો, બહુવિધ પસંદગીના પ્રશ્નો વગેરે જેવા વિવિધ પ્રકારના પ્રશ્નોનો પણ ઉપયોગ કર્યો છે. પ્રશ્નની મુશ્કેલી એ પ્રશ્નની સિન્ટેક્ટિક રચના, જવાબ મેળવવા માટે જરૂરી મલ્ટી-હોપ રિઝનિંગ અને જટિલતાને આધારે લેવામાં આવે છે. અમે KI-BERT[1] દ્વારા પ્રેરિત QG મોડલમાં સંબંધિત નોલેજ ઉમેરવા માટે નોલેજ ગ્રાફનો પણ ઉપયોગ કરી રહ્યા છીએ. અમે પ્રશ્ન જનરેશનની કામગીરીમાં સુધારો કરવા માટે મૂળ બિલ્ટ નેચરલ લેંગ્વેજ અન્ડરસ્ટેન્ડિંગ ટેકનિકનો લાભ લઈએ છીએ.
ટેક્સ્ટ જનરેટ કરવા માટે અમે T5[2] જેવા જનરેટિવ મોડલનો ઉપયોગ કરી શકીએ છીએ, જે આપેલ સંદર્ભ અને જવાબમાંથી પ્રશ્ન જનરેટ કરી શકે છે. ફ્લો કેવો દેખાશે તે અહીં છે.

આઉટકમ
Embibe AI પ્લેટફોર્મ વિદ્યાર્થીઓ માટે પાઠ્ય પુસ્તકોમાંથી શક્ય તેટલા વધુ પ્રશ્નો પેદા કરવા માટે આ કાર્યનો લાભ લે છે. તમામ ગ્રેડ, ધ્યેયો, પરીક્ષાઓ, રાજ્ય બોર્ડને ધ્યાનમાં લેતા, અત્યાર સુધીમાં અમે ધોરણ 6 થી 12 ની NCERT બુકમાંથી ~125k પ્રશ્નો જનરેટ કર્યા છે. અમારી પાસે કોઈપણ ફ્રી-ફોર્મ લર્નિંગ ટેક્સ્ટમાંથી પ્રશ્નો જનરેટ કરવાની ક્ષમતા છે.
વાસ્તવિક દુનિયાના સંજોગોમાં જીવન અને શિક્ષણના પરિણામોને હાંસલ કરવા માટે આ સિસ્ટમને કોઈપણ ડોમેન અને લક્ષ્યમાં લઈ શકાય છે. અમે અદ્યતન NLP ના ક્ષેત્રમાં મોડલ અને સિસ્ટમને વધુ અદ્યતન બનાવવા અને તેને ડોમેન વિશિષ્ટ બનાવવાના માર્ગ પર છીએ.
અહીં, અમે ડોમેન વિશિષ્ટ ઇનપુટ અને જનરેટ થયેલા પ્રશ્નોના સેટના કેટલાક ઉદાહરણો આપ્યા છે.
શૈક્ષણિક લખાણ:

જનરેટ કરેલ પ્રશ્નો:

સંદર્ભ
[3] દેસાઈ, નિશિત, કેયુર ફાલદુ, અચિંત થોમસ અને અદિતિ અવસ્થી. “એસેસમેન્ટ પેપર બનાવવા અને તેની ગુણવત્તા માપવા માટેની સિસ્ટમ અને પદ્ધતિ.” યુ.એસ. પેટન્ટ એપ્લિકેશન 16/684,434, ઑક્ટોબર 1, 2020 ના રોજ ફાઇલ કરવામાં આવી.
[4] “ડાયગ્નોસ્ટિક ટેસ્ટ અને તેમની ગુણવત્તા મૂલ્યાંકનનું સ્વયંસંચાલિતકરણ – EDM:2020”, EDM 2020 પ્રસ્તુતિ, જુલાઈ 2020, https://www.youtube.com/watch?v=7wZz0ckqWFs
[5] થોમસ, અચિંત, કેયુર ફાલદુ અને અદિતિ અવસ્થી. “અધિક્રમિક રીતે શૈક્ષણિક કોન્ટેન્ટની વ્યક્તિગત પુનઃપ્રાપ્તિ માટેની સિસ્ટમ અને પદ્ધતિ.” યુ.એસ. પેટન્ટ એપ્લિકેશન 16/740,223, ઑક્ટોબર 1, 2020 ના રોજ ફાઇલ કરવામાં આવી.
[6] ફાલદુ, કેયુર, અચિંત થોમસ અને અદિતિ અવસ્થી. “સંદર્ભિત જ્ઞાન આધારનો ઉપયોગ કરીને વ્યક્તિગત કોન્ટેન્ટની ભલામણ કરવા માટેની સિસ્ટમ અને પદ્ધતિ.” યુ.એસ. પેટન્ટ એપ્લિકેશન 16/586,512, ઑક્ટોબર 1, 2020 ફાઇલ કરવામાં આવી.