નોલેજ ગ્રાફ નોડ્સ વચ્ચેના સંબંધોનું સ્વત: વર્ગીકરણ
પરિચય:
Embibe નો નોલેજ ગ્રાફ (KG) એ એક અભ્યાસક્રમ અજ્ઞેયાત્મક બહુ-પરિમાણીય ગ્રાફ છે જેમાં 75,000+ નોડ્સનો સમાવેશ થાય છે. આ દરેક નોડ શૈક્ષણિક નોલેજના એક અલગ એકમનું પ્રતિનિધિત્વ કરે છે, જેને કોન્સેપ્ટ પણ કહેવાય છે. નોલેજ ગ્રાફમાં નોડ વચ્ચે હજારો આંતર-જોડાણો (સંબંધો) પણ છે જે દર્શાવે છે કે કેવી રીતે કોન્સેપ્ટ સ્વતંત્ર નથી પરંતુ તેના બદલે અન્ય કોન્સેપ્ટ સાથે સંબંધિત છે.
નોડ્સ વચ્ચેના આંતર-જોડાણોને તેમની વચ્ચે અસ્તિત્વમાં રહેલા સંબંધના પ્રકારને આધારે એક પ્રકાર સોંપવામાં આવે છે. અપૂર્ણ નોલેજ ગ્રાફ અને ખોવાયેલા સંબંધો સંશોધકો વચ્ચે જાણીતી સમસ્યાઓ પૈકીની એક છે. જો કે, જેમ જેમ Embibe તેના કોન્ટેન્ટને વિસ્તૃત કરે છે, ત્યાં પ્રક્રિયાને ઓટોમેટિક કરવાની જરૂર છે. છેલ્લા 8 વર્ષોમાં લાખો વિદ્યાર્થીઓ માટે KG કોન્ટેન્ટ પરની ક્રિયાપ્રતિક્રિયાના ડેટાની ઉપલબ્ધતાને જોતાં, અને ગ્રાફ થિયરી અને પ્રાકૃતિક ભાષાની સમજણમાંથી તકનીકોનો ઉપયોગ કરીને, સંબંધોને N વર્ગોમાંથી એકમાં ઓટો: વર્ગીકરણ કરવું શક્ય છે.
સંબંધોના પ્રકાર:
પૂર્વશરત સંબંધ આ સંબંધોમાંથી એક છે. કોઈ ચોક્કસ કોન્સેપ્ટ શીખતા પહેલા શીખવાની તમામ પૂર્વજરૂરીયાતો આ સંબંધ દ્વારા અમારા KG માં આપવામાં આવી છે. સામાન્ય રીતે, વિદ્યાર્થી કોઈપણ કોન્સેપ્ટ શીખતા પહેલા પૂર્વજરૂરીયાતો શીખે છે. તે તેમને કોન્સેપ્ટને વધુ સારી રીતે સમજવામાં મદદ કરે છે. અમે કોન્સેપ્ટ નિપુણતાના દાખલાઓ અને શીખવાના માર્ગો મેળવવા માટે લાખો વિદ્યાર્થીઓના અબજો અભ્યાસ અને ટેસ્ટ પ્રયાસોનું વિશ્લેષણ કરીએ છીએ. આ દાખલાઓનો ઉપયોગ કોન્સેપ્ટ વચ્ચેના પ્રયોગમૂલક કારણો સ્થાપિત કરવા માટે થાય છે. ડેટાના આ છુપાયેલા લક્ષણે વિદ્યાર્થી દ્વારા તેમના ધ્યેયને હાંસલ કરવા માટે અનુસરવામાં આવતા સામાન્ય શીખવાનો માર્ગ શોધવામાં અમને મદદ કરી છે. અમે સ્કોરિંગ પદ્ધતિના આધારે પૂર્વજરૂરી કોન્સેપ્ટ શોધવા માટે આ સામાન્ય શીખવાના માર્ગોનો ઉપયોગ કર્યો છે.
સંશોધન અભિગમો:
અમે વિદ્યાર્થીઓ માટે કોન્સેપ્ટ નિપુણતાની આગાહી કરવા માટે નોલેજ ગ્રાફમાંથી નોલેજ પ્રેરણા સાથે ઊંડા નોલેજ ટ્રેસિંગની અત્યાધુનિક ટેકનિકનો ઉપયોગ કરીએ છીએ. અમે ઐતિહાસિક પહેલાના આધાર પર કન્ડિશનલ કોન્સેપ્ટ માસ્ટરીને પોપ્યુલેટ કરીને કોલ્ડ સ્ટાર્ટ સમસ્યાને પણ હેન્ડલ કરીએ છીએ. વિદ્યાર્થીઓના વર્તુંણકીય માપાંકન અને નોલેજ ગ્રાફના કોન્સેપ્ટ પર તેના પ્રતિબિંબને કારણે Embibe વિશિષ્ટ રીતે સ્થિત છે. કોન્સેપ્ટ વચ્ચેના સંબંધને વર્ગીકૃત કરવામાં કોન્સેપ્ટના આ વર્તણૂકીય લક્ષણોનો પણ લાભ લેવામાં આવે છે.
નોલેજ ગ્રાફને આગળ વધારવો:
અમે પહેલાથી જ કોન્સેપ્ટ વચ્ચે ઘણા સંબંધો ધરાવીએ છીએ. જ્યારે પણ ગ્રાફમાં કોઈપણ નવો કોન્સેપ્ટ રજૂ કરવામાં આવે છે, ત્યારે આપણે અન્ય કોન્સેપ્ટ સાથે તેના સંબંધોને વ્યાખ્યાયિત કરવાની જરૂર છે. કાર્યની જટિલતાને કારણે આ એક ખૂબ જ મહત્વપૂર્ણ ઉપયોગ બની જાય છે. કોઈપણ ખોટું સંબંધિત ટેગીંગ યુઝરને ખોટી દિશામાં રીડાયરેક્ટ કરી શકે છે.
Embibe પર, અમે અમારી પ્રોડક્ટને વિવિધ ભાષાઓમાં અને વિવિધ અભ્યાસક્રમો માટે લોન્ચ કરવા માંગીએ છીએ. આ નવા કોન્સેપ્ટ માટે અમારે અમારા KG ને લંબાવવું પડશે. આજ સુધી અમે નવા કોન્સેપ્ટ સર્ચ અને અન્ય કોન્સેપ્ટ સાથે તેમના સંબંધો શોધવા અને હાલના સંબંધોની માન્યતા માટે ફેકલ્ટીઝ પર સંપૂર્ણપણે નિર્ભર હતા. આ કાર્યો ખૂબ જ કંટાળાજનક તેમજ ધીમા છે. ડેટાનું પ્રમાણ ઝડપથી વધી રહ્યું હોવાથી આ અમારા માટે ખૂબ જ પડકારજનક બની ગયું છે. સમગ્ર ડેટા તૈયાર કરવાની પ્રક્રિયા માટે માનવ પૂર્વગ્રહની પણ જરૂર છે.
અમે જોયું છે કે કોઈપણ કોન્સેપ્ટ શીખતા પહેલા વિદ્યાર્થીઓ અનુરૂપ પૂર્વજરૂરીયાતો શીખે છે. તેથી વિદ્યાર્થીઓના પ્રયાસ ક્રમ (પ્રયત્નો ક્રમ) માં તેમના કોન્સેપ્ટ પૂર્વજરૂરી કોન્સેપ્ટ પછીના છે. અમે વિદ્યાર્થીની સામાન્ય વિશેષતા મેળવવા માટે પ્રયાસ કરેલ પ્રશ્ન ક્રમ પેટર્ન શોધી રહ્યા છીએ જે વિદ્યાર્થીની ચોકસાઈમાં સુધારણાને અસર કરી રહી છે. આને અસરકારક રીતે ઉકેલવા માટે, DKT (ડીપ નોલેજ ટ્રેસિંગ) (LSTM) નો ઉપયોગ યુઝર પ્રયાસ ડેટા અને ચોકસાઈ સાથે કરવામાં આવી રહ્યો છે તે જોવા માટે કે કયા કોન્સેપ્ટ/પ્રયાસની ક્રમ વર્ગીકરણ સમસ્યા તરીકે તેની પેટર્ન ચોકસાઈ પર વધુ અસર કરે છે. છેલ્લે પ્રશિક્ષિત DKT મોડેલનો ઉપયોગ નવા કોન્સેપ્ટ માટે સંબંધ રેન્કિંગ માટે કરવામાં આવ્યો છે. બાદમાં આ રેન્કિંગ નોલેજ ગ્રાફ નોડ્સ વચ્ચેના નવા સંબંધિત સૂચનો માટે વપરાય છે.
સારાંશ:
નોલેજ ગ્રાફ એ Embibe ની તમામ પ્રોડક્ટ માટે કરોડરજ્જુ છે. તેથી નોલેજ ગ્રાફ પૂર્ણ કરવો એ આપણું પ્રાથમિક કાર્ય છે. આ કાર્યથી અમને નોલેજ ગ્રાફ જાળવવામાં અને અત્યંત ન્યૂનતમ મેન્યુઅલ ઇન્ટરવેશન સાથે તેને ઝડપથી વિસ્તારવામાં મદદ મળી છે.
છેવટે, કોન્સેપ્ટ વચ્ચેના નવા ગુપ્ત સંબંધોને શોધવા માટે આ એક ખુલ્લી સમસ્યા છે. અમે વિવિધ સ્ત્રોતોમાંથી આપેલ ટેક્સ્ટ્યુઅલ ડેટામાંથી કોન્સેપ્ટ શોધવાની પ્રક્રિયાને સ્વચાલિત કરી છે. પાછળથી આપણે આ ટેકનિકનો ઉપયોગ કરીને હાલના કોન્સેપ્ટ સાથે આ નવા મળેલા કોન્સેપ્ટના સંબંધો શોધીએ છીએ. આ પદ્ધતિને નોલેજ ગ્રાફ માન્યતા માટે પણ વિસ્તૃત કરી શકાય છે.
સંદર્ભ:
- ક્રિસ પીચ, જોનાથન સ્પેન્સર, જોનાથન હુઆંગ, સૂર્યા ગાંગુલી, મેહરાન સાહમી, લિયોનીદાસ જે. ગુઇબાસ અને જસ્સા સોહલ-ડિકસ્ટેન. ડીપ નોલેજ ટ્રેસિંગ.CoRR, abs/1506.05908, 2015. URLhttp://arxiv.org/abs/1506.05908.
- કે. ગ્રેફ, આર. કે. શ્રીવાસ્તવ, જે. કાઉટનીક, બી. આર. સ્ટ્યુનબ્રિંક અને જે. શ્મિધુબર, “LSTM: સર્ચ સ્પેસ ઓડિસી,” ન્યુરલ નેટવર્ક અને લર્નિંગ સિસ્ટમ પર IEEE ટ્રાન્ઝેક્શનમાં, વોલ્યુમ. 28, નં. 10, પૃષ્ઠ 2222-2232, ઓક્ટોબર. 2017, doi: 10.1109/TNNLS.2016.2582924.
- ફાલદુ, કેયુર, અમિત શેઠ, પ્રશાંત કિકાણી અને હેમાંગ અકબરી. “KI-BERT: વધુ સારી ભાષા અને ડોમેન સમજણ માટે નોલેજ સંદર્ભનો સમાવેશ.” arXiv preprint arXiv:2104.08145 (2021).
- શેઠ, અમિત, માનસ ગૌર, કૌશિક રોય અને કેયુર ફાલદુ. “સમજવાપાત્ર AI માટે જ્ઞાન-સઘન ભાષા સમજણ.” IEEE ઇન્ટરનેટ કમ્પ્યુટિંગ 25, નં. 5 (2021): 19-24.