नॉलेज ग्राफ नोड मधील संबंधांचे स्वयं-वर्गीकरण
ओळख:
Embibe चा नॉलेज ग्राफ (KG) हा अभ्यासक्रमावर आधारित बहू-आयमी आलेख आहे जो 75,000+ नोड्सने बनलेला आहे. यापैकी प्रत्येक नोड शालेय ज्ञानाच्या स्वतंत्र एककाचे प्रतिनिधित्व करते ज्याला कॉन्सेप्ट असे देखील संबोधले जाते. ज्ञानाच्या आलेखामध्ये नोडमध्ये शेकडो हजारो अंतर्गत जोड (संबंध) आहेत जे असे दर्शविते की कॉन्सेप्ट या स्वतंत्र नाहीत परंतु त्याऐवजी त्या इतर कॉन्सेप्टशी संबंधित आहेत.
नोड मधील अंतर्गत जोडण्या या त्यांमधील संबंधांच्या प्रकारावर आधारित नियुक्त केल्या जातात. अपूर्ण ज्ञान आलेख आणि गहाळ संबंध या संशोधकांना काही माहीत असलेल्या समस्या आहेत. तथापि, जसे Embibe त्याची सामग्री वाढवत आहे, तसे ही प्रक्रिया स्वयंचलित करण्याची गरज आहे. मागील 8 वर्षांमधील लाखो विद्यार्थ्यांचा ज्ञान आलेख संकल्पनांवरील संवाद माहिती दिलेली असताना आणि आलेख सिद्धांत आणि नॅचरल लँग्वेज अंडरस्टँडिंग मधून तंत्र उपलब्ध झाल्यामुळे, संबंध कोणत्या तरी एक N वर्गामध्ये स्वयंचलित रित्या वर्गीकृत करणे शक्य आहे.
संबंधांचे प्रकार:
Embibe च्या ज्ञान आलेखामध्ये आपल्याकडे संकल्पनांमधील 16 विविध संबंध आहेत. पूर्व-आवश्यकता संबंध हा यापैकी एक संबंध आहे. या संबंधाद्वारे आमच्या ज्ञान आलेखामध्ये एखादी संकल्पना शिकण्याआधी शिकाव्या लागणाऱ्या सर्व पूर्व-आवश्यकता दिलेल्या आहेत. सामान्यतः, विद्यार्थी एखादी संकल्पना शिकण्याआधी पूर्व-आवश्यकता शिकतो. हे त्यांना संकल्पना उत्तम प्रकारे समजून घेण्यामध्ये मदत करते. संकल्पना निपुणता आणि शिकण्याच्या मार्गांचे नमुने प्राप्त करण्यासाठी आम्ही कोट्यावधी सराव आणि चाचणी प्रयत्नांचे विश्लेषण करतो. या नमुन्यांचा वापर संकल्पनांमध्ये प्रायोगिक कारणे स्थापित करण्यासाठी केला जातो. या माहितीमध्ये लपलेल्या स्वभाववैशिष्ट्याने आम्हाला त्यांचे ध्येय साध्य करण्याऱ्या विद्यार्थ्याद्वारे वापरलेला सामाईक शिक्षण मार्ग शोधण्यास मदत केली. आम्ही या सामाईक शिक्षण मार्गांचा वापर गुण मिळविण्याच्या पद्धतीवर आधारीत पूर्व-आवश्यक संकल्पना शोधण्यासाठी केला.
संशोधनाचा दृष्टिकोन:
विद्यार्थ्यांचे कॉन्सेप्टवरील प्रभुत्व वर्तविण्यासाठी आम्ही सखोल ज्ञान मागोव्याचे स्टेट ऑफ आर्ट टेक्निक ज्ञान आलेखांच्या ज्ञान अंतर्भावासह वापरतो. याशिवाय आम्ही कोल्ड स्टार्ट समस्या मागील काळावर आधारित सशर्त संकल्पना प्रभुत्व एकत्र करून हाताळतो. Embibe विद्यार्थ्यांच्या वागणुकीच्या कालिब्रेशनमुळे आणि त्याच्या ज्ञान आलेख संकल्पनेवरील प्रातिबिंबामूळे अद्वितीयपणे प्लेस केले गेले आहे. संकल्पनांची ही वागणुकीची स्वभाव वैशिष्ठ्ये संकल्पनांमधील संबंध वर्गीकृत करण्यासाठी देखील वापरली गेली आहेत.
नॉलेज ग्राफचा प्रसार करणे:
आमच्याकडे संकल्पनांमध्ये अनेक संबंध आहेत. जेव्हा आलेखामध्ये एखादी नवीन संकल्पना आणली जाते, तेव्हा आपल्याला तिचा इतर संकल्पनांबाबतचा संबंध परिभाषेत करावा लागतो. कार्याच्या गुंतागुंतीमुळे ही खूपच महत्त्वाची क्रिया होते. चुकीचा संबंध उल्लेख केल्यामुळे वापरकर्त्यांना चुकीच्या दिशेला पाठवले जाऊ शकते.
Embibe येथे, आम्हाला आमचे उत्पादन विविध भाषांमध्ये आणि विविध अभ्यासक्रमामध्ये सादर करायचे आहे. आम्हाला या नवीन संकल्पनांसाठी आमचा ज्ञानचा आलेख वाढवावा लागतो. आजपर्यंत आम्ही नवीन संकल्पना शोधण्यासाठी आणि इतर संकल्पनांशी त्यांचा संबंध शोधण्यासाठी आणि विध्यमान संबंध प्रमाणीकरण करण्यासाठी पूर्णपणे शिक्षकांवर अवलंबून होतो. ही कार्ये खूपच क्लिष्ट आहेत आणि सावकाश होणारी आहेत. माहितीचे प्रमाण पटींनी वाढत असल्यामुळे हे आमच्यासाठी खूपच आव्हानात्मक होत आहे. याशिवाय संपूर्ण माहिती सज्जता प्रक्रियेसाठी मानवी पूर्वग्रह सुद्धा असतो.
आम्ही पहिले आहे की कोणतीही संकल्पना शिकण्याआधी विद्यार्थी पूर्व आवश्यक गोष्टी शिकतात. त्यामुळे विद्यार्थ्यांच्या प्रयत्नांच्या क्रमामध्ये (उत्तर दिलेल्या प्रश्नांचा क्रम) पूर्व आवश्यक गोष्टींनंतर संकल्पना असतात. आम्ही विद्यार्थ्यांचे सामाईक स्वभाव वैशिष्ट मिळविण्यासाठी उत्तर दिलेल्या प्रश्नांच्या क्रमांमध्ये एक आकृतिबंध शोधतो आहोत जो विद्यार्थ्यांच्या अचूकतेच्या सुधारणेवर परिणाम करत आहे. हे परिणामकारक रित्या सोडविण्यासाठी, DKT (सखोल ज्ञान मागोवा) (LTSM) हे वाप्रकरत प्रयत्न माहिती आणि अचूकता यासोबत वापरले जात आहे कोणत्या संकल्पना/प्रयत्न आकृतिबंध अचूकतेवर जास्त परिणाम करणारे आहे हे बघण्यासाठी एक क्रमवारी वर्गीकरण समस्या म्हणून. अंतिमतः नवीन संकल्पना क्रमवारी लावण्यासाठी प्रशिक्षित DKT आकृतिबंध वापरला गेला आहे. यानंतर ही क्रमवारी ज्ञान आलेख नोड्स मधील नवीन संबंध प्रस्तावांसाठी वापरली जाते.
सारांश:
नॉलेज ग्राफ हा Embibe च्या सर्व उत्पादनांचा कणा आहे. त्यामुळे ज्ञान आलेख पूर्ण करणे हे आमचे प्राथमिक कार्य आहे. या कामामुळे आम्हाला ज्ञान आलेख राखण्यासाठी आणि अतिशय कमी मानवी हस्तक्षेपाने वेगाने वाढविण्यामध्ये मदत झाली आहे.
अंतिमतः, ही आमच्यासाठीची संकल्पनांमधील नवीन अप्रगट संबंध अन्वेषित करण्याची खुली समस्या आहे. आम्ही दिलेल्या विविध स्त्रोतांमधील मजकूर रूपी महितीमधून संकल्पना शोधण्याची प्रक्रिया स्वयंचलित केली आहे. त्यानंतर हे तंत्र वापरू आम्ही या नवीन शोधलेल्या संकल्पनांचा विद्यमान संकल्पनांसोबतचा संबंध शोधतो. ही पद्धती ज्ञान आलेख प्रमाणिकरण करण्यासाठी सुद्धा वापरली जाऊ शकते.
संदर्भ:
- ख्रिस पेच, जोनाथन स्पेंसर, जोनाथन हुआंग, सूर्य गंगुली, मेहान शेहे, लिओनीदास जे. गिबा, आणि जास्चा सोहल-डिकस्टाईन. सखोल ज्ञान मागोवा .CoRR, abs/1506.05908, 2015. URLhttp://arxiv.org/abs/1506.05908.
- के. ग्रिफ, आर. के. श्रीवास्तव, जे. कोउटनिक, बी. आर. स्टेनेब्रँक आणि जे. श्मिधुबर, “LSTM: A Search Space Odyssey,” in IEEE Transactions on Neural Networks and Learning Systems, vol. 28, no. 10, pp. 2222-2232, Oct. 2017, doi: 10.1109/TNNLS.2016.2582924.
- फाल्दु, कीर, अमित शेठ, प्रशांत किकानी, आणि हेमांग अकबारी. “KI-BERT: Infusing Knowledge Context for Better Language and Domain Understanding.” arXiv preprint arXiv:2104.08145 (2021).
- शेठ, अमित, मानस गौर, कौशिक रॉय, आणि केयूर फल्डू. “Knowledge-intensive Language Understanding for Explainable AI.” IEEE Internet Computing 25, no. 5 (2021): 19-24.