लर्निंग आऊटकम AI स्टॅक तयार करणे
Embibe च्या स्थापनेपासूनच आम्ही डेटा-आधारित, डेटा-केंद्रित असण्यावर भर दिला आहे. प्रत्येक विद्यार्थ्यासाठी मोठ्या प्रमाणावर शिक्षण वैयक्तिकृत करण्यासाठी सक्षम होण्याकरीता डेटा हा महत्त्वाचा घटक आहे हे आम्हाला खूप लवकर समजले होते. मात्र असे असूनही डेटा आमच्या कामाची केवळ अर्धी बाजू आहे. तंत्रज्ञानाचा वापर करून शिक्षणाचे वैयक्तिकरण करणे ही एक आव्हानात्मक समस्या आहे ज्यासाठी प्रगत अल्गोरिदमच्या परस्पर संवादाची आवश्यकता असते. यामुळे अनेक उप-क्षेत्रामध्ये मोठ्या प्रमाणात डेटाचा लाभ घेता येऊ शकतो.
Embibe मध्ये आमचा असा विश्वास आहे की पुढारी जन्माला येत नाहीत, तर ते कालांतराने घडविले जातात आणि या प्रवासादरम्यान हजारो लहान छोट्या गोष्टी शिकण्याचा अनुभव घेतात. गेल्या आठ वर्षांमध्ये, Embibe ने आपल्या डेटा एकत्रीकरण आणि त्या देताच अर्थ लावण्याच्या क्षमतांचा अत्यंत प्रयत्नपूर्वक वापर केला आहे. प्रगत मशीन लर्निंग आणि AI तंत्रांसह या डेटाचा संयुक्त वापर करत याच प्लॅटफॉर्म चा वापर करत विद्यार्थ्यांना एक अतुलनीय वैयक्तिक शिक्षण अनुभव प्रदान केला आहे. EdTech च्या डेटा-चालित वैयक्तिकरणासाठी Embibe ची विचारसरणी पुढील प्रमाणे मांडत आहोत.
डेटा मिळवणे व संग्रहित करणे
जर डेटा हा योग्य पद्धतीने हाताळला गेला नाही, व्यवस्थित पद्धतीने गोळा करण्यात आला नाही, वेळोवेळी त्या डेटा वर जर प्रक्रिया केली नाही तर वापरकर्त्यांसाठी त्या डेटाचे फारसे महत्व नसते. उदाहरणार्थ, प्रॅक्टिस किंवा टेस्ट प्रश्न सोडविण्याचा प्रयत्न केला गेला आहे ही वस्तुस्थिती जवळजवळ सर्व सूक्ष्म घटनांशी संबंधित आहे. जसे की, पहिल्यांदा प्रश्न पाहण्याची वेळ, सेव्ह करण्याची शेवटची वेळ, प्रत्येक प्रश्नाला पुन्हा पाहण्याची वेळ, प्रत्येकवेळी प्रश्न पाहिल्यास उत्तरांची निवड बदलणे, प्रयत्न करताना प्रॅक्टिसदरम्यान वापरल्या जाणाऱ्या हिंट, टेस्ट सत्रातील क्रमाबाहेरचे प्रश्न इत्यादी. Embibe ने गेल्या आठ वर्षांमध्ये प्रकारचा सूक्ष्म डेटा संग्रहित करण्यासाठी मोठ्या प्रमाणात गुंतवणूक केली आहे. Embibe मध्ये समृद्ध डेटा प्रकार संग्रहित करण्याची क्षमता असून तो पुढील विषयांपुरताच मर्यादित आहे असे नाही. :
- यूजर-इंटरॅक्शन क्सप्लिसिट इव्हेंट्स -क्लिक्स, टॅप्स, होव्हर, स्क्रोल्स, टेक्स्ट-अपडेट्स
- यूजर-इंटरॅक्शन इम्प्लिसिट इव्हेंट्स – कर्सर स्थिती, टॅप प्रेशर, डिवाइस ओरिएंटेशन
- सिस्टीम- जनरेटेड सर्व्हर-साइड इव्हेंट्स-पेज लोड, सेशन रीफ्रेश, API कॉल्स
- सिस्टीम-जनरेटेड क्लायंट-साइड इव्हेंट्स – सिस्टीम पुश सूचना आणि ट्रिगर
डोमेन कौशल्य
सामान्यत: या क्षेत्रात तरबेज असलेल्यांना हे माहित असते की स्वतंत्रपणे काम करणारे डेटा वैज्ञानिक संग्रहित केलेल्या डेटाचा वापर करण्यामध्ये फारसे योगदान देऊ शकत नाही. याचे कारण म्हणजे त्यांच्याकडे अर्थपूर्ण आकलन करण्याइतपत पुरेसे संदर्भ व विषयाचे ज्ञान नाही. Embibe मध्ये आम्ही हे समजून घेतले आहे व डेटा वैज्ञानिक आणि शिक्षण तज्ञ यांच्यामध्ये पुरेशी परस्पर संवाद व्हावा हे सुनिश्चित केले आहे.
शैक्षणिक डेटा तयार करणे: Embibe ने सार्वजनिक क्षेत्रामध्ये उपलब्ध नसलेल्या शैक्षणिक डेटाच्या निर्मिती आणि क्युरेशनमध्ये वेळ आणि संसाधने गुंतवली आहेत. उदाहरणार्थ, गेल्या काही वर्षात 30 शिक्षकांच्या टीमने अर्ध-पर्यवेक्षित अल्गोरिदम वापरून शेकडो हजारो परस्परसंबंधांसह 62 हजार संकल्पनांचा नॉलेज ट्री तयार केला आहे, प्रत्येक संकल्पनेवर 426 मेटा व्हेरिएबल्ससह लाखो मेटा-व्हेरिएबल्स बनतात. या टीमने डाउनस्ट्रीम अल्गोरिदमसाठी प्रशिक्षण डेटा टॅग करण्यासाठी नॉलेज ट्रीवरील संकल्पना, परीक्षेचा अभ्यासक्रम, कौशल्य, अडचण पातळी, आदर्श वेळ, ब्लूम पातळी यासारख्या मेटा टॅगवर लाखो प्रश्न मॅन्युअली टॅग केले.
शैक्षणिक + विज्ञान: जेव्हा डेटा वैज्ञानिक आणि शिक्षणतज्ज्ञ एकत्र काम करतात तेव्हा नवीन काहीतरी शिकायला मिळते. उदाहरणार्थ, शास्त्रज्ञांना हे माहित असणे आवश्यक आहे की शैक्षणिक तज्ञ टेस्ट सेट करताना कोणते पॅरामीटर्स विचारात घेतात, ते बदल कसे प्रत्यक्षात आणतात आणि ते वैयक्तिक विद्यार्थ्यांसाठी टेस्ट कशा पद्धतीने पर्सनलाइज्ड करतात. अल्गोरिदमिक कोडमधील शैक्षणिक ज्ञानाचे हे भाषांतर ही वेळखाऊ प्रक्रिया असते आणि वैज्ञानिक संचयामध्ये डोमेन कौशल्य निर्माण करते. Embibe ने डेटा मायनिंग तंत्रांचा वापर करून हजारो वाक्यांचा शैक्षणिक संग्रह तयार करण्यासाठी शिक्षक-शास्त्रज्ञ परस्परसंवादाचा वापर केला आहे.
पर्सनलाइज्ड EdTech प्लॅटफॉर्म तयार करण्यासाठी डेटा आणि AI वापरणे
फर्स्ट-हँड डेटा हा पुरेश्या दीर्घ कालावधीमध्ये प्राप्त केला जातो. जरी कोणी युजर मिळवण्यासाठी भरपूर पैसे घालवले तरीही, त्यांच्याकडे कालांतराने पुरेसा प्रतिबद्धता डेटा नसू शकतो. युजर्सनी सिस्टमशी पुरेसा संवाद साधला नसावा हे याचे कारण असू शकते. Embibe कडे असा सर्व डेटा आहे आणि EdTech पर्सनलाइज्ड करण्यासाठी अनेक परस्पररित्या जोडलेल्या उप-समस्या सोडवण्यासाठी प्रगत अल्गोरिदम वापरून या डेटाचा लाभ घेते.
स्मार्ट टॅगिंग: कॉन्सेप्ट, विषय आणि इतर गोष्टीमधील टॅगिंग प्रश्नांमधील टेक्स्ट माहितीचे सार शैक्षणिक कीवर्डमध्ये आहे. एकत्रित शैक्षणिक किवर्ड शब्दकोश सार्वजनिक डोमेनमध्ये उपलब्ध नाहीत. शिवाय, शैक्षणिक किवर्ड्सना शैक्षणिक नसलेले किवर्ड वेगळे करणे अवघड आहे. ‘शेवट” सारखा शैक्षणिक नसलेला शब्द प्रत्यक्षात योग्य संदर्भात शैक्षणिक आहे, उदाहरणार्थ, “दोरीच्या शेवटी प्रयुक्त केलेले बल”. Embibe चे स्मार्ट टॅगिंग अल्गोरिदम क्राउड-सोर्स्ड मानवी शिक्षकांसाठी केवळ 18% च्या तुलनेत 82% वेळा प्रश्नाला टॅग करण्यासाठी सर्वात संबंधित कॉन्सेप्ट ओळखू शकतात.
ऑटोमेटेड टेस्ट निर्मिती: वैज्ञानिक-शिक्षकांच्या प्रॅक्टिसमुळे Embibe चे ऑटोमेटेड टेस्ट निर्मिती मॉड्यूल तयार झाले ज्याचा उपयोग 62,000 कॉन्सेप्ट, काठिण्य पातळी, निर्धारीत वेळ, विकास स्तर, कौशल्यासह टॅग केलेल्या लाखो प्रश्नांमधून अनेक परीक्षांमध्ये शेकडो टेस्ट प्रश्नपत्रिका तयार करण्यासाठी केला गेला. मॉड्यूल एक अत्याधुनिक हायब्रीड अल्गोरिदम वापरते जे सिम्युलेटेड एनीलिंग आणि जेनेटिक अल्गोरिदम वापरत नवीन टेस्ट प्रश्नपत्रिका तयार करते. हे कोणत्याही निर्दिष्ट परीक्षेच्या पातळीशी जुळते, असे करण्यास अनुभवी शिक्षकांना खूप कमी वेळ लागेल.
वर्तनाचे ध्येय निश्चित करणे आणि गुणांमध्ये वाढ होण्याचा अंदाज:
असंख्य वर्तनाशी संबंधित केस स्टडीज, शिक्षक डोमेन ज्ञान आणि सांख्यिकीय नमुना आकलन, Embibe ला सुप्त वर्तन गुणधर्म कसे मोजायचे आणि सुधारायचे हे माहित आहे. सांख्यिकीयदृष्ट्या वैध अशा शेकडो, हजारो मूल्यांकनांच्या आधारे, आम्ही आचरणाशी संबंधित सर्वाधिक प्रभावशाली गुणधर्म ओळखण्यासाठी, प्रगतीशील लक्ष्य निश्चित करण्यासाठी आणि त्या सुधारणांच्या आधारे गुणांमध्ये वाढ होण्याचा अंदाज लावण्यासाठी सक्षम आहोत.
Embibe स्कोअर गुणांक: Embibe ने घटना स्तरावर संग्रहित केलेल्या तपशीलवार डेटा सिग्नलसह शेकडो गृहितकांमधून शेकडो हजारो मूल्यांकनांच्या माध्यमातून अनेक उच्च प्रभाव वैशिष्ट्ये यशस्वीरित्या ओळखली आहेत. आम्ही 94% अचूकतेसह गुणांचा अंदाज लावू शकलो आहोत आणि शैक्षणिक गुणांक 61% आणि आचरण फॉर्म 39% परीक्षेच्या गुणांवर काय परिणाम करतात हे स्थापित करण्यास सक्षम आहोत. प्लॅटफॉर्मवर शेकडो हजारो यूजरच्या टेस्टच्या उपलब्धतेमुळे मॉडेल एकत्र होऊ शकले. ट्रान्सफर लर्निंगमध्ये, इतर परीक्षांसाठी बूट-स्ट्रॅपिंग मॉडेल खूप सोपे होते.
प्रयत्न केल्याने गुणांमध्ये सुधारणा होते: Embibe च्या प्लॅटफॉर्मवरील प्रत्येक इंटरव्हेन्शन लर्निंग आऊटकम करीता मोजला जातो. ऐतिहासिक डेटा आणि केंद्रित संशोधनाच्या चार सीझनसह, ते Embibe च्या ऑफरचे प्रमाणीकरण करते आणि लर्निंग आऊटकम अनुकूल करण्यासाठी पुढे पूरक कॉन्टेन्ट देते. उच्च प्रयत्नांच्या गटातील विद्यार्थ्यांनी परिणामी ~50% निव्वळ गुणांमध्ये सुधारणा केली आहे.
कॉन्टेन्ट डिस्कव्हरी आणि शिफारसी:
Embibe चे डिस्कव्हरी-आधारित UI हे गेल्या आठ वर्षात विद्यार्थ्यांनी आमच्या प्लॅटफॉर्मशी संवाद साधताना मोठ्या प्रमाणात गोळा केलेला डेटा वापरून उभारले आहे. आमचे सर्च इंजिन जे युजरच्या शोधांवर आधारित कॉन्टेन्ट प्रदान करते. यामुळे युजरच्या कोहॉर्ट असाइनमेंट, ऐतिहासिक सर्च ट्रेंड आणि कॉन्टेन्ट वापरण्याच्या पद्धती, कॉन्टेन्टच्या आधारावर परीक्षेत अडचण आणि युजरच्या मागील युजरच्या परस्परसंवादाच्या आधारावर संबंधित परिणामांना री-रँक करते. अश्या 25 महत्त्वाच्या घटकांपैकी निवडण्यासाठी आणि री-रँक करण्यासाठी शेकडो-लाखो संभाव्य जोड्यांची एकत्रित सर्च जागा वापरते. या व्यतिरिक्त, जर पुरेसा डेटा उपलब्ध असल्यास प्लॅटफॉर्मवर त्यांच्या पूर्वीच्या परस्परसंवादाच्या आधारावर, किंवा डेटा अपुऱ्या प्रकरणांमध्ये समान युजरवर आधारित, लक्ष्यित कॉन्टेन्टसाठी विद्यार्थ्यांना त्यांचा वेळ केंद्रित करण्यासाठी शिफारसी दाखवल्या जातात.
EdTech साठी AI प्लॅटफॉर्म बनण्यासाठी काय आवश्यक आहे
आज जगात असंख्य EdTech कंपन्या आहेत. यापैकी बहुतेक कंपन्या केवळ शिक्षण वैयक्तिकृत करण्यासाठी आणि EdTech साठी AI-चालित प्लॅटफॉर्म तयार करण्यासाठी लक्ष देण्यासारख्या समस्यांच्या काही उपसंचांवर लक्ष केंद्रित करतात. खालील सारणीमध्ये EdTech कंपनीची उत्क्रांती मांडली आहे. हे टेस्ट प्रीप पोर्टल ते एक अस्सल EdTech प्लॅटफॉर्म असा प्रवास दर्शवते:
कॉन्टेन्ट | प्रयत्नांचा डेटा | डोमेन कौशल्य | नॉलेज ग्राफ | डेटा सायंस लॅब | शक्यता |
(1) धडा स्तरावर सरासरी 250+ प्रश्न, (2) किमान 3 धडा स्तरीय टेस्ट, (3) 10 संपूर्ण टेस्ट | मूलभूत टेस्ट तयारी | ||||
(1) धडा स्तरावर सरासरी 250+ प्रश्न, (2) किमान 3 धडा स्तरीय टेस्ट , (3) 10 संपूर्ण टेस्ट | प्रश्नांवर युजरच्या स्तरावरील काही किमान प्रयत्न | > मूलभूत टेस्ट तयारी + मूलभूत युजर-स्तरीय अभिप्राय विश्लेषणे | |||
(1) धडा स्तरावर सरासरी 250+ प्रश्न, (2) कमीतकमी 3 धडा स्तरीय टेस्ट, (3) 10 संपूर्ण टेस्ट, (4) 5 प्रत्येक धडा लर्न कॉन्टेन्ट (व्हिडिओ, टेस्ट, लिंक) जाणून घ्या | प्रश्नांवर युजरच्या स्तरावर काही किमान प्रयत्न | मूलभूत टेस्ट तयारी + मूलभूत अभिप्राय विश्लेषण + लर्न | |||
(1) धडा स्तरावर सरासरी 500+ प्रश्न, (2) कमीतकमी 3 धडा स्तरीय टेस्ट, (3) 10 पूर्ण टेस्ट, (4) 5 प्रत्येक धड्यातील कॉन्टेन्ट जाणून घ्या | प्रत्येक प्रश्नांसाठी सरासरी 25+ प्रयत्न ~ सर्व प्रश्नांकरीता 6 दशलक्ष प्रयत्न | (1) कॉन्टेन्ट हायजिन, (2) टेस्ट वर गुणवत्ता नियंत्रण, (3) शंकांचे निरसन यासाठी निर्धारीत शिक्षकवृंद | मूलभूत टेस्ट तयारी + सविस्तर अभिप्राय विश्लेषण + लर्न + शंकांचे निरसन | ||
(1) धडा स्तरावर सरासरी 500+ प्रश्न, (2) कमीतकमी 3 धडा स्तरीय टेस्ट, (3) 10संपूर्ण टेस्ट, (4) 5 प्रति धडा कॉन्टेन्ट जाणून घ्या | प्रत्येक प्रश्नांसाठी सरासरी 25+ प्रयत्न ~ सर्व प्रश्नांकरीता 6 दशलक्ष प्रयत्न | (1) कॉन्टेन्ट हायजिन , (2) टेस्टवर गुणवत्ता नियंत्रण, (3) शंकांचे निरसन | विषयांसाठी मूलभूत वर्गीकरण विषय पातळीपर्यंत (प्रत्येक धड्यासाठी 5 मुद्दे ) | प्रगत टेस्ट तयारी = मूलभूत टेस्ट तयारी +सविस्तर अभिप्राय विश्लेषण + लर्न + शंकांचे निरसन + टॉपिक-स्तरीय वैशिष्ट्ये | |
(1) धडा स्तरावर सरासरी 500+ प्रश्न, (2) कमीतकमी 3 टेस्ट, (3) 10 संपूर्ण टेस्ट, (4) 5 प्रति धडा कॉन्टेन्ट जाणून घ्या | प्रत्येक प्रश्नांसाठी सरासरी 100+ प्रयत्न ~ सर्व प्रश्नांकरीता 20 दशलक्ष प्रयत्न | (1) कॉन्टेन्ट हायजिन, (2) टेस्टवर गुणवत्ता नियंत्रण, (3) शंकांचे निरसन , (4) डेटा शास्त्रज्ञांसह AI गृहितक निर्मिती | (1) 40 हजार कॉन्सेप्टसाठी कॉन्सेप्ट पातळीपर्यंत ( 100 कॉन्सेप्ट प्रति धडा) सखोल वर्गीकरण | 2+ वर्षे काम करणारी 4 व्यक्ती डेटा विज्ञान संघ | प्रगत टेस्ट तयारी + वैयक्तिकरण + लर्निंग आऊटकम |
(1) धडा स्तरावर सरासरी 500+ प्रश्न, (2) कमीतकमी 3 धडा स्तरीय टेस्ट, (3) 10 पूर्ण टेस्ट, (4) प्रति धडा किमान 5 कॉन्टेन्ट जाणून घ्या | प्रत्येक प्रश्नांसाठी सरासरी 150+ प्रयत्न (प्रत्येक 50 सह विद्यार्थी)~ सर्व प्रश्नांकरीता 30 दशलक्ष प्रयत्न | (1) कॉन्टेन्ट हायजिन , (2) टेस्टवर गुणवत्ता नियंत्रण, (3) शंका निराकरण, (4) डेटा शास्त्रज्ञांसह एआय गृहितक निर्मिती या साठी अंतर्गत शिक्षक | (1) 40 हजार संकल्पनांसाठी संकल्पना पातळीपर्यंत (प्रति धडा 100 संकल्पना) सखोल वर्गीकरण | 8 व्यक्ती डेटा सायंस टीम 2+ वर्षांपासून काम करत आहे जसे प्रत्यक्ष अंतर्ग्रहण (OCR), प्रत्यक्ष टॅगिंग (NLP, ML), पॅकेजिंग (सर्वोत्तमीकरण), ज्ञान आलेख निर्मिती आणि इयत्तीकरण (IR, आलेख आकलन, ML), वर्तन हस्तक्षेप (ML) ), वैयक्तिकरण (IRT, ML) | शिक्षणासाठी AI प्लॅटफॉर्म = प्रगत टेस्ट तयारी + वैयक्तिकरण + लर्निंग आऊटकम + बुद्धिमत्ता-सेवा-म्हणून |