लर्निंग आउटकम AI स्टैक का निर्माण

लर्निंग आउटकम AI स्टैक का निर्माण 

Embibe शुरुआत से ही एक डेटा-संचालित, डेटा पर केंद्रित, डेटा के लिए इच्छुक कंपनी है, जिसने बहुत पहले ही समझ लिया था कि व्यापक स्तर पर प्रत्येक छात्र के लिए शिक्षा को पर्सनलाइज्ड बनाने के लिए डेटा ही अहम तत्त्व है  और तब भी, जब डेटा केवल आधा योगदान ही देता है। तकनीक की मदद से शिक्षा का पर्सनलाईजेशन एक चुनौतीपूर्ण समस्या है, जिसके लिए एडवांस्ड एल्गोरिथम विधियों को प्रयोग करने की आवश्यकता है, जो एकाधिक उप-डोमेनों के विशाल डेटा का लाभ उठा सकता है। 

Embibe में, हमारा मानना है कि लीडर जन्म नहीं लेते, बल्कि समय और अनुभव की यात्रा के दौरान लाखों छोटे-बड़े अनुभवों के जरिए वे तराशे जाते हैं।  पिछले आठ वर्षों में, Embibe ने कड़ी मेहनत से अपने डेटा संग्रह और व्याख्या करने की क्षमताओं को उन्नत किया  है और इस डेटा का उन्नत मशीन लर्निंग और AI तकनीकों के साथ इस्तेमाल करके छात्रों को अपने प्लेटफ़ॉर्म की मदद से एक बेजोड़ पर्सनलाइज्ड शिक्षा अनुभव प्रदान करने के लिए उपयोग किया है। उसके बाद तो हमने Embibe के शैक्षिक प्रौद्योगिकी(EdTech) प्लेटफ़ॉर्म के लिए डेटा संचालित पर्सनलाईजेशन के सिद्धांत की स्थापना ही कर डाली। 

डेटा को कैप्चर और संग्रह करना

डेटा का यदि सही तरह से इस्तेमाल न किया जाए, नित्य एकत्र न किया जाए और यूजर के महत्व के लिए सही तरह से संयोजित कर बेकार डेटा डिलीट न करें तो केवल डेटा के होने का कोई विशेष महत्व नहीं रह जाता। उदाहरण के लिए, यदि किसी प्रैक्टिस या टेस्ट प्रश्न को हल किया जा रहा हो, तो वह उतना उपयोगी नहीं होता, जितने कि उसे हल करने से जुड़ी छोटी-छोटी घटनाएं होती हैं, जैसे कि प्रश्न को पहली बार देखने का समय, अंतिम बार सेव करने का समय, प्रत्येक रीविजिट का समय, प्रत्येक विजिट पर उत्तर के विकल्प में बदलाव होना, हल करने के लिए प्रैक्टिस पर विजिट के दौरान इस्तेमाल किए गए हिंट, टेस्ट सत्र में क्रम से बाहर का प्रश्न, इत्यादि। Embibe ने पिछले आठ वर्षों में बारीक डेटा हासिल करने के लिए भारी-भरकम निवेश किया है।  Embibe के पास समृद्ध डेटा कैप्चर करने की क्षमता है, जिनमें व्यापक रूप से निम्नांकित शामिल हैं:

  • यूजर-इंटरैक्शन वाली सुस्पष्ट गतिविधियां – जैसे कि क्लिक्स, टैप्स, हॉवर्स, स्क्रोल्स, टेक्स्ट-अपडेट्स
  • यूजर-इंटरैक्शन वाली अस्पष्ट गतिविधियां – जैसे कि कर्सर पोजिशन, टैप प्रेशर, डिवाइस ओरिएंटेशन
  • सिस्टम द्वारा उत्पन्न सर्वर की ओर से की जाने वाली गतिविधियां – पेज लोड, सेशन रिफ़्रेश, API कॉल्स
  • सिस्टम द्वारा उत्पन्न क्लाइंट की ओर से की जाने वाली गतिविधियां – सिस्टम पुश नोटिफिकेशन और ट्रिगर्स

डोमेन की विशेषज्ञता

आमतौर पर इस कला में निपुण लोग जानते हैं कि साइलोज में काम करने वाले डेटा वैज्ञानिक कैप्चर किए गए डेटा का मूल्य वर्धन नहीं कर पाते हैं, क्योंकि सार्थक जानकारी हासिल करने के लिए उनके पास पर्याप्त संदर्भ और डोमेन की आवश्यक जानकारी मौजूद नहीं रहती हैं। Embibe यह समझता है और इसीलिए इसने डेटा वैज्ञानिक और शैक्षिक विशेषज्ञों के बीच एक कारगर सेतु का निर्माण किया है। 

शैक्षिक डेटा को तैयार करना: Embibe ने पब्लिक डोमेन में अनुपलब्ध शैक्षिक डेटा के सृजन और प्रसंस्करण में समय और संसाधन का निवेश किया है। उदाहरण के लिए, 30 शिक्षकों की एक टीम ने वर्षों तक मेहनत करके लगभग 62K कॉन्सेप्ट वाले  नॉलेज ट्री का निर्माण किया, जहां प्रत्येक कॉन्सेप्ट पर 426 मेटा वेरिएबल के साथ लाखों अंतर सम्बन्धों ने अर्द्ध-पर्यवेक्षित एल्गोरिथम विधियों का इस्तेमाल किया, जिससे अरबों मेटा-वेरिएबल का निर्माण हुआ।  इस टीम ने मैनुअल रूप से लाखों प्रश्नों को, नॉलेज ट्री के कॉन्सेप्ट, परीक्षा का पाठ्यक्रम, कौशल, कठिनाई का स्तर, आदर्श समय, ब्लूम लेवल इत्यादि जैसे मेटा टैग्स के साथ टैग भी किया, ताकि डाउनस्ट्रीम एल्गोरिथम विधियों के लिए ट्रेनिंग के डेटा का सृजन किया जा सके। 

शैक्षणिक + विज्ञान: यह एक लर्निंग कर्व है, जहां डेटा वैज्ञानिक और शिक्षाविद साथ मिलकर काम करते हैं। उदाहरण के लिए, वैज्ञानिकों को जानना होता है कि टेस्ट बनाते समय शिक्षक कौन से मापदंड  पर विचार करते हैं, वे विविधता कैसे लाते हैं और वे छात्र विशेष के लिए कैसे पर्सनलाइज्ड टेस्ट कैसे बनाते हैं। शिक्षकों के ज्ञान को एल्गोरिदम कोड में रूपांतरित होने में काफी समय लगता है और वैज्ञानिकों के समूह में डोमेन की विशेषज्ञता निर्मित करता है। डेटा माइनिंग तकनीकों की मदद से करोड़ों शैक्षिक कोषों का सृजन करने के लिए Embibe ने शिक्षक-वैज्ञानिक अंतर्क्रिया का भी इस्तेमाल किया। 

एक पर्सनलाइज्ड शैक्षिक प्रौद्योगिकी (EdTech) प्लेटफ़ॉर्म बनाने के लिए डेटा और AI का इस्तेमाल 

फ़र्स्ट-हैंड डेटा काफी लंबे समय में हासिल होता है।  भले ही कोई यूजर को हासिल करने के लिए कितना भी पैसे लगा दे, उनके पास समय के साथ पर्याप्त एंगेज्मेंट डेटा हासिल नहीं भी हो सकता है, क्योंकि हो सकता हैं कि यूजर ने सिस्टम पर अधिक समय तक काम ही न किया हो।  Embibe अपने सभी डेटा पर अपना स्वामित्व रखता है और इन डेटा का फ़ायदा वह एडवांस्ड एल्गोरिथम विधियों के इस्तेमाल में उठाता है, ताकि शैक्षिक प्रौद्योगिकी (EdTech) को पर्सनलाइज्ड बनाने के लिए काफी सारे परस्पर संबंधित उप-प्रश्नों को हल किया जा सके। 

स्मार्ट टैगिंग: कॉन्सेप्ट, टॉपिक और अन्य चीजों में प्रश्नों को टैग करने के लिए संदर्भीय जानकारी का महत्व शैक्षिक प्रमुख-शब्दों (की-वर्ड्स) में निहित होता है। समग्र शैक्षिक प्रमुख-शब्द शब्दकोश पब्लिक डोमेन में उपलब्ध नहीं रहते हैं। इसके अलावा, शैक्षिक प्रमुख-शब्दों को गैर-शैक्षिक प्रमुख-शब्दों से अलग करना पेंचीदा होता है। ‘जैसे कि ‘अंत’’ जैसा गैर-शैक्षिक लगने वाला शब्द उचित संदर्भ में दरअसल शैक्षिक होते है, उदाहरण के लिए, “स्ट्रिंग के अंत में लगाया गया बल”। Embibe का स्मार्ट टैगिंग एल्गोरिथम किसी प्रश्न को टैग करने के लिए सर्वाधिक प्रासंगिक कॉन्सेप्ट की पहचान कर सकते हैं, जो 18% क्राउड-सोर्स्ड ह्यूमन फ़ैकल्टी की तुलना में 82% बेहतर होता है।  

ऑटोमेटैड टेस्ट जेनरेशन: ऊपर बताए वैज्ञानिक – शिक्षाविद प्रयास ने Embibe के ऑटोमैटेड टेस्ट जेनरेशन मॉड्यूल को जन्म दिया, जिसका इस्तेमाल कई परीक्षाओं में लाखों टेस्ट प्रश्न पत्रों के निर्माण में किया गया है, जहां लाखों प्रश्न लगभग 62,000 कॉन्सेप्ट, कठिनाई स्तर, आदर्श समय, ब्लूम लेवल और कौशलों के साथ टैग किए गए थे। यह मॉड्यूल एक अत्याधुनिक हाइब्रिड एल्गोरिथम विधियों का इस्तेमाल करता है, जो सिम्युलेटेड ऐनेलिंग और जेनेटिक एल्गोरिथम विधि का उपयोग कर बहुत ही कम समय में ऐसे नए टेस्ट प्रश्न पत्रों का निर्माण करता है, जो किसी निर्दिष्ट परीक्षा के स्तर से मेल खाए और जिसे बनाने के लिए किसी अनुभवी फैकल्टी की आवश्यकता हों। 

व्यवहारगत लक्ष्य निर्धारण और स्कोर सुधार अनुमान: असंख्य व्यवहारगत केस अध्ययनों, फ़ैकल्टी डोमेन की जानकारी और सांख्यिकीय पैटर्न माइनिंग के चलते,  Embibe जानता है कि प्रतिभा के व्यवहारगत लक्षणों का आकलन और सुधार कैसे किया जा सकता हैं। सांख्यिकीय रूप से मान्य लाखों मूल्यांकनों के आधार पर, हम सर्वाधिक प्रभावशाली व्यवहारगत लक्षणों की पहचान करने, प्रगतिशील लक्ष्यों को निर्धारित करने और उन सुधारों के आधार पर अंको में आने वाले सुधार का अनुमान लगाने में सक्षम होते हैं। 

Embibe स्कोर क्वोशन्ट: घटना स्तर पर विस्तृत डेटा सिग्नल्स वाले लाखों मूल्यांकनों के लाखों संकल्पनाओं से प्राप्त काफी सारे प्रभावशाली गुणों की Embibe ने सफलतापूर्वक पहचान की है।  हम अंक का 94% सटीकता के साथ आकलन करने में समर्थ रहे हैं और यह निर्णय करने में सक्षम रहे कि परीक्षा के अंकों को प्रभावित करने वाले कारकों में ऐकैडमिक क्वोशन्ट 61% का निर्माण करता है और व्यवहारगत वस्तुएँ 39% का निर्माण करती है। यह मॉडल बनने में सक्षम रहा क्योंकि इस प्लेटफ़ॉर्म पर लाखों-करोड़ों यूजरों के टेस्ट उपलब्ध हैं। ट्रांसफर लर्निंग के साथ अन्य परीक्षाओं के लिए बूट-स्ट्रैपिंग मॉडल्स काफी आसान हो जाते हैं।

अंको में प्रयास प्रेरित सुधार: Embibe के प्लेटफ़ॉर्म के प्रत्येक क्रिया का आकलन लर्निंग आउटकम के साथ किया जाता है।   हिस्टोरिकल डेटा और केन्द्रित अनुसंधान के चार सत्रों के साथ, यह Embibe की पेशकश को मान्य करता है और लर्निंग आउटकम को अधिकतम करने के लिए संसाधन प्रदान करता है।  परिणामस्वरूप उच्च प्रयास वाले समूह के विद्यार्थियों ने नेट अंकों में ~50%  सुधार हासिल किया है।

कंटेंट की खोज और सुझाव: Embibe के अनुसंधान आधारित UI को पिछले आठ वर्षों में हमारे प्लेटफ़ॉर्म के साथ संपर्क में आने वाले छात्रों से एकत्र डेटा की विशाल मात्रा से काफी सहायता मिली है।  हमारा सर्च इंजन जो यूजर सर्च के आधार पर पाठ्य-सामग्री प्रदान करता है, यूजर कोहर्ट असाइनमेंट, हिस्टोरिकल सर्च ट्रेंड और कंटेंट कंजम्पशन पैटर्न, परीक्षा पर आधारित और यूजर के पिछले क्रियाओं, जैसे कारकों के आधार पर पाठ्य-सामग्री की कठिनाई पर संबद्ध नतीजों को तत्काल री-रैंक करता है, ये सभी कारक , चुनने और री-रैंक करने हेतु करोड़ों संभावित कॉम्बिनेशनों के एक संयोजित सर्च स्पेस के लिए उपयोगी ऐसे 25 अहम कारकों में शामिल हैं।   इसके अतिरिक्त, यदि पर्याप्त डेटा उपलब्ध हो या पर्याप्त डेटा न रहने की स्थिति में एक जैसे दिखने वाले यूजरों के आधार पर छात्रों के इस प्लेटफ़ॉर्म के साथ पिछली क्रियाओं के आधार पर छात्रों को लक्षित पाठ्य-सामग्री के लिए सुझाव दिए जाते हैं, ताकि वे अपना समय उनके ऊपर लगा सकें।

शैक्षिक प्रौद्योगिकी (EdTech) के लिए AI प्लेटफ़ॉर्म होने की क्या शर्ते हैं

आज के समय में दुनिया में काफी सारे शैक्षिक प्रौद्योगिकी (EdTech) कंपनियां मौजूद हैं। इनमें से ज्यादातर कंपनियां केवल सवालों के कुछ ऐसे उप-समूह पर केंद्रित हैं, जिन्हें हल करना शिक्षा के पर्सनलाईजेशन और शैक्षिक प्रौद्योगिकी (EdTech) के लिए AI प्रेरित प्लेटफ़ॉर्म के निर्माण के लिए आवश्यक होता है। नीचे की तालिका किसी शैक्षिक प्रौद्योगिकी (EdTech) कंपनी के विकास को दिखाती है, जहां यह एक टेस्ट की तैयारी करने वाले पोर्टल से आरंभ कर एक सही मायने में शैक्षिक प्रौद्योगिकी (EdTech) प्लेटफ़ॉर्म की यात्रा तय करती है।

कंटेंट अटेम्प्ट डेटा डोमेन की विशेषज्ञता नॉलेज ग्राफ डेटा साइंस लैब संभावनाएं
(1) औसतन 250+ प्रश्न अध्याय स्तर पर,
(2) कम से कम 3 अध्याय स्तर के टेस्ट,
(3) 10 पूर्ण टेस्ट
 मूलभूत टेस्ट की तैयारी
(1) औसतन 250+ प्रश्न अध्याय स्तर पर,
(2) कम से कम 3 अध्याय स्तर के टेस्ट,
(3) 10 पूर्ण टेस्ट
प्रश्नों पर यूजर-स्तर पर प्रयासों की कुछ न्यूनतम संख्यामूलभूत टेस्ट की तैयारी + मूलभूत यूजर-स्तर पर फीडबैक एनालिटिक्स
(1) औसतन 250+ प्रश्न अध्याय स्तर पर,
(2) कम से कम 3 अध्याय स्तर के टेस्ट,
(3) 10  पूर्ण टेस्ट,
(4) 5  लर्न कंटेंट (वीडियोज, टेक्स्ट, लिंक्स) प्रति अध्याय
प्रश्नों पर यूजर-स्तर पर प्रयासों की कुछ न्यूनतम संख्यामूलभूत टेस्ट की तैयारी + मूलभूत फ़ीडबैक ऐनालिटिक्स + लर्न
(1) औसतन 500+ प्रश्न अध्याय स्तर पर,
(2) कम से कम 3 अध्याय स्तर के टेस्ट,
(3) 10 पूर्ण टेस्ट,
(4) 5 लर्न कंटेंट प्रति अध्याय
प्रति प्रश्न औसतन 25+ प्रयास, सभी प्रश्नों पर ~6 मिलियन प्रयासों तक(1) कंटेंट की शुद्धता
(2) टेस्ट का गुणवत्ता नियंत्रण,
(3) डाउट रिजॉल्यूशन के लिए इन-हाउस शिक्षक
मूलभूत टेस्ट की तैयारी + विस्तृत फ़ीडबैक ऐनालिटिक्स + लर्न ‌+ डाउट रिजॉल्यूशन
(1) औसतन 500+ प्रश्न अध्याय स्तर पर,
(2) कम से कम 3 अध्याय स्तर के टेस्ट,
(3) 10 पूर्ण टेस्ट,
(4) 5 लर्न कंटेंट प्रति अध्याय
प्रति प्रश्न कम से कम 25+ प्रयास, सभी प्रश्नों पर कुल ~6 मिलियन प्रयासों तक(1) कंटेंट की शुद्धता
(2) टेस्ट का गुणवत्ता नियंत्रण,
(3) डाउट रिजॉल्यूशन के लिए इन-हाउस शिक्षक
(1)टॉपिक स्तर तक मूलभूत वर्गीकरण (~5 टॉपिक प्रति अध्याय), ~4000 टॉपिक तकएडवांस्ड टेस्ट की तैयारी 
=
मूलभूत टेस्ट की तैयारी + विस्तृत फ़ीडबैक ऐनालिटिक्स + लर्न ‌+ डाउट रिजॉल्यूशन + टॉपिक स्तरीय फीचर
(1) औसतन 500+ प्रश्न अध्याय स्तर पर,
(2) कम से कम 3 अध्याय स्तर के टेस्ट,
(3) 10 पूर्ण टेस्ट,
(4) 5 लर्न कंटेंट प्रति अध्याय
प्रति प्रश्न औसतन 100+ प्रयास, सभी प्रश्नों पर ~20 मिलियन प्रयासों तक(1) कंटेंट की शुद्धता
(2) टेस्ट का गुणवत्ता नियंत्रण,
(3) डाउट रिजॉल्यूशन
(4) डेटा वैज्ञानिकों के साथ AI हाइपोथीसिस जनरेशन के लिए इन-हाउस शिक्षक
(1) कॉन्सेप्ट स्तर तक गहन वर्गीकरण (~100 कॉन्सेप्ट प्रति अध्याय), ~40 कॉन्सेप्ट तक4 व्यक्तियों का  डेटा विज्ञान टीम 2+ वर्षों तक कार्यरतएडवांस्ड टेस्ट की तैयारी + पर्सनलाईजेशन+ लर्निंग आउटकम
(1) औसतन 500+ प्रश्न अध्याय स्तर पर,
(2) कम से कम 3 अध्याय स्तर के टेस्ट,
(3) 10 पूर्ण टेस्ट,
(4) कम से कम 5 लर्न कंटेंट प्रति अध्याय
प्रति प्रश्न औसतन 150+ प्रयास (50 प्रति कोहर्ट), सभी प्रश्नों पर ~30 मिलियन प्रयासों तक(1) कंटेंट की शुद्धता
(2) टेस्ट का गुणवत्ता नियंत्रण,
(3) डाउट रिजॉल्यूशन
(4) डेटा वैज्ञानिकों के साथ AI हाइपोथीसिस जनरेशन के लिए इन-हाउस शिक्षक
(1) कॉन्सेप्ट स्तर तक गहन वर्गीकरण (~100 कॉन्सेप्ट प्रति अध्याय), ~40 कॉन्सेप्ट तक8 व्यक्तियों का  डेटा विज्ञान टीम 2+ वर्षों तक ऑटो इंजेस्शन(OCR), ऑटो टैगिंग (NLP, ML), पैकेजिंग (अनुकूलन), नॉलेज ग्राफ का निर्माण  और कैलीब्रेशन (IR, ग्राफ माइनिंग, ML), व्यवहार हस्तक्षेप (ML), पर्सनलाईजेशन (IRT, ML) जैसी समस्या के समाधानों में कार्यरतशिक्षा के लिए AI प्लेटफ़ॉर्म
=
एडवांस्ड टेस्ट की तैयारी + पर्सनलाईजेशन +लर्निंग आउटकम+ इंटेलिजेंस, सर्विस के रूप में