डेटा ही नवीन शक्ती आहे

डेटा ही नवीन शक्ती आहे

Embibe हे डेटाला तयार करणे, जाणून घेणे, संकलन करणे, डेटाचा शोध घेणे आणि संग्रहण करणे यावर भर देते. Embibe कडे असणाऱ्या डेटावर आमचा IP अवलंबून असतो. Embibe मध्ये, आमचे युजर्स आमच्या उत्पादनांशी कशा प्रकारे परिसंवाद साधतात, तसेच कोणते घटक विशिष्ट परिणामांकडे नेतात हे जाणून घेण्यासाठी आम्ही पुरेसे साहित्य तयार होईपर्यंत प्रकाशन पुढे ढकलतो. डेटाच्या या ध्यासामुळेच आम्हाला विद्यार्थी कसे अभ्यास करतात आणि त्यांचे ध्येय कसे साध्य करतात याबद्दल अनेक सखोल खुलासे होतात. उदाहरणार्थ, विद्यार्थ्यांची गुण मिळवण्याच्या क्षमतेमध्ये त्यांची शिकण्याची क्षमता जी गुण मिळवण्याच्या एकूण क्षमतेच्या ~ 61% योगदान देते तसेच त्यांचे आचरणाचे गुणधर्म ~ 39% योगदान देतात. डेटावर विसंबून होण्यास  अतिशय  सूक्ष्म स्तरावर लक्ष केंद्रित केल्यामुळेच Embibe च्या सुविधा प्रत्यक्षात आल्या आहेत. यामुळे शिक्षण वैयक्तिकृत करते आणि विद्यार्थ्यांच्या शिक्षण लर्निंग आऊटकम मध्ये प्रचंड सुधारणा करते.

प्राथमिक डेटा संग्रहण

Embibe च्या प्लॅटफॉर्मवर विविध टप्प्यांवर आणि सर्व ठिकाणी डेटा तयार केला जातो आणि संग्रहित केला जातो. केवळ डेटा करणे पुरेसे नसते तर योग्य प्रकारचा डेटा, योग्य वेळी, योग्य संदर्भात, योग्य पातळीवर, योग्य प्रमाणात मिळविणे हे देखील तितकेच महत्वाचे असते.

 Embibe मध्ये डेटा खालील प्रकारात विभागात येईल:

  • समृद्ध इव्हेन्ट प्रकारांची उपकरणयोजना:
    • युजर-इंटरॅक्शन निर्विवाद इव्हेंट्स – क्लिक, टॅप, होव्हर, स्क्रोल, टेक्स्ट-अपडेट्स 
    • युजर-परिसंवाद निर्विवाद इव्हेंट्स – कर्सर पोझिशन, टॅप प्रेशर, डिव्हाईस ओरिएंटेशन, स्थान
    • सिस्टम-जनरेटेड सर्व्हर साइड इव्हेंट्स – पेज लोड, सत्र रीफ्रेश करणे, api कॉल्स
    • सिस्टम-जनरेटेड क्लायंट-साइड इव्हेंट्स – सिस्टम चालना सूचना आणि ट्रिगर
  • गुणधर्माद्वारे विशिष्ट डेटा:
    • पेज व्ह्यूज (URL, रेफरर (संदर्भकर्ता), युजर एजन्ट, डिव्हाईस, IP, टाइमस्टॅम्प, ट्राफिक स्त्रोत, कॅम्पेन)
    • डेटा प्रॅक्टिसच्या पातळीचे प्रयत्न करणे (टाइमस्टॅम्प, व्हिजिट/रीव्हिजिट, उत्तराची निवड, पहिल्यांदा पाहिलेला वेळ, योग्य, दिलेला वेळ, सोल्युशन व्ह्यूड, वापरलेली हिंट) – सेशन लेव्हल वर एकत्रित केले जाते
    • लर्न आचरण डेटा:
      • इव्हेंट डेटा शोधणे (टाइमस्टॅम्प, शंका, निकाल संच)
      • परिणाम परिसंवाद डेटा (टाइमस्टॅम्प, सुचविलेला निकाल निवडला, निकाल विजेट आणि संदर्भ, विजेट स्थिती)
    • इव्हेंट लेव्हल डेटाच्या टेस्टचे प्रयत्न  (टाइमस्टॅम्प, व्हिजिट/रीव्हिजिट, उत्तर निवड, पहिल्यांदा पाहिलेली वेळ, योग्य, दिलेला वेळ, फीडबॅक व्ह्यूड) – सेशन लेव्हल वर एकत्रित
    • प्रश्न आणि सविस्तर उत्तर (शैक्षणिक मंच) विचारा, टाइमस्टॅम्प, युजरचे मतदान आचरण
    • देयक (युजर ओळखकर्ता, युजर ईमेल, त्रयस्थ पक्ष देयक गेटवे, देयक गेटवे व्यवहार ओळखकर्ता, देयकाचे माध्यम (कार्ड, वॉलेट, इत्यादी), ऑर्डर विनंतीचा टाइमस्टॅम्प, देयक मिळाल्याचे टाइमस्टॅम्प, कोणतीही लागू केलेली सूट, ऑर्डर वस्तू तपशील)

अनेक व्यावहारिक बाबी असतात ज्या Embibe ने केलेल्या प्रमाणित डेटा संकलनाच्या उपकरणांचे नियोजन करताना या बाबी लक्षात घेणे आवश्यक असते. उदाहरणार्थ, हा सर्व डेटा गोळा करण्यासाठी आपण अनेक पद्धतींवर अवलंबून असतो. युजर परिसंवादाचे  लॉगिंग इव्हेंट स्ट्रीम हे त्रयस्थ पक्षासह प्लगइन केले जाते. segment.io आणि Heap यांच्या एकत्रीकरणातून हे  साध्य होऊ शकते. सर्व्हर-साइड पेज लोड आणि सेशन इव्हेंट लॉगिंग इन-हाऊस केले जाते तर noSql डेटाबेसवर टाकले जाते. प्रॅक्टिस आणि टेस्ट यांसारख्या गुणधर्मांवरील युजरच्या कृतींचा दैनंदिन डेटा फ्रंट एंडपर्यंत शंका एकत्रीकरणासाठी DB मध्ये संग्रहित केला जातो.

डेटा प्रोसेसिंग 

एकदा प्राथमिक डेटाचे संकलन झाल्यावर, तो समृद्ध करणे, त्याची मांडणी व आकलन करणे आणि संकल्पना करणे आवश्यक असते. Embibe मध्ये, आपण संग्रहित केलेला डेटा वापरण्यासाठी खालील व्यापक दृष्टिकोन आहेत:

  • अंतर्गत अहवाल आणि तात्कालिक विश्लेषण:
    • स्पार्क स्ट्रीमिंग आणि Hadoop नकाशा वापरून लॉग मायनिंग -आमचा युजर GOV डेटा तयार आणि अपडेट करण्यासाठी AWS EMR वर जॉब कमी करतो जो सत्र पातळीवरील कृती संग्रहित करतो तसेच GAV डेटा जो प्रत्येक युजरसाठी शैक्षणिक क्षमता प्रोफाइल डेटाच्या प्रत्येक भागावर संग्रहित करतो. GOV आणि GAV डेटा Elasticsearch क्लस्टर्समध्ये स्केलवर सेवा देण्यासाठी साठवले जातात.
    • traffic patterns, user monetization, test-on-test improvement, search failures आणि इतर गरजांसाठी अहवाल डेटा तयार करण्यासाठी लॉग मायनिंग करा. प्रक्रिया केलेला डेटा पुन्हा Elasticsearch मध्ये पाठविला जातो आणि Kibana आणि Grafana डॅशबोर्ड वापरून तो दृश्यमान केला जातो.
    • प्राथमिक कच्चा डेटा HBase वर HDFS वर संग्रहित केला जातो ज्यामुळे तात्कालिक आधारावर आयोजित केलेले कोणतेही आवश्यक असलेले विश्लेषण करता येईल.
आकृती 1: डेटा फ्लो स्टॅक एक उच्च स्तरीय योजना जी Embibe च्या डेटा सायन्स लॅबने विकसित केलेल्या इंटेलिजन्सला सपोर्ट देते
  • व्यवसाय/उत्पादन/विपणन स्वंय सेवेसाठी त्रयस्थ पक्षाची साधने
    • segment.io (त्रयस्थ पक्ष प्लगइन) वापरून आमची ऑन-पेज आणि अ‍ॅप-मधील युजर परिसंवाद डेटा मिळविला जातो जो विविध बाह्य डेटाचे कल्पनाचित्रण करण्यासाठी प्लॅटफॉर्मवर डेटा स्वयंचलित करतो
    • ट्रॅफिक सोर्सेस, लोकसंख्याशास्त्रीय आणि स्थानाची माहिती, डिव्हाईस ब्रेकडाउन, पेज व्ह्यूज, दिलेला वेळ, रिटेन्शन मेट्रिक्ससह व्यापक पातळीवरील ट्रॅफिक मॉनिटरिंगसाठी गुगल ॲनालिटीक्स असतो.
    • युजरच्या ओघाचे विश्लेषण आणि सर्वोत्तमीकरणासाठी Heap Analytics असते. FE वायर हे सर्व युजर परिसंवाद इव्हेंट्स Segment.io द्वारे Heap वर पाठविण्याठी वापरले जाते. Heap हे सेल्फ-सर्व्ह पद्धत असलेल्या युजरचे कन्व्हर्जन फनेल आणि ओघाला गतिशील रीतीने तयार करते.