Embibe তথ্য- তৈরী করা, পরিমাপ করা, সংগ্রহ করা, খুঁজে বের করা এবং সংরক্ষণ করার ব্যাপারে দায়বদ্ধ। Embibe নিজের তথ্যের অধিকারী, আমাদের IP এর উপরে নির্ভর করে। Embibe-এ, আমাদের ব্যবহারকারীরা আমাদের পণ্যগুলির সাথে পারস্পরিক আদানপ্রদান করতে পারছে কিনা, সেইসাথে কোন কারণগুলি নির্দিষ্ট ফলাফলের দিকে নিয়ে যায় তা পরিমাপ করার জন্য যথাযথ উপকরণ উপলব্ধ না হওয়া পর্যন্ত আমরা প্রকাশে বিলম্ব করি। তথ্যের প্রতি এই কৌতূহলই ছাত্রছাত্রীরা কীভাবে পড়াশুনো করে এবং তাদের লক্ষ্যপূরণ করে সেই সম্মন্ধে অনেক অন্তর্দৃষ্টিপূর্ণ উদ্ঘাটনের দিকে পরিচালিত করেছে। উদাহরণ স্বরূপ, একজন শিক্ষার্থীর স্কোর করার সম্ভাবনা হল দুটি উপাদানের সংমিশ্রণ – তাদের শেখার ক্ষমতা যা স্কোর করার সামগ্রিক সম্ভাবনার ~61% অবদান রাখে এবং তাদের আচরণগত বৈশিষ্ট্য যা ~39% অবদান রাখে। তথ্য-পরিচালিত হওয়ার উপর এই তীক্ষ্ণ লক্ষ্যটিই Embibe -কে এমন পণ্য তৈরি করতে সক্ষম করেছে যা শিক্ষাকে ব্যক্তিগতকৃত (পার্সোনালাইজ) করে এবং শিক্ষার্থীদের শেখার ক্ষেত্রে অসাধারণ উন্নতি প্রদান করে।
প্রাথমিক তথ্য সংগ্রহ করা
Embibe এর প্লাটফর্ম জুড়ে বিভিন্ন পর্যায়ে এবং বিভিন্ন জায়গায় তথ্য তৈরী এবং সংগ্রহ করা হয়। শুধু তথ্য সংগ্রহ করলেই হবে না, সঠিক সময়ে , সঠিক প্রেক্ষাপটে, সঠিক মাত্রার গ্রানুলারিটি সহ সঠিক ধরণের তথ্য সংগ্রহ করা জরুরি। Embibe এ সংগ্রহীত তথ্য নিম্নলিখিত শ্রেণীতে পড়ে:
- সমৃদ্ধ ঘটনার উপকরণের প্রকার :
- ইউজার ইন্টারঅ্যাকশন এক্সপ্লিসিট ইভেন্টস – ক্লিকস, ট্যাপস, হবার, স্ক্রলস, টেক্সট-আপডেটস
- ইউজার ইন্টারঅ্যাকশন ইমপ্লিসিট ইভেন্টস – কারসার পজিসন, ট্যাপ প্রেসার, ডিভাইস ওরিয়েন্টেশন, লোকেশন
- সিস্টেম-জেনারেটেড সার্ভার সাইড ইভেন্টস- পেজ লোড, সেশন রিফ্রেশেস, এপি কলস
- সিস্টেম-জেনারেটেড ক্লাইন্ট সাইড ইভেন্টস- সিস্টেম পুশ নোটিফিকেশনস এবং ট্রিগারস
- বৈশিষ্ট্য অনুযায়ী নির্দিষ্ট তথ্য:
- পেজ ভিউস (ইউআরএল, রেফার,ইউজার এজেন্ট, ডিভাইস,আইপি, টাইমস্ট্যাম্প, ট্রাফিক সোর্স, ক্যাম্পেইন)
- অনুশীলনের প্রচেষ্টা স্তরের তথ্য (টাইমস্ট্যাম্প, ভিজিট/রি- ভিজিট, আনসার চয়েস, টাইম ফার্স্ট সীন, কারেক্ট,টাইম স্পেন্ট,সল্যুশন ভিউড ,হিন্ট ইউসড) – সেশন লেভেলে একত্রিত
- অর্জিত আচরণ তথ্য:
- সার্চ ইভেন্ট তথ্য (টাইমস্টাম্প, কোয়েরি, রেজাল্ট সেট)
- রেজাল্ট ইন্টারঅ্যাকশন তথ্য (টাইমস্টাম্প, সাজেস্টেড রেজাল্ট সিলেক্টেড, রেজাল্ট উইজেট এন্ড কনটেক্সট, উইজেট পজিশন)
- টেস্ট আটেম্প্ট ঘটনা স্তরের তথ্য (টাইমস্ট্যাম্প, ভিজিট/রি-ভিজিট, আনসার চয়েস, টাইম ফার্স্ট সিন্, কারেক্ট, টাইম স্পেন্ট, ফিডব্যাক ভিউড) – সেশন স্তরে একত্রিত হয়
- প্রশ্ন ও উত্তরের বিশদ বিবরণ, টাইমস্ট্যাম্প, ইউজার ভোটিং বেহেভিওর জিজ্ঞাসা(একাডেমিক ফোরাম) করুন
- পেমেন্টস (ইউজার আইডেন্টিফায়ার, ইউজার ইমেইল, থার্ড পার্টি পেমেন্ট গেটওয়ে, পেমেন্ট গেটওয়ে ট্রানসাকশান আইডেন্টিফায়ার, মোড অফ পেমেন্ট( কার্ড, ওয়ালেট, ইত্যাদি), টাইম স্ট্যাম্প অফ অর্ডার রিকোয়েস্ট, টাইম স্ট্যাম্প অফ পেমেন্ট রিয়েলাইজেশন, যেকোনো ডিসকাউন্ট এপ্লায়েড, অর্ডার আইটেম স্পেসিফাইজ )
অনেকগুলি ব্যবহারিক বিবেচ্য বিষয় রয়েছে যা Embibe যে স্কেলে তথ্য সংগ্রহের উপকরণ তৈরি করে তার জন্য ধরা দরকার। উদাহরণস্বরূপ, আমরা এই সমস্ত তথ্য সংগ্রহ করার জন্য অনেকগুলি পদ্ধতির উপর নির্ভর করি। segment.io এবং হিপ এর মত তৃতীয় পক্ষের প্লাগইনগুলির সাথে একীভূত করার মাধ্যমে ব্যবহারকারীর ইন্টারঅ্যাকশন ইভেন্ট স্ট্রীমের লগিং করা হয়। সার্ভার-সাইড পেজলোড এবং সেশন ইভেন্ট লগিং ইন-হাউস ইনস্ট্রুমেন্ট করা হয় এবং noSql ডাটাবেসে পুশ করা হয়। প্র্যাকটিস এবং টেস্টের মতো বৈশিষ্ট্যগুলিতে ব্যবহারকারীর কার্যকলাপের দৈনিক তথ্য সামনের প্রান্তে কোয়েরি একত্রিত করার জন্য DB তে সংরক্ষণ করা হয়।
তথ্য প্রক্রিয়াকরণ বা ডাটা প্রসেসিং
প্রাথমিক তথ্য সংগ্রহের পরে, এটি শুদ্ধ, সমৃদ্ধ, মাইন এবং ভিজুয়ালাইজ করার প্রয়োজন রয়েছে। Embibe-এ , আমরা যে তথ্য সংগ্রহ করি তা ব্যবহার করার জন্য আমাদের নিম্নলিখিত বিস্তৃত পদ্ধতি রয়েছে:
- ইন-হাউস রিপোর্টিং এবং অ্যাড-হক বিশ্লেষণ:
- স্পার্ক স্ট্রিমিং ব্যবহার করে লগ মাইনিং এবং হ্যাডুপ ম্যাপ-রেডিউস কাজগুলি AWS EMR-এর মাধ্যমে তৈরি এবং আপডেট করতে আমাদের ব্যবহারকারীর GOV তথ্য যা সেশন স্তরের কার্যকলাপের পাশাপাশি GAV তথ্য সংরক্ষণ করে যা প্রতিটি ব্যবহারকারীর জন্য প্রতিটি বিষয়বস্তুর অংশের জন্য একাডেমিক সক্ষমতার প্রোফাইল সংরক্ষণ করে। GOV এবং GAV তথ্য স্কেলে পরিবেশনের জন্য ইলাস্টিক সার্চ ক্লাস্টারে সংরক্ষণ করা হয়।
- ট্রাফিক প্যাটার্ন, ব্যবহারকারী নগদীকরণ, পরীক্ষা-নিরীক্ষার উন্নতি, অনুসন্ধান ব্যর্থতা এবং অন্যান্য প্রয়োজনের জন্য রিপোর্টিং তথ্য তৈরি করতে লগ মাইনিং করো। প্রসেস্ড তথ্য আবার ইলাস্টিকসার্চে পুশ করা হয় এবং কিবানা এবং গ্রাফানা ড্যাশবোর্ড ব্যবহার করে ভিজ্যুয়ালাইজ করা হয়।
- প্রাথমিক র-তথ্য HBase-এ HDFS-এ সংরক্ষিত হয় যা কোনও প্রয়োজনীয় বিশ্লেষণের জন্য অ্যাড-হক ভিত্তিতে পরিচালিত হয়।
চিত্র 1: ডেটা ফ্লো স্ট্যাকের একটি উচ্চ স্তরের পরিকল্পনা যা Embibe ডেটা সায়েন্স ল্যাব বিকাশকারী বুদ্ধিমত্তাকে শক্তিশালী করে
- ব্যবসা/দ্রব্য/মার্কেটিং সেলফ সার্ভের জন্য থার্ড পার্টি টুলস
- আমাদের অন-পেজ এবং ইন-অ্যাপ ব্যবহারকারীর আদানপ্রদান তথ্য segment.io (থার্ড পার্টি প্লাগইন) ব্যবহার করে ক্যাপচার করা হয় যা বিভিন্ন বাহ্যিক তথ্য ভিজ্যুয়ালাইজেশন প্ল্যাটফর্মে তথ্যকে স্বয়ংক্রিয়ভাবে রুট করে।
- ট্রাফিক সোর্স, জনসংখ্যা এবং অবস্থানের তথ্য, ডিভাইস ব্রেকডাউন, পেজ ভিউস, টাইম স্পেন্ট, রিটেনশন মেট্রিক্স সহ বিস্তৃত স্তরের ট্র্যাফিক পর্যবেক্ষণের জন্য গুগল মেট্রিক্স।
- বিশ্লেষণের জন্য হিপ অ্যানালিটিক্স এবং ইউসার ফ্লো এর অপ্টিমাইজেশন। FE তারযুক্ত সমস্ত ইউসার ইন্টারঅ্যাকশন ইভেন্টগুলিকে segment.io-এর মাধ্যমে হিপ-এ পুশ করা হয়। হিপ ব্যবহারকারীর কনভার্সন ফানেল এবংফ্লো এর স্ব-পরিষেবা স্টাইলের গতিশীল সেটআপের অনুমতি দেয়।