তথ্যই হল নতুন শক্তি

Embibe তথ্য- তৈরী করা, পরিমাপ করা, সংগ্রহ করা, খুঁজে বের করা এবং সংরক্ষণ করার  ব্যাপারে দায়বদ্ধ। Embibe নিজের তথ্যের অধিকারী, আমাদের IP এর উপরে নির্ভর করে। Embibe-এ, আমাদের ব্যবহারকারীরা আমাদের পণ্যগুলির সাথে পারস্পরিক আদানপ্রদান করতে পারছে কিনা, সেইসাথে কোন কারণগুলি নির্দিষ্ট ফলাফলের দিকে নিয়ে যায় তা পরিমাপ করার জন্য যথাযথ উপকরণ উপলব্ধ না হওয়া পর্যন্ত আমরা প্রকাশে বিলম্ব করি। তথ্যের প্রতি এই কৌতূহলই ছাত্রছাত্রীরা কীভাবে পড়াশুনো করে এবং তাদের লক্ষ্যপূরণ করে সেই সম্মন্ধে অনেক অন্তর্দৃষ্টিপূর্ণ উদ্ঘাটনের দিকে পরিচালিত করেছে। উদাহরণ স্বরূপ, একজন শিক্ষার্থীর স্কোর করার সম্ভাবনা হল দুটি উপাদানের সংমিশ্রণ – তাদের শেখার ক্ষমতা যা স্কোর করার সামগ্রিক সম্ভাবনার ~61% অবদান রাখে এবং তাদের আচরণগত বৈশিষ্ট্য যা ~39% অবদান রাখে। তথ্য-পরিচালিত হওয়ার উপর এই তীক্ষ্ণ লক্ষ্যটিই Embibe -কে এমন পণ্য তৈরি করতে সক্ষম করেছে যা শিক্ষাকে ব্যক্তিগতকৃত (পার্সোনালাইজ) করে এবং শিক্ষার্থীদের শেখার ক্ষেত্রে অসাধারণ উন্নতি প্রদান করে।

প্রাথমিক তথ্য সংগ্রহ করা 

Embibe এর প্লাটফর্ম জুড়ে বিভিন্ন পর্যায়ে এবং বিভিন্ন জায়গায় তথ্য তৈরী এবং সংগ্রহ করা হয়। শুধু তথ্য সংগ্রহ করলেই হবে না, সঠিক সময়ে , সঠিক প্রেক্ষাপটে, সঠিক মাত্রার গ্রানুলারিটি সহ সঠিক ধরণের তথ্য সংগ্রহ করা জরুরি। Embibe এ সংগ্রহীত তথ্য নিম্নলিখিত শ্রেণীতে পড়ে:

  • সমৃদ্ধ ঘটনার উপকরণের প্রকার  :
    • ইউজার ইন্টারঅ্যাকশন এক্সপ্লিসিট ইভেন্টস – ক্লিকস, ট্যাপস, হবার, স্ক্রলস, টেক্সট-আপডেটস   
    • ইউজার ইন্টারঅ্যাকশন ইমপ্লিসিট ইভেন্টস – কারসার পজিসন, ট্যাপ প্রেসার, ডিভাইস ওরিয়েন্টেশন, লোকেশন    
    • সিস্টেম-জেনারেটেড সার্ভার সাইড ইভেন্টস- পেজ লোড, সেশন রিফ্রেশেস, এপি কলস   
    • সিস্টেম-জেনারেটেড ক্লাইন্ট সাইড ইভেন্টস- সিস্টেম পুশ নোটিফিকেশনস এবং ট্রিগারস 
  • বৈশিষ্ট্য অনুযায়ী নির্দিষ্ট তথ্য: 
    • পেজ ভিউস (ইউআরএল, রেফার,ইউজার এজেন্ট, ডিভাইস,আইপি, টাইমস্ট্যাম্প, ট্রাফিক সোর্স, ক্যাম্পেইন)   
    • অনুশীলনের প্রচেষ্টা স্তরের তথ্য (টাইমস্ট্যাম্প, ভিজিট/রি- ভিজিট, আনসার চয়েস, টাইম ফার্স্ট সীন, কারেক্ট,টাইম স্পেন্ট,সল্যুশন ভিউড ,হিন্ট ইউসড) – সেশন লেভেলে একত্রিত
    • অর্জিত আচরণ তথ্য: 
      • সার্চ ইভেন্ট তথ্য (টাইমস্টাম্প, কোয়েরি, রেজাল্ট সেট)
      • রেজাল্ট ইন্টারঅ্যাকশন তথ্য (টাইমস্টাম্প, সাজেস্টেড রেজাল্ট সিলেক্টেড, রেজাল্ট উইজেট এন্ড কনটেক্সট, উইজেট পজিশন)
    • টেস্ট আটেম্প্ট ঘটনা স্তরের তথ্য (টাইমস্ট্যাম্প, ভিজিট/রি-ভিজিট, আনসার চয়েস, টাইম ফার্স্ট সিন্, কারেক্ট, টাইম স্পেন্ট, ফিডব্যাক ভিউড) – সেশন স্তরে একত্রিত হয়
    •  প্রশ্ন ও উত্তরের বিশদ বিবরণ, টাইমস্ট্যাম্প, ইউজার ভোটিং বেহেভিওর জিজ্ঞাসা(একাডেমিক ফোরাম) করুন
    • পেমেন্টস (ইউজার আইডেন্টিফায়ার, ইউজার ইমেইল, থার্ড পার্টি পেমেন্ট গেটওয়ে, পেমেন্ট গেটওয়ে ট্রানসাকশান আইডেন্টিফায়ার, মোড অফ পেমেন্ট( কার্ড, ওয়ালেট, ইত্যাদি), টাইম স্ট্যাম্প অফ অর্ডার রিকোয়েস্ট, টাইম স্ট্যাম্প অফ পেমেন্ট রিয়েলাইজেশন, যেকোনো ডিসকাউন্ট এপ্লায়েড, অর্ডার আইটেম স্পেসিফাইজ ) 

অনেকগুলি ব্যবহারিক বিবেচ্য বিষয় রয়েছে যা Embibe যে স্কেলে তথ্য সংগ্রহের উপকরণ তৈরি করে তার জন্য ধরা দরকার। উদাহরণস্বরূপ, আমরা এই সমস্ত তথ্য সংগ্রহ করার জন্য অনেকগুলি পদ্ধতির উপর নির্ভর করি। segment.io এবং হিপ এর মত তৃতীয় পক্ষের প্লাগইনগুলির সাথে একীভূত করার মাধ্যমে ব্যবহারকারীর ইন্টারঅ্যাকশন ইভেন্ট স্ট্রীমের লগিং করা হয়। সার্ভার-সাইড পেজলোড এবং সেশন ইভেন্ট লগিং ইন-হাউস ইনস্ট্রুমেন্ট করা হয় এবং noSql ডাটাবেসে পুশ করা হয়। প্র্যাকটিস এবং টেস্টের মতো বৈশিষ্ট্যগুলিতে ব্যবহারকারীর কার্যকলাপের দৈনিক তথ্য সামনের প্রান্তে কোয়েরি একত্রিত করার জন্য DB তে সংরক্ষণ করা হয়।

তথ্য প্রক্রিয়াকরণ  বা ডাটা প্রসেসিং 

প্রাথমিক তথ্য সংগ্রহের পরে, এটি শুদ্ধ, সমৃদ্ধ, মাইন এবং ভিজুয়ালাইজ করার প্রয়োজন রয়েছে। Embibe-এ , আমরা যে তথ্য সংগ্রহ করি তা ব্যবহার করার জন্য আমাদের নিম্নলিখিত বিস্তৃত পদ্ধতি রয়েছে:

  • ইন-হাউস রিপোর্টিং এবং অ্যাড-হক বিশ্লেষণ:
    • স্পার্ক স্ট্রিমিং ব্যবহার করে লগ মাইনিং এবং হ্যাডুপ ম্যাপ-রেডিউস কাজগুলি AWS EMR-এর মাধ্যমে তৈরি এবং আপডেট করতে আমাদের ব্যবহারকারীর GOV তথ্য যা সেশন স্তরের কার্যকলাপের পাশাপাশি GAV তথ্য সংরক্ষণ করে যা প্রতিটি ব্যবহারকারীর জন্য প্রতিটি বিষয়বস্তুর অংশের জন্য একাডেমিক সক্ষমতার প্রোফাইল সংরক্ষণ করে। GOV এবং GAV তথ্য স্কেলে পরিবেশনের জন্য ইলাস্টিক সার্চ ক্লাস্টারে সংরক্ষণ করা হয়।
    • ট্রাফিক প্যাটার্ন, ব্যবহারকারী নগদীকরণ, পরীক্ষা-নিরীক্ষার উন্নতি, অনুসন্ধান ব্যর্থতা এবং অন্যান্য প্রয়োজনের জন্য রিপোর্টিং তথ্য তৈরি করতে লগ মাইনিং করো। প্রসেস্ড তথ্য আবার ইলাস্টিকসার্চে পুশ করা হয় এবং কিবানা এবং গ্রাফানা ড্যাশবোর্ড ব্যবহার করে ভিজ্যুয়ালাইজ করা হয়।
    • প্রাথমিক র-তথ্য HBase-এ HDFS-এ সংরক্ষিত হয় যা কোনও প্রয়োজনীয় বিশ্লেষণের জন্য অ্যাড-হক ভিত্তিতে পরিচালিত হয়।

চিত্র 1: ডেটা ফ্লো স্ট্যাকের একটি উচ্চ স্তরের পরিকল্পনা যা Embibe ডেটা সায়েন্স ল্যাব বিকাশকারী বুদ্ধিমত্তাকে শক্তিশালী করে

  • ব্যবসা/দ্রব্য/মার্কেটিং সেলফ সার্ভের জন্য থার্ড পার্টি টুলস   
    •  আমাদের অন-পেজ এবং ইন-অ্যাপ ব্যবহারকারীর আদানপ্রদান তথ্য segment.io (থার্ড পার্টি প্লাগইন) ব্যবহার করে ক্যাপচার করা হয় যা বিভিন্ন বাহ্যিক তথ্য ভিজ্যুয়ালাইজেশন প্ল্যাটফর্মে তথ্যকে স্বয়ংক্রিয়ভাবে রুট করে।
    • ট্রাফিক সোর্স, জনসংখ্যা এবং অবস্থানের তথ্য, ডিভাইস ব্রেকডাউন, পেজ ভিউস, টাইম স্পেন্ট, রিটেনশন মেট্রিক্স সহ বিস্তৃত স্তরের ট্র্যাফিক পর্যবেক্ষণের জন্য গুগল মেট্রিক্স। 
    •  বিশ্লেষণের জন্য হিপ অ্যানালিটিক্স এবং ইউসার ফ্লো এর অপ্টিমাইজেশন। FE তারযুক্ত সমস্ত ইউসার ইন্টারঅ্যাকশন ইভেন্টগুলিকে segment.io-এর মাধ্যমে হিপ-এ পুশ করা হয়। হিপ ব্যবহারকারীর কনভার্সন ফানেল এবংফ্লো এর  স্ব-পরিষেবা স্টাইলের গতিশীল সেটআপের অনুমতি দেয়।