ଡାଟା ହେଉଛି ନୂଆ ବଳ

ଡାଟା ହେଉଛି ନୂଆ ବଳ

ଡାଟାକୁ ଇନଷ୍ଟ୍ରୁମେଣ୍ଟିଂ, ମାପ, ସଂଗ୍ରହ, ମାଇନିଂ ଏବଂ ଆର୍କାଇଭିଂ କରିବା ଲାଗି Embibe ପ୍ରତିବଦ୍ଧ । Embibe ମାଲିକାନା ଅଧୀନରେ ଏହି ଡାଟା ରହିଛି । ଆମର IP ଏହା ଉପରେ ନିର୍ଭର କରେ । Embibeରେ ଆମର ୟୁଜରମାନେ ଆମର ଉତ୍ପାଦ ସହିତ କିପରି କାର୍ଯ୍ୟ କରନ୍ତି, ଏବଂ କେଉଁ କାରଣଗୁଡିକ ନିର୍ଦ୍ଦିଷ୍ଟ ଫଳାଫଳକୁ ନେଇଥାଏ ତାହା ନିରୂପଣ କରିବା ପାଇଁ ପର୍ଯ୍ୟାପ୍ତ ଇନଷ୍ଟ୍ରୁମେଣ୍ଟେସନ୍ ନହେବା ପର୍ଯ୍ୟନ୍ତ ଆମେ ରିଲିଜ୍ ବିଳମ୍ବ କରିଥାଉ । ଡାଟା ସହିତ ଏହି ଝୁଙ୍କ୍ ହିଁ ଆମକୁ ବିଦ୍ୟାର୍ଥୀମାନେ କିପରି ଅଧ୍ୟୟନ କରନ୍ତି ଏବଂ ସେମାନଙ୍କର ଲକ୍ଷ୍ୟ ହାସଲ କରନ୍ତି ସେ ସମ୍ବନ୍ଧରେ ଅନେକ ଅନ୍ତର୍ନିହିତ ଗୁଣକୁ ସ୍ପଷ୍ଟ ରୂପେ ଦେଖାଇବ । ଉଦାହରଣ ସ୍ୱରୂପ, ସ୍କୋର୍ କରିବାକୁ ଜଣେ ବିଦ୍ୟାର୍ଥୀର ସାମର୍ଥ୍ୟ ହେଉଛି ଦୁଇଟି କାରଣର ଏକ ମିଶ୍ରଣ – ସେମାନଙ୍କର ଶିକ୍ଷଣ କ୍ଷମତା ଯାହା ସ୍କୋର୍ କରିବାର ସାମଗ୍ରିକ ସାମର୍ଥ୍ୟର ~61%, ଏବଂ ସେମାନଙ୍କର ଆଚରଣଗତ ଗୁଣ ଯାହା ~39% ଅବଦାନ ଥାଏ । ଡାଟା-ଚାଳିତ ହେବା ଉପରେ ଏହି ତୀକ୍ଷ୍ଣ ନଜର ହିଁ Embibeକୁ ଉତ୍ପାଦ ଗଠନ କରିବାରେ ସକ୍ଷମ କରିଛି ଯାହା ଶିକ୍ଷାକୁ ବ୍ୟକ୍ତିଗତ କରିଥାଏ ଏବଂ ବିଦ୍ୟାର୍ଥୀମାନଙ୍କ ପାଇଁ ଲର୍ଣ୍ଣିଂ ଆଉଟକମ୍‌ରେ ଅତୁଳନୀୟ ଉନ୍ନତି ଆଣିଦେଇଥାଏ ।

ପ୍ରମୁଖ ଡାଟା ସଂଗ୍ରହଣ

Embibe ପ୍ଲାଟଫର୍ମରେ ବିଭିନ୍ନ ପର୍ଯ୍ୟାୟରେ ଏବଂ ସ୍ଥାନରେ ଡାଟା ସାଧନ ଓ ସଂଗୃହିତ ହୋଇଥାଏ । ସଠିକ୍ ସମୟରେ, ସଠିକ୍ ପ୍ରସଙ୍ଗରେ, ସଠିକ୍ ସୂକ୍ଷ୍ମ ସ୍ତର ସହିତ ତଥ୍ୟକୁ କ୍ୟାପଚର୍ କରିବା କେବଳ ଆବଶ୍ୟକ ନୁହେଁ । Embibe ରେ ଡାଟା କ୍ୟାପଚର୍ କୁ  ନିମ୍ନଲିଖିତ ଭାବେ ଶ୍ରେଣୀଭୁକ୍ତ କରାଯାଇଛି:

  • ରିଚ୍ ଇଭେଣ୍ଟ ଟାଇପ୍ ର ଇନଷ୍ଟ୍ରୁମେଣ୍ଟେସନ୍:
  • ୟୁଜର- ଇଣ୍ଟରାକ୍ସନ୍ ଏକ୍ସପ୍ଲିସିଟ୍ ଇଭେଣ୍ଟ – କ୍ଲିକ୍, ଟ୍ୟାପସ୍, ହୋବର୍, ସ୍କ୍ରୋଲସ୍, ଟେକ୍ସଟ୍-ଅପଡେଟ୍
  • ୟୁଜର ଇଣ୍ଟରାକ୍ସନ୍ ଇମ୍ପ୍ଲିସିଟି ଇଭେଣ୍ଟ – କର୍ସର୍ ପୋଜିସନ୍, ଟ୍ୟାପ୍ ପ୍ରେସର, ଡିଭାଇସ୍ ଓରିଏଣ୍ଟେସନ୍, ଲୋକେସନ୍
  • ସିଷ୍ଟମ୍ -ଜେନେରେଟେଡ୍ ସର୍ଭର ସାଇଡ୍ ଇଭେଣ୍ଟସ୍ – ପେଜ୍ ଲୋଡ୍, ସେସନ୍ ରିଫ୍ରେସ୍, api କଲ୍
  • ସିଷ୍ଟମ୍ -ଜେନେରେଟେଡ୍ କ୍ଲାଏଣ୍ଟ ସାଇଡ୍ ଇଭେଣ୍ଟସ୍ – ସିଷ୍ଟମ୍ ପୁସ୍ ନୋଟିଫିକେସନ୍ ଏବଂ ଟ୍ରିଗର୍
  • ଗୁଣ ଅନୁସାରେ ନିର୍ଦ୍ଦିଷ୍ଟ ଡାଟା:
  • ପେଜ୍ ଭିଉଜ୍ (URL, ରେଫରର୍, ୟୁଜର୍ ଏଜେଣ୍ଟ, ଡିଭାଇସ୍, IP, ଟାଇମ ଷ୍ଟାମ୍ପ, ଟ୍ରାଫିକ୍ ସୋର୍ସ, କ୍ୟାମ୍ପେନ୍)
  • ପ୍ରାକ୍ଟିସ୍ ଆଟେମ୍ପଟ୍ ଲେଭଲ୍ ଡାଟା (ଟାଇମଷ୍ଟାମ୍ପ୍, ଭିଜିଟ୍/ରି-ଭିଜିଟ୍, ଉତ୍ତର ବିକଳ୍ପ, ପ୍ରଥମେ ଦେଖାଯାଇଥିବା ସମୟ, ସଠିକ୍, ଅତିବାହିତ ସମୟ, ଦେଖିଥିବା ସମାଧାନ, ବ୍ୟବହୃତ ହିଣ୍ଟ୍) – ସେସନ୍ ସ୍ତରରେ ଏକତ୍ରିତ ଡାଟା
  • ଲର୍ଣ୍ଣ ଆଚରଣଗତ ଡାଟା :
  • ସର୍ଚ୍ଚ ଇଭେଣ୍ଟ ଡାଟା (ଟାଇମଷ୍ଟାମ୍ପ୍, ପ୍ରଶ୍ନ, ଫଳାଫଳ ସେଟ୍)
  • ରେଜଲ୍ଟ ଇଣ୍ଟରାକ୍ସନ୍ ଡାଟା (ଟାଇମଷ୍ଟାମ୍ପ୍, ମନୋନୀତ ହୋଇଥିବା ପ୍ରସ୍ତାବିତ ଫଳାଫଳ, ଫଳାଫଳ ୱିଜେଟ୍ ଏବଂ ପ୍ରସଙ୍ଗ, ୱିଜେଟ୍ ସ୍ଥିତି)
  • ଟେଷ୍ଟ ପ୍ରୟାସ ଇଭେଣ୍ଟ ଲେଭଲ ଡାଟା (ଟାଇମଷ୍ଟାମ୍ପ୍, ଭିଜିଟ୍/ରି-ଭିଜିଟ୍, ଉତ୍ତର ବିକଳ୍ପ, ପ୍ରଥମ ଦେଖାଯାଇଥିବା ସମୟ, ସଠିକ୍, ଅତିବାହିତ ସମୟ, ଦେଖିଥିବା ଫିଡବ୍ୟାକ୍) – ସେସନ୍ ସ୍ତରରେ ଏକତ୍ରିତ ।
  • ପ୍ରଶ୍ନ ପଚାରନ୍ତୁ (ଏକାଡେମିକ୍ ଫୋରମ୍) ଏବଂ ଉତ୍ତର ବିବରଣୀ, ଟାଇମଷ୍ଟାମ୍ପ୍, ୟୁଜର ଭୋଟିଂ ଆଚରଣ ।
  • ଦେୟ (ୟୁଜର ଚିହ୍ନଟକାରୀ, ୟୁଜର ଇମେଲ, ତୃତୀୟ ପକ୍ଷ ପେମେଣ୍ଟ ଗେଟୱେ, ପେମେଣ୍ଟ ଗେଟୱେ କାରବାର ଚିହ୍ନଟକାରୀ, ଦେୟ ମୋଡ (କାର୍ଡ, ୱାଲେଟ, ଇତ୍ୟାଦି), ଅର୍ଡର ଅନୁରୋଧର ଟାଇମଷ୍ଟାମ୍ପ, ଦେୟ ବାସ୍ତବତାର ସମୟ ସୀମା, କୌଣସି ରିହାତି ପ୍ରୟୋଗ, ଆଇଟମ୍ ନିର୍ଦ୍ଦିଷ୍ଟତା)

ସେଠାରେ ଅନେକ ବ୍ୟାବହାରିକ ବିଚାର ଅଛି ଯାହା Embibe କରୁଥିବା ସ୍କେଲରେ ଡାଟା ସଂଗ୍ରହକୁ ସାଧନ କରିବା ପାଇଁ ହିସାବକୁ ନିଆଯିବା ଆବଶ୍ୟକ । ଉଦାହରଣ ସ୍ୱରୂପ, ଏହି ସମସ୍ତ ଡାଟା ସଂଗ୍ରହ କରିବା ପାଇଁ ଆମେ ଅନେକ ମୋଡାଲିଟି ଉପରେ ନିର୍ଭର କରୁ । segment.io ଏବଂ ହିପ୍ ପରି ତୃତୀୟ-ପକ୍ଷ ପ୍ଲଗ୍ ଇନ୍ ସହିତ ଏକୀକୃତ ହୋଇ ଉପଭୋକ୍ତା ଇଣ୍ଟରାକସନ୍ ଇଭେଣ୍ଟ ଷ୍ଟ୍ରିମର ଲଗିଂ ହାସଲ ହୁଏ । ସର୍ଭର-ସାଇଡ୍ ପେଜ୍ ଲୋଡ୍ ଓ ସେସନ୍ ଇଭେଣ୍ଟ ଲଗିଂ ଇନ୍-ହାଉସ୍ ଇନଷ୍ଟ୍ରୁମେଣ୍ଟ୍ ହୋଇ noSql ଡାଟାବେସ୍ କୁ ଚାଲିଯାଏ । ପ୍ରାକ୍ଟିସ୍ ଏବଂ ଟେଷ୍ଟ ପରି ବୈଶିଷ୍ଟ୍ୟ ଉପରେ ୟୁଜର କାର୍ଯ୍ୟକଳାପର ଦୈନିକ ଡାଟା ଫ୍ରଣ୍ଟ ଏଣ୍ଡ ଦ୍ୱାରା ପ୍ରଶ୍ନ ଏଗ୍ରିଗେସନ୍ ପାଇଁ DB ରେ ଗଚ୍ଛିତ ରଖାଯାଏ ।

ଡାଟା ପ୍ରୋସେସିଂ

ଥରେ ପ୍ରାଥମିକ ଡାଟା ସଂଗ୍ରହ ହୋଇଗଲେ, ଏହାକୁ ସଂପାଦନା କରିବା, ସମୃଦ୍ଧ କରିବା, ମାଇନିଂ ଏବଂ ଭିଜୁଆଲାଇଜ୍ କରିବାର ଆବଶ୍ୟକତା ଅଛି । Embibe ରେ, ଆମେ ସଂଗ୍ରହ କରୁଥିବା ତଥ୍ୟକୁ ବ୍ୟବହାର କରିବା ପାଇଁ ଆମର ନିମ୍ନଲିଖିତ ଉପାୟ ସବୁ ରହିଛି:

  • ଇନ-ହାଉସ୍ ରିପୋର୍ଟିଂ ଓ ଆଡ-ହକ୍ ଆନାଲିସିସ୍ :
  • ଆମର ୟୁଜର୍ ଗ୍ଲୋବାଲ୍ ୱାନ୍ ଭ୍ୟୁ (GOV) ଡାଟା ସୃଷ୍ଟି ଏବଂ ଅପଡେଟ୍ କରିବା ପାଇଁ AWS EMR ଉପରେ ସ୍ପାର୍କ ଷ୍ଟ୍ରିମିଂ ଏବଂ ହାଡପ୍ ମ୍ୟାପ୍ ବ୍ୟବହାର କରି ଲଗ୍ ମାଇନିଂ କରେ ଯାହା ସେସନ୍ ସ୍ତରର କାର୍ଯ୍ୟକଳାପ ତଥା ଗ୍ଲୋବାଲ୍ ଏକାଡେମିକ୍ ଭ୍ୟୁ (GAV) ଡାଟା ସଂରକ୍ଷଣ କରେ ଯାହା ପ୍ରତ୍ୟେକ ୟୁଜର୍ ପାଇଁ ଏକାଡେମିକ୍ ଦକ୍ଷତା ପ୍ରୋଫାଇଲ୍ ଗଚ୍ଛିତ କରେ । ସ୍କେଲରେ କରିବା ପାଇଁ GOV ଏବଂ GAV ଡାଟା ଇଲେଷ୍ଟିକ୍ ସର୍ଚ୍ଚ କ୍ଲଷ୍ଟରରେ ଗଚ୍ଛିତ ରୁହେ ।
  • ଟ୍ରାଫିକ୍ ପାର୍ଟନ୍, ୟୁଜର୍ ମନିଟାଇଜେସନ୍, ଟେଷ୍ଟ-ଅନ୍-ଟେଷ୍ଟ ଉନ୍ନତି, ସର୍ଚ୍ଚ ବିଫଳତା ଏବଂ ଅନ୍ୟାନ୍ୟ ଆବଶ୍ୟକତା ପାଇଁ ରିପୋର୍ଟିଂ ଡାଟା ସୃଷ୍ଟି କରିବାକୁ ଲଗ୍ ମାଇନିଂ କରନ୍ତୁ । ପ୍ରକ୍ରିୟାକୃତ ଡାଟାକୁ ପୁନର୍ବାର ଇଲେଷ୍ଟିକ୍ ସର୍ଚ୍ଚରେ ରଖାଯାଇଥାଏ ଏବଂ କିବାନା ଓ ଗ୍ରାଫାନା ଡ୍ୟାସବୋର୍ଡ ବ୍ୟବହାର କରି ଭିଜୁଆଲାଇଜ୍ କରାଯାଏ ।
  • ଯେକୌଣସି ଆବଶ୍ୟକୀୟ ବିଶ୍ଳେଷଣ ପାଇଁ ଆଡ୍-ହକ୍ ଆଧାରରେ ପ୍ରାଥମିକ ଅପ୍ରସ୍ତୁତ ଡାଟା HBase ଉପରେ HDFS ଉପରେ ଗଚ୍ଛିତ ହୋଇଛି ।
ଚିତ୍ର 1: ଡାଟା ଫ୍ଲୋ ଷ୍ଟାକ୍ ର ଏକ ଉଚ୍ଚ ସ୍ତରୀୟ ସ୍କିମେଟିକ୍ ଯାହା Embibe ର ଡାଟା ସାଇନ୍ସ ଲ୍ୟାବ୍ ବିକାଶ କରୁଥିବା ଇଣ୍ଟେଲିଜେନ୍ସକୁ ଶକ୍ତିଶାଳୀ କରିଥାଏ

ବ୍ୟବସାୟ / ଉତ୍ପାଦ / ମାର୍କେଟିଂ ସ୍ୱୟଂ-କରିବା ପାଇଁ ତୃତୀୟ ପକ୍ଷ ଉପକରଣ

  • ଆମର ଅନ୍-ପେଜ୍ ଏବଂ ଇନ୍-ଆପ୍ ୟୁଜର୍ ଇଣ୍ଟରାକସନ୍ ଡାଟାକୁ segment.io (ତୃତୀୟ ପକ୍ଷ ପ୍ଲଗ୍ ଇନ୍) ବ୍ୟବହାର କରି କ୍ୟାପଚର୍ କରାଯାଏ ଯାହା ଡାଟାକୁ ବିଭିନ୍ନ ବାହ୍ୟ ଡାଟା ଭିଜୁଆଲାଇଜେସନ୍ ପ୍ଲାଟଫର୍ମକୁ ଅଟୋ-ରୁଟ୍ କରିଥାଏ ।
  • ଟ୍ରାଫିକ୍ ଉତ୍ସ, ପରିସଂଖ୍ୟାନ ଓ ଅବସ୍ଥାନ ସୂଚନା, ଡିଭାଇସ୍ ବ୍ରେକଡାଉନ୍, ପେଜ୍ ଭ୍ୟୁ, ଅତିବାହିତ ସମୟ, ଧାରଣ ମେଟ୍ରିକ୍ସ ସହିତ ବ୍ୟାପକ ସ୍ତରର ଟ୍ରାଫିକ୍ ମନିଟରିଂ ପାଇଁ ଗୁଗୁଲ୍ ଆନାଲିଟିକ୍ସର ବ୍ୟବହାର ।
  • ୟୁଜର୍ ପ୍ରବାହର ବିଶ୍ଳେଷଣ ଏବଂ ଅପ୍ଟିମାଇଜେସନ୍ ପାଇଁ ହିପ୍ ଆନାଲିଟିକ୍ସ । ସମସ୍ତ ୟୁଜର୍ ଇଣ୍ଟରାକସନ୍ ଇଭେଣ୍ଟଗୁଡ଼ିକୁ segment.io ମାଧ୍ୟମରେ ହିପ୍ କୁ ପଠାଇବା ପାଇଁ FE wired ବ୍ୟବହୃତ ହୋଇଥାଏ । ହିପ୍ ୟୁଜର୍ ରୂପାନ୍ତର ଫନେଲ୍ ଏବଂ ପ୍ରବାହର ସେଲ୍ଫ-ସର୍ଭ ଷ୍ଟାଇଲ୍ ଶୈଳୀ ଡାଇନାମିକ୍ ସେଟିଂକୁ ଅନୁମତି ଦେଇଥାଏ ।