ଡାଟା ହେଉଛି ନୂଆ ବଳ
ଡାଟାକୁ ଇନଷ୍ଟ୍ରୁମେଣ୍ଟିଂ, ମାପ, ସଂଗ୍ରହ, ମାଇନିଂ ଏବଂ ଆର୍କାଇଭିଂ କରିବା ଲାଗି Embibe ପ୍ରତିବଦ୍ଧ । Embibe ମାଲିକାନା ଅଧୀନରେ ଏହି ଡାଟା ରହିଛି । ଆମର IP ଏହା ଉପରେ ନିର୍ଭର କରେ । Embibeରେ ଆମର ୟୁଜରମାନେ ଆମର ଉତ୍ପାଦ ସହିତ କିପରି କାର୍ଯ୍ୟ କରନ୍ତି, ଏବଂ କେଉଁ କାରଣଗୁଡିକ ନିର୍ଦ୍ଦିଷ୍ଟ ଫଳାଫଳକୁ ନେଇଥାଏ ତାହା ନିରୂପଣ କରିବା ପାଇଁ ପର୍ଯ୍ୟାପ୍ତ ଇନଷ୍ଟ୍ରୁମେଣ୍ଟେସନ୍ ନହେବା ପର୍ଯ୍ୟନ୍ତ ଆମେ ରିଲିଜ୍ ବିଳମ୍ବ କରିଥାଉ । ଡାଟା ସହିତ ଏହି ଝୁଙ୍କ୍ ହିଁ ଆମକୁ ବିଦ୍ୟାର୍ଥୀମାନେ କିପରି ଅଧ୍ୟୟନ କରନ୍ତି ଏବଂ ସେମାନଙ୍କର ଲକ୍ଷ୍ୟ ହାସଲ କରନ୍ତି ସେ ସମ୍ବନ୍ଧରେ ଅନେକ ଅନ୍ତର୍ନିହିତ ଗୁଣକୁ ସ୍ପଷ୍ଟ ରୂପେ ଦେଖାଇବ । ଉଦାହରଣ ସ୍ୱରୂପ, ସ୍କୋର୍ କରିବାକୁ ଜଣେ ବିଦ୍ୟାର୍ଥୀର ସାମର୍ଥ୍ୟ ହେଉଛି ଦୁଇଟି କାରଣର ଏକ ମିଶ୍ରଣ – ସେମାନଙ୍କର ଶିକ୍ଷଣ କ୍ଷମତା ଯାହା ସ୍କୋର୍ କରିବାର ସାମଗ୍ରିକ ସାମର୍ଥ୍ୟର ~61%, ଏବଂ ସେମାନଙ୍କର ଆଚରଣଗତ ଗୁଣ ଯାହା ~39% ଅବଦାନ ଥାଏ । ଡାଟା-ଚାଳିତ ହେବା ଉପରେ ଏହି ତୀକ୍ଷ୍ଣ ନଜର ହିଁ Embibeକୁ ଉତ୍ପାଦ ଗଠନ କରିବାରେ ସକ୍ଷମ କରିଛି ଯାହା ଶିକ୍ଷାକୁ ବ୍ୟକ୍ତିଗତ କରିଥାଏ ଏବଂ ବିଦ୍ୟାର୍ଥୀମାନଙ୍କ ପାଇଁ ଲର୍ଣ୍ଣିଂ ଆଉଟକମ୍ରେ ଅତୁଳନୀୟ ଉନ୍ନତି ଆଣିଦେଇଥାଏ ।
ପ୍ରମୁଖ ଡାଟା ସଂଗ୍ରହଣ
Embibe ପ୍ଲାଟଫର୍ମରେ ବିଭିନ୍ନ ପର୍ଯ୍ୟାୟରେ ଏବଂ ସ୍ଥାନରେ ଡାଟା ସାଧନ ଓ ସଂଗୃହିତ ହୋଇଥାଏ । ସଠିକ୍ ସମୟରେ, ସଠିକ୍ ପ୍ରସଙ୍ଗରେ, ସଠିକ୍ ସୂକ୍ଷ୍ମ ସ୍ତର ସହିତ ତଥ୍ୟକୁ କ୍ୟାପଚର୍ କରିବା କେବଳ ଆବଶ୍ୟକ ନୁହେଁ । Embibe ରେ ଡାଟା କ୍ୟାପଚର୍ କୁ ନିମ୍ନଲିଖିତ ଭାବେ ଶ୍ରେଣୀଭୁକ୍ତ କରାଯାଇଛି:
- ରିଚ୍ ଇଭେଣ୍ଟ ଟାଇପ୍ ର ଇନଷ୍ଟ୍ରୁମେଣ୍ଟେସନ୍:
- ୟୁଜର- ଇଣ୍ଟରାକ୍ସନ୍ ଏକ୍ସପ୍ଲିସିଟ୍ ଇଭେଣ୍ଟ – କ୍ଲିକ୍, ଟ୍ୟାପସ୍, ହୋବର୍, ସ୍କ୍ରୋଲସ୍, ଟେକ୍ସଟ୍-ଅପଡେଟ୍
- ୟୁଜର ଇଣ୍ଟରାକ୍ସନ୍ ଇମ୍ପ୍ଲିସିଟି ଇଭେଣ୍ଟ – କର୍ସର୍ ପୋଜିସନ୍, ଟ୍ୟାପ୍ ପ୍ରେସର, ଡିଭାଇସ୍ ଓରିଏଣ୍ଟେସନ୍, ଲୋକେସନ୍
- ସିଷ୍ଟମ୍ -ଜେନେରେଟେଡ୍ ସର୍ଭର ସାଇଡ୍ ଇଭେଣ୍ଟସ୍ – ପେଜ୍ ଲୋଡ୍, ସେସନ୍ ରିଫ୍ରେସ୍, api କଲ୍
- ସିଷ୍ଟମ୍ -ଜେନେରେଟେଡ୍ କ୍ଲାଏଣ୍ଟ ସାଇଡ୍ ଇଭେଣ୍ଟସ୍ – ସିଷ୍ଟମ୍ ପୁସ୍ ନୋଟିଫିକେସନ୍ ଏବଂ ଟ୍ରିଗର୍
- ଗୁଣ ଅନୁସାରେ ନିର୍ଦ୍ଦିଷ୍ଟ ଡାଟା:
- ପେଜ୍ ଭିଉଜ୍ (URL, ରେଫରର୍, ୟୁଜର୍ ଏଜେଣ୍ଟ, ଡିଭାଇସ୍, IP, ଟାଇମ ଷ୍ଟାମ୍ପ, ଟ୍ରାଫିକ୍ ସୋର୍ସ, କ୍ୟାମ୍ପେନ୍)
- ପ୍ରାକ୍ଟିସ୍ ଆଟେମ୍ପଟ୍ ଲେଭଲ୍ ଡାଟା (ଟାଇମଷ୍ଟାମ୍ପ୍, ଭିଜିଟ୍/ରି-ଭିଜିଟ୍, ଉତ୍ତର ବିକଳ୍ପ, ପ୍ରଥମେ ଦେଖାଯାଇଥିବା ସମୟ, ସଠିକ୍, ଅତିବାହିତ ସମୟ, ଦେଖିଥିବା ସମାଧାନ, ବ୍ୟବହୃତ ହିଣ୍ଟ୍) – ସେସନ୍ ସ୍ତରରେ ଏକତ୍ରିତ ଡାଟା
- ଲର୍ଣ୍ଣ ଆଚରଣଗତ ଡାଟା :
- ସର୍ଚ୍ଚ ଇଭେଣ୍ଟ ଡାଟା (ଟାଇମଷ୍ଟାମ୍ପ୍, ପ୍ରଶ୍ନ, ଫଳାଫଳ ସେଟ୍)
- ରେଜଲ୍ଟ ଇଣ୍ଟରାକ୍ସନ୍ ଡାଟା (ଟାଇମଷ୍ଟାମ୍ପ୍, ମନୋନୀତ ହୋଇଥିବା ପ୍ରସ୍ତାବିତ ଫଳାଫଳ, ଫଳାଫଳ ୱିଜେଟ୍ ଏବଂ ପ୍ରସଙ୍ଗ, ୱିଜେଟ୍ ସ୍ଥିତି)
- ଟେଷ୍ଟ ପ୍ରୟାସ ଇଭେଣ୍ଟ ଲେଭଲ ଡାଟା (ଟାଇମଷ୍ଟାମ୍ପ୍, ଭିଜିଟ୍/ରି-ଭିଜିଟ୍, ଉତ୍ତର ବିକଳ୍ପ, ପ୍ରଥମ ଦେଖାଯାଇଥିବା ସମୟ, ସଠିକ୍, ଅତିବାହିତ ସମୟ, ଦେଖିଥିବା ଫିଡବ୍ୟାକ୍) – ସେସନ୍ ସ୍ତରରେ ଏକତ୍ରିତ ।
- ପ୍ରଶ୍ନ ପଚାରନ୍ତୁ (ଏକାଡେମିକ୍ ଫୋରମ୍) ଏବଂ ଉତ୍ତର ବିବରଣୀ, ଟାଇମଷ୍ଟାମ୍ପ୍, ୟୁଜର ଭୋଟିଂ ଆଚରଣ ।
- ଦେୟ (ୟୁଜର ଚିହ୍ନଟକାରୀ, ୟୁଜର ଇମେଲ, ତୃତୀୟ ପକ୍ଷ ପେମେଣ୍ଟ ଗେଟୱେ, ପେମେଣ୍ଟ ଗେଟୱେ କାରବାର ଚିହ୍ନଟକାରୀ, ଦେୟ ମୋଡ (କାର୍ଡ, ୱାଲେଟ, ଇତ୍ୟାଦି), ଅର୍ଡର ଅନୁରୋଧର ଟାଇମଷ୍ଟାମ୍ପ, ଦେୟ ବାସ୍ତବତାର ସମୟ ସୀମା, କୌଣସି ରିହାତି ପ୍ରୟୋଗ, ଆଇଟମ୍ ନିର୍ଦ୍ଦିଷ୍ଟତା)
ସେଠାରେ ଅନେକ ବ୍ୟାବହାରିକ ବିଚାର ଅଛି ଯାହା Embibe କରୁଥିବା ସ୍କେଲରେ ଡାଟା ସଂଗ୍ରହକୁ ସାଧନ କରିବା ପାଇଁ ହିସାବକୁ ନିଆଯିବା ଆବଶ୍ୟକ । ଉଦାହରଣ ସ୍ୱରୂପ, ଏହି ସମସ୍ତ ଡାଟା ସଂଗ୍ରହ କରିବା ପାଇଁ ଆମେ ଅନେକ ମୋଡାଲିଟି ଉପରେ ନିର୍ଭର କରୁ । segment.io ଏବଂ ହିପ୍ ପରି ତୃତୀୟ-ପକ୍ଷ ପ୍ଲଗ୍ ଇନ୍ ସହିତ ଏକୀକୃତ ହୋଇ ଉପଭୋକ୍ତା ଇଣ୍ଟରାକସନ୍ ଇଭେଣ୍ଟ ଷ୍ଟ୍ରିମର ଲଗିଂ ହାସଲ ହୁଏ । ସର୍ଭର-ସାଇଡ୍ ପେଜ୍ ଲୋଡ୍ ଓ ସେସନ୍ ଇଭେଣ୍ଟ ଲଗିଂ ଇନ୍-ହାଉସ୍ ଇନଷ୍ଟ୍ରୁମେଣ୍ଟ୍ ହୋଇ noSql ଡାଟାବେସ୍ କୁ ଚାଲିଯାଏ । ପ୍ରାକ୍ଟିସ୍ ଏବଂ ଟେଷ୍ଟ ପରି ବୈଶିଷ୍ଟ୍ୟ ଉପରେ ୟୁଜର କାର୍ଯ୍ୟକଳାପର ଦୈନିକ ଡାଟା ଫ୍ରଣ୍ଟ ଏଣ୍ଡ ଦ୍ୱାରା ପ୍ରଶ୍ନ ଏଗ୍ରିଗେସନ୍ ପାଇଁ DB ରେ ଗଚ୍ଛିତ ରଖାଯାଏ ।
ଡାଟା ପ୍ରୋସେସିଂ
ଥରେ ପ୍ରାଥମିକ ଡାଟା ସଂଗ୍ରହ ହୋଇଗଲେ, ଏହାକୁ ସଂପାଦନା କରିବା, ସମୃଦ୍ଧ କରିବା, ମାଇନିଂ ଏବଂ ଭିଜୁଆଲାଇଜ୍ କରିବାର ଆବଶ୍ୟକତା ଅଛି । Embibe ରେ, ଆମେ ସଂଗ୍ରହ କରୁଥିବା ତଥ୍ୟକୁ ବ୍ୟବହାର କରିବା ପାଇଁ ଆମର ନିମ୍ନଲିଖିତ ଉପାୟ ସବୁ ରହିଛି:
- ଇନ-ହାଉସ୍ ରିପୋର୍ଟିଂ ଓ ଆଡ-ହକ୍ ଆନାଲିସିସ୍ :
- ଆମର ୟୁଜର୍ ଗ୍ଲୋବାଲ୍ ୱାନ୍ ଭ୍ୟୁ (GOV) ଡାଟା ସୃଷ୍ଟି ଏବଂ ଅପଡେଟ୍ କରିବା ପାଇଁ AWS EMR ଉପରେ ସ୍ପାର୍କ ଷ୍ଟ୍ରିମିଂ ଏବଂ ହାଡପ୍ ମ୍ୟାପ୍ ବ୍ୟବହାର କରି ଲଗ୍ ମାଇନିଂ କରେ ଯାହା ସେସନ୍ ସ୍ତରର କାର୍ଯ୍ୟକଳାପ ତଥା ଗ୍ଲୋବାଲ୍ ଏକାଡେମିକ୍ ଭ୍ୟୁ (GAV) ଡାଟା ସଂରକ୍ଷଣ କରେ ଯାହା ପ୍ରତ୍ୟେକ ୟୁଜର୍ ପାଇଁ ଏକାଡେମିକ୍ ଦକ୍ଷତା ପ୍ରୋଫାଇଲ୍ ଗଚ୍ଛିତ କରେ । ସ୍କେଲରେ କରିବା ପାଇଁ GOV ଏବଂ GAV ଡାଟା ଇଲେଷ୍ଟିକ୍ ସର୍ଚ୍ଚ କ୍ଲଷ୍ଟରରେ ଗଚ୍ଛିତ ରୁହେ ।
- ଟ୍ରାଫିକ୍ ପାର୍ଟନ୍, ୟୁଜର୍ ମନିଟାଇଜେସନ୍, ଟେଷ୍ଟ-ଅନ୍-ଟେଷ୍ଟ ଉନ୍ନତି, ସର୍ଚ୍ଚ ବିଫଳତା ଏବଂ ଅନ୍ୟାନ୍ୟ ଆବଶ୍ୟକତା ପାଇଁ ରିପୋର୍ଟିଂ ଡାଟା ସୃଷ୍ଟି କରିବାକୁ ଲଗ୍ ମାଇନିଂ କରନ୍ତୁ । ପ୍ରକ୍ରିୟାକୃତ ଡାଟାକୁ ପୁନର୍ବାର ଇଲେଷ୍ଟିକ୍ ସର୍ଚ୍ଚରେ ରଖାଯାଇଥାଏ ଏବଂ କିବାନା ଓ ଗ୍ରାଫାନା ଡ୍ୟାସବୋର୍ଡ ବ୍ୟବହାର କରି ଭିଜୁଆଲାଇଜ୍ କରାଯାଏ ।
- ଯେକୌଣସି ଆବଶ୍ୟକୀୟ ବିଶ୍ଳେଷଣ ପାଇଁ ଆଡ୍-ହକ୍ ଆଧାରରେ ପ୍ରାଥମିକ ଅପ୍ରସ୍ତୁତ ଡାଟା HBase ଉପରେ HDFS ଉପରେ ଗଚ୍ଛିତ ହୋଇଛି ।
ବ୍ୟବସାୟ / ଉତ୍ପାଦ / ମାର୍କେଟିଂ ସ୍ୱୟଂ-କରିବା ପାଇଁ ତୃତୀୟ ପକ୍ଷ ଉପକରଣ
- ଆମର ଅନ୍-ପେଜ୍ ଏବଂ ଇନ୍-ଆପ୍ ୟୁଜର୍ ଇଣ୍ଟରାକସନ୍ ଡାଟାକୁ segment.io (ତୃତୀୟ ପକ୍ଷ ପ୍ଲଗ୍ ଇନ୍) ବ୍ୟବହାର କରି କ୍ୟାପଚର୍ କରାଯାଏ ଯାହା ଡାଟାକୁ ବିଭିନ୍ନ ବାହ୍ୟ ଡାଟା ଭିଜୁଆଲାଇଜେସନ୍ ପ୍ଲାଟଫର୍ମକୁ ଅଟୋ-ରୁଟ୍ କରିଥାଏ ।
- ଟ୍ରାଫିକ୍ ଉତ୍ସ, ପରିସଂଖ୍ୟାନ ଓ ଅବସ୍ଥାନ ସୂଚନା, ଡିଭାଇସ୍ ବ୍ରେକଡାଉନ୍, ପେଜ୍ ଭ୍ୟୁ, ଅତିବାହିତ ସମୟ, ଧାରଣ ମେଟ୍ରିକ୍ସ ସହିତ ବ୍ୟାପକ ସ୍ତରର ଟ୍ରାଫିକ୍ ମନିଟରିଂ ପାଇଁ ଗୁଗୁଲ୍ ଆନାଲିଟିକ୍ସର ବ୍ୟବହାର ।
- ୟୁଜର୍ ପ୍ରବାହର ବିଶ୍ଳେଷଣ ଏବଂ ଅପ୍ଟିମାଇଜେସନ୍ ପାଇଁ ହିପ୍ ଆନାଲିଟିକ୍ସ । ସମସ୍ତ ୟୁଜର୍ ଇଣ୍ଟରାକସନ୍ ଇଭେଣ୍ଟଗୁଡ଼ିକୁ segment.io ମାଧ୍ୟମରେ ହିପ୍ କୁ ପଠାଇବା ପାଇଁ FE wired ବ୍ୟବହୃତ ହୋଇଥାଏ । ହିପ୍ ୟୁଜର୍ ରୂପାନ୍ତର ଫନେଲ୍ ଏବଂ ପ୍ରବାହର ସେଲ୍ଫ-ସର୍ଭ ଷ୍ଟାଇଲ୍ ଶୈଳୀ ଡାଇନାମିକ୍ ସେଟିଂକୁ ଅନୁମତି ଦେଇଥାଏ ।