ଫ୍ରି ଟେକ୍ସଟ୍ ପାଠ୍ୟ ଉତ୍ତର ଆଧାରିତ ପ୍ରଶ୍ନର ସ୍ୱୟଂଚାଳିତ ମୂଲ୍ୟାଙ୍କନ

ଫ୍ରି ଟେକ୍ସଟ୍ ପାଠ୍ୟ ଉତ୍ତର ଆଧାରିତ ପ୍ରଶ୍ନର ସ୍ୱୟଂଚାଳିତ ମୂଲ୍ୟାଙ୍କନ

ପ୍ରତିଯୋଗିତାମୂଳକ ପରୀକ୍ଷାରେ ଅଂଶଗ୍ରହଣକାରୀମାନଙ୍କୁ ଅଧିକାଂଶ ବସ୍ତୁନିଷ୍ଠ ପ୍ରଶ୍ନର ସମାଧାନ କରିବାକୁ ପଡେ । ଏଥିରେ ପ୍ରଦତ୍ତ ଉତ୍ତରଗୁଡିକ ମଧ୍ୟରୁ ଏକ କିମ୍ବା ଏକାଧିକ ଉତ୍ତର ବାଛିବାକୁ ପଡିଥାଏ କିମ୍ବା ଏଭଳି ପ୍ରଶ୍ନ ଥାଏ ଯାହା ପାଇଁ ଅଂଶଗ୍ରହଣକାରୀମାନଙ୍କୁ ସାଂଖ୍ୟିକ ମୂଲ୍ୟରେ ଉତ୍ତର ଦେବାକୁ ପଡେ । ବସ୍ତୁନିଷ୍ଠ ପ୍ରଶ୍ନ ଆଧାରରେ ହୋଇଥିବା ଟେଷ୍ଟର ମୂଲ୍ୟାୟନ ପ୍ରକ୍ରିୟା ସ୍ପଷ୍ଟ ଏବଂ ଏଥିରେ କୌଣସି ପ୍ରକାର ଦ୍ୱନ୍ଦ୍ୱ ନଥାଏ ।

ତେବେ, ବୋର୍ଡ ପରୀକ୍ଷା ଭଳି ଅନେକ ପରୀକ୍ଷାରେ ଏଭଳି କିଛି ପ୍ରଶ୍ନ ଥାଏ, ଯାହାର ଫ୍ରି ଟେକ୍ସ ଉତ୍ତର ବା ଦୀର୍ଘ ଉତ୍ତରମୂଳକ ହୋଇଥାଏ । ଏଭଳି ଅସୀମିତ ପାଠ୍ୟ ଉତ୍ତରଗୁଡିକର ମୂଲ୍ୟାଙ୍କନକୁ ନେଇ ଏବେ ମଧ୍ୟ ସମସ୍ୟା ରହିଛି, ତେବେ ନିବନ୍ଧାତ୍ମକ ସ୍କୋରିଂ ଅନୁସାରେ ଏହାର ମୂଲ୍ୟାୟନରେ କିଛି ସମାଧାନ ମିଳିଛି । Embibe ହେଉଛି ଏକ AI ପ୍ଲାଟଫର୍ମ, ଯାହା ସ୍କେଲରେ[7] ଲର୍ଣ୍ଣିଂ ଆଉଟକମ୍ ପ୍ରଦାନ କରିଥାଏ ଏବଂ ଏପରି କ୍ଷମତା ଦୀର୍ଘ ଉତ୍ତରମୂଳକ ପ୍ରଶ୍ନଗୁଡ଼ିକୁ ନେଇ ବ୍ୟକ୍ତି ଅନୁସାରେ ପରୀକ୍ଷା ପ୍ରସ୍ତୁତ କରିବାରେ ଏବଂ ବିଷୟବସ୍ତୁ ନଲେଜ୍ ଗ୍ରାଫ୍ ରେ[6][8] ବିଦ୍ୟାର୍ଥୀମାନଙ୍କ କନସେପ୍ଟ ମାଷ୍ଟରୀକୁ ମୂଲ୍ୟାଙ୍କନ କରିବାରେ ସାହାଯ୍ୟ କରିଥାଏ । ବିଭିନ୍ନ ଶିକ୍ଷଣ ବିଷୟ ମଧ୍ୟରେ ଭିନ୍ନ ଭିନ୍ନ ଶୈଳୀରେ ଅସୀମିତ ପାଠ୍ୟ ଉତ୍ତର ସ୍କୋରିଂ କରିପାରୁଥିବା ମୌଳିକ ମୂଲ୍ୟାଙ୍କନକାରୀ ବିକାଶ କରିବାକୁ ହେଲେ ଅତ୍ୟାଧୁନିକ NLP/NLU ର ବ୍ୟବହାର ଆବଶ୍ୟକ ହୁଏ ଏବଂ ଏହା Embibeର ଅନ୍ୟତମ କାର୍ଯ୍ୟକ୍ଷେତ୍ର ।

ଆମେ ଏହି ସମସ୍ୟାକୁ ଦୁଇଟି ଉପ-ସମସ୍ୟାରେ ବିଭକ୍ତ କରିପାରିବା ।

  1. ଏଣ୍ଟିଟି ଲିକିଂ
  2. ସେମାଣ୍ଟିକ୍ ସିମିଲାରିଟି(ଅର୍ଥଗତ ସମାନତା)

ଏଣ୍ଟିଟି ଲିକିଂ

ଏଣ୍ଟିଟି ଲିକିଂରେ, ଆମେ କ୍ଷୁଦ୍ର ରୂପ/ ଆକ୍ଷରିକ ନାମ ଏବଂ ଅନ୍ୟନାମ ପ୍ରକାର ଏଣ୍ଟିଟିଜ୍ ଅନ୍ତର୍ଭୁକ୍ତ କରିପାରିବା । ଉଦାହରଣ ସ୍ୱରୂପ, ଏଭଳି ସଂକ୍ଷିପ୍ତାକାର ଶବ୍ଦ ଦିଆଯାଇଛି –

“PMC “: “ପୋଲେନ ମଦର ସେଲ୍”,

“MMC “: “ମେଗାସ୍ପୋର୍ ମଦର୍ ସେଲ୍”,

“PEN”: “ପ୍ରାଇମେରୀ ଏଣ୍ଡୋସ୍ପୋର୍ମ ନ୍ୟୁକ୍ଲୀୟସ୍”,

“PEC”: “ପ୍ରାଇମେରୀ ଏଣ୍ଡୋସ୍ପୋର୍ମ ସେଲ୍”,

“LH “: “ଲ୍ୟୁଟିନାଇଜିଂ ହରମୋନ୍”,

“FSH “: “ଫୋସିଲ୍ ଷ୍ଟିମୁଲେଟିଂ ହରମୋନ୍”

ଏବଂ ଅନ୍ୟନାମରେ ପରିଚିତ, ଯେମତି,

“mushroom”: “toadstool”,

“germs”: “microbes”,

“bacteria”: “microbes”,

“yeast”: “microbes”,

“renewable”: “inexhaustible”,

“traits”: “characteristics”,

ଆମେ ରାସାୟନିକ ନାମ ଏଣ୍ଟିଟିକୁ ମଧ୍ୟ ମ୍ୟାପ୍ କରିପାରିବା,

‘(NH4)(NO3)’ : ‘ଆମୋନିୟମ୍ ନାଇଟ୍ରେଟ୍’,

‘(NH4)2C2O4’ : ‘ଆମୋନିୟମ୍ ଅକଜାଲେଟ୍’,

‘Ag2O’ : ‘ସିଲଭର୍ ଅକ୍ସାଇଡ୍’,

‘Ag2SO4’ : ‘ସିଲଭର୍ ସଲଫେଟ୍’,

‘Al(NO3)3’ : ‘ଆଲୁମିନିୟମ୍ ନାଇଟ୍ରେଟ୍’,

ଏହି ମ୍ୟାପିଂଗୁଡିକ ବ୍ୟବହାର କରି, ଆମେ ଆକ୍ଷରିକ ଶବ୍ଦ ଏବଂ ସମାନ ଶବ୍ଦ ମ୍ୟାପ୍ କରିପାରିବା ଏବଂ ତା’ପରେ ପ୍ରକୃତ ଉତ୍ତର ସହିତ ମେଳ କରିପାରିବା ।

ଅର୍ଥଗତ ସମାନତା

ଦୁଇଟି ବାକ୍ୟର ଅର୍ଥରେ ସମାନତା ଥାଇପାରେ । ପ୍ରାକୃତିକ ଭାଷା ବୋଧ ଓ ଜ୍ଞାନ-ସନ୍ନିହିତ ଶିକ୍ଷଣକୁ ନେଇ ଆମର ଅତ୍ୟାଧୁନିକ ଗବେଷଣା ସାହାଯ୍ୟରେ ବିଷୟ-ସନ୍ନିହିତ ଜ୍ଞାନ ଓ ଭାଷା ମଡେଲ୍ ସମ୍ଭାବନାକୁ ବ୍ୟବହାର କରି ଆମେ ଅର୍ଥଗତ ସମାନତା ଜାଣିପାରୁ[3][4][5] ।

ଆମେ ବିଦ୍ୟାର୍ଥୀଙ୍କ ଉତ୍ତରର ଏମ୍ବେଡିଂ ବା ସନ୍ନିହିତ ପାଇପାରିବା ଏବଂ ଏହାକୁ ପ୍ରକୃତ ଉତ୍ତର ସହିତ ମିଳାଇ ତୁଳନା କରିପାରିବା । ଯଦି ସେମାନଙ୍କ ମଧ୍ୟରେ କୋସାଇନ୍ ଦୂରତା ନିର୍ଦ୍ଦିଷ୍ଟ ସୀମାଠାରୁ କମ୍, ତେବେ ଆମେ ସେଗୁଡିକୁ ସମାନ ଭାବରେ ବିଚାର କରିପାରିବା ଏବଂ ଉତ୍ତରକୁ ସଠିକ୍ ଭାବରେ ଚିହ୍ନିତ କରିପାରିବା ।

ବିଦ୍ୟାର୍ଥୀଙ୍କ ଉତ୍ତର ଏବଂ ସଠିକ୍ ଉତ୍ତରର ସନ୍ନିହିତ କରିବା ଲାଗି ଆମେ BERT[1] ଏବଂ RoBERTa[2] ପରି ସ୍ୱୟଂ-ଧ୍ୟାନକୈନ୍ଦ୍ରିକ ମଡେଲଗୁଡିକ ବ୍ୟବହାର କରିପାରିବା ଏବଂ ସେମାନଙ୍କ ମଧ୍ୟରେ ସମାନତା ପାଇବା ପାଇଁ ସେମାନଙ୍କ ମଧ୍ୟରେ ଥିବା କୋସାଇନ୍ ଦୂରତାକୁ ଗଣନା ନିରୂପଣ କରିବା ।

ସନ୍ଦର୍ଭ:

[1] Jacob Devlin, Ming-Wei Chang, Kenton Lee, Kristina Toutanova. “BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding”

[2] Yinhan Liu, Myle Ott, Naman Goyal, Jingfei Du, Mandar Joshi, Danqi Chen, Omer Levy, Mike Lewis, Luke Zettlemoyer, Veselin Stoyanov. “RoBERTa: A Robustly Optimized BERT Pretraining Approach”