Saas ମାଧ୍ୟମରେ AIକୁ ଅନଲକ୍ କରିବା
ଅନୁବାଦ
Embibe ହେଉଛି ଏକ ବିସ୍ତୃତ AI- ଆଧାରିତ ପ୍ଲାଟଫର୍ମ ଯାହା ବିଦ୍ୟାର୍ଥୀମାନଙ୍କୁ ଲର୍ଣ୍ଣିଂ ଆଉଟକମ୍ ପ୍ରଦାନ କରିଥାଏ [5][6] । ଆମେ ସାରା ବିଶ୍ୱର ଯେକୌଣସି ସ୍ଥାନ ଓ ଯେକୌଣସି ଭାଷାରେ ବିଦ୍ୟାର୍ଥୀମାନଙ୍କୁ ସାହାଯ୍ୟ କରିବାକୁ ପ୍ରତିଶ୍ରୁତିବଦ୍ଧ । ଆମର ଅନୁବାଦ ପ୍ରକଳ୍ପ ଭାରତର ଲକ୍ଷ ଲକ୍ଷ ବିଦ୍ୟାର୍ଥୀଙ୍କୁ ଆଂଚଳିକ ଭାଷାରେ ଶିକ୍ଷାଗତ ବିଷୟବସ୍ତୁ ପ୍ରଦାନ କରିବାକୁ ଲକ୍ଷ୍ୟ ରଖିଛି । ବିଦ୍ୟାର୍ଥୀମାନଙ୍କୁ ସେମାନଙ୍କର ଶିକ୍ଷଣ ଯାତ୍ରା ସମୟରେ ବ୍ୟକ୍ତିଗତ ଶିକ୍ଷଣ, ଅଭ୍ୟାସ ଏବଂ ମୂଲ୍ୟାଙ୍କନ ବିଷୟବସ୍ତୁ ଦିଆଯାଇଥିବାର ସୁନିଶ୍ଚିତ କରିବାକୁ ବିଷୟବସ୍ତୁକୁ କ୍ୟୁରେଟ୍, ସୃଷ୍ଟି କିମ୍ବା ଅନୁବାଦ କରିବା ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ [7][8] ।
ଅଧିକାଂଶ ଉଚ୍ଚମାନର ଏକାଡେମିକ୍ ବିଷୟବସ୍ତୁ ଇଂରାଜୀରେ ଉପଲବ୍ଧ । ଯଦି ଆମେ ଏହି ବିଷୟବସ୍ତୁକୁ ଭାରତୀୟ ସ୍ଥାନୀୟ ଭାଷାରେ ଅନୁବାଦ କରିପାରିବା, ତେବେ ଏହା ବିଦ୍ୟାର୍ଥୀମାନଙ୍କ ପାଇଁ ବହୁତ ସହାୟକ ହେବ । ତାହା କରିବା ପାଇଁ, ଆମେ ଭାରତର ସମସ୍ତ ସ୍ଥାନୀୟ ଭାଷା ପାଇଁ ଇନ୍-ହାଉସ୍ ନ୍ୟୁରାଲ୍ ମେସିନ୍ ଅନୁବାଦ, NMT(Neural Machine Translation) ମଡେଲ ନିର୍ମାଣ କରିଛୁ । ପ୍ରତ୍ୟେକ ମଡେଲ୍ ଏକାଡେମିକ୍ ଇଂରାଜୀ ବାକ୍ୟଗୁଡ଼ିକୁ ଇନପୁଟ୍ ଭାବରେ ଗ୍ରହଣ କରିବ ଏବଂ ଆବଶ୍ୟକ ଆଂଚଳିକ ଭାଷାରେ ଅନୁବାଦିତ ବାକ୍ୟଗୁଡ଼ିକୁ ଆଉଟପୁଟ୍ ଦେବ ।
ବର୍ତ୍ତମାନ, ଆମେ 11 ଟି ଭାରତୀୟ ଭାଷାରେ କାମ କରୁଛୁ:
- ହିନ୍ଦୀ (hi)
- ଗୁଜରାଟୀ (gu)
- ମରାଠୀ (mr)
- ତାମିଲ୍ (ta)
- ତେଲୁଗୁ (te)
- ବଙ୍ଗାଳୀ (bn)
- କନ୍ନଡ (kn)
- ଆସାମୀ (as)
- ଓଡିଆ (or)
- ପଞ୍ଜାବୀ (pa)
- ମାଲାୟାଲମ୍ (ml)
ଗୁଗଲ୍ ଅନୁବାଦ ବେଳେବେଳେ ତ୍ରୁଟି କରିଥାଏ କାରଣ ଏହା ନିର୍ଦ୍ଦିଷ୍ଟ ଭାବରେ ଏକାଡେମିକ୍ ଡୋମେନ୍ ପାଇଁ ନିର୍ମିତ ନୁହେଁ । ଏଠାରେ କିଛି ଉଦାହରଣ ଅଛି:
ଇଂରାଜୀ | ଗୁଗୁଲ୍ ଟ୍ରାନ୍ସଲେସନ୍ | NMT ଟ୍ରାନ୍ସଲେସନ୍ |
---|---|---|
which of the following law was given by Einstein: | ଆଇନ୍ଷ୍ଟାଇନ୍ ଦ୍ୱାରା ନିମ୍ନଲିଖିତ ନିୟମ ମଧ୍ୟରୁ କେଉଁଟି ଦିଆଯାଇଥିଲା: | ନିମ୍ନଲିଖିତ ମଧ୍ୟରୁ କେଉଁ ନିୟମ ଆଇନ୍ଷ୍ଟାଇନ୍ ବାହାର କରିଥିଲେ: |
which one of the following is not alkaline earth metal? | ନିମ୍ନଲିଖିତ ମଧ୍ୟରୁ କେଉଁଟି କ୍ଷାରୀୟ ପୃଥିବୀ ଧାତୁ ନୁହେଁ? | ନିମ୍ନଲିଖିତ ମଧ୍ୟରୁ କେଉଁଟି ଆଲକାଲାଇନ୍ ଆର୍ଥ ମେଟାଲ୍ ନୁହେଁ? |
Endogenous antigens are produced by intra-cellular bacteria within a host cell. | ଏଣ୍ଡୋଜେନସ୍ ଆଣ୍ଟିଜେନ୍ସ ଏକ ହୋଷ୍ଟ ସେଲ୍ ମଧ୍ୟରେ ଇଣ୍ଟ୍ରା-ସେଲୁଲାର୍ ବ୍ୟାକ୍ଟେରିଆ ଦ୍ produced ାରା ଉତ୍ପନ୍ନ ହୁଏ | | ପୋଷକ ମଧ୍ୟରେ ଆନ୍ତଃକୋଶୀୟ ସେଲୁଲାର୍ ଜୀବାଣୁ ଦ୍ୱାରା ଅନ୍ତର୍ଜାତ ପ୍ରତିଜନକ ସୃଷ୍ଟି ହୋଇଥାଏ । |
ପଦ୍ଧତି
ବର୍ତ୍ତମାନ, ନ୍ୟୁରାଲ୍ ମେସିନ୍ ଅନୁବାଦ(NMT) ମଡେଲଗୁଡିକ ଆରମ୍ଭରୁ ନିର୍ମାଣ କରିବାକୁ, ଆମକୁ ଅନେକ ତଥ୍ୟ ଦରକାର – ଅତିକମରେ କିଛି ନିୟୁତ ବାକ୍ୟ । ତେଣୁ, ଆମେ ଏକ ଫିଡବ୍ୟାକ୍ ଲୁପ୍ ସୃଷ୍ଟି କରିଛୁ, ଯାହା ସମୟକ୍ରମେ ବିକଶିତ ହେଉଛି । ଆମେ ଏଠାରେ ଥିବା ସମସ୍ତ ଭାଷାଗୁଡ଼ିକରେ ଏକାଡେମିକ୍ ଅନୁବାଦକମାନଙ୍କର ସାହାଯ୍ୟ ନେଇଛୁ ।
ଆମେ ଏକାଡେମିକ୍ ଅନୁବାଦକମାନଙ୍କୁ ମେସିନ୍-ଅନୁବାଦିତ (NMT ବ୍ୟବହାର କରି) ବାକ୍ୟ ପ୍ରଦାନ କରିଥାଉ, ଏବଂ ତା’ପରେ ମଡେଲକୁ ଆଡାପ୍ଟିଭ୍ ଅପଡେଟ୍ କରିବା ପାଇଁ ଏକାଡେମିକ୍ ଅନୁବାଦକଙ୍କ ମତାମତ ସାମିଲ୍ କରାଯାଏ । ଏହା ସୁନିଶ୍ଚିତ କରେ ଯେ ସମୟ ସହିତ ମେସିନ୍-ଅନୁବାଦିତ ବାକ୍ୟଗୁଡ଼ିକର ଗୁଣବତ୍ତା ଉନ୍ନତ ହେଉଛି ।
ଏଠାରେ ଏକ ଚିତ୍ର ଅଛି ଯାହା ସମଗ୍ର ପ୍ରୋଜେକ୍ଟର ସାମଗ୍ରିକ ଗଠନକୁ ଦର୍ଶାଏ ।
ତେଣୁ, ଅନୁବାଦ ସମସ୍ୟାର ସମାଧାନ ପାଇଁ, ଆମେ ଉଭୟ ହ୍ୟୁମ୍ୟାନ୍ ଇଣ୍ଟେଲିଜେନ୍ସି ଏବଂ AI କୁ ବ୍ୟବହାର କରୁଛୁ ।
Embibe ର ନ୍ୟୁରାଲ୍ ମେସିନ୍ ଅନୁବାଦ ଟେକ୍ନୋଲୋଜି ବ୍ୟବହାର କରି, ଏକାଡେମିକ୍ ଅନୁବାଦକମାନଙ୍କ ଦ୍ୱାରା କରାଯାଇଥିବା ମାନୁଆଲ୍ କାର୍ଯ୍ୟ ~ 80% ହ୍ରାସ କରାଯାଇଛି । ସେମାନଙ୍କର ଉତ୍ପାଦକତା ବହୁଗୁଣିତ ହୋଇଛି । ଏହା ସହିତ ଅନୁବାଦର ମୂଲ୍ୟ ମଧ୍ୟ ଯଥେଷ୍ଟ ହ୍ରାସ ପାଇଛି ।
ଚିତ୍ର-ଅନୁବାଦ:
ଆମେ ମଧ୍ୟ ଚିତ୍ର-ଅନୁବାଦ ସମସ୍ୟାର ସମାଧାନ କରିବାକୁ ଚେଷ୍ଟା କରୁଛୁ, ଯେଉଁଠାରେ ଇଂରାଜୀ ଲେବଲ୍ ସହିତ ଏକ ଚିତ୍ର ଦିଆଯ।ଇଥିବ ଏବଂ ଆଉଟପୁଟ୍ଟି ଆବଶ୍ୟକ ଆଂଚଳିକ ଭାଷାରେ ଲେବଲ୍ ସହିତ ଏକ ପ୍ରତିଛବି ହୋଇଯିବ ।
ଉଦାହରଣ ସ୍ୱରୂପ, ଏହି ଇନପୁଟ୍ ଚିତ୍ର ସ୍ୱୟଂଚାଳିତ ଭାବରେ
ନିମ୍ନ ଆଉଟପୁଟ୍ ପ୍ରତିଛବିରେ ରୂପାନ୍ତରିତ ହେବ:
ଏହି ପ୍ରୋଜେକ୍ଟ ପାଇଁ, ଆମେ ପ୍ରଥମେ ପ୍ରତିଛବିରୁ ଟେକ୍ସଟ୍ ଲେବଲ୍ ଚିହ୍ନଟ କରୁ, ତାପରେ ପ୍ରତ୍ୟେକ ଟେକ୍ସଟ୍ ଲେବଲ୍ ପାଇଁ OCR କରୁ, ତାପରେ ସେଗୁଡିକୁ ନ୍ୟୁରାଲ୍ ମେସିନ୍ ଟ୍ରାନ୍ସଲେସନ୍(NMT) API ବ୍ୟବହାର କରି ଅନୁବାଦ କରୁ ଏବଂ ଶେଷରେ ସେହି ଅନୁବାଦିତ ପାଠକୁ ଯଥା ସ୍ଥାନରେ ରଖିଦେଉ ।
ସନ୍ଦର୍ଭ
[1] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, Illia Polosukhin. “Attention Is All You Need.”
[2] Faldu, Keyur, Amit Sheth, Prashant Kikani, and Hemang Akabari. “KI-BERT: Infusing Knowledge Context for Better Language and Domain Understanding.” arXiv preprint arXiv:2104.08145 (2021).
[3] Gaur, Manas, Keyur Faldu, and Amit Sheth. “Semantics of the Black-Box: Can knowledge graphs help make deep learning systems more interpretable and explainable?.” IEEE Internet Computing 25, no. 1 (2021): 51-59
[4] Sheth, Amit, Manas Gaur, Kaushik Roy, and Keyur Faldu. “Knowledge-intensive Language Understanding for Explainable AI.” IEEE Internet Computing 25, no. 5 (2021): 19-24.
← AI ହୋମ୍କୁ ଫେରନ୍ତୁ