மொழிப்பெயர்ப்பு

Embibe என்பது கற்றல் வெளிப்பாடுகளை அளவுகோளில் வழங்குவதற்கான AI தளமாகும். உலகெங்கிலும் உள்ள அனைத்து மாணவர்களுக்கும், எந்த மொழியிலும் படிக்க இந்த தளத்தை பயன்படுத்தி கொள்ளலாம்.

இந்தியாவில் உள்ள லட்ச கணக்கான மாணவர்களுக்கு வட்டார மொழிகளில் கல்வி உள்ளடக்கத்தை வழங்குவதே மொழிபெயர்ப்பு திட்டத்தின் குறிக்கோளாகும்.

மாணவர்களின் கற்றல் பயணத்தின் போது தனிப்பயனாக்கப்பட்ட கற்றல், பயிற்சி மற்றும் மதிப்பீடு உள்ளடக்கம் வழங்கப்படுவதை உறுதிசெய்ய உள்ளடக்கத்தை உருவாக்குவது அல்லது மொழிபெயர்ப்பது முக்கியம்.

பெரும்பாலான உயர்தர கல்வி உள்ளடக்கங்கள் ஆங்கிலத்தில் கிடைக்கிறது. இந்த உள்ளடக்கங்களை இந்திய மொழிகளில் மொழிபெயர்க்க முடிந்தால் அது மாணவர்களுக்கு பெரும் உதவியாக இருக்கும். அதை செய்ய, நாங்கள் இந்தியாவின் அனைத்து முக்கிய வட்டார மொழிகளுக்கும் சொந்த நியூரல் இயந்திர மொழிபெயர்ப்பு மாதிரிகளை கட்டமைத்துள்ளோம். ஒவ்வொரு மாதிரியும் ஆங்கில வாக்கியங்களை உள்ளீடாக பெற்று இலக்கு மொழியில் மொழிபெயர்க்கப்பட்ட வாக்கியங்களை வெளியீடாக கொடுக்கும்.

தற்போது, நாங்கள் 11 இந்திய மொழிகளை கொண்டுள்ளோம் :

1. இந்தி 

2. குஜராத்தி 

3. மராத்தி 

4. தமிழ் 

5. தெலுங்கு 

6. பெங்காலி 

7. கன்னடம்  

8. அசாமியம்  

9. ஒரியா 

10. பஞ்சாபி 

11. மலையாளம்

கல்வி சார்ந்த களத்திற்காக உருவாக்கப்படாத காரணத்தினால் கூகுள் மொழிபெயர்ப்பு சில நேரங்களில் தவறுகளை செய்கிறது. இங்கே அதற்கான சில உதாரணங்கள் உள்ளன:

ஆங்கிலம் கூகுள் மொழிபெயர்ப்பு கற்றல் தோழியின் மொழிபெயர்ப்பு
which of the following law was given by Einstein:பின்வரும் எந்த சட்டத்தை ஐன்ஸ்டீன் வழங்கினார்:பின்வருவனவற்றில் எந்த விதியை ஐன்ஸ்டீன் வழங்கினார்:
which one of the following is not alkaline earth metal?பின்வருவனவற்றில் எது கார பூமி உலோகம் அல்ல?பின்வருவனவற்றில் எது காரமண் உலோகம் அல்ல?
Endogenous antigens are produced by intra-cellular bacteria within a host cell.எண்டோஜெனஸ் ஆன்டிஜென்கள் ஒரு புரவலன் கலத்திற்குள் உள்ள உள்-செல்லுலார் பாக்டீரியாவால் உற்பத்தி செய்யப்படுகின்றன.அகந்தோன்றி எதிர்பொருள் தூண்டிகள் ஒரு விருந்தோம்பியின் செல்களுக்குள் உள்ள செல்லக பாக்டீரியாவால் உற்பத்தி செய்யப்படுகின்றன.

அணுகுமுறை

இப்போது, புதிதாக நியூரல் இயந்திர மொழிபெயர்ப்பு மாதிரிகள் உருவாக்க, நமக்கு பல வகையான தகவல்கள் தேவை- குறைந்தது ஒரு சில லட்ச வாக்கியங்கள் நமக்கு தேவைப்படும். எனவே, காலத்திற்கு ஏற்ப மேம்மபடக்கூடிய  ஒரு Feedback லூப்பை உருவாக்கியுள்ளோம். இங்குள்ள அனைத்து மொழிகளுக்கும் கல்வி மொழிபெயர்ப்பாளர்களின் உதவியை நாங்கள் பெற்றுள்ளோம்.

நாங்கள் இயந்திரம் மூலம் மொழிபெயர்க்கப்பட்ட வாக்கியங்களை கல்வி மொழிபெயர்ப்பாளர்களுக்கு வழங்குகிறோம். அவர்கள் அதில் தேவைப்பட்டால் சிறிய திருத்தங்களைச் செய்து பின்னர் திருத்தப்பட்ட மொழிபெயர்ப்புகளை வழங்குகிறார்கள். அதன் பின், இந்த புதிய  Feedback தரவு மூலம் எங்கள் மாதிரிக்கு பயிற்சியளிக்கிறோம். இப்போது, புதுப்பிக்கப்பட்ட நியூரல் இயந்திர மொழிபெயர்ப்பு மாதிரிகள், முன்பு இருந்த இயந்திரம் மொழிபெயர்க்கப்பட்ட வாக்கியங்களின் தரத்தை விட சிறந்தது.

முழு திட்டத்தின் ஒட்டுமொத்த கட்டமைப்பையும்  காட்டும் வரைபடம் கீழே கொடுக்கப்பட்டுள்ளது.

எனவே, மொழிபெயர்ப்பு பிரச்சினையைத் தீர்க்க, மனித நுண்ணறிவு மற்றும் செயற்கை நுண்ணறிவு(AI)  ஆகிய இரண்டையும் நாங்கள் பயன்படுத்துகிறோம்.

Embibe தளத்தின் நியூரல் இயந்திர மொழிபெயர்ப்பு தொழில்நுட்பத்தைப் பயன்படுத்துவதன் மூலம், கல்வி மொழிபெயர்ப்பாளர்களால் செய்யப்பட வேண்டிய வேலை ~80% குறைக்கப்பட்டுள்ளது. இதனால் அவற்றின் உற்பத்தித்திறன் பல முறை அதிகரித்துள்ளது. இறுதியில், மொழிபெயர்ப்பு செலவும் கணிசமாக குறைகிறது.

பட மொழிபெயர்ப்பு: 

நாங்கள் பட-மொழிபெயர்ப்பில் உள்ள சிக்கலையும் தீர்க்க முயற்சிக்கிறோம். இதில் ஆங்கில லேபிள்கள் கொண்ட ஒரு படம் கணினியில் வழங்கப்பட்டால், அதன் வெளியீடு இலக்கு மொழியை கொண்ட லேபிள்களுடன் ஒரு படமாக இருக்கும்

உதாரணமாக, இந்த உள்ளீட்டு படம்: 

கீழே உள்ள வெளியீடு படமாக தானாகவே மாற்றப்படும்: 

நாம் இந்த படத்தை மேம்படுத்த சிறிய font-styling மாற்றங்களை செய்யலாம்.

இந்த திட்டத்திற்காக, நாங்கள் முதலில் படத்தில் இருந்து உரை லேபிள்களைக் கண்டறிந்து, ஒவ்வொரு உரை லேபிளுக்கும் OCR செய்து, பின்னர்  நியூரல் இயந்திர API-களைப் பயன்படுத்தி அவற்றை மொழிபெயர்க்கிறோம். இறுதியாக அந்த மொழிபெயர்க்கப்பட்ட உரை தேவையான இடத்தில் படத்தில் பொருத்தப்படுகின்றன.

ரெபெரென்ஸ்:

   [1] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, Illia Polosukhin. “Attention Is All You Need.”

[2] Faldu, Keyur, Amit Sheth, Prashant Kikani, and Hemang Akabari. “KI-BERT: Infusing Knowledge Context for Better Language and Domain Understanding.” arXiv preprint arXiv:2104.08145 (2021).

[3] Gaur, Manas, Keyur Faldu, and Amit Sheth. “Semantics of the Black-Box: Can knowledge graphs help make deep learning systems more interpretable and explainable?.” IEEE Internet Computing 25, no. 1 (2021): 51-59

[4] Sheth, Amit, Manas Gaur, Kaushik Roy, and Keyur Faldu. “Knowledge-intensive Language Understanding for Explainable AI.” IEEE Internet Computing 25, no. 5 (2021): 19-24.

← AI ஹோமிற்கு பின் செல்லவும்