ಅನುವಾದ

ಭಾರತದಲ್ಲಿರುವ ಲಕ್ಷಾಂತರ ವಿದ್ಯಾರ್ಥಿಗಳಿಗೆ ಶೈಕ್ಷಣಿಕ ವಿದ್ಯಾಭ್ಯಾಸದ ವಿಷಯಗಳನ್ನು ತಮ್ಮತಮ್ಮ ಮಾತೃಭಾಷೆಯಲ್ಲಿ ಪೂರೈಸುವುದೇ ಅನುವಾದ ಯೋಜನೆಯ ಒಂದು ಗುರಿಯಾಗಿದೆ.   

ಭಾರತದಲ್ಲಿ ಬಹುತೇಕವಾಗಿ ಉನ್ನತ-ಗುಣಮಟ್ಟದ ಶೈಕ್ಷಣಿಕ ವಿಷಯ ಇಂಗ್ಲಿಷ್‌ ಭಾಷೆಯಲ್ಲಿ ಲಭ್ಯವಿದೆ. ನಾವು ಈ ವಿಷಯಗಳನ್ನು ಭಾರತೀಯ ಮಾತೃ ಭಾಷೆಗಳಿಗೆ ಭಾಷಾಂತರಿಸಲು ಸಾಧ್ಯವಾದರೆ ಅದು ವಿದ್ಯಾರ್ಥಿಗಳಿಗೆ ಬಹುದೊಡ್ಡ ಸಹಾಯವಾಗುತ್ತದೆ. ಆ ಕಾರ್ಯವನ್ನು ಮಾಡುವ ಸಲುವಾಗಿ, ನಾವು ಭಾರತದ ಎಲ್ಲಾ ಪ್ರಮುಖ ಮಾತೃ ಭಾಷೆಗಳಿಗೆ ಆಂತರಿಕ ನ್ಯೂರಲ್ ಮೆಷಿನ್ ಟ್ರಾನ್ಸ್‌ಲೇಷನ್ ಮಾದರಿಗಳನ್ನು ರಚಿಸಿದ್ದೇವೆ. ಪ್ರತಿಯೊಂದು ಮಾದರಿಯು ಶೈಕ್ಷಣಿಕ ಇಂಗ್ಲಿಷ್ ವಾಕ್ಯಗಳನ್ನು ಇನ್‌ಪುಟ್ ರೂಪದಲ್ಲಿ ಪಡೆಯುತ್ತದೆ ಹಾಗೇ ಅನುವಾದಿತ ವಾಕ್ಯಗಳನ್ನು ಒದಗಿಸಿದ ಉದ್ದೇಶಿತ ಭಾಷೆಯ ರೂಪದಲ್ಲಿ ಔಟ್‍ಪುಟ್ ಅನ್ನಾಗಿ ಫಲಿತಾಂಶವನ್ನು ನೀಡುತ್ತದೆ.

ಪ್ರಸ್ತುತ, ನಾವು 11 ಭಾರತೀಯ ಭಾಷೆಗಳ ಕಾರ್ಯಗಳಿಗೆ ಬೆಂಬಲ ನೀಡುತ್ತಿದ್ದೇವೆ:

  1. ಹಿಂದಿ
  2. ಗುಜರಾತಿ
  3. ಮರಾಠಿ
  4. ತಮಿಳು
  5. ತೆಲುಗು
  6. ಬಂಗಾಳಿ
  7. ಕನ್ನಡ
  8. ಅಸ್ಸಾಮೀಸ್
  9. ಒರಿಯಾ
  10. ಪಂಜಾಬಿ
  11. ಮಲಯಾಳಂ

ಕೆಲವೊಮ್ಮೆ ಗೂಗಲ್ ಅನುವಾದವು ಕೆಲವೊಂದು ತಪ್ಪುಗಳನ್ನು ಮಾಡುತ್ತದೆ, ಏಕೆಂದರೆ ಇದನ್ನು ನಿರ್ದಿಷ್ಟವಾಗಿ ಶೈಕ್ಷಣಿಕ ಡೊಮೇನ್‌ಗೆಂದೇ ನಿರ್ಮಿಸಲಾಗಿಲ್ಲ. ಇಲ್ಲಿ ಕೆಲವು ಉದಾಹರಣೆಗಳಿವೆ:

ಇಂಗ್ಲೀಷ್ಗೂಗಲ್ ಭಾಷಾಂತರNMT ಅನುವಾದ
which of the following law was given by Einstein:ಕೆಳಗಿನ ಯಾವ ಕಾನೂನನ್ನು ಐನ್‌ಸ್ಟೈನ್ ನೀಡಿದರು:ಈ ಕೆಳಗಿನ ಯಾವ ಕಾನೂನನ್ನು ಐನ್ಸ್ಟೈನ್ ನೀಡಿದರು:
which one of the following is not alkaline earth metal?ಕೆಳಗಿನವುಗಳಲ್ಲಿ ಯಾವುದು ಕ್ಷಾರೀಯ ಭೂಮಿಯ ಲೋಹವಲ್ಲ?ಈ ಕೆಳಗಿನವುಗಳಲ್ಲಿ ಯಾವುದು ಕ್ಷಾರೀಯ ಭೂಮಿಯ ಲೋಹವಲ್ಲ?
Endogenous antigens are produced by intra-cellular bacteria within a host cell.ಅಂತರ್ವರ್ಧಕ ಪ್ರತಿಜನಕಗಳು ಆತಿಥೇಯ ಜೀವಕೋಶದೊಳಗಿನ ಜೀವಕೋಶದೊಳಗಿನ ಬ್ಯಾಕ್ಟೀರಿಯಾದಿಂದ ಉತ್ಪತ್ತಿಯಾಗುತ್ತವೆ.ಅಂತರ್ವರ್ಧಕ ಪ್ರತಿಜನಕಗಳನ್ನು ಆತಿಥೇಯ ಕೋಶದೊಳಗೆ ಇಂಟ್ರಾ – ಸೆಲ್ಯುಲಾರ್ ಬ್ಯಾಕ್ಟೀರಿಯಾದಿಂದ ಉತ್ಪಾದಿಸಲಾಗುತ್ತದೆ.

ದೃಷ್ಟಿಕೋನ

ಈಗ, ಸ್ಕ್ರ್ಯಾಚ್‌ನಿಂದ ನ್ಯೂರಾಲ್ ಮೆಷಿನ್ ಟ್ರಾನ್ಸ್‌ಲೇಷನ್ ಮಾದರಿಗಳನ್ನು ನಿರ್ಮಿಸಲು, ನಮಗೆ ಸಾಕಷ್ಟು ಅಗಾಧವಾದ ಪ್ರಮಾಣದಲ್ಲಿ ದತ್ತಾಂಶ ಬೇಕಾಗುತ್ತದೆ – ಕನಿಷ್ಠಪಕ್ಷ ಕೆಲವು ದಶಲಕ್ಷ ವಾಕ್ಯಗಳಾದರೂ ಬೇಕೇ ಬೇಕು. ಆದ್ದರಿಂದ, ನಾವು ಪ್ರತಿಮಾಹಿತಿ ಲೂಪ್ ಅನ್ನು ನಿರ್ಮಿಸಿದ್ದೇವೆ ಅದು ಸಮಯ ಕಳೆದಂತೆ ಸುಧಾರಿಸುತ್ತದೆ. ನಾವು ಇಲ್ಲಿ ಎಲ್ಲಾ ಭಾಷೆಗಳ ಶೈಕ್ಷಣಿಕ ಅನುವಾದಕರ ಸಹಾಯವನ್ನು ತೆಗೆದುಕೊಂಡಿದ್ದೇವೆ. 

ನಾವು ಯಂತ್ರದಿಂದ-ಅನುವಾದ ಆಗಿರುವ ವಾಕ್ಯಗಳನ್ನು ಶೈಕ್ಷಣಿಕ ಅನುವಾದಕರಿಗೆ ಒದಗಿಸುತ್ತೇವೆ. ಅವರು ಅಗತ್ಯವಿದ್ದ ಭಾಗದಲ್ಲಿ ಸಣ್ಣಪುಟ್ಟ ತಿದ್ದುಪಡಿಗಳನ್ನು ಮಾಡುತ್ತಾರೆ. ಸರಿಪಡಿಸಿದ ಅನುವಾದಗಳನ್ನು ಪೂರೈಸುತ್ತಾರೆ ಅಂದರೆ ನಮಗೆ ಪ್ರತಿಮಾಹಿತಿ ದತ್ತಾಂಶ ಒದಗಿಸುತ್ತಾರೆ. ಅನಂತರ, ನಾವು ಈ ಹೊಸ ಪ್ರತಿಮಾಹಿತಿ ದತ್ತಾಂಶದೊಂಡಿಗೆ ನಮ್ಮ ಮಾದರಿಗೆ ತರಬೇತಿ ನೀಡುತ್ತೇವೆ. ಈಗ, ಪರಿಷ್ಕರಿಸಿದ ನ್ಯೂರಲ್ ಮೆಷಿನ್ ಅನುವಾದ ಮಾದರಿಗಳ ಜೊತೆಗೆ, ಯಂತ್ರ-ಅನುವಾದಿತ ವಾಕ್ಯಗಳ ಗುಣಮಟ್ಟವು ಮೊದಲಿಗಿಂತ ಅತ್ಯುತ್ತಮವಾಗಿ ಮಾರ್ಪಡುತ್ತದೆ. 

ಇಡೀ ಯೋಜನೆಯ ಒಟ್ಟಾರೆ ರಚನೆಯನ್ನು ತೋರಿಸುವ ಒಂದು ರೇಖಾಚಿತ್ರವು ಇಲ್ಲಿದೆ.

ಆದ್ದರಿಂದ, ಅನುವಾದದ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲು, ನಾವು ನಮ್ಮ  ಬುದ್ಧಿವಂತಿಕೆ ಮತ್ತು AI ಎರಡನ್ನೂ ಬಳಸುತ್ತೇವೆ.

Embibe ನ ನ್ಯೂರಲ್ ಮೆಷಿನ್ ತಂತ್ರಜ್ಞಾನವನ್ನು ಬಳಸುವ ಮೂಲಕ, ಶೈಕ್ಷಣಿಕ ಅನುವಾದಕರು ಮಾಡಬೇಕಾದ ದೈಹಿಕ ಶ್ರಮದಿಂದ ಕೂಡಿದ ಕೆಲಸವನ್ನು ~80% ಕಡಿಮೆ ಮಾಡಲಾಗಿದೆ. ಅವರ ಉತ್ಪಾದಕತೆಯು ಹಲವಾರು ಪಟ್ಟು ಹೆಚ್ಚಾಗಿದೆ. ಅಂತಿಮವಾಗಿ, ಅನುವಾದದ ಖರ್ಚುವೆಚ್ಚವನ್ನೂ ಸಹ ಗಣನೀಯವಾಗಿ ಕಡಿಮೆ ಮಾಡಲಾಗಿದೆ.

ಚಿತ್ರ ಅನುವಾದ:

ನಾವು ಚಿತ್ರ-ಅನುವಾದ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲು ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದೇವೆ, ಅಲ್ಲಿ ಇಂಗ್ಲಿಷ್ ಲೇಬಲ್‌ಗಳನ್ನು ಹೊಂದಿರುವ ಚಿತ್ರವನ್ನು ಸಿಸ್ಟಮ್‌ಗೆ ಫೀಡ್ ಮಾಡಲಾಗುತ್ತದೆ ಮತ್ತು ಔಟ್‌ಪುಟ್ ರೂಪದಲ್ಲಿ ಉದ್ದೇಶಿತ ಭಾಷೆಯ ಹೆಸರುಗಳಿಂದ ಕೂಡಿದ ಚಿತ್ರವು ಕೊನೆಯಲ್ಲಿ ದೊರೆಯಲಿದೆ. 

ಉದಾಹರಣೆಗೆ, ಈ ಇನ್‌ಪುಟ್ ಚಿತ್ರ:

ಕೆಳಗಿನ ಫಲಿತಾಂಶದ ಚಿತ್ರದ ರೂಪಕ್ಕೆ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಪರಿವರ್ತಿಸಲಾಗುತ್ತದೆ:

ಈ ಔಟ್ ಪುಟ್ ಚಿತ್ರವನ್ನು ಪರಿಪೂರ್ಣಗೊಳಿಸಲೆಂದು ನಾವು ಅದನ್ನು ಫಾಂಟ್-ಸ್ಟೈಲಿಂಗ್‌ನಂತಹ ಕಿರು ಪರಿಷ್ಕರಣೆಗಳನ್ನು ಮಾಡಬಹುದು.

ಈ ಪ್ರಾಜೆಕ್ಟ್‌ಗಾಗಿಯೇ, ನಾವು ಮೊದಲಿಗೆ ಚಿತ್ರದಿಂದ ಪಠ್ಯದ ಲೇಬಲ್‌ಗಳನ್ನು ಪತ್ತೆ ಮಾಡುತ್ತೇವೆ, ಆನಂತರ, ಪ್ರತಿಯೊಂದು ಪಠ್ಯದ ಲೇಬಲ್‌ಗಾಗಿ OCR ಮಾಡಿ, ಆಮೇಲೆ ಅವುಗಳನ್ನು ನ್ಯೂರಲ್ ಮೆಷಿನ್ ಅನುವಾದ API ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಭಾಷಾಂತರಿಸಲಾಗುತ್ತದೆ. ಕೊನೆಯದಾಗಿ ಆ ಅನುವಾದಿತ ಪಠ್ಯವನ್ನು ಆಯಾ ಸ್ಥಳದಲ್ಲಿ ಚಿತ್ರಕ್ಕೆ ಇರಿಸಲಾಗುತ್ತದೆ.

ಉಲ್ಲೇಖಗಳು:

[1] ಆಶಿಶ್ ವಾಸ್ವಾನಿ, ನೋಮ್ ಶಜೀರ್, ನಿಕಿ ಪರ್ಮಾರ್, ಜಾಕೋಬ್ ಉಸ್ಕೋರೈಟ್, ಲಿಯೋನ್ ಜೋನ್ಸ್, ಏಡನ್ ಎನ್. ಗೊಮೆಜ್, ಲುಕಾಸ್ಜ್ ಕೈಸರ್, ಇಲಿಯಾ ಪೊಲೊಸುಖಿನ್. “ಅಟೆಂಷನ್‌ ಈಸ್‌ ಆಲ್‌ ಯು ನೀಡ್‌.”

[2] ಫಾಲ್ದು, ಕೆಯೂರ್, ಅಮಿತ್ ಶೇಠ್, ಪ್ರಶಾಂತ್ ಕಿಕಾನಿ ಮತ್ತು ಹೇಮಾಂಗ್ ಅಕಾಬರಿ. “KI-BERT: ಇನ್ಫ್ಯೂಸಿಂಗ್ ನಾಲೆಜ್ ಕಾಂಟೆಕ್ಸ್ಟ್ ಫಾರ್ ಬೆಟರ್ ಲ್ಯಾಂಗ್ವೇಜ್ ಅಂಡ್ ಡೊಮೇನ್ ಅಂಡರ್ಸ್ಟ್ಯಾಂಡಿಂಗ್.” arXiv ಪ್ರಿಪ್ರಿಂಟ್ arXiv:2104.08145 (2021).

[3] ಗೌರ್, ಮಾನಸ್, ಕೆಯೂರ್ ಫಾಲ್ಡು ಮತ್ತು ಅಮಿತ್ ಶೇತ್. “ಸೆಮಾಂಟಿಕ್ಸ್ ಆಫ್‌ ದಿ ಬ್ಲಾಕ್-ಬಾಕ್ಸ್: ಕ್ಯಾನ್ ನಾಲೆಜ್ ಗ್ರಾಫ್ಸ್ ಹೆಲ್ಪ್ ಮೇಕ್ ಡೀಪ್ ಲರ್ನಿಂಗ್ ಸಿಸ್ಟಮ್ಸ್ ಮೋರ್‌ ಇಂಟರ್ಪ್ರೆಟಬಲ್ ಅಂಡ್ ಎಕ್ಸಪ್ಲೈನಬಲ್?.” IEEE ಇಂಟರ್ನೆಟ್ ಕಂಪ್ಯೂಟಿಂಗ್ 25, ನಂ. 1 (2021): 51-59

[4] ಶೇತ್, ಅಮಿತ್, ಮಾನಸ್ ಗೌರ್, ಕೌಶಿಕ್ ರಾಯ್ ಮತ್ತು ಕೆಯೂರ್ ಫಾಲ್ಡು. “ನಾಲೆಜ್-ಇಂಟೆನ್ಸಿವ್ ಲ್ಯಾಂಗ್ವೇಜ್ ಅಂಡರ್ಸ್ಟ್ಯಾಂಡಿಂಗ್ ಫಾರ್ ಎಕ್ಸಪ್ಲೈನಬಲ್ AI.” IEEE ಇಂಟರ್ನೆಟ್ ಕಂಪ್ಯೂಟಿಂಗ್ 25, ನಂ. 5 (2021): 19-24.”

← AI ಹೋಂಗೆ ಹಿಂತಿರುಗಿ