ಅಪೇಕ್ಷಿತ ಸಂಕೀರ್ಣ ಪ್ರಶ್ನೆಗಳ ಸ್ವಯಂ-ರಚನೆ

ಅಪೇಕ್ಷಿತ ಸಂಕೀರ್ಣ ಪ್ರಶ್ನೆಗಳ ಸ್ವಯಂ-ರಚನೆ

Embibe ಶಿಕ್ಷಣದ ಮೂರ್ತರೂಪದ ಬಗ್ಗೆ ಮತ್ತು ನಮ್ಮ ತಂತ್ರಜ್ಞಾನವು ಸೂಕ್ತ ವಿಷಯವನ್ನು, ಸೂಕ್ತ ವಿದ್ಯಾರ್ಥಿಗೆ, ಸೂಕ್ತ ಸಮಯದಲ್ಲಿ ಸೇವೆ ಸಲ್ಲಿಸುವಲ್ಲಿ ಉತ್ತಮವಾಗಿದೆ. ಈ ಕಾರಣಕ್ಕಾಗಿಯೇ ಬಳಸಬಹುದಾದ ಒಳಪಿಡಿಯ ಒಂದು ದೊಡ್ಡ ದತ್ತಾಂಶ ಸಮುಚ್ಚಯ ಅನುಮತಿಯನ್ನು ಹೊಂದಿದೆ, ಮತ್ತು ವಿಶೇಷವಾಗಿ ಪ್ರಶ್ನೆಗಳು, ನಮಗೆ ಬಹಳ ಮುಖ್ಯ. ಐತಿಹಾಸಿಕವಾಗಿ, Embibe ಪ್ರಶ್ನೆಗಳ ದತ್ತಾಂಶ ಸಮುಚ್ಚಯವನ್ನು ಮಾನವ ಡೇಟಾ ಎಂಟ್ರಿ ಆಪರೇಟರ್‌ಗಳು ಸಿದ್ಧಪಡಿಸಿದ್ದಾರೆ. ಅವರು ಅಂತರ್ಜಾಲದಲ್ಲಿ ಅಥವಾ ನಮ್ಮ ಪಾಲುದಾರ ಸಂಸ್ಥೆಗಳೊಂದಿಗಿನ ಟೈ-ಅಪ್‌ಗಳ ಮೂಲಕ ಉಚಿತವಾಗಿ ಲಭ್ಯವಿರುವ ವಿವಿಧ ಪ್ರಶ್ನೆಕೋಶಗಳಿಂದ ಪ್ರಶ್ನೆಗಳನ್ನು ಮೂಲದಿಂದ ಪಡೆಯುತ್ತಾರೆ.

ಪ್ರಶ್ನೆಗಳ ಸ್ವಯಂರಚನೆಯ ಪ್ರಮುಖ ಉದ್ದೇಶವೆಂದರೆ ವಿದ್ಯಾರ್ಥಿಗಳು ತಮ್ಮ ಶಿಕ್ಷಕರು/ ಮಾರ್ಗದರ್ಶಕರ ಅವಲಂಬನೆಯನ್ನು ತಗ್ಗಿಸುವುದಾಗಿದೆ. ಲಕ್ಷಾಂತರ ವಿದ್ಯಾರ್ಥಿಗಳಿಗೆ ನಿಜವಾಗಿಯೂ ಶಿಕ್ಷಣವನ್ನು ಉನ್ನತೀಕರಿಸಲು, ಅವರು ಯಾವುದೇ ಬಾಹ್ಯ ನೆರವಿಲ್ಲದೆ, ಸ್ವತಃ ತಾವೇ ಪರಿಕಲ್ಪನೆಗಳು/ ಟಾಪಿಕ್‌ಗಳನ್ನು ಪ್ರ್ಯಾಕ್ಟೀಸ್ ಮಾಡಲು ಮತ್ತು ತಮ್ಮ ಪ್ರಗತಿಯನ್ನು ಅಳೆಯಲು ಸಾಧ್ಯವಾಗಬೇಕು. ಬುದ್ಧಿವಂತ ಮೌಲ್ಯಮಾಪನ ರಚನೆ[3], ವಿದ್ಯಾರ್ಥಿಗಳ ಜ್ಞಾನ ನಿರ್ಣಯ [4] ಅಥವಾ ಕಲಿಕಾ ಫಲಿತಾಂಶಗಳನ್ನು ಪೂರೈಸಲು ವೈಯಕ್ತೀಕರಿಸಿದ ಕಂಟೆಂಟ್ ಅನ್ನು ಒದಗಿಸುವಲ್ಲಿ [5][6] ಸಶಕ್ತಗೊಳಿಸುವ ಅನಿಯಮಿತ ಪ್ರಶ್ನೆಗಳಿಗೆ ಪ್ರವೇಶ. ಪ್ರಶ್ನೆಗಳ ಸ್ವಯಂ ರಚನೆ ಮತ್ತು ವಿದ್ಯಾರ್ಥಿಗಳಿಗೆ ಪ್ರ್ಯಾಕ್ಟೀಸ್ ಮಾಡಲು ಮತ್ತು ತಮ್ಮ ಪ್ರಗತಿಯನ್ನು ವಿಶ್ಲೇಷಿಸಲು ಅನುಮತಿಸುವುದು ಇದರತ್ತ ಒಂದು ಹೆಜ್ಜೆಯಾಗಿದೆ. 

ಆದಾಗ್ಯೂ, ನಮ್ಮ ವೇದಿಕೆಯಲ್ಲಿ ವಿದ್ಯಾರ್ಥಿಗಳು ತಾವು ಪ್ರಗತಿಯನ್ನು ಸಾಧಿಸಲು ಬಯಸುವ ಯಾವುದೇ ಟಾಪಿಕ್ ಬಗೆಗಿನ ಪ್ರಶ್ನೆಗಳು ಮುದ್ರಿತವಾಗಿಲ್ಲ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಲು, Embibe AI ಅನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲು ಹೂಡಿಕೆ ಮಾಡುತ್ತಿದ್ದು ಅದು ಹೊಸ ಪ್ರಶ್ನೆಗಳನ್ನು ಮತ್ತು ಅದಕ್ಕೆ ಸಂಬಂಧಿಸಿದ ಉತ್ತರಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಸೃಷ್ಟಿಸುತ್ತದೆ. ಈ ಕೆಲಸವು ವಿಷಯವನ್ನು ಕಲೆಹಾಕುವುದು, ವಿಷಯದ ಮಾದರಿ, ಅತಿನೂತನ NLG ಮತ್ತು solver technology ಯಿಂದ ವಿಚಾರಗಳನ್ನು ಎರವಲು ಪಡೆಯುವುದನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ. 

ಉದ್ದೇಶ:

ನಾವು, Embibe ನಲ್ಲಿ, ಪರಿಕಲ್ಪನೆಗಳನ್ನು ಅಭ್ಯಾಸ ಮಾಡುವ ಮೂಲಕ ಮತ್ತು ಪ್ರಾವೀಣ್ಯತೆಯನ್ನು ಪಡೆಯುವ ಮೂಲಕ ಕಲಿಕೆಯ ಚೌಕಟ್ಟನ್ನು ಪ್ರಸ್ತಾಪಿಸುತ್ತೇವೆ ಮತ್ತು ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರಿಸುವ ಮೂಲಕ ಪರಿಕಲ್ಪನೆಗಳನ್ನು ನೆನಪಿಟ್ಟುಕೊಳ್ಳಲು ಮತ್ತು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಪರೋಕ್ಷ ಮಾರ್ಗವಾಗಿದೆ. ಸ್ವಯಂಚಾಲಿತ ಪ್ರಶ್ನೆ ಸೃಷ್ಟಿಯೂ ಡಿಜಿಟಲೀಕರಣ ಮಾಡಿದ ಪುಸ್ತಕಗಳನ್ನು ಇನ್ಪುಟ್ ಆಗಿ ತೆಗೆದುಕೊಳ್ಳುವ ಪ್ರಕ್ರಿಯೆ ಸೇರಿದೆ ಮತ್ತು ಅದರಲ್ಲಿ ವಿದ್ಯಾರ್ಥಿಗಳು ಅಭ್ಯಾಸ ಮಾಡಲು ಮತ್ತು ಕಲಿಯಲು ತಮ್ಮ ಜ್ಞಾನವನ್ನು ಅನ್ವಯಿಸಬಹುದು.

ಸ್ವಯಂಚಾಲಿತ ಪ್ರಶ್ನೆಯ ಸೃಷ್ಟಿಯು ನೈಸರ್ಗಿಕ ಭಾಷಾ ಸಂಸ್ಕರಣೆಯ ಭಾಗವಾಗಿದೆ (NLP). ಇದು ಅನೇಕ ಸಂಶೋಧಕರು ತಮ್ಮ ಕೆಲಸವನ್ನು ಪ್ರಸ್ತುತಪಡಿಸಿದ ಸಂಶೋಧನೆಯ ಕ್ಷೇತ್ರವಾಗಿದೆ. ಇನ್ನೂ ಇದರ ಗರಿಷ್ಠ ಮಟ್ಟದ ನಿಖರತೆಯ ಅವಶ್ಯಕತೆ ಇದೆ. NLP ಯ ಮೂಲಕ ಬಹಳಷ್ಟು ಸಂಶೋಧಕರು ಸ್ವಯಂಚಾಲಿತ ಪ್ರಶ್ನೆ ಸೃಷ್ಟಿಸುವ ಕ್ಷೇತ್ರದಲ್ಲಿ ಕಾರ್ಯ ನಿರ್ವಹಿಸಿದ್ದಾರೆ ಮತ್ತು ವಿವಿಧ ರೀತಿಯ ಪ್ರಶ್ನೆಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಸೃಷ್ಟಿಸಲು ಹಲವಾರು ತಂತ್ರಗಳು ಮತ್ತು ಮಾದರಿಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾಗಿದೆ. 

ವಿಧಾನ:

ಚಿತ್ರ 1  ಸ್ವಯಂ ಪ್ರಶ್ನೆ ಸೃಷ್ಟಿಯ ವಿನ್ಯಾಸಕ್ಕೆ ಅತ್ಯಂತ ಉನ್ನತ ಮಟ್ಟದ ವಿಧಾನವನ್ನು ತೋರಿಸುತ್ತದೆ. ಸ್ವಯಂಚಾಲಿತ ಪ್ರಶ್ನೆಯ ಸೃಷ್ಟಿಯು ಶುದ್ಧ NLP ತಂತ್ರಗಳ ಜೊತೆಗೆ ಅತಿನೂತನ ರೂಪಾಂತರಿ ಮಾದರಿಗಳನ್ನು ಬಳಸುತ್ತದೆ. ಇದರ ಕುರಿತು ನಡೆಸುತ್ತಿರುವ ಸಂಶೋಧನಾ ಕಾರ್ಯವು ಸೃಷ್ಟಿಯಾದ ಪ್ರಶ್ನೆಗಳ ಗುಣಮಟ್ಟ ಮತ್ತು ವಾಕ್ಯರಚನೆ ಮತ್ತು ಶಬ್ದಾರ್ಥ ಸಂಬಂಧದ ಸಂಕೀರ್ಣತೆಯನ್ನು ನಿಯಂತ್ರಿಸುತ್ತದೆ.

ಚಿತ್ರ 1.  ಸ್ವಯಂ ಪ್ರಶ್ನೆ ಸೃಷ್ಟಿಯ ಉನ್ನತ ಮಟ್ಟದ ವಿನ್ಯಾಸ

ಕೊಳವೆಯನ್ನು  ಜೋಡಿಸುವಿಕೆಯಂತೆ ಸ್ವಯಂಚಾಲಿತ ಪ್ರಶ್ನೆ ಸೃಷ್ಟಿಯು ಪಠ್ಯ ಪ್ರಕ್ರಿಯೆಯಂತಹ ಸಾಕಷ್ಟು ಅಂಶಗಳನ್ನು ಒಳಗೊಂಡಿದೆ, ವೈಶಿಷ್ಟ್ಯ ಸಂಗ್ರಹಿಸುವುದು ಮತ್ತು ಇಂಜಿನಿಯರಿಂಗ್, ಮಾದರಿ ರಚನೆ ಮತ್ತು ತರಬೇತಿ, ಮಾದರಿ ಮೌಲ್ಯಮಾಪನ, ಟಿಪ್ಪಣಿ ಮತ್ತು ಕೆಲವು ML ತಂತ್ರಕೌಶಲಗಳಂತಹ ಸಾಕಷ್ಟು ಅಂಶಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. 

ನಮ್ಮ QA ಮಾದರಿಯನ್ನು ತರಬೇತುಗೊಳಿಸಲು ARC, DROP, QASC, SciQ, SciTail, SQuAD ಮತ್ತು Google NQ ಮತ್ತು Embibe ಮಾಲೀಕತ್ವದ ಡೇಟಾಸೆಟ್‌ಗಳಂತಹ 20+ ವಿವಿಧ ಮುಕ್ತ-ಮೂಲದ ಡೇಟಾಸೆಟ್‌ಗಳನ್ನು ನಾವು ಬಳಸಿದ್ದೇವೆ. ಬೂಲಿಯನ್, ಸ್ಪಾನ್-ಆಧಾರಿತ, ಬಿಟ್ಟ ಸ್ಥಳ ತುಂಬಿರಿ, ಬಹು ಆಯ್ಕೆಯ ಪ್ರಶ್ನೆಗಳು ಇತ್ಯಾದಿಯಂತಹ ವಿವಿಧ ರೀತಿಯ ಪ್ರಶ್ನೆಗಳನ್ನು ಕೂಡಾ ನಾವು ಬಳಸಿದ್ದೇವೆ. ಪ್ರಶ್ನೆಯ ಕ್ಲಿಷ್ಟತೆಯನ್ನು ಪ್ರಶ್ನೆಯ ವಾಕ್ಯ ರಚನೆ, ಉತ್ತರ ಪಡೆಯಲು ಬೇಕಾಗಿರುವ ಬಹು ಬಾಕ್ ತಾರ್ಕಿಕತೆ ಮತ್ತು ಪರಿಕಲ್ಪನೆ ಆಧಾರವಾಗಿರುವ ಸಂಕೀರ್ಣತೆಯಿಂದ ಪಡೆಯಲಾಗಿದೆ. KI-BERT[1] ಯಿಂದ ಪ್ರೇರಿತವಾದ QG ಮಾದರಿಗಳಿಗೆ ಸಂಬಂಧಿತ ಜ್ಞಾನವನ್ನು ಒಳಸೇರಿಸಲು ನಾಲೆಡ್ಜ್ ಗ್ರಾಫ್ ಅನ್ನು ಕೂಡಾ ನಾವು ಬಳಸುತ್ತಿದ್ದೇವೆ. ಪ್ರಶ್ನೆಯ ರಚನೆಯ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಸುಧಾರಿಸಲು ನಾವು ಸ್ಥಳೀಯವಾಗಿ ನಿರ್ಮಿಸಿದ ನೈಸರ್ಗಿಕ ಭಾಷೆ ಅರ್ಥೈಸುವ ತಂತ್ರಗಳು   ಅನ್ನು ಬಳಸುತ್ತೇವೆ .

ಪಠ್ಯವನ್ನು ರಚಿಸಲು ನಾವು T5[2] ನಂತಹ ಜನರೇಟಿವ್ ಮಾದರಿಗಳನ್ನು ಬಳಸಬಹುದು, ಇದು ನೀಡಲಾದ ಸಂದರ್ಭ ಮತ್ತು ಉತ್ತರದಿಂದ ಪ್ರಶ್ನೆಯನ್ನು ರಚಿಸಬಹುದು. ಹರಿವು ಹೇಗೆ ಕಾಣುತ್ತದೆ ಎಂಬುದರ ನೋಟ ಇಲ್ಲಿದೆ.

ಚಿತ್ರ 2. ಕಾರ್ಯದ ಹರಿವಿನ QG ಮಾದರಿ

ಫಲಿತಾಂಶ:

Embibe ತನ್ನ  AI ವೇದಿಕೆಯಲ್ಲಿ ಸನ್ನೆಯ ಪದ್ಧತಿಯನ್ನು ಉಪಯೋಗಿಸಿ ವಿದ್ಯಾರ್ಥಿಗಳಿಗೆ ಎಷ್ಟು ಸಾಧ್ಯವೋ ಅಷ್ಟು ಪ್ರಶ್ನೆಗಳನ್ನು ಪಠ್ಯಪುಸ್ತಕದಿಂದ ಕಲೆ ಹಾಕುತ್ತದೆ. ಎಲ್ಲಾ ತರಗತಿಗಳು, ಧ್ಯೇಯಗಳು, ಪರೀಕ್ಷೆಗಳು, ರಾಜ್ಯದ ಮಂಡಳಿಗಳನ್ನು ಪರಿಗಣಿಸಿ ಇಲ್ಲಿಯವರೆಗೆ ನಾವು 6 ರಿಂದ 12 ನೇ ತರಗತಿಯ NCERT ಪುಸ್ತಕಗಳಿಂದ ~125k ಪ್ರಶ್ನೆಗಳನ್ನು ರೂಪಿಸಿದ್ದೇವೆ. ಯಾವುದೇ ಮುಕ್ತ ರೂಪದ ಪಠ್ಯದಿಂದ ಪ್ರಶ್ನೆಗಳನ್ನು ರಚಿಸುವ ಸಾಮರ್ಥ್ಯವನ್ನು ನಾವು ಹೊಂದಿದ್ದೇವೆ.

ಈ ವ್ಯವಸ್ಥೆಯನ್ನು ಯಾವುದೇ ವಿಭಾಗವು ಸದುಪಯೋಗಪಡಿಸಿಕೊಳ್ಳಬಹುದು ಮತ್ತು ಜೀವನದ ಗುರಿ ಮತ್ತು ನೈಜ ಜಗತ್ತಿನ ಸನ್ನಿವೇಶಕ್ಕೆ ತಕ್ಕಂತೆ ಕಲಿಕೆಯ ಫಲಿತಾಂಶವನ್ನು ಪಡೆಯಬಹುದು. ಮಾದರಿ ಮತ್ತು ವ್ಯವಸ್ಥೆಯನ್ನು ರೂಪಿಸುವ ಹಾದಿಯಲ್ಲಿ ನಾವಿದ್ದೇವೆ. ಅತಿನೂತನ NLP ಮತ್ತು ಆಯಾ ವಿಭಾಗದಲ್ಲಿ ವಿಶೇಷವಾಗಿ ಅತ್ಯಾಧುನಿಕವಾಗಿ ನಿರ್ದಿಷ್ಟವಾಗಿ ಬಳಸುವಂತೆ ವ್ಯವಸ್ಥೆಗೊಳಿಸಿದ್ದೇವೆ.

ಡೊಮೇನ್ ನಿರ್ದಿಷ್ಟವಾಗಿ ನೀಡಲಾದ ಇನ್‌‌ಪುಟ್ ಮತ್ತು ರಚಿಸಲಾದ ಪ್ರಶ್ನೆಗಳ ಜೊತೆಯನ್ನು ಕೆಲವು ಉದಾಹರಣೆಗಳಾಗಿ ಇಲ್ಲಿ ನಾವು ಒದಗಿಸಿದ್ದೇವೆ.

ಶೈಕ್ಷಣಿಕ ಪಠ್ಯ:

ಚಿತ್ರ 3. ಆಯ್ದ ಪ್ಯಾರಾಗ್ರಾಫ್ ಮತ್ತು ಹೈಲೈಟ್ ಮಾಡಿದ ADPE ಅಂದರೆ ಶೈಕ್ಷಣಿಕವಾಗಿ ಪ್ರಸ್ತುತವಾದ ಶಬ್ದಗಳು

ರಚಿಸಿದ ಪ್ರಶ್ನೆಗಳು:

ಚಿತ್ರ 4. ಆಯ್ದ ಪ್ಯಾರಾಗ್ರಾಫ್‌ನಿಂದ QG ಮಾದರಿಯು ರಚಿಸಿದ ಪ್ರಶ್ನೆಗಳು

ಉಲ್ಲೇಖಗಳು:

[1] Faldu, Keyur, Amit Sheth, Prashant Kikani, and Hemang Akabari. “KI-BERT: Infusing Knowledge Context for Better Language and Domain Understanding.” arXiv preprint arXiv:2104.08145 (2021).

[2] Colin Raffel, Noam Shazeer, Adam Roberts, Katherine Lee, Sharan Narang, Michael Matena, Yanqi Zhou, Wei Li, Peter J. Liu. “Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer”

[3] Desai, Nishit, Keyur Faldu, Achint Thomas, and Aditi Avasthi. “System and method for generating an assessment paper and measuring the quality thereof.” U.S. Patent Application 16/684,434, filed October 1, 2020.

[4] “Autogeneration of Diagnostic Test and Their Quality Evaluation – EDM:2020”, EDM 2020 presentation, Jul 2020, https://www.youtube.com/watch?v=7wZz0ckqWFs

[5] Thomas, Achint, Keyur Faldu, and Aditi Avasthi. “System and method for personalized retrieval of academic content in a hierarchical manner.” U.S. Patent Application 16/740,223, filed October 1, 2020.

[6] Faldu, Keyur, Achint Thomas, and Aditi Avasthi. “System and method for recommending personalized content using contextualized knowledge base.” U.S. Patent Application 16/586,512, filed October 1, 2020.