ਮੁਫ਼ਤ ਲਿਖਤੀ ਜਵਾਬ ਆਧਾਰਿਤ ਸਵਾਲਾਂ ਦਾ ਸਵੈਚਲਿਤ ਮੁਲਾਂਕਣ

ਪ੍ਰਤੀਯੋਗੀ ਇਮਤਿਹਾਨਾਂ ਦੀ ਇੱਕ ਵੱਡੀ ਬਹੁਗਿਣਤੀ ਵਿੱਚ ਭਾਗੀਦਾਰਾਂ ਨੂੰ ਉਦੇਸ਼ ਕਿਸਮ ਦੇ ਪ੍ਰਸ਼ਨਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਜਿਵੇਂ ਕਿ ਪ੍ਰਸ਼ਨ ਜਿਨ੍ਹਾਂ ਲਈ ਇੱਕ ਜਾਂ ਇੱਕ ਤੋਂ ਵੱਧ ਸਹੀ ਉੱਤਰਾਂ ਦੀ ਚੋਣ ਜਵਾਬ ਵਿਕਲਪਾਂ ਜਾਂ ਪ੍ਰਸ਼ਨਾਂ ਦੇ ਦਿੱਤੇ ਗਏ ਸਮੂਹ ਵਿੱਚੋਂ ਕਰਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਜਿਸ ਲਈ ਭਾਗੀਦਾਰਾਂ ਨੂੰ ਇੱਕ ਸੰਖਿਆਤਮਕ ਮੁੱਲ ਦਾਖਲ ਕਰਨਾ ਹੁੰਦਾ ਹੈ। ਇਮਤਿਹਾਨਾਂ ਦਾ ਮੁਲਾਂਕਣ ਜੋ ਉਦੇਸ਼ ਕਿਸਮ ਦੇ ਪ੍ਰਸ਼ਨਾਂ ‘ਤੇ ਅਧਾਰਤ ਹਨ, ਬਿਲਕੁਲ ਸਿੱਧਾ-ਅੱਗੇ ਹੈ। 

ਹਾਲਾਂਕਿ, ਇੱਥੇ ਬਹੁਤ ਸਾਰੀਆਂ ਪ੍ਰੀਖਿਆਵਾਂ ਹਨ, ਉਦਾਹਰਨ ਲਈ ਬੋਰਡ ਪ੍ਰੀਖਿਆਵਾਂ, ਜਿਸ ਵਿੱਚ ਮੁਫਤ ਪਾਠ ਜਵਾਬਾਂ ਵਾਲੇ ਪ੍ਰਸ਼ਨ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ। ਮੁਫਤ ਪਾਠ ਜਵਾਬਾਂ ਦਾ ਮੁਲਾਂਕਣ ਅਜੇ ਵੀ ਲੇਖ ਸਕੋਰਿੰਗ ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾਉਣ ਵਾਲੇ ਕੁਝ ਸਫਲ ਹੱਲਾਂ ਦੇ ਨਾਲ ਇੱਕ ਖੁੱਲੀ ਖੋਜ ਸਮੱਸਿਆ ਹੈ। Embibe ਪੈਮਾਨੇ ‘ਤੇ ਸਿੱਖਣ ਦੇ ਨਤੀਜੇ ਪ੍ਰਦਾਨ ਕਰਨ ਲਈ ਇੱਕ AI ਪਲੇਟਫਾਰਮ ਹੈ [7], ਅਤੇ ਅਜਿਹੀ ਸਮਰੱਥਾ ਮੁਫਤ-ਟੈਕਸਟ ਜਵਾਬ ਅਧਾਰਤ ਪ੍ਰਸ਼ਨਾਂ ਦੇ ਨਾਲ ਵਿਅਕਤੀਗਤ ਟੈਸਟ ਬਣਾਉਣ ਅਤੇ ਪ੍ਰਸੰਗਿਕ ਗਿਆਨ ਗ੍ਰਾਫ [6][8] ਵਿੱਚ ਵਿਦਿਆਰਥੀਆਂ ਦੀ ਧਾਰਨਾਵਾਂ ਦੀ ਮੁਹਾਰਤ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦੀ ਹੈ। ਇੱਕ ਆਮ ਮੁਲਾਂਕਣ ਕਰਨ ਵਾਲੇ ਨੂੰ ਵਿਕਸਤ ਕਰਨ ਲਈ ਜੋ ਵੱਖ-ਵੱਖ ਅਕਾਦਮਿਕ ਡੋਮੇਨਾਂ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਸ਼ੈਲੀਆਂ ਦੇ ਮੁਫ਼ਤ ਪਾਠ ਜਵਾਬ ਸਕੋਰ ਕਰ ਸਕਦਾ ਹੈ, ਲਈ ਉੱਨਤ NLP/NLU ਦੀ ਵਰਤੋਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਅਤੇ ਇਹ Embibe ਲਈ ਦਿਲਚਸਪੀ ਦਾ ਖੇਤਰ ਹੈ।

ਅਸੀਂ ਸਮੱਸਿਆ ਨੂੰ ਦੋ ਉਪ-ਸਮੱਸਿਆਵਾਂ ਵਿੱਚ ਵੰਡ ਸਕਦੇ ਹਾਂ।

  1. ਇਕਾਈ ਲਿੰਕਿੰਗ
  2. ਸਿਮੈਂਟਿਕ ਸਮਾਨਤਾ

ਇਕਾਈ ਲਿੰਕਿੰਗ

ਇਕਾਈ ਨੂੰ ਜੋੜਨ ਵਿੱਚ, ਅਸੀਂ ਛੋਟੇ ਫਾਰਮ/ਐਕਰੋਨਿਮਸ ਅਤੇ (ਜਿਸ ਨੂੰ ਇਹ ਵੀ ਕਿਹਾ ਜਾਂਦਾ ਹੈ) ਕਿਸਮ ਦੀਆਂ ਇਕਾਈਆਂ ਨੂੰ ਸ਼ਾਮਲ ਕਰ ਸਕਦੇ ਹਾਂ। ਉਦਾਹਰਨ ਲਈ, ਸੰਖੇਪ ਸ਼ਬਦ

“PMC”: “ਪਰਾਗ ਮਦਰ ਸੈੱਲ”,

“MMC”: “ਮੈਗਾਸਪੋਰ ਮਦਰ ਸੈੱਲ”,

“PEN”: “ਪ੍ਰਾਇਮਰੀ ਐਂਡੋਸਪਰਮ ਨਿਊਕਲੀਅਸ”,

“PEC”: “ਪ੍ਰਾਇਮਰੀ ਐਂਡੋਸਪਰਮ ਸੈੱਲ”,

“LH”: “ਲੁਟੀਨਾਈਜ਼ਿੰਗ ਹਾਰਮੋਨ”,

“FSH”: “ਫੋਲਿਕਲ ਉਤੇਜਕ ਹਾਰਮੋਨ”

ਅਤੇ ਜਿਸ ਨੂੰ ਇਹ ਵੀ ਕਿਹਾ ਜਾਂਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ,

“ਮਸ਼ਰੂਮ”: “ਟੌਡਸਟੂਲ”,

“ਕੀਟਾਣੂ”: “ਜੀਵਾਣੂ”,

“ਬੈਕਟੀਰੀਆ”: “ਜੀਵਾਣੂ”,

“ਖਮੀਰ”: “ਜੀਵਾਣੂ”,

“ਨਵਿਆਉਣਯੋਗ”: “ਅਮੁੱਕ”,

“ਗੁਣ”: “ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ”,

ਅਸੀਂ ਰਸਾਇਣਕ ਨਾਮ ਵਾਲੀਆਂ ਸੰਸਥਾਵਾਂ ਦਾ ਨਕਸ਼ਾ ਵੀ ਬਣਾ ਸਕਦੇ ਹਾਂ ਜਿਵੇਂ ਕਿ,

‘(NH4)(NO3)’ : ‘ਅਮੋਨੀਅਮ ਨਾਈਟ੍ਰੇਟ’,

‘(NH4)2C2O4’ : ‘ਅਮੋਨੀਅਮ ਆਕਸਲੇਟ’,

‘Ag2O’ : ‘ਸਿਲਵਰ ਆਕਸਾਈਡ’,

‘Ag2SO4’ : ‘ਸਿਲਵਰ ਸਲਫੇਟ’,

‘Al(NO3)3’ : ‘ਅਲਮੀਨੀਅਮ ਨਾਈਟ੍ਰੇਟ’,

ਇਹਨਾਂ ਮੈਪਿੰਗਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਅਸੀਂ ਸੰਖੇਪ ਸ਼ਬਦਾਂ ਅਤੇ ਸਮਾਨ ਸ਼ਬਦਾਂ ਨੂੰ ਮੈਪ ਕਰ ਸਕਦੇ ਹਾਂ ਅਤੇ ਫਿਰ ਉਹਨਾਂ ਨੂੰ ਅਸਲ ਜਵਾਬਾਂ ਨਾਲ ਮਿਲਾ ਸਕਦੇ ਹਾਂ।

ਸਿਮੈਂਟਿਕ ਸਮਾਨਤਾ

ਦੋ ਵਾਕਾਂ ਦਾ ਅਰਥ ਇੱਕੋ ਹੀ ਹੋ ਸਕਦਾ ਹੈ। ਅਸੀਂ ਡੋਮੇਨ-ਇਨਫਿਊਜ਼ਡ ਗਿਆਨ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਅਤੇ ਭਾਸ਼ਾ ਦੇ ਮਾਡਲ ਦੀਆਂ ਸੰਭਾਵਨਾਵਾਂ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਉਂਦੇ ਹੋਏ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਦੀ ਸਮਝ ਅਤੇ ਗਿਆਨ ਨਾਲ ਭਰਪੂਰ ਸਿੱਖਣ ਦੀ ਕਲਾ ਦੀ ਖੋਜ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਅਰਥ-ਵਿਗਿਆਨਕ ਸਮਾਨਤਾ ਸਥਾਪਤ ਕਰਦੇ ਹਾਂ [3][4][5]।

ਅਸੀਂ ਵਿਦਿਆਰਥੀ ਦੇ ਜਵਾਬ ਦੀ ਏਮਬੈਡਿੰਗ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੇ ਹਾਂ ਅਤੇ ਇਸਦੀ ਅਸਲ ਜਵਾਬ ਨਾਲ ਏਮਬੈਡਿੰਗ ਨਾਲ ਤੁਲਨਾ ਕਰ ਸਕਦੇ ਹਾਂ। ਜੇਕਰ ਉਹਨਾਂ ਵਿਚਕਾਰ ਕੋਸਾਈਨ ਦੀ ਦੂਰੀ ਨਿਸ਼ਚਿਤ ਥ੍ਰੈਸ਼ਹੋਲਡ ਤੋਂ ਘੱਟ ਹੈ, ਤਾਂ ਅਸੀਂ ਉਹਨਾਂ ਅਤੇ ਸਮਾਨ ਨੂੰ ਸਮਝ ਸਕਦੇ ਹਾਂ ਅਤੇ ਉੱਤਰ ਨੂੰ ਸਹੀ ਵਜੋਂ ਚਿੰਨ੍ਹਿਤ ਕਰ ਸਕਦੇ ਹਾਂ।

ਅਸੀਂ ਵਿਦਿਆਰਥੀ ਦੇ ਜਵਾਬ ਅਤੇ ਸਹੀ ਉੱਤਰ ਦੇ ਏਮਬੈਡਿੰਗ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ BERT[1] ਅਤੇ RoBERta[2] ਵਰਗੇ ਸਵੈ-ਧਿਆਨ ਅਧਾਰਤ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੇ ਹਾਂ, ਅਤੇ ਉਹਨਾਂ ਵਿਚਕਾਰ ਸਮਾਨਤਾ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਉਹਨਾਂ ਵਿਚਕਾਰ ਕੋਸਾਈਨ ਦੂਰੀ ਦੀ ਗਣਨਾ ਕਰ ਸਕਦੇ ਹਾਂ।

ਹਵਾਲੇ

[1] ਜੈਕਬ ਡੇਵਲਿਨ, ਮਿੰਗ-ਵੇਈ ਚਾਂਗ, ਕੈਂਟਨ ਲੀ, ਕ੍ਰਿਸਟੀਨਾ ਟੂਟਾਨੋਵਾ। “BERT: ਭਾਸ਼ਾ ਦੀ ਸਮਝ ਲਈ ਡੂੰਘੇ ਦੁਵੱਲੇ ਟ੍ਰਾਂਸਫਾਰਮਰਾਂ ਦੀ ਪੂਰਵ-ਸਿਖਲਾਈ”

[2] ਯਿਨਹਾਨ ਲਿਊ, ਮਾਈਲੇ ਓਟ, ਨਮਨ ਗੋਇਲ, ਜਿੰਗਫੇਈ ਡੂ, ਮੰਦਾਰ ਜੋਸ਼ੀ, ਡੈਨਕੀ ਚੇਨ, ਓਮਰ ਲੇਵੀ, ਮਾਈਕ ਲੇਵਿਸ, ਲੂਕ ਜ਼ੇਟਲਮੋਏਰ, ਵੇਸੇਲਿਨ ਸਟੋਯਾਨੋਵ। “ਰੋਬਰਟਾ: ਇੱਕ ਮਜ਼ਬੂਤੀ ਨਾਲ ਅਨੁਕੂਲਿਤ BERT ਪ੍ਰੀਟ੍ਰੇਨਿੰਗ ਪਹੁੰਚ”

[3] ਫਲਦੂ, ਕੀਯੂਰ, ਅਮਿਤ ਸ਼ੇਠ, ਪ੍ਰਸ਼ਾਂਤ ਕਿਕਾਨੀ, ਅਤੇ ਹੇਮਾਂਗ ਅਕਬਰੀ। “KI-BERT: ਬਿਹਤਰ ਭਾਸ਼ਾ ਅਤੇ ਡੋਮੇਨ ਸਮਝ ਲਈ ਗਿਆਨ ਸੰਦਰਭ ਨੂੰ ਭਰਨਾ।” arXiv ਪ੍ਰੀਪ੍ਰਿੰਟ arXiv:2104.08145 (2021)।

[4] ਗੌੜ, ਮਾਨਸ, ਅੰਕਿਤ ਦੇਸਾਈ, ਕੇਯੂਰ ਫਲਦੂ, ਅਤੇ ਅਮਿਤ ਸ਼ੇਠ। “ਗਿਆਨ ਗ੍ਰਾਫ਼ਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਵਿਆਖਿਆਯੋਗ AI।” ACM CoDS-COMAD ਕਾਨਫਰੰਸ ਵਿੱਚ। 2020।

[5] ਗੌੜ, ਮਾਨਸ, ਕੀਯੂਰ ਫਲਦੂ, ਅਤੇ ਅਮਿਤ ਸੇਠ। “ਬਲੈਕ-ਬਾਕਸ ਦੇ ਅਰਥ ਵਿਗਿਆਨ: ਕੀ ਗਿਆਨ ਗ੍ਰਾਫ਼ ਡੂੰਘੇ ਸਿਖਲਾਈ ਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਵਧੇਰੇ ਵਿਆਖਿਆਯੋਗ ਅਤੇ ਵਿਆਖਿਆਯੋਗ ਬਣਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦੇ ਹਨ?।” IEEE ਇੰਟਰਨੈਟ ਕੰਪਿਊਟਿੰਗ 25, ਨੰ. 1 (2021): 51-59.

[6] ਧਵਾਲਾ, ਸੋਮਾ, ਚਿਰਾਗ ਭਾਟੀਆ, ਜੋਏ ਬੋਸ, ਕੀਯੂਰ ਫਲਦੂ, ਅਤੇ ਅਦਿਤੀ ਅਵਸਥੀ। “ਡਾਇਗਨੌਸਟਿਕ ਅਸੈਸਮੈਂਟਸ ਅਤੇ ਉਹਨਾਂ ਦੀ ਗੁਣਵੱਤਾ ਦੇ ਮੁਲਾਂਕਣ ਦੀ ਆਟੋ ਜਨਰੇਸ਼ਨ.” ਇੰਟਰਨੈਸ਼ਨਲ ਐਜੂਕੇਸ਼ਨਲ ਡਾਟਾ ਮਾਈਨਿੰਗ ਸੁਸਾਇਟੀ (2020)।

[7] “#RAISE2020 – Embibe – ਵਿਅਕਤੀਗਤ ਸਿੱਖਿਆ ਲਈ AI-ਪਾਵਰਡ ਲਰਨਿੰਗ ਨਤੀਜੇ ਪਲੇਟਫਾਰਮ”, MyGov ਇੰਡੀਆ, ਅਕਤੂਬਰ 2020, https://www.youtube.com/watch?v=kuwFtHgN3qU

[8] ਫਾਲਦੂ, ਕੀਯੂਰ, ਅਚਿੰਤ ਥਾਮਸ, ਅਤੇ ਅਦਿਤੀ ਅਵਸਥੀ। “ਪ੍ਰਸੰਗਿਕ ਗਿਆਨ ਅਧਾਰ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਵਿਅਕਤੀਗਤ ਸਮੱਗਰੀ ਦੀ ਸਿਫ਼ਾਰਿਸ਼ ਕਰਨ ਲਈ ਸਿਸਟਮ ਅਤੇ ਢੰਗ।” ਯੂ.ਐੱਸ. ਪੇਟੈਂਟ ਐਪਲੀਕੇਸ਼ਨ 16/586,512, ਅਕਤੂਬਰ 1, 2020 ਨੂੰ ਦਾਇਰ ਕੀਤੀ ਗਈ।