ਐਜੂਕੇਸ਼ਨ ਟੈਕਨਾਲੋਜੀ ਦੇ ਖੇਤਰ ਵਿੱਚ, ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕੰਮ ਸਮੱਗਰੀ ਨੂੰ ਸਾਰੇ ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਪਹੁੰਚਯੋਗ ਅਤੇ ਖੋਜਣਯੋਗ ਬਣਾਉਣਾ ਹੈ। ਅਜਿਹਾ ਕਰਨ ਲਈ, ਕੰਪਨੀਆਂ ਮਨੁੱਖੀ ਐਨੋਟੇਟਰਾਂ ਜਾਂ ਵਿਸ਼ਾ ਵਸਤੂ ਮਾਹਿਰਾਂ ਨੂੰ ਸੰਬੰਧਿਤ ਟੈਗਸ ਨਾਲ ਟੈਗ ਕਰਨ ਲਈ ਨਿਯੁਕਤ ਕਰਦੀਆਂ ਹਨ ਜੋ ਉਤਪਾਦ ਦੇ ਸਮੁੱਚੇ ਉਪਭੋਗਤਾ ਅਨੁਭਵ ਨਾਲ ਜੁੜੀਆਂ ਹੁੰਦੀਆਂ ਹਨ।

Embibe ਦੇ ਨੌਲੇਜ ਗ੍ਰਾਫ਼ ਵਿੱਚ 74,000+ ਨੋਡ ਹਨ, ਹਰੇਕ ਨੌਲੇਜ ਦੀ ਇੱਕ ਵੱਖਰੀ ਇਕਾਈ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਇੱਥੇ 1,89,380 ਇੰਟਰਕਨੈਕਸ਼ਨ ਅਤੇ 2,15,062 ਯੋਗਤਾਵਾਂ ਹਨ। ਜਿਵੇਂ ਕਿ ਸੈਂਕੜੇ ਸਿਲੇਬੀਆਂ ਵਿੱਚ ਹਜ਼ਾਰਾਂ ਪ੍ਰੀਖਿਆਵਾਂ ਵਿੱਚ ਸਮੱਗਰੀ ਦਾ ਵਿਸਤਾਰ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਟੈਗਿੰਗ ਦੀ ਪ੍ਰਕਿਰਿਆ ਵਧੇਰੇ ਮਹਿੰਗੀ ਅਤੇ ਸਮਾਂ ਬਰਬਾਦ ਕਰਨ ਵਾਲੀ ਬਣ ਜਾਂਦੀ ਹੈ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਇੱਥੇ ਹਮੇਸ਼ਾ ਮਨੁੱਖੀ ਪੱਖਪਾਤ ਹੁੰਦਾ ਹੈ ਜੋ ਡੈਟਾਸੈੱਟ ਦੇ ਵੱਖ-ਵੱਖ ਸਬਸੈੱਟਾਂ ‘ਤੇ ਕੰਮ ਕਰਨ ਵਾਲੇ ਮਲਟੀਪਲ ਮਨੁੱਖੀ ਐਨੋਟੇਟਰ ਹੋਣ ਕਾਰਨ ਡੈਟਾਸੈੱਟ ਦੀ ਮੈਨੂਅਲ ਟੈਗਿੰਗ ਹੋਣ ‘ਤੇ ਹੁੰਦਾ ਹੈ।

ਮੈਟਾਟੈਗਸ ਰੈਂਕਰ ਦਾ ਉਦੇਸ਼ ਇੱਕ ਲੂਪ ਅਰਧ-ਆਟੋਮੈਟਿਕ ਟੈਗਿੰਗ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਮਨੁੱਖੀ ਨਾਲ ਮੈਨੂਅਲ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਬਦਲ ਕੇ ਮਨੁੱਖੀ ਟੈਗਿੰਗ ਨਾਲ ਜੁੜੀਆਂ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਦੂਰ ਕਰਨਾ ਹੈ। ਮੈਟਾ ਟੈਗਸ ਰੈਂਕਰ ਵਿਸ਼ਾ ਵਸਤੂ ਮਾਹਿਰਾਂ ਲਈ ਬਣਾਇਆ ਗਿਆ ਇੱਕ ਟੂਲ ਹੈ, ਜੋ ਉਹਨਾਂ ਨੂੰ Embibe ਪਲੇਟਫਾਰਮ ਦੁਆਰਾ ਸਮਰਥਿਤ ਸਾਰੇ ਟੀਚਿਆਂ ਲਈ ਵਿਸ਼ੇ, ਇਕਾਈ, ਅਧਿਆਏ, ਵਿਸ਼ੇ ਅਤੇ ਕਿਸੇ ਵੀ ਦਿੱਤੇ ਸਵਾਲਾਂ ਦੇ ਸੰਕਲਪ ਨੂੰ ਟੈਗ ਕਰਨ ਲਈ ਸੁਝਾਅ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਇਹ ਮੁਸ਼ਕਲ ਪੱਧਰ, ਆਦਰਸ਼ ਸਮਾਂ ਅਤੇ ਪ੍ਰਸ਼ਨ ਦੇ ਖਿੜ ਦੇ ਪੱਧਰ ਲਈ ਸੁਝਾਅ ਵੀ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।

ਆਉ ਅਸੀਂ ਦੋ ਉਦਾਹਰਣਾਂ ਨਾਲ ਸਮਝਾਉਂਦੇ ਹਾਂ ਕਿ ਇਹ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ।

ਮੈਟਾਟੈਗਸ ਰੈਂਕਰ ਐਕਸਟ੍ਰੀਮ ਮਲਟੀਕਲਾਸ ਵਰਗੀਕਰਣ ਸਮੱਸਿਆ (ਐਕਸਐਮਸੀ) [1][2] ‘ਤੇ ਅਧਾਰਤ ਹੈ। Embibe ਲਈ, ਕਿਸੇ ਵੀ ਦਿੱਤੇ ਸਵਾਲ ਲਈ 74,000+ ਕਲਾਸਾਂ ਜਾਂ ਸੰਕਲਪ ਹਨ। ਕਲਾਸਾਂ ਆਪਸੀ ਤੌਰ ‘ਤੇ ਨਿਵੇਕਲੇ ਨਹੀਂ ਹਨ, ਅਰਥਾਤ, ਸੰਕਲਪਾਂ ਕੁਦਰਤ ਵਿੱਚ ਅਰਥਾਂ ਦੇ ਰੂਪ ਵਿੱਚ ਓਵਰਲੈਪ ਹੁੰਦੀਆਂ ਹਨ। XMC ਲਈ ਦੂਜੀ ਚੁਣੌਤੀ ਡੇਟਾਸੇਟ ਦੀ ਵੰਡ ਹੈ। ਸਾਰੀਆਂ ਕਲਾਸਾਂ ਜਾਂ ਸੰਕਲਪਾਂ ਵਿੱਚ ਲੋੜੀਂਦੀ ਗਿਣਤੀ ਵਿੱਚ ਡੇਟਾ ਪੁਆਇੰਟ ਨਹੀਂ ਹੁੰਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ, ਕੁਝ ਕਲਾਸਾਂ ਵਿੱਚ ਬਹੁਤ ਸਾਰੇ ਡੇਟਾ ਪੁਆਇੰਟ ਹੁੰਦੇ ਹਨ ਜਦੋਂ ਕਿ ਹੋਰਾਂ ਵਿੱਚ ਬਹੁਤ ਘੱਟ ਹੁੰਦੇ ਹਨ ਜੋ ਮਾਡਲ ਪੂਰਵ-ਅਨੁਮਾਨ ਦੁਆਰਾ ਅਣਡਿੱਠ ਕੀਤੇ ਜਾਣ ਵਾਲੇ ਕੁਝ ਡੇਟਾ ਪੁਆਇੰਟਾਂ ਵਾਲੀਆਂ ਕਲਾਸਾਂ ਦੀ ਅਗਵਾਈ ਕਰ ਸਕਦੇ ਹਨ। ਮੈਟਾਟੈਗਸ ਰੈਂਕਰ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਦੀ ਸਮਝ ਲਈ ਆਧੁਨਿਕ ਡੂੰਘੀ ਸਿੱਖਣ ਦੀਆਂ ਤਕਨੀਕਾਂ ਦਾ ਲਾਭ ਉਠਾਉਂਦਾ ਹੈ। ਇਹ ਸਿਖਲਾਈ ਨਿਊਰਲ ਮਾਡਲਾਂ [3] ਵਿੱਚ ਨੌਲੇਜ ਗ੍ਰਾਫਾਂ ਦਾ ਵੀ ਲਾਭ ਉਠਾਉਂਦਾ ਹੈ। ਮਾਡਲ ਦੁਆਰਾ ਵਿਆਖਿਆਯੋਗ ਅਤੇ ਵਿਆਖਿਆਯੋਗ ਭਵਿੱਖਬਾਣੀਆਂ ਪ੍ਰੋਡਕਸ਼ਨ ਸੈਟਿੰਗਾਂ [4][5] ਵਿੱਚ ਇਸ ਸਮਰੱਥਾ ਨੂੰ ਤੈਨਾਤ ਕਰਨ ਵਿੱਚ ਪਾਲਣ-ਪੋਸ਼ਣ ਕਰਨ ਵਾਲੇ ਅਕਾਦਮਿਕ ਵਿਸ਼ਵਾਸ ਵਿੱਚ ਮਦਦ ਕਰਦੀਆਂ ਹਨ। ਅਜਿਹੀ ਭਰਪੂਰ ਸਮੱਗਰੀ ਆਟੋ ਟੈਸਟ ਜਨਰੇਸ਼ਨ [5][7] ਅਤੇ ਸਿੱਖਣ ਦੇ ਨਤੀਜੇ [6] ਪ੍ਰਦਾਨ ਕਰਨ ਦੀ ਯੋਗਤਾ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ।

ਮੈਟਾ ਟੈਗ ਜਨਰੇਟਰ ਨੇ ਕਿਤਾਬਾਂ, ਸਵਾਲਾਂ ਅਤੇ ਸਿੱਖਣ ਵਾਲੇ ਵੀਡੀਓਜ਼ ਲਈ AI ਨਾਲ ਮੈਨੂਅਲ ਟੈਗ ਬਣਾਉਣ ਦੀ ਪ੍ਰਕਿਰਿਆ ਦੇ ਹਜ਼ਾਰਾਂ ਘੰਟਿਆਂ ਦੀ ਬਚਤ ਕੀਤੀ। ਇਸ ਨਾਲ ਵੱਖ-ਵੱਖ ਗ੍ਰੇਡਾਂ ਅਤੇ ਵਿਸ਼ਿਆਂ ਲਈ ਵਿਸ਼ਾ ਵਸਤੂ ਦੀ ਮੁਹਾਰਤ ਦੀ ਲੋੜ ਵੀ ਘਟ ਗਈ। Embibe ਵੀਡੀਓ ਅਤੇ 3D ਸੰਪਤੀ ਬਣਾਉਣ ਲਈ ਸਪੀਚ ਮੈਟਾਟੈਗ ਵੀ ਵਿਕਸਿਤ ਕਰ ਰਿਹਾ ਹੈ।

ਡੈਮੋ ਵੀਡੀਓ

ਹਵਾਲੇ:

[1] ਚਾਂਗ, ਵੇਈ-ਚੇਂਗ, ਹਸਿਆਂਗ-ਫੂ ਯੂ, ਕਾਈ ਝੋਂਗ, ਯੀਮਿੰਗ ਯਾਂਗ, ਅਤੇ ਇੰਦਰਜੀਤ ਐਸ. ਢਿੱਲੋਂ। “ਅਤਿਅੰਤ ਮਲਟੀ-ਲੇਬਲ ਟੈਕਸਟ ਵਰਗੀਕਰਣ ਲਈ ਪਹਿਲਾਂ ਤੋਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਟ੍ਰਾਂਸਫਾਰਮਰਾਂ ਨੂੰ ਟੇਮਿੰਗ.” ਨੌਲੇਜ ਖੋਜ ਅਤੇ ਡੇਟਾ ਮਾਈਨਿੰਗ ‘ਤੇ 26ਵੀਂ ACM SIGKDD ਅੰਤਰਰਾਸ਼ਟਰੀ ਕਾਨਫਰੰਸ ਦੀ ਕਾਰਵਾਈ ਵਿੱਚ, pp. 3163-3171। 2020।

[2] ਦਹੀਆ, ਕੁਨਾਲ, ਦੀਪਕ ਸੈਣੀ, ਅੰਸ਼ੁਲ ਮਿੱਤਲ, ਅੰਕੁਸ਼ ਸ਼ਾਅ, ਕੁਸ਼ਲ ਦਵੇ, ਅਕਸ਼ੈ ਸੋਨੀ, ਹਿਮਾਂਸ਼ੂ ਜੈਨ, ਸੁਮੀਤ ਅਗਰਵਾਲ, ਅਤੇ ਮਾਨਿਕ ਵਰਮਾ। “DeepXML: ਇੱਕ ਡੂੰਘੀ ਐਕਸਟ੍ਰੀਮ ਮਲਟੀ-ਲੇਬਲ ਲਰਨਿੰਗ ਫਰੇਮਵਰਕ ਛੋਟੇ ਟੈਕਸਟ ਦਸਤਾਵੇਜ਼ਾਂ ‘ਤੇ ਲਾਗੂ ਕੀਤਾ ਗਿਆ ਹੈ।” ਵੈੱਬ ਖੋਜ ਅਤੇ ਡੇਟਾ ਮਾਈਨਿੰਗ ‘ਤੇ 14ਵੀਂ ਏਸੀਐਮ ਇੰਟਰਨੈਸ਼ਨਲ ਕਾਨਫਰੰਸ ਦੀ ਕਾਰਵਾਈ ਵਿੱਚ, ਪੀਪੀ. 31-39. 2021।[arXiv]

[3] ਫਲਦੂ, ਕੀਯੂਰ, ਅਮਿਤ ਸ਼ੇਠ, ਪ੍ਰਸ਼ਾਂਤ ਕਿਕਾਨੀ, ਅਤੇ ਹੇਮਾਂਗ ਅਕਬਰੀ। “KI-BERT: ਬਿਹਤਰ ਭਾਸ਼ਾ ਅਤੇ ਡੋਮੇਨ ਸਮਝ ਲਈ ਨੌਲੇਜ ਸੰਦਰਭ ਨੂੰ ਭਰਨਾ।” arXiv ਪ੍ਰੀਪ੍ਰਿੰਟ arXiv:2104.08145 (2021)।

[4] ਗੌੜ, ਮਾਨਸ, ਕੀਯੂਰ ਫਲਦੂ, ਅਤੇ ਅਮਿਤ ਸੇਠ। “ਬਲੈਕ-ਬਾਕਸ ਦੇ ਅਰਥ ਵਿਗਿਆਨ: ਕੀ ਨੌਲੇਜ ਗ੍ਰਾਫ਼ ਡੂੰਘੇ ਸਿਖਲਾਈ ਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਵਧੇਰੇ ਵਿਆਖਿਆਯੋਗ ਅਤੇ ਵਿਆਖਿਆਯੋਗ ਬਣਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦੇ ਹਨ?।” IEEE ਇੰਟਰਨੈਟ ਕੰਪਿਊਟਿੰਗ 25, ਨੰ. 1 (2021): 51-59.

[5] ਧਵਲਾ, ਸੋਮਾ, ਚਿਰਾਗ ਭਾਟੀਆ, ਜੋਏ ਬੋਸ, ਕੀਯੂਰ ਫਲਦੂ, ਅਤੇ ਅਦਿਤੀ ਅਵਸਥੀ। “ਡਾਇਗਨੌਸਟਿਕ ਅਸੈਸਮੈਂਟਸ ਅਤੇ ਉਹਨਾਂ ਦੀ ਗੁਣਵੱਤਾ ਦੇ ਮੁਲਾਂਕਣ ਦੀ ਆਟੋ ਜਨਰੇਸ਼ਨ.” ਇੰਟਰਨੈਸ਼ਨਲ ਐਜੂਕੇਸ਼ਨਲ ਡਾਟਾ ਮਾਈਨਿੰਗ ਸੁਸਾਇਟੀ (2020)।

[6] ਫਾਲਦੂ, ਕੀਯੂਰ, ਅਦਿਤੀ ਅਵਸਥੀ, ਅਤੇ ਅਚਿੰਤ ਥਾਮਸ। “ਸਕੋਰ ਸੁਧਾਰ ਅਤੇ ਇਸਦੇ ਭਾਗਾਂ ਲਈ ਅਨੁਕੂਲ ਸਿਖਲਾਈ ਮਸ਼ੀਨ।” ਯੂ.ਐੱਸ. ਪੇਟੈਂਟ 10,854,099, ਦਸੰਬਰ 1, 2020 ਨੂੰ ਜਾਰੀ ਕੀਤਾ ਗਿਆ।

[7] ਦੇਸਾਈ, ਨਿਸ਼ਿਤ, ਕੀਯੂਰ ਫਾਲਦੂ, ਅਚਿੰਤ ਥਾਮਸ, ਅਤੇ ਅਦਿਤੀ ਅਵਸਥੀ। “ਇੱਕ ਮੁਲਾਂਕਣ ਪੇਪਰ ਤਿਆਰ ਕਰਨ ਅਤੇ ਇਸਦੀ ਗੁਣਵੱਤਾ ਨੂੰ ਮਾਪਣ ਲਈ ਸਿਸਟਮ ਅਤੇ ਢੰਗ।” ਯੂ.ਐੱਸ. ਪੇਟੈਂਟ ਐਪਲੀਕੇਸ਼ਨ 16/684,434, ਅਕਤੂਬਰ 1, 2020 ਨੂੰ ਦਾਇਰ ਕੀਤੀ ਗਈ।

← AI ਹੋਮ 'ਤੇ ਵਾਪਸ ਜਾਓ