ਜਾਣ-ਪਛਾਣ:
Embibe ਦਾ ਨੌਲੇਜ ਗ੍ਰਾਫ਼ (KG) ਇੱਕ ਪਾਠਕ੍ਰਮ ਅਗਿਆਨੀ ਬਹੁ-ਆਯਾਮੀ ਗ੍ਰਾਫ ਹੈ ਜਿਸ ਵਿੱਚ 75,000+ ਗੰਢ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ। ਇਹਨਾਂ ਵਿੱਚੋਂ ਹਰੇਕ ਗੰਡ ਅਕਾਦਮਿਕ ਨੌਲੇਜ ਦੀ ਇੱਕ ਵੱਖਰੀ ਇਕਾਈ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਜਿਸਨੂੰ ਸੰਕਲਪ ਵੀ ਕਿਹਾ ਜਾਂਦਾ ਹੈ। ਨੌਲੇਜ ਗ੍ਰਾਫ਼ ਵਿੱਚ ਗੰਡਾ ਦੇ ਵਿਚਕਾਰ ਸੈਂਕੜੇ ਹਜ਼ਾਰਾਂ ਅੰਤਰ-ਸੰਬੰਧ (ਸਬੰਧ) ਵੀ ਹੁੰਦੇ ਹਨ ਜੋ ਇਹ ਦਰਸਾਉਂਦੇ ਹਨ ਕਿ ਕਿਵੇਂ ਸੰਕਲਪ ਸੁਤੰਤਰ ਨਹੀਂ ਹਨ, ਸਗੋਂ ਹੋਰ ਸੰਕਲਪਾਂ ਨਾਲ ਸੰਬੰਧਿਤ ਹਨ।
ਗੰਡਾ ਵਿਚਕਾਰ ਅੰਤਰ-ਕੁਨੈਕਸ਼ਨਾਂ ਨੂੰ ਉਹਨਾਂ ਵਿਚਕਾਰ ਮੌਜੂਦ ਸਬੰਧਾਂ ਦੀ ਕਿਸਮ ਦੇ ਅਧਾਰ ਤੇ ਇੱਕ ਕਿਸਮ ਨਿਰਧਾਰਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਅਧੂਰੇ ਨੌਲੇਜ ਗ੍ਰਾਫ ਅਤੇ ਗੁੰਮ ਰਿਸ਼ਤੇ ਖੋਜਕਰਤਾਵਾਂ ਵਿੱਚ ਜਾਣੀਆਂ ਜਾਣ ਵਾਲੀਆਂ ਸਮੱਸਿਆਵਾਂ ਵਿੱਚੋਂ ਇੱਕ ਹਨ। ਹਾਲਾਂਕਿ, ਜਿਵੇਂ ਕਿ ਐਮਬੀਬੇ ਆਪਣੀ ਸਮਗਰੀ ਦਾ ਵਿਸਤਾਰ ਕਰਦਾ ਹੈ, ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਆਟੋਮੈਟਿਕ ਕਰਨ ਦੀ ਜ਼ਰੂਰਤ ਹੈ. ਪਿਛਲੇ 8 ਸਾਲਾਂ ਵਿੱਚ ਲੱਖਾਂ ਵਿਦਿਆਰਥੀਆਂ ਲਈ KG ਸੰਕਲਪਾਂ ‘ਤੇ ਪਰਸਪਰ ਕ੍ਰਿਆਵਾਂ ਦੇ ਡੇਟਾ ਦੀ ਉਪਲਬਧਤਾ ਦੇ ਮੱਦੇਨਜ਼ਰ, ਅਤੇ ਗ੍ਰਾਫ ਥਿਊਰੀ ਅਤੇ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਦੀ ਸਮਝ ਤੋਂ ਤਕਨੀਕਾਂ ਦਾ ਲਾਭ ਲੈ ਕੇ, ਸਬੰਧਾਂ ਨੂੰ N ਕਲਾਸਾਂ ਵਿੱਚੋਂ ਇੱਕ ਵਿੱਚ ਸਵੈ-ਵਰਗੀਕ੍ਰਿਤ ਕਰਨਾ ਸੰਭਵ ਹੈ।
ਸਬੰਧਾਂ ਦੀਆਂ ਕਿਸਮਾਂ:
Embibe ਦੇ KG ਵਿੱਚ, ਸਾਡੇ ਕੋਲ ਸੰਕਲਪਾਂ ਵਿਚਕਾਰ 16 ਵੱਖ-ਵੱਖ ਸਬੰਧ ਹਨ। ਇੱਕ ਪੂਰਵ-ਸ਼ਰਤ ਸਬੰਧ ਇਹਨਾਂ ਸਬੰਧਾਂ ਵਿੱਚੋਂ ਇੱਕ ਹੈ। ਕਿਸੇ ਵਿਸ਼ੇਸ਼ ਸੰਕਲਪ ਨੂੰ ਸਿੱਖਣ ਤੋਂ ਪਹਿਲਾਂ ਸਿੱਖਣ ਦੀਆਂ ਸਾਰੀਆਂ ਸ਼ਰਤਾਂ ਇਸ ਰਿਸ਼ਤੇ ਦੁਆਰਾ ਸਾਡੇ ਕੇਜੀ ਵਿੱਚ ਦਿੱਤੀਆਂ ਗਈਆਂ ਹਨ। ਆਮ ਤੌਰ ‘ਤੇ, ਇੱਕ ਵਿਦਿਆਰਥੀ ਕਿਸੇ ਵੀ ਧਾਰਨਾ ਨੂੰ ਸਿੱਖਣ ਤੋਂ ਪਹਿਲਾਂ ਪਹਿਲਾਂ ਜ਼ਰੂਰੀ ਸ਼ਰਤਾਂ ਸਿੱਖਦਾ ਹੈ। ਇਹ ਉਹਨਾਂ ਨੂੰ ਸੰਕਲਪ ਨੂੰ ਬਿਹਤਰ ਤਰੀਕੇ ਨਾਲ ਸਮਝਣ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ। ਅਸੀਂ ਸੰਕਲਪ ਦੀ ਮੁਹਾਰਤ ਦੇ ਨਮੂਨੇ ਅਤੇ ਸਿੱਖਣ ਦੇ ਮਾਰਗਾਂ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ, ਲੱਖਾਂ ਵਿਦਿਆਰਥੀਆਂ ਤੋਂ ਅਰਬਾਂ ਅਭਿਆਸ ਅਤੇ ਟੈਸਟ ਦੀਆਂ ਕੋਸ਼ਿਸ਼ਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਦੇ ਹਾਂ। ਇਹ ਪੈਟਰਨ ਸੰਕਲਪਾਂ ਵਿਚਕਾਰ ਅਨੁਭਵੀ ਕਾਰਨਾਂ ਨੂੰ ਸਥਾਪਿਤ ਕਰਨ ਲਈ ਵਰਤੇ ਜਾਂਦੇ ਹਨ। ਡੇਟਾ ਦੇ ਇਸ ਛੁਪੇ ਹੋਏ ਗੁਣ ਨੇ ਵਿਦਿਆਰਥੀ ਦੁਆਰਾ ਆਪਣੇ ਟੀਚੇ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਅਪਣਾਏ ਗਏ ਸਾਂਝੇ ਸਿੱਖਣ ਮਾਰਗ ਨੂੰ ਲੱਭਣ ਵਿੱਚ ਸਾਡੀ ਮਦਦ ਕੀਤੀ। ਅਸੀਂ ਇੱਕ ਸਕੋਰਿੰਗ ਵਿਧੀ ਦੇ ਅਧਾਰ ਤੇ ਪੂਰਵ-ਲੋੜੀਂਦੀਆਂ ਧਾਰਨਾਵਾਂ ਨੂੰ ਲੱਭਣ ਲਈ ਇਹਨਾਂ ਆਮ ਸਿੱਖਣ ਦੇ ਮਾਰਗਾਂ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਹੈ।
ਖੋਜ ਦੇ ਤਰੀਕੇ:
ਅਸੀਂ ਵਿਦਿਆਰਥੀਆਂ ਲਈ ਸੰਕਲਪ ਦੀ ਮੁਹਾਰਤ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਲਈ ਨੌਲੇਜ ਗ੍ਰਾਫਾਂ ਤੋਂ ਨੌਲੇਜ ਦੇ ਨਿਵੇਸ਼ ਨਾਲ ਡੂੰਘੇ ਨੌਲੇਜ ਟਰੇਸਿੰਗ ਦੀਆਂ ਅਤਿ-ਆਧੁਨਿਕ ਤਕਨੀਕਾਂ ਦਾ ਵਿਸਤਾਰ ਕਰਦੇ ਹਾਂ। ਅਸੀਂ ਇਤਿਹਾਸਕ ਪਹਿਲ ਦੇ ਆਧਾਰ ‘ਤੇ ਸ਼ਰਤੀਆ ਸੰਕਲਪ ਮਹਾਰਤਾਂ ਨੂੰ ਤਿਆਰ ਕਰਕੇ ਕੋਲਡ ਸਟਾਰਟ ਸਮੱਸਿਆ ਨੂੰ ਵੀ ਸੰਭਾਲਦੇ ਹਾਂ। ਵਿਦਿਆਰਥੀਆਂ ਦੇ ਵਿਵਹਾਰਕ ਕੈਲੀਬ੍ਰੇਸ਼ਨ ਅਤੇ ਨੌਲੇਜ ਗ੍ਰਾਫ ਸੰਕਲਪਾਂ ‘ਤੇ ਇਸ ਦੇ ਪ੍ਰਤੀਬਿੰਬ ਦੇ ਕਾਰਨ ਐਮਬੀਬੇ ਦੀ ਸਥਿਤੀ ਵਿਲੱਖਣ ਹੈ। ਸੰਕਲਪਾਂ ਦੇ ਇਹਨਾਂ ਵਿਵਹਾਰਕ ਗੁਣਾਂ ਨੂੰ ਸੰਕਲਪਾਂ ਦੇ ਵਿਚਕਾਰ ਸਬੰਧਾਂ ਨੂੰ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰਨ ਵਿੱਚ ਵੀ ਲਿਆ ਜਾਂਦਾ ਹੈ।
ਨੌਲੇਜ ਗ੍ਰਾਫਾਂ ਦਾ ਵਿਸਥਾਰ ਕਰਨਾ:
ਸਾਡੇ ਕੋਲ ਪਹਿਲਾਂ ਹੀ ਸੰਕਲਪਾਂ ਵਿਚਕਾਰ ਬਹੁਤ ਸਾਰੇ ਰਿਸ਼ਤੇ ਹਨ. ਜਦੋਂ ਵੀ ਕਿਸੇ ਗ੍ਰਾਫ਼ ਵਿੱਚ ਕੋਈ ਨਵਾਂ ਸੰਕਲਪ ਪੇਸ਼ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਸਾਨੂੰ ਹੋਰ ਸੰਕਲਪਾਂ ਨਾਲ ਇਸਦੇ ਸਬੰਧਾਂ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਕੰਮ ਦੀ ਗੁੰਝਲਤਾ ਦੇ ਕਾਰਨ ਇਹ ਇੱਕ ਬਹੁਤ ਮਹੱਤਵਪੂਰਨ ਅਭਿਆਸ ਬਣ ਜਾਂਦਾ ਹੈ. ਕੋਈ ਵੀ ਗਲਤ ਰਿਸ਼ਤਾ ਟੈਗਿੰਗ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਗਲਤ ਦਿਸ਼ਾ ਵੱਲ ਰੀਡਾਇਰੈਕਟ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।
Embibe ਵਿਖੇ, ਅਸੀਂ ਵੱਖ-ਵੱਖ ਭਾਸ਼ਾਵਾਂ ਅਤੇ ਵੱਖ-ਵੱਖ ਪਾਠਕ੍ਰਮਾਂ ਲਈ ਆਪਣਾ ਉਤਪਾਦ ਲਾਂਚ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹਾਂ। ਸਾਨੂੰ ਇਹਨਾਂ ਨਵੇਂ ਸੰਕਲਪਾਂ ਲਈ ਆਪਣਾ ਕੇਜੀ ਵਧਾਉਣ ਦੀ ਲੋੜ ਹੈ। ਅੱਜ ਤੱਕ ਅਸੀਂ ਨਵੇਂ ਸੰਕਲਪ ਦੀ ਖੋਜ ਅਤੇ ਹੋਰ ਸੰਕਲਪਾਂ ਨਾਲ ਉਹਨਾਂ ਦੇ ਸਬੰਧਾਂ ਦੀ ਖੋਜ ਅਤੇ ਮੌਜੂਦਾ ਸਬੰਧਾਂ ਦੀ ਪ੍ਰਮਾਣਿਕਤਾ ਲਈ ਫੈਕਲਟੀਜ਼ ‘ਤੇ ਪੂਰੀ ਤਰ੍ਹਾਂ ਨਿਰਭਰ ਸੀ। ਇਹ ਕੰਮ ਬਹੁਤ ਥਕਾਵਟ ਦੇ ਨਾਲ-ਨਾਲ ਹੌਲੀ ਹੁੰਦੇ ਹਨ। ਕਿਉਂਕਿ ਡੇਟਾ ਦਾ ਪੈਮਾਨਾ ਤੇਜ਼ੀ ਨਾਲ ਵਧ ਰਿਹਾ ਹੈ ਇਹ ਸਾਡੇ ਲਈ ਬਹੁਤ ਚੁਣੌਤੀਪੂਰਨ ਬਣ ਗਿਆ ਹੈ। ਪੂਰੀ ਡਾਟਾ ਤਿਆਰ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ ਲਈ ਮਨੁੱਖੀ ਪੱਖਪਾਤ ਵੀ ਹੈ।
ਅਸੀਂ ਦੇਖਿਆ ਹੈ ਕਿ ਕਿਸੇ ਵੀ ਧਾਰਨਾ ਨੂੰ ਸਿੱਖਣ ਤੋਂ ਪਹਿਲਾਂ ਵਿਦਿਆਰਥੀ ਸੰਬੰਧਿਤ ਸ਼ਰਤਾਂ ਸਿੱਖਦੇ ਹਨ। ਇਸ ਲਈ ਵਿਦਿਆਰਥੀਆਂ ਦੇ ਯਤਨ ਕ੍ਰਮ (ਕੋਸ਼ਿਸ਼ ਪ੍ਰਸ਼ਨ ਕ੍ਰਮ) ਵਿੱਚ ਉਹਨਾਂ ਦੀਆਂ ਪੂਰਵ-ਲੋੜੀਂਦੀਆਂ ਧਾਰਨਾਵਾਂ ਤੋਂ ਬਾਅਦ ਸੰਕਲਪ ਹੋਣਗੇ। ਅਸੀਂ ਵਿਦਿਆਰਥੀ ਦੇ ਸਾਂਝੇ ਗੁਣ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਇੱਕ ਕੋਸ਼ਿਸ਼ ਕੀਤੇ ਪ੍ਰਸ਼ਨ ਕ੍ਰਮ ਪੈਟਰਨ ਲੱਭ ਰਹੇ ਹਾਂ ਜੋ ਵਿਦਿਆਰਥੀ ਦੀ ਸ਼ੁੱਧਤਾ ਵਿੱਚ ਸੁਧਾਰ ਨੂੰ ਪ੍ਰਭਾਵਤ ਕਰ ਰਿਹਾ ਹੈ। ਇਸ ਨੂੰ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਹੱਲ ਕਰਨ ਲਈ, DKT (ਡੀਪ ਨਾਲੇਜ ਟਰੇਸਿੰਗ) (LSTM) ਦੀ ਵਰਤੋਂ ਉਪਭੋਗਤਾ ਕੋਸ਼ਿਸ਼ ਡੇਟਾ ਅਤੇ ਸ਼ੁੱਧਤਾ ਨਾਲ ਕੀਤੀ ਜਾ ਰਹੀ ਹੈ ਇਹ ਦੇਖਣ ਲਈ ਕਿ ਕਿਹੜੀਆਂ ਧਾਰਨਾਵਾਂ/ਕੋਸ਼ਿਸ਼ ਪੈਟਰਨ ਸ਼ੁੱਧਤਾ ‘ਤੇ ਵਧੇਰੇ ਪ੍ਰਭਾਵ ਪਾਉਂਦੇ ਹਨ, ਇੱਕ ਕ੍ਰਮ ਵਰਗੀਕਰਨ ਸਮੱਸਿਆ ਦੇ ਰੂਪ ਵਿੱਚ। ਅੰਤ ਵਿੱਚ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਡੀਕੇਟੀ ਮਾਡਲ ਨੂੰ ਨਵੇਂ ਸੰਕਲਪਾਂ ਲਈ ਸਬੰਧਾਂ ਦੀ ਦਰਜਾਬੰਦੀ ਲਈ ਵਰਤਿਆ ਗਿਆ ਹੈ। ਬਾਅਦ ਵਿੱਚ ਇਹ ਦਰਜਾਬੰਦੀ ਨੌਲੇਜ ਗ੍ਰਾਫ਼ ਗੰਡਾ ਵਿਚਕਾਰ ਨਵੇਂ ਸਬੰਧਾਂ ਦੇ ਸੁਝਾਵਾਂ ਲਈ ਵਰਤੀ ਜਾਂਦੀ ਹੈ।
ਸੰਖੇਪ:
Embibe ਦੇ ਸਾਰੇ ਉਤਪਾਦਾਂ ਲਈ ਨੌਲੇਜ ਗ੍ਰਾਫ਼ ਰੀੜ੍ਹ ਦੀ ਹੱਡੀ ਹੈ। ਇਸ ਲਈ ਨੌਲੇਜ ਗ੍ਰਾਫ ਨੂੰ ਪੂਰਾ ਕਰਨਾ ਸਾਡਾ ਮੁੱਢਲਾ ਕੰਮ ਹੈ। ਇਸ ਕੰਮ ਨੇ ਨੌਲੇਜ ਗ੍ਰਾਫ਼ ਨੂੰ ਬਣਾਈ ਰੱਖਣ ਅਤੇ ਬਹੁਤ ਘੱਟ ਦਸਤੀ ਦਖਲਅੰਦਾਜ਼ੀ ਨਾਲ ਇਸ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਵਧਾਉਣ ਵਿੱਚ ਸਾਡੀ ਮਦਦ ਕੀਤੀ।
ਅੰਤ ਵਿੱਚ, ਇਹ ਸਾਡੇ ਲਈ ਸੰਕਲਪਾਂ ਵਿੱਚ ਨਵੇਂ ਗੁਪਤ ਸਬੰਧਾਂ ਦੀ ਪੜਚੋਲ ਕਰਨ ਲਈ ਇੱਕ ਖੁੱਲੀ ਸਮੱਸਿਆ ਹੈ। ਅਸੀਂ ਵੱਖ-ਵੱਖ ਸਰੋਤਾਂ ਤੋਂ ਦਿੱਤੇ ਪਾਠ ਸੰਬੰਧੀ ਡੇਟਾ ਤੋਂ ਸੰਕਲਪ ਖੋਜਣ ਦੀ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਸਵੈਚਲਿਤ ਕੀਤਾ ਹੈ। ਬਾਅਦ ਵਿੱਚ ਅਸੀਂ ਇਸ ਤਕਨੀਕ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਇਹਨਾਂ ਨਵੀਆਂ ਲੱਭੀਆਂ ਧਾਰਨਾਵਾਂ ਦੇ ਮੌਜੂਦਾ ਸੰਕਲਪਾਂ ਨਾਲ ਸਬੰਧ ਲੱਭਦੇ ਹਾਂ। ਇਸ ਵਿਧੀ ਨੂੰ ਨੌਲੇਜ ਗ੍ਰਾਫ ਪ੍ਰਮਾਣਿਕਤਾ ਲਈ ਵੀ ਵਧਾਇਆ ਜਾ ਸਕਦਾ ਹੈ।
ਹਵਾਲੇ:
- ਕ੍ਰਿਸ ਪੀਚ, ਜੋਨਾਥਨ ਸਪੈਂਸਰ, ਜੋਨਾਥਨ ਹੁਆਂਗ, ਸੂਰਿਆ ਗਾਂਗੁਲੀ, ਮੇਹਰਾਨ ਸਾਹਮੀ, ਲਿਓਨੀਦਾਸ ਜੇ. ਗੁਇਬਾਸ, ਅਤੇ ਜਸਚਾ ਸੋਹਲ-ਡਿਕਸਟਾਈਨ। ਡੂੰਘੀ ਨੌਲੇਜ ਟਰੇਸਿੰਗ.CoRR, abs/1506.05908, 2015. URLhttp://arxiv.org/abs/1506.05908.
- ਕੇ. ਗ੍ਰੇਫ, ਆਰ. ਕੇ. ਸ਼੍ਰੀਵਾਸਤਵ, ਜੇ. ਕੌਟਨਿਕ, ਬੀ. ਆਰ. ਸਟਿਊਨਬ੍ਰਿੰਕ ਅਤੇ ਜੇ. ਸ਼ਮਿਧੁਬਰ, “ਐਲਐਸਟੀਐਮ: ਏ ਸਰਚ ਸਪੇਸ ਓਡੀਸੀ,” ਆਈਈਈਈ ਟ੍ਰਾਂਜੈਕਸ਼ਨਜ਼ ਆਨ ਨਿਊਰਲ ਨੈੱਟਵਰਕਸ ਐਂਡ ਲਰਨਿੰਗ ਸਿਸਟਮਜ਼, ਵੋਲ. 28, ਨੰ. 10, ਪੰਨਾ 2222-2232, ਅਕਤੂਬਰ 2017, doi: 10.1109/TNNLS.2016.2582924.
- ਫਲਦੂ, ਕੇਯੂਰ, ਅਮਿਤ ਸੇਠ, ਪ੍ਰਸ਼ਾਂਤ ਕਿਕਾਨੀ, ਅਤੇ ਹੇਮਾਂਗ ਅਕਬਰੀ। “KI-BERT: ਬਿਹਤਰ ਭਾਸ਼ਾ ਅਤੇ ਡੋਮੇਨ ਸਮਝ ਲਈ ਨੌਲੇਜ ਸੰਦਰਭ ਨੂੰ ਭਰਨਾ।” arXiv ਪ੍ਰੀਪ੍ਰਿੰਟ arXiv:2104.08145 (2021)।
- ਸੇਠ, ਅਮਿਤ, ਮਾਨਸ ਗੌੜ, ਕੌਸ਼ਿਕ ਰਾਏ, ਅਤੇ ਕੇਯੂਰ ਫਲਦੂ। “ਸਮਝਾਉਣਯੋਗ AI ਲਈ ਗਿਆਨ-ਅਧੀਨ ਭਾਸ਼ਾ ਦੀ ਸਮਝ।” IEEE ਇੰਟਰਨੈਟ ਕੰਪਿਊਟਿੰਗ 25, ਨੰ. 5 (2021): 19-24.