ਡਾਟਾ ਨਵੀਂ ਤਾਕਤ ਹੈ

Embibe ਡੇਟਾ ਬਾਰੇ ਕੱਟੜ ਹੈ – ਸਾਧਨ ਬਣਾਉਣਾ, ਮਾਪਣਾ, ਇਕੱਠਾ ਕਰਨਾ, ਮਾਈਨਿੰਗ ਕਰਨਾ, ਅਤੇ ਇਸਨੂੰ ਪੁਰਾਲੇਖ ਕਰਨਾ। Embibe ਇਸਦੇ ਡੇਟਾ ਦਾ ਮਾਲਕ ਹੈ, ਸਾਡਾ IP ਇਸ ‘ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ। Embibe ‘ਤੇ, ਅਸੀਂ ਰੀਲੀਜ਼ ਨੂੰ ਉਦੋਂ ਤੱਕ ਦੇਰੀ ਕਰਦੇ ਹਾਂ ਜਦੋਂ ਤੱਕ ਇਹ ਮਾਪਣ ਲਈ ਕਿ ਸਾਡੇ ਉਪਭੋਗਤਾ ਸਾਡੇ ਉਤਪਾਦਾਂ ਨਾਲ ਕਿਵੇਂ ਅੰਤਰਕਿਰਿਆ ਕਰਦੇ ਹਨ, ਨਾਲ ਹੀ ਕਿਹੜੇ ਕਾਰਕ ਖਾਸ ਨਤੀਜਿਆਂ ਵੱਲ ਲੈ ਜਾਂਦੇ ਹਨ। ਇਹ ਡੇਟਾ ਦੇ ਨਾਲ ਇਹ ਜਨੂੰਨ ਹੈ ਜਿਸ ਨੇ ਸਾਨੂੰ ਵਿਦਿਆਰਥੀ ਕਿਵੇਂ ਅਧਿਐਨ ਕਰਦੇ ਹਨ ਅਤੇ ਆਪਣੇ ਟੀਚਿਆਂ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਦੇ ਹਨ ਇਸ ਬਾਰੇ ਬਹੁਤ ਸਾਰੇ ਸੂਝਵਾਨ ਖੁਲਾਸੇ ਕੀਤੇ ਹਨ। ਉਦਾਹਰਨ ਲਈ, ਇੱਕ ਵਿਦਿਆਰਥੀ ਦੀ ਸਕੋਰ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਕਾਰਕਾਂ ਦੇ ਦੋ ਸੈੱਟਾਂ ਦਾ ਸੁਮੇਲ ਹੈ – ਉਹਨਾਂ ਦੀ ਸਿੱਖਣ ਦੀ ਯੋਗਤਾ ਜੋ ਸਕੋਰ ਕਰਨ ਦੀ ਸਮੁੱਚੀ ਸੰਭਾਵਨਾ ਦੇ ~ 61% ਦਾ ਯੋਗਦਾਨ ਪਾਉਂਦੀ ਹੈ, ਅਤੇ ਉਹਨਾਂ ਦੇ ਵਿਹਾਰਕ ਗੁਣ ਜੋ ~ 39% ਦਾ ਯੋਗਦਾਨ ਪਾਉਂਦੇ ਹਨ। ਡਾਟਾ-ਸੰਚਾਲਿਤ ਹੋਣ ‘ਤੇ ਇਹ ਰੇਜ਼ਰ-ਤਿੱਖੀ ਫੋਕਸ ਨੇ Embibe ਨੂੰ ਅਜਿਹੇ ਉਤਪਾਦ ਬਣਾਉਣ ਦੇ ਯੋਗ ਬਣਾਇਆ ਹੈ ਜੋ ਸਿੱਖਿਆ ਨੂੰ ਵਿਅਕਤੀਗਤ ਬਣਾਉਂਦੇ ਹਨ ਅਤੇ ਵਿਦਿਆਰਥੀਆਂ ਲਈ ਸਿੱਖਣ ਦੇ ਨਤੀਜਿਆਂ ਵਿੱਚ ਬਹੁਤ ਸੁਧਾਰ ਕਰਦੇ ਹਨ।

ਪ੍ਰਾਇਮਰੀ ਡਾਟਾ ਸੰਗ੍ਰਹਿ

Embibe ਦੇ ਪਲੇਟਫਾਰਮ ‘ਤੇ ਵੱਖ-ਵੱਖ ਪੜਾਵਾਂ ਅਤੇ ਸਥਾਨਾਂ ‘ਤੇ ਡਾਟਾ ਇੰਸਟਰੂਮੈਂਟਡ ਅਤੇ ਇਕੱਠਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਇਹ ਸਿਰਫ਼ ਡੇਟਾ ਨੂੰ ਕੈਪਚਰ ਕਰਨਾ ਜ਼ਰੂਰੀ ਨਹੀਂ ਹੈ, ਜਿੰਨਾ ਸਹੀ ਕਿਸਮ ਦੇ ਡੇਟਾ ਨੂੰ ਕੈਪਚਰ ਕਰਨਾ, ਸਹੀ ਸਮੇਂ ਤੇ, ਸਹੀ ਸੰਦਰਭ ਵਿੱਚ, ਗ੍ਰੈਨਿਊਲਿਟੀ ਦੇ ਸਹੀ ਪੱਧਰ ਦੇ ਨਾਲ। Embibe ‘ਤੇ ਡਾਟਾ ਕੈਪਚਰ ਮੋਟੇ ਤੌਰ ‘ਤੇ ਹੇਠ ਲਿਖੀਆਂ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ ਆਉਂਦਾ ਹੈ:

  • ਅਮੀਰ ਇਵੈਂਟ ਕਿਸਮਾਂ ਦਾ ਸਾਧਨ:
    • ਉਪਭੋਗਤਾ-ਇੰਟਰੈਕਸ਼ਨ ਸਪਸ਼ਟ ਇਵੈਂਟਸ – ਕਲਿੱਕ, ਟੈਪ, ਹੋਵਰ, ਸਕ੍ਰੋਲ, ਟੈਕਸਟ-ਅੱਪਡੇਟ
    • ਉਪਭੋਗਤਾ-ਇੰਟਰੈਕਸ਼ਨ ਅਪ੍ਰਤੱਖ ਘਟਨਾਵਾਂ – ਕਰਸਰ ਸਥਿਤੀ, ਟੈਪ ਪ੍ਰੈਸ਼ਰ, ਡਿਵਾਈਸ ਸਥਿਤੀ, ਸਥਾਨ
    • ਸਿਸਟਮ ਦੁਆਰਾ ਤਿਆਰ ਸਰਵਰ ਸਾਈਡ ਇਵੈਂਟਸ – ਪੇਜ ਲੋਡ, ਸੈਸ਼ਨ ਰਿਫਰੈਸ਼, ਏਪੀਆਈ ਕਾਲ
    • ਸਿਸਟਮ ਦੁਆਰਾ ਤਿਆਰ ਕਲਾਇੰਟ ਸਾਈਡ ਇਵੈਂਟਸ – ਸਿਸਟਮ ਪੁਸ਼ ਸੂਚਨਾਵਾਂ ਅਤੇ ਟਰਿਗਰਸ
  • ਸੰਪੱਤੀ ਦੁਆਰਾ ਖਾਸ ਡੇਟਾ:
    • ਪੰਨਾ ਦ੍ਰਿਸ਼ (URL, ਰੈਫਰਰ, ਉਪਭੋਗਤਾ ਏਜੰਟ, ਡਿਵਾਈਸ, IP, ਟਾਈਮਸਟੈਂਪ, ਟ੍ਰੈਫਿਕ ਸਰੋਤ, ਮੁਹਿੰਮ)
    • ਅਭਿਆਸ ਪੱਧਰ ਦੇ ਡੇਟਾ (ਟਾਈਮਸਟੈਂਪ, ਵਿਜ਼ਿਟ/ਮੁੜ-ਵਿਜ਼ਿਟ, ਜਵਾਬ ਵਿਕਲਪ, ਸਮਾਂ ਪਹਿਲੀ ਵਾਰ ਦੇਖਿਆ ਗਿਆ, ਸਹੀ, ਸਮਾਂ ਬਿਤਾਇਆ ਗਿਆ, ਹੱਲ ਦੇਖਿਆ ਗਿਆ, ਸੰਕੇਤ ਵਰਤਿਆ ਗਿਆ) – ਸੈਸ਼ਨ ਪੱਧਰ ‘ਤੇ ਇਕੱਠਾ ਕੀਤਾ ਗਿਆ
    • ਵਿਹਾਰ ਡੇਟਾ ਸਿੱਖੋ:
    • ਖੋਜ ਇਵੈਂਟ ਡੇਟਾ (ਟਾਈਮਸਟੈਂਪ, ਪੁੱਛਗਿੱਛ, ਨਤੀਜਾ ਸੈੱਟ)
    • ਨਤੀਜਾ ਪਰਸਪਰ ਕ੍ਰਿਆ ਡੇਟਾ (ਟਾਈਮਸਟੈਂਪ, ਸੁਝਾਇਆ ਗਿਆ ਨਤੀਜਾ ਚੁਣਿਆ ਗਿਆ, ਨਤੀਜਾ ਵਿਜੇਟ ਅਤੇ ਸੰਦਰਭ, ਵਿਜੇਟ ਸਥਿਤੀ)
    • ਟੈਸਟ ਦੀ ਕੋਸ਼ਿਸ਼ ਇਵੈਂਟ ਪੱਧਰ ਡੇਟਾ (ਟਾਈਮਸਟੈਂਪ, ਵਿਜ਼ਿਟ/ਮੁੜ-ਵਿਜ਼ਿਟ, ਜਵਾਬ ਵਿਕਲਪ, ਸਮਾਂ ਪਹਿਲੀ ਵਾਰ ਦੇਖਿਆ ਗਿਆ, ਸਹੀ, ਸਮਾਂ ਬਿਤਾਇਆ ਗਿਆ, ਫੀਡਬੈਕ ਦੇਖਿਆ ਗਿਆ) – ਸੈਸ਼ਨ ਪੱਧਰ ‘ਤੇ ਇਕੱਠਾ ਕੀਤਾ ਗਿਆ
    • ਪੁੱਛੋ (ਅਕਾਦਮਿਕ ਫੋਰਮ) ਸਵਾਲ ਅਤੇ ਜਵਾਬ ਵੇਰਵੇ, ਟਾਈਮਸਟੈਂਪ, ਉਪਭੋਗਤਾ ਵੋਟਿੰਗ ਵਿਹਾਰ
    • ਭੁਗਤਾਨ (ਉਪਭੋਗਤਾ ਪਛਾਣਕਰਤਾ, ਉਪਭੋਗਤਾ ਈਮੇਲ, ਤੀਜੀ ਧਿਰ ਦਾ ਭੁਗਤਾਨ ਗੇਟਵੇ, ਭੁਗਤਾਨ ਗੇਟਵੇ ਟ੍ਰਾਂਜੈਕਸ਼ਨ ਪਛਾਣਕਰਤਾ, ਭੁਗਤਾਨ ਦਾ ਢੰਗ (ਕਾਰਡ, ਵਾਲਿਟ, ਆਦਿ), ਆਰਡਰ ਦੀ ਬੇਨਤੀ ਦਾ ਟਾਈਮਸਟੈਂਪ, ਭੁਗਤਾਨ ਪ੍ਰਾਪਤੀ ਦਾ ਟਾਈਮਸਟੈਂਪ, ਕੋਈ ਵੀ ਛੋਟ ਲਾਗੂ, ਆਰਡਰ ਆਈਟਮ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ)

ਇੱਥੇ ਬਹੁਤ ਸਾਰੇ ਵਿਹਾਰਕ ਵਿਚਾਰ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਐਮਬੀਬੀ ਦੁਆਰਾ ਕੀਤੇ ਗਏ ਪੈਮਾਨੇ ‘ਤੇ ਡੇਟਾ ਦੇ ਸੰਗ੍ਰਹਿ ਦਾ ਸਾਧਨ ਬਣਾਉਣ ਵੇਲੇ ਧਿਆਨ ਵਿੱਚ ਰੱਖਣਾ ਚਾਹੀਦਾ ਹੈ। ਉਦਾਹਰਨ ਲਈ, ਅਸੀਂ ਇਹ ਸਾਰਾ ਡਾਟਾ ਇਕੱਠਾ ਕਰਨ ਲਈ ਕਈ ਰੂਪ-ਰੇਖਾਵਾਂ ‘ਤੇ ਭਰੋਸਾ ਕਰਦੇ ਹਾਂ। ਉਪਭੋਗਤਾ ਇੰਟਰਐਕਸ਼ਨ ਇਵੈਂਟ ਸਟ੍ਰੀਮ ਦਾ ਲੌਗਿੰਗ segment.io ਅਤੇ Heap ਵਰਗੇ ਤੀਜੀ-ਧਿਰ ਪਲੱਗਇਨਾਂ ਨਾਲ ਏਕੀਕ੍ਰਿਤ ਕਰਕੇ ਪ੍ਰਾਪਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਸਰਵਰ-ਸਾਈਡ ਪੇਜ ਲੋਡ ਅਤੇ ਸੈਸ਼ਨ ਇਵੈਂਟ ਲੌਗਿੰਗ ਇਨ-ਹਾਊਸ ਇੰਸਟਰੂਮੈਂਟ ਕੀਤੀ ਜਾਂਦੀ ਹੈ ਅਤੇ noSql ਡੇਟਾਬੇਸ ਵਿੱਚ ਧੱਕੀ ਜਾਂਦੀ ਹੈ। ਪ੍ਰੈਕਟਿਸ ਅਤੇ ਟੈਸਟ ਵਰਗੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ‘ਤੇ ਉਪਭੋਗਤਾ ਦੀ ਗਤੀਵਿਧੀ ਦਾ ਰੋਜ਼ਾਨਾ ਡੇਟਾ ਸਾਹਮਣੇ ਸਿਰੇ ਦੁਆਰਾ ਪੁੱਛਗਿੱਛ ਦੇ ਏਕੀਕਰਣ ਲਈ DB ਵਿੱਚ ਸਟੋਰ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।

ਡਾਟਾ ਪ੍ਰੋਸੈਸਿੰਗ

ਇੱਕ ਵਾਰ ਪ੍ਰਾਇਮਰੀ ਡਾਟਾ ਇਕੱਠਾ ਹੋਣ ਤੋਂ ਬਾਅਦ, ਇਸ ਨੂੰ ਸਾਫ਼, ਅਮੀਰ, ਮਾਈਨ, ਅਤੇ ਕਲਪਨਾ ਕਰਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। Embibe ਵਿਖੇ, ਸਾਡੇ ਦੁਆਰਾ ਇਕੱਤਰ ਕੀਤੇ ਗਏ ਡੇਟਾ ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ ਸਾਡੇ ਕੋਲ ਨਿਮਨਲਿਖਤ ਵਿਆਪਕ ਪਹੁੰਚ ਹਨ:

  • ਇਨ-ਹਾਊਸ ਰਿਪੋਰਟਿੰਗ ਅਤੇ ਐਡ-ਹਾਕ ਵਿਸ਼ਲੇਸ਼ਣ:
    • ਸਾਡੇ ਉਪਭੋਗਤਾ ਗਲੋਬਲ ਵਨ ਵਿਊ (GOV) ਡੇਟਾ ਨੂੰ ਬਣਾਉਣ ਅਤੇ ਅਪਡੇਟ ਕਰਨ ਲਈ ਸਪਾਰਕ ਸਟ੍ਰੀਮਿੰਗ ਅਤੇ AWS EMR ਉੱਤੇ ਹੈਡੂਪ ਮੈਪ-ਰੀਡਿਊਸ ਜੌਬਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਲੌਗ ਮਾਈਨਿੰਗ ਕਰੋ ਜੋ ਸੈਸ਼ਨ ਪੱਧਰ ਦੀ ਗਤੀਵਿਧੀ ਦੇ ਨਾਲ-ਨਾਲ ਗਲੋਬਲ ਅਕਾਦਮਿਕ ਵਿਊ (GAV) ਡੇਟਾ ਨੂੰ ਸਟੋਰ ਕਰਦਾ ਹੈ ਜੋ ਹਰੇਕ ਉਪਭੋਗਤਾ ਲਈ ਅਕਾਦਮਿਕ ਯੋਗਤਾ ਪ੍ਰੋਫਾਈਲਾਂ ਨੂੰ ਸਟੋਰ ਕਰਦਾ ਹੈ। ਸਮੱਗਰੀ ਦੇ ਹਰੇਕ ਹਿੱਸੇ ਦੇ ਵਿਰੁੱਧ. GOV ਅਤੇ GAV ਡੇਟਾ ਨੂੰ ਪੈਮਾਨੇ ‘ਤੇ ਸੇਵਾ ਕਰਨ ਲਈ Elasticsearch ਕਲੱਸਟਰਾਂ ਵਿੱਚ ਸਟੋਰ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।
    • ਟ੍ਰੈਫਿਕ ਪੈਟਰਨਾਂ, ਉਪਭੋਗਤਾ ਮੁਦਰੀਕਰਨ, ਟੈਸਟ-ਆਨ-ਟੈਸਟ ਸੁਧਾਰ, ਖੋਜ ਅਸਫਲਤਾਵਾਂ ਅਤੇ ਹੋਰ ਲੋੜਾਂ ਲਈ ਰਿਪੋਰਟਿੰਗ ਡੇਟਾ ਤਿਆਰ ਕਰਨ ਲਈ ਲੌਗ ਮਾਈਨਿੰਗ ਕਰੋ। ਪ੍ਰੋਸੈਸਡ ਡੇਟਾ ਨੂੰ ਦੁਬਾਰਾ ਇਲਾਸਟਿਕ ਖੋਜ ਵਿੱਚ ਧੱਕਿਆ ਜਾਂਦਾ ਹੈ ਅਤੇ ਕਿਬਾਨਾ ਅਤੇ ਗ੍ਰਾਫਾਨਾ ਡੈਸ਼ਬੋਰਡਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਵਿਜ਼ੂਅਲ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।
    • ਐਡ-ਹਾਕ ਆਧਾਰ ‘ਤੇ ਕੀਤੇ ਜਾਣ ਵਾਲੇ ਕਿਸੇ ਵੀ ਲੋੜੀਂਦੇ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਪ੍ਰਾਇਮਰੀ ਕੱਚਾ ਡੇਟਾ HBase ਉੱਤੇ HDFS ‘ਤੇ ਸਟੋਰ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।
ਚਿੱਤਰ 1: ਡੇਟਾ ਪ੍ਰਵਾਹ ਸਟੈਕ ਦੀ ਇੱਕ ਉੱਚ ਪੱਧਰੀ ਯੋਜਨਾਬੰਦੀ ਜੋ ਖੁਫੀਆ ਜਾਣਕਾਰੀ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ ਜੋ Embibe ਦੀ ਡੇਟਾ ਸਾਇੰਸ ਲੈਬ ਵਿਕਸਤ ਕਰਦੀ ਹੈ
  • ਕਾਰੋਬਾਰ/ਉਤਪਾਦ/ਮਾਰਕੀਟਿੰਗ ਸਵੈ-ਸੇਵਾ ਲਈ ਤੀਜੀ ਧਿਰ ਦੇ ਸਾਧਨ
    • ਸਾਡਾ ਆਨ-ਪੇਜ ਅਤੇ ਇਨ-ਐਪ ਉਪਭੋਗਤਾ ਇੰਟਰੈਕਸ਼ਨ ਡੇਟਾ segment.io (ਤੀਜੀ ਧਿਰ ਪਲੱਗਇਨ) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਕੈਪਚਰ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਜੋ ਵੱਖ-ਵੱਖ ਬਾਹਰੀ ਡੇਟਾ ਵਿਜ਼ੂਅਲਾਈਜ਼ੇਸ਼ਨ ਪਲੇਟਫਾਰਮਾਂ ਲਈ ਡੇਟਾ ਨੂੰ ਆਟੋ-ਰੂਟ ਕਰਦਾ ਹੈ।
    • ਟ੍ਰੈਫਿਕ ਸਰੋਤਾਂ, ਜਨਸੰਖਿਆ ਅਤੇ ਸਥਾਨ ਦੀ ਜਾਣਕਾਰੀ, ਡਿਵਾਈਸ ਬ੍ਰੇਕਡਾਊਨ, ਪੇਜ ਵਿਯੂਜ਼, ਸਮਾਂ ਬਿਤਾਇਆ, ਧਾਰਨ ਮੈਟ੍ਰਿਕਸ ਸਮੇਤ ਵਿਆਪਕ ਪੱਧਰ ਦੀ ਆਵਾਜਾਈ ਦੀ ਨਿਗਰਾਨੀ ਲਈ Google ਵਿਸ਼ਲੇਸ਼ਣ।
    • ਉਪਭੋਗਤਾ ਵਹਾਅ ਦੇ ਵਿਸ਼ਲੇਸ਼ਣ ਅਤੇ ਅਨੁਕੂਲਤਾ ਲਈ ਹੀਪ ਵਿਸ਼ਲੇਸ਼ਣ। FE ਵਾਇਰਡ ਸਾਰੇ ਉਪਭੋਗਤਾ ਇੰਟਰਐਕਸ਼ਨ ਇਵੈਂਟਸ ਨੂੰ segment.io ਦੁਆਰਾ Heap ਵਿੱਚ ਧੱਕਣ ਲਈ। ਹੀਪ ਉਪਭੋਗਤਾ ਪਰਿਵਰਤਨ ਫਨਲ ਅਤੇ ਪ੍ਰਵਾਹ ਦੀ ਸਵੈ-ਸੇਵਾ ਸ਼ੈਲੀ ਦੀ ਗਤੀਸ਼ੀਲ ਸਥਾਪਨਾ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ।