సరికొత్త శక్తి వనరుగా డేటా

సరికొత్త శక్తి వనరుగా డేటా

Embibe డేటా గురించి అమితంగా ఇష్టపడతారు – సాధనచేయడం, కొలత, సేకరించడం, మైనింగ్ మరియు ఆర్కైవ్ చేయడం. Embibe దాని డేటాను కలిగి ఉంది, మా IP దానిపై ఆధారపడి ఉంటుంది. Embibe లో, మా వినియోగదారులు మా ఉత్పత్తులతో ఎలా వ్యవహరిస్తారో, అలాగే నిర్దిష్ట ఫలితాలకు ఏ అంశాలు దారితీస్తాయో కొలవడానికి తగిన ఇన్‌స్ట్రుమెంటేషన్ అమలయ్యే వరకు మేము విడుదలను ఆలస్యం చేస్తాము. డేటాతో ఈ ముట్టడి వల్ల విద్యార్థులు ఎలా చదువుకుంటారు మరియు వారి లక్ష్యాలను ఎలా సాధిస్తారనే దానిపై అనేక అంతర్దృష్టితో కూడిన ఆవిష్కరణలకు దారితీసింది. ఉదాహరణకు, స్కోర్ చేసే విద్యార్థి యొక్క సంభావ్యత రెండు సెట్ల కారకాల కలయిక – వారి అభ్యసన సామర్థ్యం మొత్తం స్కోర్ చేసే సామర్థ్యంలో ~ 61%, మరియు వారి ప్రవర్తనా లక్షణాలు ~ 39% తోడ్పడతాయి. డేటా ఆధారితమైనదిగా ఉండే ఈ రేజర్-షార్ప్ ఫోకస్ విద్యను వ్యక్తిగతీకరించే ఉత్పత్తులను రూపొందించడానికి మరియు విద్యార్ధులకు అభ్యాస ఫలితాలలో అద్భుతమైన మెరుగుదలలను అందించడానికి Embibeని ఎనేబుల్ చేసింది.

ప్రాథమిక డేటా సేకరణ

Embibe ప్లాట్‌ఫారమ్‌లోని వివిధ దశలు మరియు స్థానాల్లో డేటా ఇన్‌స్ట్రుమెంట్ చేయబడింది మరియు సేకరించబడుతుంది. సరైన సమయంలో, సరైన సందర్భంలో, సరైన స్థాయి గ్రాన్యులారిటీతో సరైన రకమైన డేటాను సంగ్రహించినంత మాత్రాన డేటాను సంగ్రహించడం మాత్రమే అవసరం లేదు. Embibe వద్ద డేటా క్యాప్చర్ విస్తృతంగా క్రింది వర్గాలలోకి వస్తుంది:

రిచ్ ఈవెంట్ రకాల ఇన్‌స్ట్రుమెంటేషన్:

  • వినియోగదారు పరస్పర చర్య స్పష్టమైన ఈవెంట్‌లు – క్లిక్‌లు, ట్యాప్‌లు, హోవర్‌లు, స్క్రోల్‌లు, వచన-నవీకరణలు
  • వినియోగదారు పరస్పర చర్య అవ్యక్త సంఘటనలు – కర్సర్ స్థానం, ట్యాప్ ఒత్తిడి, పరికర ధోరణి, స్థానం
  • సిస్టమ్-సృష్టించిన సర్వర్ సైడ్ ఈవెంట్‌లు – పేజీ లోడ్, సెషన్ రిఫ్రెష్‌లు, api కాల్‌లు
  • సిస్టమ్-ఉత్పత్తి క్లయింట్ సైడ్ ఈవెంట్‌లు – సిస్టమ్ పుష్ నోటిఫికేషన్‌లు మరియు ట్రిగ్గర్‌లు

 ప్రాపర్టీ చేత నిర్దిష్ట డేటా:

  • పేజీ వీక్షణలు (URL, రెఫరర్, వినియోగదారు ఏజెంట్, పరికరం, IP, టైమ్‌స్టాంప్, ట్రాఫిక్ మూలం, ప్రచారం).
  • ప్రాక్టీస్ ప్రయత్న స్థాయి డేటా (టైమ్‌స్టాంప్, సందర్శన/పునః సందర్శన, సమాధాన ఎంపిక, మొదట చూసిన సమయం, సరైనది, గడిపిన సమయం, వీక్షించిన పరిష్కారం, ఉపయోగించిన సూచన) – సెషన్ స్థాయిలో సమగ్రపరచబడింది.

ప్రవర్తన డేటాను తెలుసుకోండి:

  • ఈవెంట్ డేటాను సెర్చ్ చేయండి  (టైమ్‌స్టాంప్, ప్రశ్న, ఫలితం సెట్)
  • ఫలితాల పరస్పర డేటా (టైమ్‌స్టాంప్, సూచించబడిన ఫలితం ఎంచుకోబడింది, ఫలితం విడ్జెట్ మరియు సందర్భం, విడ్జెట్ స్థానం)
  • టెస్ట్ ప్రయత్న ఈవెంట్ స్థాయి డేటా (టైమ్‌స్టాంప్, సందర్శన/పునః సందర్శన, సమాధానం ఎంపిక, మొదట చూసిన సమయం, సరైనది, గడిపిన సమయం, వీక్షించిన అభిప్రాయం) – సెషన్ స్థాయిలో సమగ్రపరచబడింది
  • అడగండి (అకడమిక్ ఫోరమ్) ప్రశ్న మరియు సమాధానాల వివరాలు, టైమ్‌స్టాంప్‌లు, వినియోగదారు ఓటింగ్ ప్రవర్తన
  • చెల్లింపులు (యూజర్ ఐడెంటిఫైయర్, యూజర్ ఇమెయిల్, థర్డ్ పార్టీ పేమెంట్ గేట్‌వే, పేమెంట్ గేట్‌వే ట్రాన్సాక్షన్ ఐడెంటిఫైయర్, పేమెంట్ మోడ్ (కార్డ్, వాలెట్ మొదలైనవి), ఆర్డర్ రిక్వెస్ట్ టైమ్‌స్టాంప్, పేమెంట్ రియలైజేషన్ టైమ్‌స్టాంప్, వర్తించే ఏవైనా తగ్గింపులు, ఆర్డర్ ఐటెమ్ స్పెసిఫికేషన్‌లు).

Embibe చేసే స్కేల్‌లో డేటా సేకరణను ఇన్‌స్ట్రుమెంట్ చేసేటప్పుడు పరిగణించాల్సిన అనేక ఆచరణాత్మక అంశాలు ఉన్నాయి. ఉదాహరణకు, ఈ మొత్తం డేటాను సేకరించడానికి మేము అనేక పద్ధతులపై ఆధారపడతాము. segment.io మరియు Heap వంటి థర్డ్-పార్టీ ప్లగిన్‌లతో ఏకీకరణ చేయడం ద్వారా వినియోగదారు పరస్పర చర్య ఈవెంట్ స్ట్రీమ్‌ని లాగింగ్ చేయడం సాధ్యపడుతుంది. సర్వర్-సైడ్ పేజీ లోడ్ మరియు సెషన్ ఈవెంట్ లాగింగ్ ఇన్-హౌస్‌లో ఇన్‌స్ట్రుమెంట్ చేయబడింది మరియు noSql డేటాబేస్‌లకు నెట్టబడుతుంది. ప్రాక్టీస్ మరియు టెస్ట్ వంటి ప్రాపర్టీస్‌పై యూజర్ యాక్టివిటీ యొక్క రోజువారీ డేటా ఫ్రంట్ ఎండ్ ద్వారా క్వెరీ అగ్రిగేషన్‌ల కోసం DBలో నిల్వ చేయబడుతుంది.

డేటా ప్రాసెసింగ్

ప్రాథమిక డేటా సేకరణ జరిగిన తర్వాత, దానిని శుభ్రపరచడం, మెరుగుపరచడం, గని చేయడం మరియు దృశ్యమానం చేయడం అవసరం. Embibe వద్ద, మేము సేకరించే డేటాను ఉపయోగించడానికి మేము క్రింది విస్తృత విధానాలను కలిగి ఉన్నాము.

అంతర్గత రిపోర్టింగ్ మరియు తాత్కాలిక విశ్లేషణ:

  • Spark స్ట్రీమింగ్ మరియు Hadoop మ్యాప్‌ని ఉపయోగించి లాగ్ మైనింగ్ చేయడం ద్వారా AWS EMR ద్వారా ఉద్యోగాలను తగ్గించడం ద్వారా సెషన్ స్థాయి యాక్టివిటీని నిల్వ చేసే మా వినియోగదారు GOV డేటాను అలాగే ప్రతి వినియోగదారుకు అకడమిక్ ఎబిలిటీ ప్రొఫైల్‌లను ప్రతి కంటెంట్‌కు వ్యతిరేకంగా నిల్వ చేసే GAV డేటాను రూపొందించడానికి మరియు నవీకరించడానికి. GOV మరియు GAV డేటా స్కేల్‌లో అందించడానికి సాగే శోధన క్లస్టర్‌లలో నిల్వ చేయబడతాయి.
  • ట్రాఫిక్ నమూనాలు, వినియోగదారు మానిటైజేషన్, టెస్ట్-ఆన్-టెస్ట్ మెరుగుదల, శోధన వైఫల్యాలు మరియు ఇతర అవసరాల కోసం రిపోర్టింగ్ డేటాను రూపొందించడానికి లాగ్ మైనింగ్. ప్రాసెస్ చేయబడిన డేటా మళ్లీ సాగే శోధనలోకి నెట్టబడుతుంది మరియు కిబానా మరియు గ్రాఫానా డ్యాష్‌బోర్డ్‌లను ఉపయోగించి దృశ్యమానం చేయబడుతుంది.
  • తాత్కాలిక ప్రాతిపదికన నిర్వహించాల్సిన ఏదైనా అవసరమైన విశ్లేషణ కోసం ప్రాథమిక ముడి డేటా HDFS ద్వారా HBaseలో నిల్వ చేయబడుతుంది.
చిత్రం 1: Embibe యొక్క డేటా సైన్స్ ల్యాబ్ అభివృద్ధి చేసే ఇంటెలిజెన్స్‌కు శక్తినిచ్చే డేటా ఫ్లో స్టాక్ యొక్క ఉన్నత స్థాయి స్కీమాటిక్

వ్యాపారం/ఉత్పత్తి/మార్కెటింగ్ స్వీయ-సేవ కోసం మూడవ పక్షం సాధనాలు:

  • మా ఆన్-పేజ్ మరియు ఇన్-యాప్ యూజర్ ఇంటరాక్షన్ డేటా segment.io (థర్డ్ పార్టీ ప్లగ్ఇన్) ఉపయోగించి క్యాప్చర్ చేయబడుతుంది, ఇది డేటాను వివిధ బాహ్య డేటా విజువలైజేషన్ ప్లాట్‌ఫారమ్‌లకు ఆటో-రూట్ చేస్తుంది
  • ట్రాఫిక్ మూలాలు, జనాభా మరియు స్థాన సమాచారం, పరికరం విచ్ఛిన్నం, పేజీ వీక్షణలు, గడిపిన సమయం, నిలుపుదల కొలమానాలతో సహా విస్తృత స్థాయిలో ట్రాఫిక్ పర్యవేక్షణ కోసం Google Analytics.
  • వినియోగదారు ప్రవాహాల విశ్లేషణ మరియు ఆప్టిమైజేషన్ కోసం హీప్ అనలిటిక్స్. Segment.io ద్వారా అన్ని యూజర్ ఇంటరాక్షన్ ఈవెంట్‌లను హీప్‌కి నెట్టడానికి FE వైర్ చేయబడింది. వినియోగదారు మార్పిడి ఫన్నెల్‌లు మరియు ప్రవాహాల స్వీయ-సేవ శైలి డైనమిక్ సెటప్‌ను హీప్ అనుమతిస్తుంది.