సరికొత్త శక్తి వనరుగా డేటా
Embibe డేటా గురించి అమితంగా ఇష్టపడతారు – సాధనచేయడం, కొలత, సేకరించడం, మైనింగ్ మరియు ఆర్కైవ్ చేయడం. Embibe దాని డేటాను కలిగి ఉంది, మా IP దానిపై ఆధారపడి ఉంటుంది. Embibe లో, మా వినియోగదారులు మా ఉత్పత్తులతో ఎలా వ్యవహరిస్తారో, అలాగే నిర్దిష్ట ఫలితాలకు ఏ అంశాలు దారితీస్తాయో కొలవడానికి తగిన ఇన్స్ట్రుమెంటేషన్ అమలయ్యే వరకు మేము విడుదలను ఆలస్యం చేస్తాము. డేటాతో ఈ ముట్టడి వల్ల విద్యార్థులు ఎలా చదువుకుంటారు మరియు వారి లక్ష్యాలను ఎలా సాధిస్తారనే దానిపై అనేక అంతర్దృష్టితో కూడిన ఆవిష్కరణలకు దారితీసింది. ఉదాహరణకు, స్కోర్ చేసే విద్యార్థి యొక్క సంభావ్యత రెండు సెట్ల కారకాల కలయిక – వారి అభ్యసన సామర్థ్యం మొత్తం స్కోర్ చేసే సామర్థ్యంలో ~ 61%, మరియు వారి ప్రవర్తనా లక్షణాలు ~ 39% తోడ్పడతాయి. డేటా ఆధారితమైనదిగా ఉండే ఈ రేజర్-షార్ప్ ఫోకస్ విద్యను వ్యక్తిగతీకరించే ఉత్పత్తులను రూపొందించడానికి మరియు విద్యార్ధులకు అభ్యాస ఫలితాలలో అద్భుతమైన మెరుగుదలలను అందించడానికి Embibeని ఎనేబుల్ చేసింది.
ప్రాథమిక డేటా సేకరణ
Embibe ప్లాట్ఫారమ్లోని వివిధ దశలు మరియు స్థానాల్లో డేటా ఇన్స్ట్రుమెంట్ చేయబడింది మరియు సేకరించబడుతుంది. సరైన సమయంలో, సరైన సందర్భంలో, సరైన స్థాయి గ్రాన్యులారిటీతో సరైన రకమైన డేటాను సంగ్రహించినంత మాత్రాన డేటాను సంగ్రహించడం మాత్రమే అవసరం లేదు. Embibe వద్ద డేటా క్యాప్చర్ విస్తృతంగా క్రింది వర్గాలలోకి వస్తుంది:
రిచ్ ఈవెంట్ రకాల ఇన్స్ట్రుమెంటేషన్:
- వినియోగదారు పరస్పర చర్య స్పష్టమైన ఈవెంట్లు – క్లిక్లు, ట్యాప్లు, హోవర్లు, స్క్రోల్లు, వచన-నవీకరణలు
- వినియోగదారు పరస్పర చర్య అవ్యక్త సంఘటనలు – కర్సర్ స్థానం, ట్యాప్ ఒత్తిడి, పరికర ధోరణి, స్థానం
- సిస్టమ్-సృష్టించిన సర్వర్ సైడ్ ఈవెంట్లు – పేజీ లోడ్, సెషన్ రిఫ్రెష్లు, api కాల్లు
- సిస్టమ్-ఉత్పత్తి క్లయింట్ సైడ్ ఈవెంట్లు – సిస్టమ్ పుష్ నోటిఫికేషన్లు మరియు ట్రిగ్గర్లు
ప్రాపర్టీ చేత నిర్దిష్ట డేటా:
- పేజీ వీక్షణలు (URL, రెఫరర్, వినియోగదారు ఏజెంట్, పరికరం, IP, టైమ్స్టాంప్, ట్రాఫిక్ మూలం, ప్రచారం).
- ప్రాక్టీస్ ప్రయత్న స్థాయి డేటా (టైమ్స్టాంప్, సందర్శన/పునః సందర్శన, సమాధాన ఎంపిక, మొదట చూసిన సమయం, సరైనది, గడిపిన సమయం, వీక్షించిన పరిష్కారం, ఉపయోగించిన సూచన) – సెషన్ స్థాయిలో సమగ్రపరచబడింది.
ప్రవర్తన డేటాను తెలుసుకోండి:
- ఈవెంట్ డేటాను సెర్చ్ చేయండి (టైమ్స్టాంప్, ప్రశ్న, ఫలితం సెట్)
- ఫలితాల పరస్పర డేటా (టైమ్స్టాంప్, సూచించబడిన ఫలితం ఎంచుకోబడింది, ఫలితం విడ్జెట్ మరియు సందర్భం, విడ్జెట్ స్థానం)
- టెస్ట్ ప్రయత్న ఈవెంట్ స్థాయి డేటా (టైమ్స్టాంప్, సందర్శన/పునః సందర్శన, సమాధానం ఎంపిక, మొదట చూసిన సమయం, సరైనది, గడిపిన సమయం, వీక్షించిన అభిప్రాయం) – సెషన్ స్థాయిలో సమగ్రపరచబడింది
- అడగండి (అకడమిక్ ఫోరమ్) ప్రశ్న మరియు సమాధానాల వివరాలు, టైమ్స్టాంప్లు, వినియోగదారు ఓటింగ్ ప్రవర్తన
- చెల్లింపులు (యూజర్ ఐడెంటిఫైయర్, యూజర్ ఇమెయిల్, థర్డ్ పార్టీ పేమెంట్ గేట్వే, పేమెంట్ గేట్వే ట్రాన్సాక్షన్ ఐడెంటిఫైయర్, పేమెంట్ మోడ్ (కార్డ్, వాలెట్ మొదలైనవి), ఆర్డర్ రిక్వెస్ట్ టైమ్స్టాంప్, పేమెంట్ రియలైజేషన్ టైమ్స్టాంప్, వర్తించే ఏవైనా తగ్గింపులు, ఆర్డర్ ఐటెమ్ స్పెసిఫికేషన్లు).
Embibe చేసే స్కేల్లో డేటా సేకరణను ఇన్స్ట్రుమెంట్ చేసేటప్పుడు పరిగణించాల్సిన అనేక ఆచరణాత్మక అంశాలు ఉన్నాయి. ఉదాహరణకు, ఈ మొత్తం డేటాను సేకరించడానికి మేము అనేక పద్ధతులపై ఆధారపడతాము. segment.io మరియు Heap వంటి థర్డ్-పార్టీ ప్లగిన్లతో ఏకీకరణ చేయడం ద్వారా వినియోగదారు పరస్పర చర్య ఈవెంట్ స్ట్రీమ్ని లాగింగ్ చేయడం సాధ్యపడుతుంది. సర్వర్-సైడ్ పేజీ లోడ్ మరియు సెషన్ ఈవెంట్ లాగింగ్ ఇన్-హౌస్లో ఇన్స్ట్రుమెంట్ చేయబడింది మరియు noSql డేటాబేస్లకు నెట్టబడుతుంది. ప్రాక్టీస్ మరియు టెస్ట్ వంటి ప్రాపర్టీస్పై యూజర్ యాక్టివిటీ యొక్క రోజువారీ డేటా ఫ్రంట్ ఎండ్ ద్వారా క్వెరీ అగ్రిగేషన్ల కోసం DBలో నిల్వ చేయబడుతుంది.
డేటా ప్రాసెసింగ్
ప్రాథమిక డేటా సేకరణ జరిగిన తర్వాత, దానిని శుభ్రపరచడం, మెరుగుపరచడం, గని చేయడం మరియు దృశ్యమానం చేయడం అవసరం. Embibe వద్ద, మేము సేకరించే డేటాను ఉపయోగించడానికి మేము క్రింది విస్తృత విధానాలను కలిగి ఉన్నాము.
అంతర్గత రిపోర్టింగ్ మరియు తాత్కాలిక విశ్లేషణ:
- Spark స్ట్రీమింగ్ మరియు Hadoop మ్యాప్ని ఉపయోగించి లాగ్ మైనింగ్ చేయడం ద్వారా AWS EMR ద్వారా ఉద్యోగాలను తగ్గించడం ద్వారా సెషన్ స్థాయి యాక్టివిటీని నిల్వ చేసే మా వినియోగదారు GOV డేటాను అలాగే ప్రతి వినియోగదారుకు అకడమిక్ ఎబిలిటీ ప్రొఫైల్లను ప్రతి కంటెంట్కు వ్యతిరేకంగా నిల్వ చేసే GAV డేటాను రూపొందించడానికి మరియు నవీకరించడానికి. GOV మరియు GAV డేటా స్కేల్లో అందించడానికి సాగే శోధన క్లస్టర్లలో నిల్వ చేయబడతాయి.
- ట్రాఫిక్ నమూనాలు, వినియోగదారు మానిటైజేషన్, టెస్ట్-ఆన్-టెస్ట్ మెరుగుదల, శోధన వైఫల్యాలు మరియు ఇతర అవసరాల కోసం రిపోర్టింగ్ డేటాను రూపొందించడానికి లాగ్ మైనింగ్. ప్రాసెస్ చేయబడిన డేటా మళ్లీ సాగే శోధనలోకి నెట్టబడుతుంది మరియు కిబానా మరియు గ్రాఫానా డ్యాష్బోర్డ్లను ఉపయోగించి దృశ్యమానం చేయబడుతుంది.
- తాత్కాలిక ప్రాతిపదికన నిర్వహించాల్సిన ఏదైనా అవసరమైన విశ్లేషణ కోసం ప్రాథమిక ముడి డేటా HDFS ద్వారా HBaseలో నిల్వ చేయబడుతుంది.
వ్యాపారం/ఉత్పత్తి/మార్కెటింగ్ స్వీయ-సేవ కోసం మూడవ పక్షం సాధనాలు:
- మా ఆన్-పేజ్ మరియు ఇన్-యాప్ యూజర్ ఇంటరాక్షన్ డేటా segment.io (థర్డ్ పార్టీ ప్లగ్ఇన్) ఉపయోగించి క్యాప్చర్ చేయబడుతుంది, ఇది డేటాను వివిధ బాహ్య డేటా విజువలైజేషన్ ప్లాట్ఫారమ్లకు ఆటో-రూట్ చేస్తుంది
- ట్రాఫిక్ మూలాలు, జనాభా మరియు స్థాన సమాచారం, పరికరం విచ్ఛిన్నం, పేజీ వీక్షణలు, గడిపిన సమయం, నిలుపుదల కొలమానాలతో సహా విస్తృత స్థాయిలో ట్రాఫిక్ పర్యవేక్షణ కోసం Google Analytics.
- వినియోగదారు ప్రవాహాల విశ్లేషణ మరియు ఆప్టిమైజేషన్ కోసం హీప్ అనలిటిక్స్. Segment.io ద్వారా అన్ని యూజర్ ఇంటరాక్షన్ ఈవెంట్లను హీప్కి నెట్టడానికి FE వైర్ చేయబడింది. వినియోగదారు మార్పిడి ఫన్నెల్లు మరియు ప్రవాహాల స్వీయ-సేవ శైలి డైనమిక్ సెటప్ను హీప్ అనుమతిస్తుంది.