ఎంచుకున్న కఠినత స్థాయితో ప్రశ్నలను స్వయంగా రూపొందించడం

ఎంచుకున్న కఠినత స్థాయితో ప్రశ్నలను స్వయంగా రూపొందించడం

విద్యను వ్యక్తిగతీకరించడమే Embibe యొక్క ప్రధాన లక్ష్యం. ఈ క్రమంలోనే మా సాంకేతికత విద్యార్థికి సరైన సమయంలో సరైన కంటెంట్‌ని అందిస్తుంది. అత్యధిక ఉపయోగకరమైన కంటెంట్; ముఖ్యంగా ప్రశ్నలకు సులభంగా యాక్సెస్ ఇవ్వడానికి గల కారణం ఇదే. ఎందుకంటే ఇది మాకు చాలా ముఖ్యం కూడా. ప్రశ్నలకు సంబంధించి Embibe డేటాసెట్ అంతా మనుషులే డేటా ఎంట్రీ ద్వారా సమకూర్చారు. వారు ఆ ప్రశ్నలను ఇంటర్నెట్‌లో ఉన్న వివిధ వనరుల నుంచి లేదా మాకు అనుబంధమైన భాగస్వామ్య సంస్థల నుంచి సేకరించినవి.

ప్రశ్నలు వాటంతటవే ఉత్పత్తి అయ్యేలా చేయడం వెనుక ఉన్న ముఖ్య ఉద్దేశ్యం విద్యార్థులు ఉపాధ్యాయులపై ఆధారపడకుండా చేయడమే. బయట నుంచి ఎవరి సహాయం లేకుండానే తమంతట తాము సొంతంగా పలు అంశాలకు సంబంధించి వారి అభివృద్ధిని కొలిచేందుకు ఇది సహాయపడుతుంది. అనంతమైన ప్రశ్నలకు సులభమైన యాక్సెస్ ఇవ్వడం వలన విద్యార్థుల మేథోపరమైన స్థాయులను తెలుసుకోవడం (3), విద్యార్థులను పరీక్షించడం (4) లేదా లెర్నింగ్ అవుట్‌కమ్స్‌కి అవసరమైన కంటెంట్‌ని పూర్తిగా వ్యక్తిగతపరంగా మార్చడం (5) (6). వాటంతట అవి ఉత్పన్నమయ్యే ప్రశ్నలు విద్యార్థులను అభ్యాసం చేయడానికి మరియు వారి వృద్ధిని దశలవారీగా అంచనా వేయడానికి అనుమతిస్తుంది.

ఏది ఏమైనప్పటికీ విద్యార్థులకు మా వేదిక ద్వారా వారు మెరుగుపరుచుకోవాల్సిన అంశాలకు సంబంధించిన అభ్యాస ప్రశ్నలు పూర్తవడం అనేది ఖచ్చితంగా ఉండదు. ఇందుకోసం Embibe కృత్రిమ మేథస్సు ఆధారంగా వాటంతటవే ఉత్పన్నమయ్యే కొత్త ప్రశ్నలు మరియు వాటి సమాధానాలను అభివృద్ధి చేస్తుంది. కంటెంట్ క్లస్టరింగ్, టాపిక్ మోడలింగ్ మరియు న్యాచురల్ లాంగ్వేజ్ జనరేషన్ (NLG) మరియు సాల్వర్ టెక్నాలజీలను ఈ పని కోసం Embibe ఉపయోగిస్తుంది.

లక్ష్యం

Embibe వివిధ అంశాలకు సంబంధించి అభ్యాసం మరియు వాటిలో నిపుణత సాధించడానికి వీలుగా ఉండే ఒక ఫ్రేమ్‌వర్క్‌ని రూపొందిస్తుంది. దీని ద్వారా పరోక్షంగా ఆయా అంశాలను గుర్తుంచుకోవడమే కాదు.. వాటి మీద చక్కని అవగాహన కూడా పొందవచ్చు. వాటంతట అవి ఉత్పన్నమయ్యే ప్రశ్నలు అభ్యాసం చేసే టెక్ట్స్‌ని ఇన్‌పుట్‌గా తీసుకుంటాయి మరియు వాటి ఆధారంగా విద్యార్థుల తెలివితేటలకు మరింత పదునుపెట్టి, నేర్చుకునే విధంగా ఉండే ప్రశ్నలను ఉత్పన్నం చేస్తాయి.

న్యాచురల్ లాంగ్వేజ్ ప్రాసెసింగ్ (NLP)లో ప్రశ్నలు వాటంతట అవి ఉత్పన్నమవ్వడం అనేది ఒక భాగం. చాలామంది అధ్యయనకర్తలు వారి పనిని ప్రదర్శించిన విభాగం ఇది. అయితే ఇది ఇంకా ఖచ్చితత్వం పొందాల్సి ఉంది. చాలామంది అధ్యయనకర్తలు న్యాచురల్ లాంగ్వేజ్ ప్రాసెసింగ్ (NLP) మరియు వివిధ ప్రక్రియల ద్వారా ప్రశ్నలు వాటంతటవే ఉత్పత్తి అయ్యేలా చేస్తాయి. ఈ ప్రశ్నలకు సంబంధించిన నమూనాలు అభివృద్ధి కావడం ద్వారా అందులోని ప్రశ్నలకు కూడా వాటంతట అవి ఉత్పత్తి అవుతాయి.

అప్రోచ్

చిత్రం 1లో చూపించిన విధంగా ప్రశ్నలు వాటంతట అవి ఉత్పన్నం కావడానికి చాలా అధిక స్థాయిలో గల సామీప్యత అవసరం అవుతుంది. ఇవి NLP ప్రక్రియలతోపాటూ వివిధ పరివర్తన నమూనాలను సైతం ఉపయోగించుకుంటాయి. ఉత్పత్తి అయ్యే ప్రశ్నల నాణ్యత మరియు సంక్లిష్టతను పెంచడానికి వాక్య నిర్మాణం మరియు దాని అవగాహన పైన చేసిన అధ్యయన అభ్యాసం కూడా ఉపయోగపడుతుంది.

చిత్రం 1. వాటంతటవే ఉత్పన్నమయ్యే ప్రశ్నల యొక్క నిర్మాణం

వాటంతటవే ఉత్పన్నమయ్యే ప్రశ్నలనేవి టెక్ట్స్ ప్రాసెసింగ్, ఫీచర్ సంగ్రహణ, ఇంజినీరింగ్, నమూనా నిర్మాణం మరియు శిక్షణ, నమూనా మూల్యాంకనం, వ్యాఖ్య మరియు కొన్ని రకాల ప్రామాణిక ML ప్రక్రియలు మొదలైనవన్నీ కలిగి ఉండే ఒక పైప్‌లైన్.

ARC, DROP, QASC, SciQ, SciTail, SQuAD and Google NQ మరియు Embibe సొంతమైన డేటాసెట్లతో కలిపి దాదాపు 20+ బహిరంగ వనరులను మా QA నమూనాకు శిక్షణ ఇవ్వడానికి ఉపయోగించాం. బూలియన్, స్పాన్ ఆధారితమైనవి, ఖాళీలు పూరించండి, బహుళైచ్ఛిక ప్రశ్నలు.. మొదలైన వివిధ రకాల ప్రశ్నలను కూడా మేము ఉపయోగించాం. ఒక ప్రశ్న యొక్క కఠినతస్థాయి అనేది అది ఏర్పడిన వాక్య నిర్మాణం మీద ఆధారపడి ఉంటుంది. దీనికి సమాధానం చెప్పేందుకు మల్టీ హాప్ రీజనింగ్ ద్వారా దానిని విశదీకరించాల్సి ఉంటుంది. అప్పుడే ఆ అంశంలో ఎంత సంక్లిష్టత దాగి ఉందో తెలుస్తుంది.  మేము నాలెడ్జ్ గ్రాఫ్స్ ద్వారా సంబంధిత నాలెడ్జ్‌ని QG నమూనాలుగా అందిస్తుంది. ఇవి KI-BERT[1] ప్రేరణ పొందినవి. మేము స్థానికంగా నిర్మించిన న్యాచురల్ లాంగ్వేజ్ అండర్‌స్టాండింగ్ ప్రక్రియల ద్వారా ప్రశ్నలు ఉత్పన్నమయ్యే పెర్ఫార్మెన్స్‌ని మెరుగుపరిచాం.

ఇచ్చిన సందర్భం నుంచి ప్రశ్న మరియు సమాధానానికి సంబంధించిన టెక్ట్స్ ఉత్పత్తి చేయడానికి T5[2] వంటి ఉత్పన్న నమూనాలను మేము ఉపయోగిస్తాం. ఈ ఫ్లో ఎలా ఉంటుందో ఇక్కడ చూడచ్చు.

చిత్రం 2. QG నమూనా వర్క్‌ఫ్లో

ఫలితం

Embibe కృత్రిమ మేథస్సు ఆధారిత వేదిక విద్యార్థుల కోసం పుస్తకాల నుంచి వీలైనన్ని ప్రశ్నలను ఉత్పత్తి చేయడానికి పని చేస్తుంది. అన్ని గ్రేడ్లు, లక్ష్యాలు, పరీక్షలు, స్టేట్ బోర్డ్స్.. ఇలా ఇప్పటివరకు వివిధ విభాగాలను పరిగణనలోకి తీసుకుని సుమారు 125వేల ప్రశ్నలను 6 నుంచి 12వ తరగతికి చెందిన NCERT పుస్తకాల నుంచి ఉత్పత్తి చేశారు.

జీవితంలో ఏ విభాగం మరియు లక్ష్యాన్ని సాధించడానికైనా మరియు అభ్యాస ఫలితాలను వాస్తవ పరిస్థితుల్లో చూడడానికైనా ఈ వ్యవస్థను ఉపయోగిస్తారు. మేము విభాగాలను మరింత నిర్దిష్టంగా చేసేందుకు మరియు ఆధునిక NLP ప్రాంతంలో వ్యవస్థను సరళీకృతం చేస్తున్నాం. తద్వారా ఒక నమూనాని రూపొందించే మార్గాన్ని అన్వేషిస్తున్నాం.

డొమైన్‌కి నిర్దిష్టంగా ఇచ్చే ఇన్‌పుట్ మరియు ఉత్పన్నమయ్యే ప్రశ్నల సెట్‌కు ఇక్కడ మేం కొన్ని ఉదాహరణలు ఇచ్చాం.

విద్యాపరమైన టెక్ట్స్:

చిత్రం 3. ఎంచుకున్న పేరా మరియు ప్రత్యేకంగా చూపిన ఏడీపీఈ

ఉత్పన్నమైన ప్రశ్నలు:

చిత్రం 4. QG ఎంపిక చేసుకున్న పారాగ్రాఫ్ నుంచి నమూనా ద్వారా ఉత్పన్నమైన ప్రశ్నలు

రెఫెరెన్స్
[1] Faldu, Keyur, Amit Sheth, Prashant Kikani, and Hemang Akabari. “KI-BERT: Infusing Knowledge Context for Better Language and Domain Understanding.” arXiv preprint arXiv:2104.08145 (2021).

[2] Colin Raffel, Noam Shazeer, Adam Roberts, Katherine Lee, Sharan Narang, Michael Matena, Yanqi Zhou, Wei Li, Peter J. Liu. “Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer”