इंटेलिजन्ट कॉन्टेन्ट अंतर्भूत करणे

इंटेलिजन्ट कॉन्टेन्ट अंतर्भूत करणे

विद्यार्थी Embibe च्या प्लॅटफॉर्मवर अमर्यादित प्रश्न सोडवू शकतात हे अगदी खरे आहे. विद्यार्थ्यांना प्रॅक्टिस करता यावी तसेच मूलतयमापन करता यावे यासाठी Embibe कडे प्रश्नांचा मोठा डेटासेट उपलब्ध आहे. तसेच, या प्रश्नांना प्रणालीमध्ये अंतर्भूत करणे ही एक त्रासदायक आणि वेळखाऊ प्रक्रिया आहे.

गतकाळात अशा प्रकारचा प्रश्नांचा डेटासेट हा मानवी डेटा एंट्री ऑपरेटर द्वारे तयार केला जायचा. यामधले प्रश्न हे इंटरनेट वर विनामूल्य उपलब्ध असलेल्या विविध प्रश्न संचांमधून किंवा आमच्या बरोबर जोडल्या गेलेल्या भागीदार संस्थेकडून घेतले जात असत. वेब आधारीत UI मध्ये हे प्रश्न हाताने लिहीले जायचे व मग हा डेटा Embibe च्या डेटाबेस मध्ये साठवला जातो आणि मग तो विद्यार्थ्यांना सेवा देण्यासाठी उपलब्ध होण्यापूर्वी इतर डाउनस्ट्रीम मॉड्यूल्ससाठी उपलब्ध केला जातो.

डेटा एंट्री ऑपरेटर ज्या प्रश्न इनपुट प्रक्रियेचे अनुसरण करतील त्यामध्ये सामान्यत: एकापेक्षा जास्त विस्तृत स्टेप समाविष्ट आहेत:

  • प्रश्नांचा प्रकार शोधणे
  • प्रश्नाच्या मुख्य भागाची माहिती टाईप करणे
  • गणितीय आणि वैज्ञानिक चिन्हे आणि नोटेशन्सचे फॉरमॅटिंग
  • प्रश्नांमधील चित्र आणि आकृत्या ओळखणे
  • योग्य रिझोल्यूशनवर इमेज काढणे 
  • इमेज टॅगसह प्रश्नांमध्ये त्यांची स्थाने चिन्हांकित करणे
  • एक किंवा अनेक उत्तरे असलेल्या प्रश्न प्रकारांच्या उत्तराच्या पर्यायांची यादी बनवणे
  • योग्य उत्तराचा पर्याय जर दिला असेल तर नोंद करणे आणि
  • स्त्रोत डॉक्युमेंटमध्ये उपस्थित असल्यास प्रश्न सोडवण्यासाठी उत्तर स्पष्टीकरण, हिंट्स आणि/किंवा सूचना यांसारख्या विविध माहिती नोंद (रेकॉर्ड) करणे

ही प्रक्रिया ऑटोमेशनसाठी योग्य आहे व यामुळे कॉन्टेन्ट अंतर्ग्रहण सहजतेने वाढू शकते ज्यामुळे खर्च कमी होतो. शेकडो अभ्यासक्रमांमध्ये आम्ही आमचे कॉन्टेन्ट हजारो परीक्षांसाठी उपलब्ध केला असल्यामुळे, कॉन्टेन्ट स्वयंचलित करणे आणि प्रश्न अंतर्भूत  करणे ही काळाची गरज बनली आहे.

Embibe ने एक इन-हाऊस अंतर्भूत प्रणाली विकसित केली आहे – एक असे हायब्रीड पार्सर(विश्लेषक) फ्रेमवर्क ज्याला एकापेक्षा जास्त इनपुट टेम्पलेटमध्ये वेगाने रुपांतरित केले जाऊ शकते. फ्रेमवर्कचे सर्व मॉड्यूल स्वयंपूर्ण असून ते सुलभ सुधारणेची आणि बदलण्याची परवानगी देतात. जेव्हा नवीन टेम्पलेट शैली अंतर्भूत करणे आवश्यक असते, तेव्हा प्रत्येक मॉड्यूल स्वतंत्र डेव्हलपर्सद्वारे वेगाने अद्ययावत केले जाऊ शकते. हे  टेक्स्ट नमुना जुळणारे आणि पार्सर(विश्लेषक)/एक्सट्रॅक्टर स्क्रिप्ट अद्ययावत करतात.

ही विशिष्ट पायरी एक मॅन्युअल प्रक्रिया असली तरी, ती आम्हाला अंतर्ग्रहण करण्याच्या कॉन्टेन्टच्या कव्हरेज च्या तुलनेत  नवीन अंतर्ग्रहण टेम्पलेट्ससाठी उपाय रोल आउट करण्याची गती यांच्यादरम्यान एक स्वीकार्य तडजोड साध्य करण्यास मदत करते. खालील आकृती 1 हायब्रिड पार्सर फ्रेमवर्कमधील विविध उप-प्रणाली दर्शविते.

आकृती 1: ऑटोमेटेड कॉन्टेन्ट अंतर्भूत होण्यासाठी  Embibeच्या हायब्रिड पार्सर फ्रेमवर्कचे योजनाबद्ध विहंगावलोकन

खाली तक्ता 1 मध्ये दाखवल्याप्रमाणे आम्ही फ्रेमवर्कचे कार्यप्रदर्शन रिकॉल आणि अचूकता मोजली आहे. इच्छित रिकॉल दर नियंत्रित करून आम्ही स्वीकार्य अशा अचूकता दरांवर ट्रेड-ऑफवर पोहोचू शकतो.