ব্যক্তিগতকৃত সন্ধানৰ বাবে লাৰ্ণিং-টু ৰেংক

Embibeয়ে শিক্ষাৰ্থীসকলক তেওঁলোকৰ শিকনৰ  ফলাফল উন্নত কৰাত সহায় কৰে আৰু তেওঁলোকৰ প্ৰয়োজনীয় সমল বিচাৰি উলিওৱাৰ মুখ্য পদ্ধতি হৈছে মেনু-চালিত নেভিগেশ্বন প্ৰণালীৰ সলনি Embibeৰ ব্যক্তিগতকৃত চাৰ্চ ইঞ্জিন ব্যৱহাৰ কৰা। ৱেব সন্ধানৰ অগ্ৰগতিৰ সৈতে, ব্যৱহাৰকাৰীসকলে আজি আশা কৰে যে সন্ধান ফলাফলৰ প্ৰথম পৃষ্ঠাত তেওঁলোকে বিচৰা সঠিক তথ্য অন্তৰ্ভুক্ত থাকিব।

Embibeত সমলৰ পৰিমাণ হ’ল বৃহৎ আৰু ইয়াত অন্তৰ্ভুক্ত থাকে অধ্যয়ন সামগ্ৰী, ভিডিঅ’, অনুশীলনী প্ৰশ্ন, পৰীক্ষা, প্ৰবন্ধ আৰু বাতৰি, পৰীক্ষা, বিষয়, একক, অধ্যায়, ধাৰণা। ব্যৱহাৰকাৰীসকলক যিমান সম্ভৱ কাৰ্যকৰী সমলৰ সন্মুখীন কৰিবলৈ, সন্ধান ফলাফলবোৰ উইজেট ছেটৰ ৰূপত উপস্থাপন কৰা হয়। প্ৰতিটো উইজেটে সন্ধান ফলাফলৰ পৰা উদ্ধাৰ কৰা ফলাফলৰ এক সংগ্ৰহ প্ৰতিনিধিত্ব কৰে, সম্পৰ্কিত কাৰ্যকৰী লিংক আৰু সম্পৰ্কিত জ্ঞান লেখ্চিত্ৰ নোডৰ দ্বাৰা একেলগে গোট কৰা হয়। Embibeৰ সকলো সমলৰ সৈতে বিভিন্ন উইজেট প্ৰকাৰ জড়িত থাকে, আৰু কোহ’ৰ্ট-স্তৰৰ ব্যৱহাৰকাৰীৰ বিশেষত্বৰ সৈতে, ই আমাৰ সন্ধান স্থানক ব্যৱহাৰকাৰীক ঘূৰাই দিয়াৰ আগতে বাছনি কৰিবলগা ~120 নিযুত নথিপত্ৰৰ সংমিশ্ৰণলৈ সম্প্ৰসাৰিত কৰে। Embibeত সন্ধান ফলাফলৰ সৈতে ঐতিহাসিক ব্যৱহাৰকাৰীৰ আদান-প্ৰদানৰ ট্ৰেণ্ড বিশ্লেষণে দেখুৱায় যে ব্যৱহাৰকাৰীসকলে প্ৰথম পৃষ্ঠাত শীৰ্ষ উইজেট স্থিতিত আটাইতকৈ প্ৰাসঙ্গিক তথ্য আশা কৰে। সেয়েহে, ফলাফল উইজেটৰ ক্ৰমে আমাৰ ব্যৱহাৰকাৰীসকলৰ বাবে সন্ধান অধিক আকৰ্ষণীয় কৰাত আৰু আমাৰ সন্ধান ফলাফলৰ মানদণ্ড উন্নত কৰাত এক গুৰুত্বপূৰ্ণ ভূমিকা পালন কৰে।

লাৰ্ণিং-টু-ৰেংক [1] হৈছে এক তত্বাৱধান কৰা যন্ত্ৰ শিক্ষণ সমস্যা যাক অনুসন্ধান ফলাফলৰ বাবে স্বয়ংক্ৰিয়ভাৱে ৰেংকিং আৰ্হি এটা নিৰ্মাণ কৰিবলৈ ব্যৱহাৰ কৰিব পাৰি। প্ৰতিটো প্ৰশ্নৰ বাবে, সকলো সম্পৰ্কিত নথিপত্ৰ সংগ্ৰহ কৰা হয়। এই নথিপত্ৰবোৰৰ প্ৰাসংগিকতা সাধাৰণতে মানৱ মূল্যায়ন বা বিচাৰৰ ৰূপত প্ৰশিক্ষণ তথ্য হিচাপে প্ৰদান কৰা হয়। এই নথিৰ প্ৰাসংগিকতা তাৰ পিছত সকলো প্ৰশ্নৰ ওপৰত গড় ৰেংকিং ফলাফল আৰু প্ৰাসংগিক বিচাৰৰ মাজৰ পাৰ্থক্য হ্ৰাস কৰাৰ এক অপ্টিমাইজেচন লক্ষ্যৰ সৈতে লাৰ্ণিং-টু-ৰেংক আৰ্হিক প্ৰশিক্ষণ দিবলৈ ব্যৱহাৰ কৰা হয়।

চিত্ৰ 1: Embibeৰ ব্যক্তিগতকৃত সমল আৱিষ্কাৰ ইঞ্জিনৰ সন্দৰ্ভত লাৰ্ণিং-টু-ৰেংক। এগৰাকী ব্যৱহাৰকাৰীয়ে Embibeত ব্যক্তিগতকৃত সমল আৱিষ্কাৰ ইঞ্জিনলৈ এটা প্ৰশ্ন কৰে। ফলাফলবোৰ ইলাষ্টিকচাৰ্চ গোটৰ পৰা পুনৰুদ্ধাৰ কৰা হয় আৰু ফলাফলবোৰৰ পৰা উইজেট ছেট নিৰ্মাণ কৰা এক প্ৰক্ৰিয়াকৰণ-অন্ত স্তৰলৈ প্ৰেৰণ কৰা হয়। ব্যৱহাৰকাৰী ব্যক্তিগতকৰণ স্তৰে ব্যৱহাৰকাৰী, প্ৰশ্ন আৰু উইজেট সুবিধাৰ ওপৰত ভিত্তি কৰি উইজেট ছেটবোৰ পুনৰ ৰেংক কৰিবলৈ লাৰ্ণিং-টু-ৰেংক আৰ্হি এটা ব্যৱহাৰ কৰে। লাৰ্ণিং-টু-ৰেংক আৰ্হি হৈছে এক তত্বাৱধান কৰা মেচিন লাৰ্ণিং আৰ্হি যি ফলাফল উইজেটত ব্যৱহাৰকাৰীৰ ক্লিকৰ পূৰ্বানুমান কৰাৰ দৰে উইজেট ৰেংকিঙৰ সমস্যাটো কটায়। ব্যৱহাৰকাৰীয়ে কৰা প্ৰশ্নৰ বিপৰীতে উইজেটত ঐতিহাসিক ব্যৱহাৰকাৰী ক্লিক ব্যৱহাৰ কৰি আৰ্হিটো প্ৰশিক্ষণ দিয়া হয়।

যিহেতু Embibeৰ ফলাফলবোৰ উইজেটত গোট কৰা হয়, যিবোৰ প্ৰথম-অৰ্ডাৰৰ ফলাফলৰ পৰা প্ৰশ্নলৈ সম্প্ৰসাৰিত কৰা হয়, ৰেংকিং ফাংচনটো উইজেটত প্ৰয়োগ কৰিব লাগিব। সেয়েহে, আমাৰ ব্যৱহাৰৰ ক্ষেত্ৰত, যিকোনো পূৰ্ব-বিদ্যমান চাৰ্চ ইঞ্জিন যি বিল্ট-ইন লাৰ্ণিং-টু-ৰেংক কাৰ্যক্ষমতা প্ৰদান কৰে, যেনে ইলাষ্টিকচাৰ্চ v6.0 ৰ ওপৰলৈ, সমাধানটো প্ৰদান কৰিবলৈ সক্ষম নহ’ব। ব্যৱহাৰকাৰীৰ প্ৰশ্নৰ ওপৰত ভিত্তি কৰি সমল পৰিৱেশন কৰা আমাৰ ব্যক্তিগতকৃত চাৰ্চ ইঞ্জিনে, ব্যৱহাৰকাৰীৰ কোহ’ৰ্ট এছাইনমেণ্ট, ঐতিহাসিক সন্ধান প্ৰৱণতা, সমল ব্যৱহাৰৰ প্ৰকাৰ, পৰীক্ষা-আধাৰিত সমলৰ গুৰুত্ব আৰু অতীতৰ ব্যৱহাৰকাৰীৰ আদান-প্ৰদানৰ ওপৰত ভিত্তি কৰি প্ৰথম-অৰ্ডাৰৰ ফলাফলবোৰ ৰেংক কৰে, এনে 25 টা ওজনৰ কাৰকৰ ভিতৰত।

যদিও এই পদ্ধতিটোৱে অতীতৰ ব্যৱহাৰকাৰীৰ ওপৰত ভিত্তি কৰি ভালদৰে কাম কৰে, ই প্ৰশ্ন-আধাৰিত ব্যৱহাৰকাৰীৰ আদান-প্ৰদান বা প্ৰশ্ন-নথিপত্ৰ উপস্থাপন কৰা বা বিশেষকৈ আমাৰ ব্যৱহাৰ-ক্ষেত্ৰত, প্ৰশ্ন-উইজেট যোৰবোৰ উচ্চ মাত্ৰিক স্থানত আৰু ব্যৱহাৰকাৰীৰ প্ৰশ্নৰ সৈতে তেওঁলোকৰ প্ৰাসংগিকতা প্ৰক্ষেপ কৰাৰ কথা বিবেচনা নকৰে। লাৰ্ণিং-টু-ৰেংক ফ্ৰেমৱৰ্কে n-মাত্ৰিক স্থানত এটা প্ৰশ্নৰ বিপৰীতে নিৰ্ধাৰিত ফলাফল উপস্থাপন কৰি আৰু সমস্যাটো কযন্ত্ৰ শিক্ষণ সমস্যা যেনে প্ৰত্যাৱৰ্তন বা শ্ৰেণীবিভাজন বা মূল্যাঙ্কন মাপকাঠি সৰল কৰি ৰেংকিং শিকি এই ত্ৰুটিটো সমাধান কৰে।

সাধাৰণতে, লাৰ্ণিং-টু-ৰেংক সূত্ৰই প্ৰশ্ন-নথিপত্ৰ যোৰ বা তালিকাত কাম কৰে। আমাৰ ক্ষেত্ৰত, যিহেতু প্ৰতিটো প্ৰশ্নই বিভিন্ন ধৰণৰ উইজেট প্ৰকাৰ প্ৰস্তুত কৰিব আৰু আমি ব্যৱহাৰকাৰীসকলৰ বাবে ৰেংকিং ব্যক্তিগতকৰণ কৰিব বিচাৰো, আমি তিনিটা শ্ৰেণীৰ সুবিধা বিবেচনা কৰিছোঁ; অৰ্থাৎ ব্যৱহাৰকাৰী, প্ৰশ্ন আৰু উইজেট। আমি ব্যৱহাৰকাৰী প্ৰ’ফাইল, প্ৰশ্ন তথ্য আৰু ফলাফলৰ পৰা পুনৰুদ্ধাৰ কৰা শীৰ্ষ উইজেটৰ সংমিশ্ৰণৰ পৰা সুবিধা ব্যৱহাৰ কৰি ব্যৱহাৰকাৰী এগৰাকীয়ে কৰা প্ৰতিটো প্ৰশ্নৰ বিপৰীতে আমাৰ তথ্য প্ৰতিনিধিত্ব কৰোঁ। উইজেটৰ বাবে সুবিধাবোৰৰ ভিতৰত আছে উইজেটৰ প্ৰকাৰ, উইজেট উলম্ব, ঐতিহাসিক ব্ৰাউজ জনপ্ৰিয়তা, কুৱেৰী চৰ্তাৱলী উইজেট নামৰ সৈতে মিলা হয় নে নাই ইত্যাদি। প্ৰশ্নটোৰ বাবে বিশেষত্ববোৰৰ ভিতৰত আছে নিৰ্দিষ্ট অভিপ্ৰায় চিনাক্ত কৰা হৈছে নেকি, প্ৰশ্নৰ দৈৰ্ঘ্য, কুৱেৰীটোৰ শব্দ কম্পনাঙ্ক-বিপৰীত দস্তাবেজ কম্পনাঙ্ক বৈশিষ্ট্য ইত্যাদি। ব্যৱহাৰকাৰীৰ ব্যক্তিগতকৰণৰ হিচাপ ৰখাৰ বাবে, আমি ব্যৱহাৰকাৰীৰ সুবিধা যেনে ব্যৱহাৰকাৰীৰ ব্যস্ততা দল, ব্যৱহাৰকাৰীৰ প্ৰদৰ্শন দল, ব্যৱহাৰকাৰীৰ প্ৰাথমিক লক্ষ্য ইত্যাদিও অন্তৰ্ভুক্ত কৰোঁ। অন্বেষণমূলক ডাটা বিশ্লেষণ ব্যৱহাৰ কৰি, পাৰস্পৰিক তথ্য স্কোৰ [2] আৰু মাত্ৰাহ্ৰাস অধ্যয়ন কৰি অপ্ৰয়োজনীয় সুবিধাবোৰ আঁতৰ কৰা হয়।

আমি লাৰ্ণিং-টু-ৰেংকক এক পূৰ্ৱাভাস সমস্যালৈ হ্ৰাস কৰিছো য’ত আমি ব্যৱহাৰকাৰী, প্ৰশ্ন আৰু উইজেট সুবিধাবোৰ ৰখাৰ বাবে ব্যৱহাৰকাৰীয়ে এটা নিৰ্দিষ্ট উইজেটত সম্ভাৱনা ক্লিক কৰাৰ পূৰ্বানুমান কৰোঁ। ঐতিহাসিক ব্যৱহাৰকাৰীৰ প্ৰশ্ন আৰু পৰৱৰ্তী ক্লিক ইণ্টাৰেক্সন তথ্য ব্যৱহাৰ কৰি, আমি ক্লিক কৰা স্থিতিত আৰু তাৰ ওপৰত উইজেটবোৰ বিবেচনা কৰোঁ। ই আমাক ঐতিহাসিকভাৱে নিৰ্ধাৰিত তথ্যৰ তুলনামূলকভাৱে সন্তুলিত বিতৰণ প্ৰদান কৰে, ব্যৱহাৰকাৰীসকলে উচ্চতৰ উইজেটত ক্লিক কৰাৰ প্ৰৱণতা থাকে। শ্ৰেণীবিভাজন এলগ’ৰিথম এটা ব্যৱহাৰ কৰি আমি উইজেট এটাত ক্লিক কৰাৰ সম্ভাৱনা পূৰ্বানুমান কৰিব পাৰোঁ, আৰু এই পদ্ধতিটোৱে আৰম্ভ কৰিবলৈ এক ভাল বেচলাইন প্ৰদান কৰে য’ত ফলাফলবোৰ অধিক পুনৰাবৃত্তিৰ বাবে সহজে ব্যাখ্যা কৰিব পাৰি। সেয়েহে, আমি এই পদ্ধতিৰ বাবে আমাৰ প্ৰথম পচন্দ হিচাপে ল’জিষ্টিক প্ৰত্যাক্ৰমণ [3] বাছনি কৰিছিলোঁ।

আমাৰ পৰীক্ষাবোৰৰ বাবে, লক্ষ্য আছিল অনুমান কৰা এটা নিৰ্দিষ্ট অৱস্থানত ৱিডগেট এটা ক্লিক্‌ কৰা হ’ব নে নাই উপভোক্তা আৰু প্ৰশ্নৰ কোনো মিশ্ৰণৰ বাবে। আমি আৰম্ভ কৰিছিলোঁ কেৱল সাংখ্যিক বৈশিষ্ট্য লৈ যেনে ব্ৰাউচ জনপ্ৰিয়তা, পৰীক্ষা ওজন, প্ৰশ্ন দৈৰ্ঘ্য আদি আৰু এয়া ব্যৱহাৰ কৰিছিলোঁ ভেটি প্ৰদৰ্শন হিচাপে। উন্নত বৈশিষ্ট্যত শ্ৰেণীগত তথ্য যেনে ৱিডগেটৰ প্ৰকাৰ, উপভোক্তা গোট, প্ৰশ্নৰ লক্ষ্য আদি যোগ কৰি ~6% উন্নতি পালোঁ সঠিকতা আৰু নিৰ্ভুলতা দুয়োতে ক্লিক্‌ অনুমান কাৰ্যত। আমি তাৰ পিছত প্ৰশ্নবোৰৰ পৰা আহৰণ কৰা শীৰ্ষ 1,500 TF-IDF যোগ কৰিলোঁ, যি আৰ্হিটোৰ সঠিকতা ~1% বৃদ্ধি কৰিলে এয়া উল্লেখ কৰি যে আন পাঠ বৈশিষ্ট্য আহৰণ কৰাৰ প্ৰয়োজন নাই প্ৰশ্নৰ পৰা উন্নত প্ৰদৰ্শনৰ বাবে। এই পদ্ধতি প্ৰদৰ্শন এক ভেটি হিচাপে ব্যৱহাৰ কৰা হ’ব পৰৱৰ্তী গৱেষণা পুনৰাবৃত্তিত এম্বাইবৰ ব্যক্তিগতকৰণ বিষয়বস্তু আৱিষ্কাৰ ইঞ্জিনৰ মান নিৰ্ণয় শিক্ষাৰ বাবে।

প্ৰসঙ্গসমূহ:

1.        Liu T., “Learning to rank for information retrieval.”, Foundations and Trends® in Information Retrieval 3.3 (2009): 225-331.

2.        Kraskov A., Stögbauer K. and Grassberger P., “Estimating mutual information.”, Physical review E 69.6 (2004): 066138

3.        Cox D. R., “The regression analysis of binary sequences.”, Journal of the Royal Statistical Society. Series B (Methodological) (1958): 215-242.