വ്യക്തിഗത തിരയലിനായി ‘ലേർണിംഗ്- ടു റാങ്ക്’

വിദ്യാർത്ഥികൾക്ക് വ്യക്തിപരമായി ഉണ്ടായിരിക്കേണ്ട പഠനാനുഭവങ്ങൾ മെച്ചപ്പെടുത്തുന്നതിന് എംബൈബ് സഹായിക്കുന്നു. ഇതിനായി മെനു അടിസ്ഥാനമാക്കിയുള്ള സൂചകങ്ങൾക്കു പകരം വ്യക്തിഗത സെർച്ച് എൻജിൻ ഉപയോഗിച്ച് ആവശ്യമായ ഉള്ളടക്കങ്ങൾ കണ്ടെത്തുന്നതിനുള്ള സംവിധാനമാണ് എബൈബിലുള്ളത്.

പഠന സാമഗ്രികൾ, വീഡിയോകൾ, പരിശീലന ചോദ്യങ്ങൾ, ലേഖനങ്ങൾ, വാർത്താ ശകലങ്ങൾ, പരീക്ഷയുമായി ബന്ധപ്പെട്ട വിഷയങ്ങൾ, യൂണിറ്റുകൾ, അധ്യായങ്ങൾ, ആശയങ്ങൾ എന്നിങ്ങനെ എംബൈബിലെ ഉള്ളടക്കങ്ങളുടെ അളവ് വളരെ വലുതാണ്. കഴിയുന്നത്ര ഉള്ളടക്കങ്ങൾ ഉപഭോക്താവിലേക്ക് എത്തിക്കുന്നതിനായി  വിവരങ്ങളുടെ ചെറിയ കൂട്ടങ്ങളായാണ് [വിഡ്ജറ്റ് സെറ്റ്] തിരച്ചിൽ ഫലങ്ങൾ നൽകുക. ഇത്തരത്തിൽ ലഭിക്കുന്ന ഓരോ വിവരങ്ങളും അതുമായി ബന്ധപ്പെട്ട് പ്രവർത്തന ക്ഷമമായ ഇൻ്റർനെറ്റ് ലിങ്കുകളിലേക്കും നോളജ് ഗ്രാഫ് നോഡുകളിലേക്കും ബന്ധപ്പെടുത്തിയിട്ടുണ്ടാകും. എംബൈബിലെ എല്ലാ ഉള്ളടക്കങ്ങൾക്കും അതുമായി ബന്ധപ്പെട്ട് വ്യത്യസ്ത തരത്തിലുള്ള വിഡ്ജെറ്റുകളുണ്ടാകും. കോഹോർട്ട് ലെവൽ ഉപഭോക്തൃ സവിശേഷതകൾക്കൊപ്പം തിരഞ്ഞെടുക്കേണ്ട 120 ദശലക്ഷം ഡോക്യുമെൻ്റുകളുടെ കൂടിച്ചേരലിലേക്ക് ഇത് നിങ്ങളുടെ തിരയൽ ഇടത്തെ വിപുലീകരിക്കും. കൂടാതെ ഉപഭോക്താവിലേക്ക് തിരികെ നൽകുന്നതിനു മുമ്പ് വിഡ്ജെറ്റുകൾക്ക് റാങ്ക് നൽകുകയും ചെയ്യുന്നു. പ്രസക്തമായ വിവരങ്ങൾ ആദ്യപേജിൽ തന്നെ പ്രധാന വിഡ്ജറ്റുകളായി ലഭിക്കണമെന്ന് ഉപഭോക്താക്കൾ ആഗ്രഹിക്കുന്നതായി, എംബൈബിലെ തിരച്ചിൽ ഫലങ്ങളും കാലങ്ങളായുള്ള ഉപഭോക്താക്കളുടെ ഇടപെടലും അടിസ്ഥാനമാക്കിയുള്ള ട്രൻഡ് വിശകലനത്തിലൂടെ വ്യക്തമാണ്. അതിനാൽ ഉള്ളടക്കങ്ങളുടെ തിരച്ചിൽ ആകർഷകമാക്കുന്നതിൽ വിഡ്ജറ്റുകളുടെ സ്ഥാനം പ്രധാന പങ്കു വഹിക്കുന്നു. ഒപ്പം തിരച്ചിൽ ഫലങ്ങളുടെ ഗുണനിലവാരം മെച്ചപ്പെടുത്തുകയും ചെയ്യുന്നു.

മെഷ്യൻ ലേണിംഗിൻ്റെ സഹായത്തോടെയുള്ള പ്രവർത്തനമാണ് ലേൺ-ടു-റാങ്ക്. . തിരച്ചിൽ ഫലങ്ങൾക്കായുള്ള റാങ്കിംഗ് മോഡൽ സ്വയം നിർമിക്കാൻ ഇവ ഉപയോഗിക്കാം. ഓരോ അന്വേഷണങ്ങൾക്കും അതുമായി ബന്ധപ്പെട്ട രേഖകൾ ശേഖരിക്കും. വിലയിരുത്തലുകളുടേയോ വിധിന്യായങ്ങളുടേയോ രൂപത്തിൽ പരിശീലന വിവരങ്ങളായാണ് ഈ രേഖകൾക്ക് പ്രാധാന്യം നൽകുന്നത്. റാങ്കിംഗ് ഫലങ്ങളും റെലവൻസ് ജഡ്ജ്മെൻ്റും തമ്മിലുള്ള വ്യത്യാസം കുറയ്ക്കുക എന്ന അനുകൂല ലക്ഷ്യത്തോടൊപ്പം, ലേർണിംഗ്-ടു-റാങ്കിംഗ് പരിശീനത്തിനായും ഈ രേഖകൾ ഉപയോഗിക്കാം.

ചിത്രം1: എംബൈബിൻ്റെ വ്യക്തിഗത കണ്ടൻ്റ് ഡിസ്ക്കവറി എൻജിൻ പശ്ചാത്തലത്തിലുള്ള ലേർണിംഗ്-ടു- റാങ്ക്.

എംബൈബിലെ വ്യക്തിഗത കണ്ടൻ്റ് ഡിസ്ക്കവറി എൻജിനിലൂടെ ഒരു ഉപഭോക്താവ് അന്വേഷണം നടത്തുന്നു.  ഈ അന്വേഷണത്തിനുള്ള  ഉത്തരങ്ങൾ ഒരു ഇലാസ്റ്റിക് സെർച്ച് ക്ലസ്റ്ററിലൂടെ കണ്ടെത്തുകയും അവ പോസ്റ്റ് പ്രോസസിംഗ് ലെയറിലൂടെ കൈമാറ്റപ്പെട്ട് വിഡ്ജെറ്റുകളായി രൂപപ്പെടുകയും ചെയ്യുന്നു. ഉപഭോക്താവിൻ്റെ അന്വേഷണവും വിഡ്ജെറ്റിൻ്റെ പ്രത്യേകതകളും അടിസ്ഥാനമാക്കി അവയെ പുനർ റാങ്കിംഗ് നടത്തുകയും ഇതിനായി യൂസർ പേർസണലൈസേഷൻ ലെയറിൽ ലേർണിംഗ്-ടു- റാങ്ക് പദ്ധതി ഉപയോഗിക്കുകയും ചെയ്യുന്നു. മെഷീൻ ലേർണിംഗിൻ്റെ മേൽനോട്ടത്തിലുള്ളതാണ് ലേർണിംഗ് ടു റാങ്ക് മോഡൽ . ഉപഭോക്താക്കൾ തെരഞ്ഞെടുത്ത വിഡ്ജെറ്റുകളിൽ ക്ലിക്ക് ചെയ്യുമ്പോൾ സംഭവിക്കുന്നതു പോലെ, ഇത് വിഡ്ജറ്റ് റാങ്കിങ്ങിലെ പ്രശ്നങ്ങൾ കണ്ടെത്തുന്നു

എംബൈബിലെ തിരച്ചിൽ ഫലങ്ങൾ വിഡ്ജറ്റുകളായി തരംതിരിച്ചിരിക്കുന്നതിനാൽ  ചോദ്യത്തിലേക്കുള്ള ആദ്യ ഓർഡർ തിരച്ചിൽ ഫലങ്ങൾ വിപുലീകരിച്ചിരിക്കുന്നു. അതുകൊണ്ട് വിഡ്ജറ്റുകളിൽ റാങ്കിംഗ് സംവിധാനം പ്രാവർത്തികമാക്കേണ്ടതുണ്ട്. ഇലാസ്റ്റിക് സെർച്ച് V6.0 യിലുള്ളതുപോലെ ലേർണിംഗ് ടു റാങ്ക് സംവിധാനം ഇൻ ബിൽഡ് ആയി പ്രവർത്തിക്കുന്ന നിലവിലുള്ള സെർച്ച് എൻജിനുകൾക്ക് ഇത്തരത്തിലുള്ള അന്വേഷണങ്ങൾക്ക് പരിഹാരം കാണാൻ കഴിയില്ല. ഉപഭോക്താക്കളുടെ അന്വേഷങ്ങൾ അടിസ്ഥാനമാക്കി ഉള്ളടക്കം നൽകുന്ന ഞങ്ങളുടെ വ്യക്തിഗത സെർച്ച് എൻജിൻ ഫസ്റ്റ് ഓർഡർ തിരച്ചിൽ ഫലങ്ങളെ യൂസർ കോഹോട്ട് അസൈൻമെൻ്റ്, ഹിസ്റ്റോറിക്കൽ സെർച്ച് ട്രൻഡ്, കണ്ടൻ്റ് കൺസംപ്ഷൻ പാറ്റേൺ, പരീക്ഷ അടിസ്ഥാനമാക്കിയുള്ള ഉള്ളടക്കങ്ങളുടെ പ്രാധാന്യവും മുൻകാല ഉപഭോക്താക്കളുടെ ഇടപെടലും തുടങ്ങി ഇരുപത്തി അഞ്ചോളം കാര്യങ്ങളെ അടിസ്ഥാനമാക്കിയുള്ളതാണ്.

ഉപഭോക്താക്കളുടെ മുൻകാല തിരച്ചിൽ ഫലങ്ങളടങ്ങിയ ഡാറ്റയെ അടിസ്ഥാനമാക്കി ഇവ നന്നായി പ്രവർത്തിക്കുന്നു. അന്വേഷണത്തെ അടിസ്ഥാനമാക്കിയുള്ള ഉപഭോക്താക്കളുടെ ഇടപെടലുകളോ ചോദ്യ രേഖയോ ഇവിടെ കണക്കിലെടുക്കാറില്ല. ക്വറി-വിഡ്ജറ്റ് ജോഡികൾ ഉയർന്ന തലങ്ങളിലേക്ക് മാറ്റപ്പെടുകയും ഉപഭോക്താക്കളുടെ അന്വേഷണങ്ങളിൽ അവയുടെ പ്രസക്തി ഉയർത്തുകയും ചെയ്യുന്നു.  ഒരു പ്രശ്നത്തെ മെഷീൻ ലേർണിംഗ് പ്രോബ്ലമായി മാറ്റി റാങ്കിംങ് ചെയ്യുമ്പോൾ റിഗ്രഷൻ അഥവാ ക്ലാസിഫിക്കേഷനിലൂടെയോ അല്ലെങ്കിൽ മൂല്യ നിർണയ അളവുകൾ ഒപ്റ്റിമൈസ് ചെയ്യുന്നതിലൂടെയോ എൻ ഡയമെൻഷണൽ തലത്തിലുള്ള ചോദ്യത്തിന് ഉത്തരം നൽകുമ്പോൾ ലേർണിംഗ് ടു റാങ്ക്  പദ്ധതിക്ക് ചില പോരായ്മ സംഭവിക്കാറുണ്ട്.

അന്വേഷണ ഡോക്യുമെൻ്റ് ജോടികളിലോ ലിസ്റ്റുകളിലോ ആണ് സാധാരണയായി  ലേണിംഗ് ടു റാങ്ക് അൽഗൊരിതങ്ങൾ പ്രവർത്തിക്കുന്നത്. ഞങ്ങളുടെ കാര്യത്തിലാകട്ടെ ഉപഭോക്താക്കളുടെ ഓരോ അന്വേഷണങ്ങളും വിഡ്ജറ്റ് തരങ്ങൾ സൃഷ്ടിക്കും. അതുകൊണ്ട് തന്നെ  ഉപഭോക്താക്കൾക്കുള്ള റാങ്കിംഗ് വ്യക്തിഗതമാക്കാനാണ് ഞങ്ങളുടെ ആഗ്രഹം. ഉപഭോക്താവ്, അന്വേഷണം, വിഡ്ജറ്റ് എന്നിങ്ങനെ മൂന്ന് വിഭാഗത്തിലുള്ള വിശേഷ ഗുണങ്ങൾ- ഞങ്ങൾ പരിഗണിച്ചുകൊണ്ട്, ഉപഭോക്തൃ പ്രൊഫൈൽ,  ക്വറി ഇൻഫർമേഷൻ, തെരച്ചിൽ ഫലമായി കണ്ടെത്തിയ പ്രധാനപ്പെട്ട വിഡ്ജറ്റ് എന്നിവ സംയോജിപ്പിച്ച് ഒരു ഉപഭോക്താവ്  നടത്തുന്ന ഓരോ ചോദ്യത്തിനും എതിരായി ഞങ്ങൾ വിവരങ്ങൾ നൽകുന്നു. വിഡ്ജറ്റിൻ്റെ തരം, വിഡ്ജറ്റ് വെർട്ടിക്കൽ, ഹിസ്റ്റോറിക്കൽ ബ്രൌസ് പോപ്പുലാരിറ്റി, വിഡ്ജെറ്റിൻ്റെ പേരുമായി അന്വേഷണ നിബന്ധനകളുടെ ബന്ധം തുടങ്ങിയവയാണ് വിഡ്ജറ്റുകളുടെ പ്രത്യേഗതകൾ. ഉദ്ദേശിച്ച കാര്യം കണ്ടെത്താനായോ, ദൈർഘ്യം എത്രയാണ്, അന്വേഷണത്തിൻ്റെ ടേം ഫ്രീക്വൻസി-ഇൻവേഴ്സ് ഡോക്യുമെൻ്റ് ഫ്രീക്വൻസി  എന്നീ പ്രത്യകതകളെല്ലാം ഒരു അന്വേഷണത്തിൻ്റെ പ്രധാന ലക്ഷണങ്ങളാണ്. ഉപഭോക്താക്കളെ വ്യക്തിഗതമാക്കുന്നതിനു വേണ്ടി ഉപഭോക്തൃ വിശേഷ ഗുണങ്ങളായ യൂസർ എൻഗേജ്മെൻ്റ് കോഹേർട്ട്, പെർഫോമൻസ് കോഹേർട്ട്,  ഉപഭോക്താവിൻ്റെ പ്രാഥമിക ലക്ഷ്യം തുടങ്ങിയ പ്രത്യേഗതകളും ഞങ്ങൾ ഉൾപ്പെടുത്തിയിട്ടുണ്ട്. ഡയമെൻഷണാലിറ്റി റിഡക്ഷൻ, കോറിലേഷൻ മെട്രിക്സുകളെക്കുറിച്ചുള്ള പഠനം, മ്യൂച്വൽ ഇൻഫർമേഷൻ സ്കോർ, പര്യവേക്ഷക ഡാറ്റയുടെ വിശദീകരണം എന്നീ കാര്യങ്ങൾ ഒഴിവാക്കിയിട്ടുമുണ്ട്.

References:

  1. Liu T., “Learning to rank for information retrieval.”, Foundations and Trends® in Information Retrieval 3.3 (2009): 225-331.
  2. Kraskov A., Stögbauer K. and Grassberger P., “Estimating mutual information.”, Physical review E 69.6 (2004): 066138
  3. Cox D. R., “The regression analysis of binary sequences.”, Journal of the Royal Statistical Society. Series B (Methodological) (1958): 215-242.