নলেজ গ্রাফ নোডগুলির মধ্যে সম্পর্কের স্বয়ংক্রিয় শ্রেণীবিভাগ

Embibe এর নলেজ গ্রাফ (KG) হল একটি পাঠ্যক্রম অজ্ঞেয়বাদী বহুমাত্রিক গ্রাফ যা 75,000+ নোড নিয়ে গঠিত। এই নোডগুলির প্রত্যেকটি অধ্যয়ন বিষয়ক জ্ঞানের একটি পৃথক ইউনিটকে উপস্থাপন করে, যাকে ধারণাও বলা হয়। নলেজ গ্রাফে নোডগুলির মধ্যে কয়েক হাজার আন্তঃসংযোগ (সম্পর্ক) রয়েছে যা দেখায় যে কীভাবে ধারণাগুলি স্বাধীন নয় বরং অন্যান্য ধারণাগুলির সাথে সম্পর্কিত।

নোডগুলির মধ্যবর্তী আন্তঃ-সংযোগগুলি তাদের মধ্যে বিদ্যমান সম্পর্কের ধরণের উপর ভিত্তি করে একটি শ্রেণীবিভাগ নির্ধারণ করে। অসম্পূর্ণ নলেজ গ্রাফ এবং অনুপস্থিত সম্পর্কগুলি গবেষকদের মধ্যে পরিচিত সমস্যাগুলির মধ্যে একটি। যাইহোক, Embibe-এর বিষয়বস্তুকে বিস্তারিত করার সাথে সাথে প্রক্রিয়াটিকে স্বয়ংক্রিয় করার প্রয়োজন রয়েছে। গত 8 বছরে লক্ষ লক্ষ শিক্ষার্থীর জন্য KG কন্সেপ্টের উপর সংযোগ তথ্যের প্রাপ্যতা এর ওপর নির্ভর করে এবং গ্রাফ তত্ত্ব এবং প্রাকৃতিক ভাষা বোঝার কৌশলগুলি ব্যবহার করে, সম্পর্কগুলিকে  N সংখ্যক শ্রেণীবিভাগের একটির মধ্যে স্বয়ংক্রিয়ভাবে শ্রেণীবদ্ধ করা সম্ভব হয়েছে।

সম্পর্কের শ্রেণীবিভাগ:

Embibe এর KG-তে, আমরা ধারণাগুলীর মধ্যে 16টি ভিন্ন সম্পর্ক পেয়ে থাকি। পূর্বশর্ত সম্বন্ধ এই সম্পর্কগুলির মধ্যে একটি। একটি নির্দিষ্ট ধারণা শেখার আগে জ্ঞানের সমস্ত পূর্বশর্ত আমাদের KG-তে এই সম্পর্ক দ্বারা দেওয়া হয়। সাধারণত, একজন শিক্ষার্থী কোনো ধারণা শেখার আগে পূর্বশর্ত শেখে। এটি তাদের ধারণাটি আরও ভালভাবে বুঝতে সহায়তা করে। ধারণার আয়ত্তের ধরণ এবং শিক্ষার পথগুলি বের করার জন্য আমরা লক্ষ লক্ষ শিক্ষার্থীর থেকে কোটি কোটি অনুশীলন বা প্র্যাকটিস এবং পরীক্ষা বা টেস্টের প্রচেষ্টা বিশ্লেষণ করি। এই নিদর্শনগুলি ধারণাগুলির মধ্যে অভিজ্ঞতামূলক কার্যকারণ স্থাপন করতে ব্যবহৃত হয়। তথ্যের এই লুকানো বৈশিষ্ট্য আমাদের ছাত্রদের তাদের লক্ষ্য অর্জনের জন্য অনুসরণ করা সাধারণ শিক্ষার পথ খুঁজে পেতে সাহায্য করেছে। আমরা স্কোরিং পদ্ধতির উপর ভিত্তি করে পূর্বশর্ত ধারণাগুলি খুঁজে পেতে এই সাধারণ শিক্ষার পথগুলি ব্যবহার করেছি। 

গবেষণা পদ্ধতি:

আমরা শিক্ষার্থীদের জন্য ধারণা আয়ত্তের ভবিষ্যদ্বাণী করার জন্য নলেজ গ্রাফ থেকে নলেজ ইনফিউশন সহ ডিপ নলেজ ট্রেসিংয়ের অত্যাধুনিক কৌশলগুলি বৃদ্ধি করে থাকি। আমরা ঐতিহাসিক পূর্বতথ্যের উপর ভিত্তি করে শর্তসাপেক্ষ ধারণার দক্ষতা গঠন করে কোল্ড স্টার্ট সমস্যাও পরিচালনা করি। শিক্ষার্থীদের আচরণগত ক্রমাঙ্কন এবং নলেজ গ্রাফ ধারণার উপর এর প্রতিফলনের কারণে Embibe অনন্যভাবে অবস্থান করে। ধারণাগুলির এই আচরণগত বৈশিষ্ট্যগুলি ধারণাগুলির মধ্যেবর্তী সম্পর্ককে শ্রেণিবদ্ধ করার ক্ষেত্রেও ব্যবহার করা হয়।

নলেজ গ্রাফ বৃদ্ধি করা:

আমরা ইতিমধ্যে ধারণাগুলির মধ্যে অনেক সম্পর্ক পেয়ে থাকি। যখনই একটি গ্রাফে কোনো নতুন ধারণা প্রবর্তিত হয়, তখন আমাদের অন্যান্য ধারণার সাথে এর সম্পর্ক সংজ্ঞায়িত করতে হবে। কাজটির জটিলতার কারণে এটি একটি অত্যন্ত গুরুত্বপূর্ণ কাজ হয়ে ওঠে। কোনো ভুল সম্পর্ক ট্যাগিং ব্যবহারকারীদের ভুল দিকে পুনঃনির্দেশিত করতে পারে।

Embibe এ, আমরা আমাদের পণ্য বিভিন্ন ভাষায় এবং বিভিন্ন পাঠ্যক্রমের জন্য লঞ্চ করতে চাই। এই নতুন কন্সেপ্টেগুলির জন্য আমাদের KG বাড়াতে হবে। আজ অবধি আমরা নতুন ধারণা আবিষ্কার এবং অন্যান্য ধারণাগুলির সাথে তাদের সম্পর্ক অনুসন্ধান এবং বিদ্যমান সম্পর্কের বৈধতার জন্য সম্পূর্ণরূপে শিক্ষকদের উপর নির্ভরশীল ছিলাম। এই কাজগুলো যেমন খুব ক্লান্তিকর তেমনি ধীরগতির। যেহেতু তথ্যের পরিমাণ দ্রুতগতিতে বৃদ্ধি পাচ্ছে এটি আমাদের জন্য খুব চ্যালেঞ্জিং হয়ে উঠেছে। এছাড়াও সমগ্র তথ্য প্রস্তুতি প্রক্রিয়ার জন্য মানুষের পক্ষপাত রয়েছে।

আমরা দেখেছি যে কোনো ধারণা শেখার আগে শিক্ষার্থীরা সংশ্লিষ্ট পূর্বশর্তগুলো শিখে নেয়। সুতরাং শিক্ষার্থীদের প্রচেষ্টার ক্রম (প্রচেষ্টা করা প্রশ্ন এর ক্রম) হবে তাদের পূর্বশর্ত ধারণার পরের ধারণাগুলি। শিক্ষার্থীর সাধারণ বৈশিষ্ট্য যা শিক্ষার্থীর নির্ভুলতার উন্নতিতে প্রভাব ফেলছে তা পেতে আমরা একটি প্রয়াসিত প্রশ্ন ক্রম প্যাটার্ন খুঁজে পাচ্ছি। এটি কার্যকরভাবে সমাধান করার জন্য, DKT (ডিপ নলেজ ট্রেসিং) (LSTM) ব্যবহারকারীর প্রচেষ্টার তথ্য এবং নির্ভুলতার সাথে ব্যবহার করা হচ্ছে, কোনো ধারণা/প্রচেষ্টার প্যাটার্ন নির্ভুলতার উপর বেশি প্রভাব ফেলে, একটি ক্রম শ্রেণিবিন্যাসের সমস্যা হিসাবে। অবশেষে প্রশিক্ষিত DKT মডেলটি নতুন ধারণা এর জন্য সম্পর্ক র‌্যাঙ্কিংয়ের জন্য ব্যবহার করা হয়েছে। পরে এই র‌্যাঙ্কিংটি নলেজ গ্রাফ নোডের মধ্যে নতুন সম্পর্কের পরামর্শের জন্য ব্যবহার করা হয়।

সারাংশ:

নলেজ গ্রাফ হল Embibe-এর সমস্ত পণ্যের মেরুদণ্ড। তাই নলেজ গ্রাফ এর পরিপূর্ণতা আমাদের প্রাথমিক কাজ। এই কাজটি আমাদের নলেজ গ্রাফ বজায় রাখতে এবং খুব ন্যূনতম মানবিক হস্তক্ষেপের সাথে এটিকে দ্রুত প্রসারিত করতে সাহায্য করেছে।

অবশেষে, ধারণাগুলির মধ্যে নতুন সুপ্ত সম্পর্কগুলি অন্বেষণ করার জন্য এটি একটি উন্মুক্ত সমস্যা। আমরা বিভিন্ন উৎস থেকে প্রদত্ত পাঠ্য তথ্য থেকে ধারণা অনুসন্ধানের প্রক্রিয়াটিকে স্বয়ংক্রিয় করেছি। পরে আমরা এই প্রযুক্তি ব্যবহার করে বিদ্যমান ধারণাগুলির সাথে এই নতুন পাওয়া ধারণাগুলির সম্পর্ক খুঁজে বের করে থাকি। এই পদ্ধতিটি নলেজ গ্রাফ যাচাইকরণের জন্যও প্রসারিত করা যেতে পারে।