ಕಲಿಕೆ-ವೈಯಕ್ತಿಕರಿಸಿದ ಹುಡುಕಾಟದ ಶ್ರೇಯಾಂಕಕ್ಕಾಗಿ
Embibe ವಿದ್ಯಾರ್ಥಿಗಳಿಗೆ ತಮ್ಮ ಕಲಿಕೆಯ ಫಲಿತಾಂಶಗಳನ್ನು ಸುಧಾರಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ ಮತ್ತು ಮೆನು-ಚಾಲಿತ ನ್ಯಾವಿಗೇಷನ್ ಸಿಸ್ಟಮ್ಗಿಂತ ಹೆಚ್ಚಾಗಿ Embibe ನ ವೈಯಕ್ತೀಕರಿಸಿದ ಸರ್ಚ್ ಎಂಜಿನ್ ಅನ್ನು ಬಳಸುವ ಮೂಲಕ ಅವರಿಗೆ ಅಗತ್ಯವಿರುವ ವಿಷಯವನ್ನು ಹುಡುಕುವ ಮುಖ್ಯ ವಿಧಾನವಾಗಿದೆ. ವೆಬ್ ಸರ್ಚ್ನ ಪ್ರಗತಿಯಲ್ಲಿ, ಬಳಕೆದಾರರು ಇಂದು ಹುಡುಕಾಟದ ಫಲಿತಾಂಶಗಳ ಮೊದಲ ಪುಟವೇ ಅವರು ಹುಡುಕುತ್ತಿರುವ ನಿಖರವಾದ ಮಾಹಿತಿಯನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ ಎಂದು ನಿರೀಕ್ಷಿಸುತ್ತಾರೆ.
Embibe ನಲ್ಲಿ ಇರುವ ವಿಷಯಗಳ ಪ್ರಮಾಣ ಬಹಳ ಹೆಚ್ಚು ಮತ್ತು ಇದರಲ್ಲಿ ಅಧ್ಯಯನ ಸಾಮಗ್ರಿಗಳು, ವಿಡಿಯೋಗಳು, ಅಭ್ಯಾಸ ಪತ್ರಿಕೆಗಳು, ಪರೀಕ್ಷೆಗಳು, ಲೇಖನಗಳು ಮತ್ತು ವಾರ್ತಾ ಪತ್ರಿಕೆಗಳು, ಎಲ್ಲ ಪರೀಕ್ಷೆಗಳು ವಿಷಯಗಳು, ಘಟಕಗಳು, ಪಾಠಗಳು ಮತ್ತು ಪರಿಕಲ್ಪನೆಗಳು ಒಳಗೊಂಡಿರುತ್ತವೆ. ಬಳಕೆದಾರರನ್ನು ಸಾಧ್ಯವಾದಷ್ಟು ಕ್ರಿಯಾತ್ಮಕ ವಿಷಯಕ್ಕೆ ಒಡ್ಡಲು, ಹುಡುಕಾಟ ಫಲಿತಾಂಶಗಳನ್ನು ವಿಜೆಟ್ ರೂಪದಲ್ಲಿ ಪ್ರಸ್ತುತಪಡಿಸಲಾಗುತ್ತದೆ. ಪ್ರತಿಯೊಂದು ವಿಜೆಟ್ ಹಲವಾರು ಹುಡುಕಾಟದ ಫಲಿತಾಂಶಗಳ ಗುಂಪುಗಳಿಂದ ಕಲೆಹಾಕಿದ ಫಲಿತಾಂಶವನ್ನು ಸೂಚಿಸುತ್ತದೆ. ಯುಗಗಳು ಸಂಬಂಧಿತ ಕ್ರಿಯಾತ್ಮಕ ಲಿಂಕುಗಳು ಮತ್ತು ಸಂಬಂಧಿತ ಜ್ಞಾನ ನಕ್ಷೆಗಳ ಜಾಲ ಘಟಕಗಳ ಮೂಲಕ Embibe ನಲ್ಲಿರುವ ಎಲ್ಲ ವಿಷಯಗಳು ಅವುಗಳಿಗೆ ಸಂಬಂಧಿಸಿದ ವಿಭಿನ್ನ ವಿಜೆಟ್ ಪ್ರಕಾರಗಳನ್ನು ಹೊಂದಿವೆ, ಮತ್ತು ಬಳಕೆದಾರ ಸಮಂಜಸ ಮಟ್ಟದ ಗುಣಲಕ್ಷಣಗಳೊಂದಿಗೆ, ಬಳಕೆದಾರರಿಗೆ ತಲುಪಿಸುವ ಮೊದಲು ಸುಮಾರು ~120 ಮಿಲಿಯನ್ ದಾಖಲೆಗಳ ಸಂಯೋಜನೆಗೆ ಸರ್ಚ್ ವ್ಯಾಪ್ತಿಯನ್ನು ಆಯ್ಕೆ ಮಾಡುತ್ತದೆ ಮತ್ತು ಹಂಚಿಕೊಳ್ಳುತ್ತದೆ ಹೊಸ ವಿಶ್ಲೇಷಣೆಯ ಪ್ರಕಾರ ಬಳಕೆದಾರರು ಮೊದಲ ಪುಟದಲ್ಲಿಯೇ ಉನ್ನತ ಸ್ಥಾನಗಳಲ್ಲಿ ಅತ್ಯಂತ ಸೂಕ್ತವಾದ ಮಾಹಿತಿಯನ್ನು ನಿರೀಕ್ಷಿಸುತ್ತಾರೆ ಎಂದು ತೋರಿಸುತ್ತದೆ ಇದರ ಬಗ್ಗೆ Embibe ನ ಐತಿಹಾಸಿಕ ಬಳಕೆದಾರರ ಸಂವಾದ ಫಲಿತಾಂಶಗಳಿವೆ ಆದ್ದರಿಂದ ನಮ್ಮ ಬಳಕೆದಾರರಿಗೆ ಹುಡುಕಾಟವನ್ನು ಹೆಚ್ಚು ಆಕರ್ಷಕವಾಗಿ ಮಾಡುವಲ್ಲಿ ಮತ್ತು ನಮ್ಮ ಹುಡುಕಾಟ ಫಲಿತಾಂಶಗಳ ಗುಣಮಟ್ಟವನ್ನು ಸುಧಾರಿಸುವಲ್ಲಿ ಫಲಿತಾಂಶಗಳ ಕ್ರಮವು ಪ್ರಮುಖ ಪಾತ್ರ ವಹಿಸುತ್ತದೆ.
ಶ್ರೇಣಿಗಾಗಿ-ಕಲಿಕೆ [1] ಮೇಲ್ವಿಚಾರಣೆ ಯಂತ್ರ ಕಲಿಕೆಯ ಸಮಸ್ಯೆಯಾಗಿದ್ದು, ಹುಡುಕಾಟ ಫಲಿತಾಂಶಗಳಿಗಾಗಿ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಶ್ರೇಯಾಂಕ ಮಾದರಿಯನ್ನು ನಿರ್ಮಿಸಲು ಇದನ್ನು ಬಳಸಬಹುದು. ಪ್ರತಿ ಪ್ರಶ್ನೆಗೆ ಎಲ್ಲಾ ಸಂಬಂಧಿತ ದಾಖಲೆಗಳನ್ನು ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ. ಈ ದಾಖಲೆಗಳ ಪ್ರಸ್ತುತತೆಯನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಮಾನವ ಮೌಲ್ಯಮಾಪನ ಅಥವಾ ತೀರ್ಪುಗಳ ರೂಪದಲ್ಲಿ ತರಬೇತಿ ದತ್ತಾಂಶವಾಗಿ ಒದಗಿಸಲಾಗುತ್ತದೆ. ಈ ದಾಖಲೆಗಳ ಪ್ರಸ್ತುತತೆಯನ್ನು ನಂತರ ಶ್ರೇಣಿಗಾಗಿ ಕಲಿಕೆ ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಕೊಡಲು, ಶ್ರೇಯಾಂಕದ ಫಲಿತಾಂಶಗಳು ಮತ್ತು ಪ್ರಸ್ತುತ ತೀರ್ಪಿನ ನಡುವಿನ ವ್ಯತ್ಯಾಸವನ್ನು ಕಡಿಮೆ ಮಾಡಲು ಎಲ್ಲಾ ಪ್ರಶ್ನೆಗಳ ಮೇಲೆ ಸರಾಸರಿ ನೀಡಲು ಅತ್ಯುತ್ತಮ ಗುರಿಯತ್ತ ನಡೆಯುವುದು.
ಚಿತ್ರ 1: Embibe ನ ವೈಯಕ್ತಿಕರಿಸಿದ ಪರಿಕಲ್ಪನೆ ಆವಿಷ್ಕಾರ ಇಂಜಿನ್ನ ಪರಿಕಲ್ಪನೆ ಶ್ರೇಣಿಗಾಗಿ-ಕಲಿಕೆ. ಬಳಕೆದಾರರು Embibe ನಲ್ಲಿ ವೈಯಕ್ತಿಕರಿಸಿದ ವಿಷಯದ ಆವಿಷ್ಕಾರ ಎಂಜಿನ್ಗೆ ಪ್ರಶ್ನೆ ಮಾಡುತ್ತಾರೆ. ಫಲಿತಾಂಶಗಳನ್ನು ಎಲಾಸ್ಟಿಕ್ ಹುಡುಕುವ ಕ್ಲಸ್ಟರ್ನಿಂದ ಹಿಂಪಡೆಯಲಾಗುತ್ತದೆ ಮತ್ತು ಫಲಿತಾಂಶಗಳ ನಂತರ ವಿಜೆಟ್ ಸಮುಚ್ಚಯಗಳನ್ನು ನಿರ್ಮಿಸುವ ನಂತರದ ಸಂಸ್ಕರಣಾ ಪದರಕ್ಕೆ ರವಾನಿಸಲಾಗುತ್ತದೆ. ಬಳಕೆದಾರರ ವೈಯಕ್ತಿಕರಣ ಪದರವು ಬಳಕೆದಾರರು, ಪ್ರಶ್ನೆ ಮತ್ತು ವಿಜೆಟ್ ವೈಶಿಷ್ಟ್ಯಗಳ ಆಧಾರದ ಮೇಲೆ ವಿಜೆಟ್ ಸಮುಚ್ಚಯವನ್ನು ಮರು-ಶ್ರೇಣಿ ನೀಡಲು ಕಲಿಕೆಯಿಂದ ಶ್ರೇಣಿಯ ಮಾದರಿಯನ್ನು ಬಳಸುತ್ತದೆ. ಶ್ರೇಣಿಗಾಗಿ-ಕಲಿಕೆ ಮಾದರಿಯು ಮೇಲ್ವಿಚಾರಣೆಯ ಯಂತ್ರ ಕಲಿಕೆಯ ಮಾದರಿಯಾಗಿದ್ದು ಅದು ವಿಜೆಟ್ ಶ್ರೇಯಾಂಕದ ಸಮಸ್ಯೆಯನ್ನು ಉಂಟುಮಾಡುತ್ತದೆ ಮತ್ತು ಫಲಿತಾಂಶ ವಿಜೆಟ್ ಮೇಲೆ ಬಳಕೆದಾರರ ಕ್ಲಿಕ್ ಅನ್ನು ಊಹಿಸುತ್ತದೆ. ಬಳಕೆದಾರರು ಮಾಡಿದ ಪ್ರಶ್ನೆಗಳ ವಿರುದ್ಧ ವಿಜೆಟ್ಗಳ ಮೇಲೆ ಐತಿಹಾಸಿಕ ಬಳಕೆದಾರ ಕ್ಲಿಕ್ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಮಾದರಿಗೆ ತರಬೇತಿ ನೀಡಲಾಗುತ್ತದೆ.
Embibe ನಲ್ಲಿರುವ ಫಲಿತಾಂಶಗಳನ್ನು ವಿಜೆಟ್ಳಾಗಿ ವರ್ಗೀಕರಿಸಲಾಗಿದೆ ಇದರಿಂದ, ಅವುಗಳನ್ನು ಮೊದಲ ಕ್ರಮಾಂಕದ ಫಲಿತಾಂಶಗಳಿಂದ ಪ್ರಶ್ನೆಗೆ ವಿಸ್ತರಿಸಲಾಗುತ್ತದೆ, ಶ್ರೇಯಾಂಕದ ಕಾರ್ಯವನ್ನು ವಿಜೆಟ್ಗಳಲ್ಲಿ ಅನ್ವಯಿಸುವ ಅಗತ್ಯವಿದೆ. ಆದ್ದರಿಂದ, ನಮ್ಮ ಪೇಜ್ ಬಳಕೆಯ ಸಂದರ್ಭದಲ್ಲಿ, ಅಂತರ್ನಿರ್ಮಿತ ಕಲಿಕೆಯಿಂದ ಶ್ರೇಣಿಯ ಕಾರ್ಯವನ್ನು ಒದಗಿಸುವ ಯಾವುದೇ ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ಸರ್ಚ್ ಎಂಜಿನ್, ಎಲಾಸ್ಟಿಕ್ ಹುಡುಕುಕಾಟ v6.0 ಕ್ಕಿಂತ ಮೇಲಿರುವಂತೆ, ಪರಿಹಾರ ನೀಡಲು ಸಾಧ್ಯವಾಗುವುದಿಲ್ಲ. ನಮ್ಮ ವೈಯಕ್ತಿಕರಿಸಿದ ಸರ್ಚ್ ಇಂಜಿನ್ ಬಳಕೆದಾರರು ಕೇಳಿದ ಪ್ರಶ್ನೆಗಳಿಗೆ ವಿಷಯದ ಆಧಾರದ ಮೇಲೆ ಸೇವೆ ಒದಗಿಸುತ್ತದೆ, ಬಳಕೆದಾರರ ಸಮನ್ವಯ ಕಾರ್ಯಗಳು, ಐತಿಹಾಸಿಕ ಹುಡುಕಾಟ ಪ್ರವೃತ್ತಿಗಳು, ವಿಷಯ ಬಳಕೆ ಮಾದರಿಗಳು, ಪರೀಕ್ಷೆ ಆಧಾರಿತ ವಿಷಯ ಪ್ರಾಮುಖ್ಯತೆ ಮತ್ತು ಹಿಂದಿನ ಬಳಕೆದಾರರ ಪರಸ್ಪರ ಕ್ರಿಯೆ ಇಂತಹ 25 ಪ್ರಮುಖ ಅಂಶಗಳ ಆಧಾರದ ಮೇಲೆ ಮೊದಲ ಕ್ರಮಾಂಕದ ಫಲಿತಾಂಶಗಳನ್ನು ಶ್ರೇಣಿಕರಿಸುತ್ತದೆ.
ಇಂತಹ ಕಾರ್ಯಗಳು ಬಳಕೆದಾರರ ಹಿಂದಿನ ದತ್ತಾಂಶದ ಹುಡುಕಾಟದ ಫಲಿತಾಂಶದ ಆಧಾರದ ಮೇಲೆ ಚೆನ್ನಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ, ಇದು ಪ್ರಶ್ನೆ-ಆಧಾರಿತ ಬಳಕೆದಾರರ ಸಂವಾದವನ್ನು ಅಥವಾ ಪ್ರಶ್ನೆ ದಾಖಲೆಯನ್ನು ಪ್ರತಿನಿಧಿಸುವ ಅಥವಾ ನಿರ್ದಿಷ್ಟವಾಗಿ ನಮ್ಮ ಬಳಕೆಯ ಸಂದರ್ಭದಲ್ಲಿ ಗಣನೆಗೆ ತೆಗೆದುಕೊಳ್ಳುವುದಿಲ್ಲ, ಪ್ರಶ್ನೆ ವಿಜೆಟ್ ಜೋಡಿಗಳನ್ನು ಹೆಚ್ಚಿನ ಆಯಾಮದ ಜಾಗದಲ್ಲಿ ಜೋಡಿಸಲಾಗುತ್ತದೆ ಮತ್ತು ಬಳಕೆದಾರರ ಪ್ರಶ್ನೆಗಳಿಗೆ ಅವುಗಳು ಪ್ರಸ್ತುತತೆಯನ್ನು ತೋರಿಸುತ್ತದೆ. n-ಆಯಾಮದ ಜಾಗದಲ್ಲಿ ಪ್ರಶ್ನೆಯ ವಿರುದ್ಧ ಹೊಂದಿಸಿದ ಫಲಿತಾಂಶವನ್ನು ಪ್ರತಿನಿಧಿಸುವ ಮೂಲಕ ಮತ್ತು ಸಮಸ್ಯೆಯನ್ನು ಯಂತ್ರ ಕಲಿಕೆಯ ಸಮಸ್ಯೆ ಅಂದರೆ ಹಿಂಜರಿಕೆ ಅಥವಾ ವರ್ಗೀಕರಣ ಅಥವಾ ಮೌಲ್ಯಮಾಪನ ದ ಮಾಪನವನ್ನು ಉತ್ತಮಗೊಳಿಸುವ ಮೂಲಕ ಈ ಕೊರತೆಯನ್ನು ಪರಿಹರಿಸುತ್ತದೆ.
ಸಾಮಾನ್ಯವಾಗಿ, ಶ್ರೇಣಿಗಾಗಿ-ಕಲಿಕೆ ಆಲ್ಗರಿದಮ್ಗಳು ಪ್ರಶ್ನೆ ದಾಖಲೆಯ ಜೋಡಿಗಳು ಅಥವಾ ಪಟ್ಟಿಗಳಲ್ಲಿ ಕೆಲಸ ಮಾಡುತ್ತವೆ. ನಮ್ಮ ಉದಾಹರಣೆಯಲ್ಲಿ, ಪ್ರತಿ ಪ್ರಶ್ನೆಯು ವಿಭಿನ್ನ ರೀತಿಯ ವಿಜೆಟ್ ಪ್ರಕಾರಗಳನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ ಮತ್ತು ನಾವು ಬಳಕೆದಾರರಿಗೆ ಶ್ರೇಯಾಂಕವನ್ನು ವೈಯಕ್ತೀಕರಿಸಲು ಬಯಸುತ್ತೇವೆ, ಅದಕ್ಕಾಗಿ ನಾವು ಮೂರು ವರ್ಗಗಳ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಪರಿಗಣಿಸಿದ್ದೇವೆ; ಅವುಗಳೆಂದರೆ ಬಳಕೆದಾರ, ಪ್ರಶ್ನೆ ಮತ್ತು ವಿಜೆಟ್. ಬಳಕೆದಾರರ ಪ್ರೊಫೈಲ್, ವಿಚಾರಣೆಯ ಮಾಹಿತಿ ಮತ್ತು ಫಲಿತಾಂಶಗಳಿಂದ ಹಿಂಪಡೆಯಲಾದ ಮುಖ್ಯವಾದ ವಿಜೆಟ್ಗಳ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಬಳಕೆದಾರರು ಮಾಡಿದ ಪ್ರತಿ ಪ್ರಶ್ನೆಗೆ ವಿರುದ್ಧವಾಗಿ ನಾವು ನಮ್ಮ ದತ್ತಾಂಶವನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತೇವೆ. ವಿಜೆಟ್ನ ವೈಶಿಷ್ಟ್ಯಗಳಲ್ಲಿ ವಿಜೆಟ್ ಪ್ರಕಾರ, ವಿಜೆಟ್ ಲಂಬ, ಐತಿಹಾಸಿಕ ಬ್ರೌಸ್ ಜನಪ್ರಿಯತೆ, ಪ್ರಶ್ನೆ ಪದಗಳು ವಿಜೆಟ್ ಹೆಸರಿಗೆ ಹೊಂದಿಕೆಯಾಗುತ್ತವೆಯೆ ಇತ್ಯಾದಿ. ಪ್ರಶ್ನೆಯ ವೈಶಿಷ್ಟ್ಯಗಳಲ್ಲಿ ನಿರ್ದಿಷ್ಟ ಉದ್ದೇಶವನ್ನು ಪತ್ತೆಹಚ್ಚಲಾಗಿದೆಯೇ, ಪ್ರಶ್ನೆಯ ಉದ್ದ, ಪದದ ಆವರ್ತನ – ವಿಲೋಮ ದಾಖಲೆಗಳ ಆವರ್ತನ ಇನ್ನೂ ಮುಂತಾದವು ಒಳಗೊಂಡಿರುತ್ತವೆ. ಬಳಕೆದಾರರ ವೈಯಕ್ತಿಕರಣವನ್ನು ಲೆಕ್ಕಹಾಕಲು, ಬಳಕೆದಾರರ ನಿಶ್ಚಿತಾರ್ಥದ ಸಮನ್ವಯ,ಬಳಕೆದಾರರ ಕಾರ್ಯಕ್ಷಮತೆ, ಬಳಕೆದಾರರ ಪ್ರಾಥಮಿಕ ಗುರಿ ಇತ್ಯಾದಿಗಳಂತಹ ಬಳಕೆದಾರ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ನಾವು ಸೇರಿಸುತ್ತೇವೆ. ಪರಿಶೋಧಕ ದತ್ತಾಂಶ ವಿಶ್ಲೇಷಣೆ, ಪರಸ್ಪರ ಸಂಬಂಧದ ವ್ಯೂಹ, ಪರಸ್ಪರ ಮಾಹಿತಿ ಅಂಕ ಮತ್ತು ಆಯಾಮದ ಕಡಿತವನ್ನು ಅಧ್ಯಯನ ಮಾಡುವ ಮೂಲಕ ಅನಗತ್ಯ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ತೆಗೆದುಹಾಕಲಾಗುತ್ತದೆ.
ನಾವು ಶ್ರೇಣಿಗಾಗಿ-ಕಲಿಕೆಯಿಂದ ಊಹೆ ಸಮಸ್ಯೆ ಸರಳಗೊಳಿಸಿದ್ದೇವೆ ಇದರಲ್ಲಿ ಬಳಕೆದಾರರು ಪ್ರಶ್ನೆ ಮತ್ತು ವಿಜೆಟ್ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ನೀಡಿದರೆ ನಿರ್ದಿಷ್ಟ ವಿಜೆಟ್ನಲ್ಲಿ ಬಳಕೆದಾರರ ಕ್ಲಿಕ್ ಸಂಭವನೀಯತೆಯನ್ನು ನಾವು ಊಹಿಸುತ್ತೇವೆ. ಐತಿಹಾಸಿಕ ಬಳಕೆದಾರರ ಪ್ರಶ್ನೆಗಳು ಮತ್ತು ಹೆಚ್ಚಾಗಿ ಕ್ಲಿಕ್ ಮಾಡಿದ ಪರಸ್ಪರ ದತ್ತಾಂಶವನ್ನು ಬಳಸಿ, ಕ್ಲಿಕ್ ಮಾಡಿದ ಸ್ಥಾನ ಮತ್ತು ಮೇಲಿನ ವಿಜೆಟ್ಗಳನ್ನು ನಾವು ಪರಿಗಣಿಸುತ್ತೇವೆ. ಇದು ಐತಿಹಾಸಿಕವಾಗಿ ದತ್ತಾಂಶ ಗುಂಪನ್ನು ತುಲನಾತ್ಮಕವಾಗಿ ಸಮತೋಲಿತ ವಿತರಣೆಯನ್ನು ನೀಡುತ್ತದೆ, ಬಳಕೆದಾರರು ಹೆಚ್ಚಿನ ವಿಜೆಟ್ಗಳನ್ನು ಕ್ಲಿಕ್ ಮಾಡಲು ಒಲವು ತೋರುತ್ತಾರೆ. ವರ್ಗೀಕರಣ ಅಲ್ಗಾರಿದಮ್ ಅನ್ನು ಬಳಸುವ ಮೂಲಕ ಒಂದು ವಿಜೆಟ್ ಮೇಲೆ ಆಗುವ ಸಂಭವನೀಯ ಕ್ಲಿಕ್ಗಳನ್ನು ನಾವು ಊಹಿಸಬಹುದು ಮತ್ತು ಈ ವಿಧಾನವು ಪ್ರಾರಂಭಿಸಲು ಉತ್ತಮ ಆಧಾರವನ್ನು ಒದಗಿಸುತ್ತದೆ, ಅಲ್ಲಿ ಫಲಿತಾಂಶಗಳನ್ನು ಮತ್ತಷ್ಟು ಪುನರಾವರ್ತನೆಗಳಿಗೆ ಸುಲಭವಾಗಿ ಅರ್ಥೈಸಬಹುದು. ಆದ್ದರಿಂದ ನಾವು ಈ ವಿಧಾನಕ್ಕೆ ನಮ್ಮ ಮೊದಲ ಆಯ್ಕೆಯಾಗಿ ಲಾಜಿಸ್ಟಿಕ್ ರಿಗ್ರೆಷನ್ [3] ಅನ್ನು ಆಯ್ಕೆ ಮಾಡಿದ್ದೇವೆ.
ನಮ್ಮ ಪ್ರಯೋಗಗಳಿಗಾಗಿ ನಿರ್ದಿಷ್ಟ ಸ್ಥಾನದಲ್ಲಿರುವ ವಿಜೆಟ್ ಅನ್ನು ಕ್ಲಿಕ್ ಮಾಡಲಾಗುತ್ತದೆಯೇ ಅಥವಾ ಬಳಕೆದಾರರ ಮತ್ತು ವಿಚಾರಣೆಯ ಕೆಲವು ಸಂಯೋಜನೆಗಾಗಿ ಊಹಿಸುವ ಕಾರ್ಯ ಇದು. ಬ್ರೌಸ್ ಜನಪ್ರಿಯತೆ, ಪರೀಕ್ಷೆಯ ಕಠಿಣತೆ ಪ್ರಶ್ನೆಯ ಉದ್ದ ಇತ್ಯಾದಿ ಸಂಖ್ಯಾತ್ಮಕ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಬಳಸಿ ನಾವು ಇದನ್ನು ಆರಂಭಿಸಿದ್ದೇವೆ ಮತ್ತು ಇದನ್ನು ಅಡಿಪಾಯ ಕಾರ್ಯಕ್ಷಮತೆಯಾಗಿ ಬಳಸುತ್ತೇವೆ. ವಿಜೆಟ್ ಪ್ರಕಾರ, ಬಳಕೆದಾರ ಸಮನ್ವಯ, ಪ್ರಶ್ನೆ ಗುರಿಗಳು ಮತ್ತು ಹೇಗೆ ವರ್ಗೀಕರಿಸಿದ ದತ್ತಾಂಶವನ್ನು ವರ್ಧಿತ ಲಕ್ಷಣಗಳ ಗುಂಪಿಗೆ ಸೇರಿಸುವುದರಿಂದ ಕ್ಲಿಕ್ ಪ್ರಿಡಿಕ್ಷನ್ ಟಾಸ್ಕ್ನಲ್ಲಿ ನಿಖರತೆ ಮತ್ತು ನಿರ್ದಿಷ್ಟತೆ ಎರಡರಲ್ಲೂ ~6% ಸುಧಾರಣೆಯಾಗಿದೆ. ನಾವು ನಂತರ ಪ್ರಶ್ನೆಗಳಿಂದ ಹೊರತೆಗೆಯಲಾದ ಅಗ್ರ 1,500 TF-IDF ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಸೇರಿಸಿದ್ದೇವೆ ಮತ್ತು ಇದು ಮಾದರಿ ನಿಖರತೆಯನ್ನ ~1% ರಷ್ಟು ಸುಧಾರಿಸಿದೆ, ಉತ್ತಮ ಕಾರ್ಯಕ್ಷಮತೆಗಾಗಿ ಇತರ ಪಠ್ಯ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಪ್ರಶ್ನೆಗಳಿಂದ ಹೊರತೆಗೆಯಬೇಕಾಗಬಹುದು ಎಂದು ಸೂಚಿಸುತ್ತದೆ. ಈ ವಿಧಾನದ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು Embibe ನ ವೈಯಕ್ತಿಕರಿಸಿದ ವಿಷಯ ಪತ್ತೆ ಎಂಜಿನ್ಗಾಗಿ ಶ್ರೇಣಿಗಾಗಿ-ಕಲಿಕೆ ಹೆಚ್ಚಿನ ಸಂಶೋಧನಾ ಪುನರಾವರ್ತನೆಗಳಿಗೆ ಆಧಾರವಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ.
ಉಲ್ಲೇಖಗಳು:
- Liu T., “Learning to rank for information retrieval.”, Foundations and Trends® in Information Retrieval 3.3 (2009): 225-331.
- Kraskov A., Stögbauer K. and Grassberger P., “Estimating mutual information.”, Physical review E 69.6 (2004): 066138.
- Cox D. R., “The regression analysis of binary sequences.”, Journal of the Royal Statistical Society. Series B (Methodological) (1958): 215-242.