Phát triển một số phương pháp lọc thông tin cho hệ tư vấn

135 25 0
Phát triển một số phương pháp lọc thông tin cho hệ tư vấn

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

L I CAM OAN Tôi xin cam oan ây cơng trình nghiên c u c a riêng tơi Các k t qu c vi t chung v i tác gi khác u cs ng ý c a ng tác gi trư c ưa vào lu n án Các k t qu nêu lu n án trung th c chưa t ng c cơng b cơng trình khác Tác gi Nguy n Duy Ph ng L i c m ơn Th c hi n lu n án ti n s m t th thách l n, òi h i s kiên trì t p trung cao Tôi th c s h nh phúc v i k t qu tài nghiên t c không ch n l c cá nhân, mà cịn có c u c a Nh ng k t qu s h tr giúp t c c a t p th giáo viên hư ng d n, nhà trư ng, b mơn, nghi p gia ình Tơi mu n bày t tình c m c a Trư c tiên, xin bày t s bi t ơn sâu s c d n PGS TS T Minh Phương PGS TS ng nv ih n t p th giáo viên hư ng inh M nh Tư ng c làm vi c v i hai th y m t h i l n cho h c h i phương pháp nghiên c u C m ơn hai th y r!t nhi u s hư ng d n t n tình, nghiêm túc khoa h c Tôi xin trân tr ng c m ơn B mơn Khoa h c máy tính, Khoa Cơng ngh thơng tin, Phịng t o, Ban giám hi u trư ng i h c Công ngh ãt o i u ki n thu n l i cho tơi su t q trình th c hi n lu n án Tôi xin c m ơn t p th Lãnh o H c Vi n Công ngh Bưu Vi"n thơng, cán b , gi ng viên khoa Công ngh thông tin – H c Vi n Công ngh Bưu Vi"n thơng ã c# v$ ng viên tơi q trình nghiên c u Tơi c m ơn t!t c nh ng ngư i b n c a tôi, nh ng ngư i chia s% c# v$ tơi nh ng lúc khó kh&n ghi nh Cu i cùng, xin bày t lịng bi t ơn vơ h n ln bên c nh ng h , giúp i u ó i v i cha m' gia ình ã M CL C PH(N M) (U Tính c!p thi t c a lu n án 11 M*c tiêu c a lu n án 12 Các óng góp c a lu n án 13 B c*c c a lu n án 15 CH+ƠNG T-NG QUAN V L/C THÔNG TIN CHO H0 T+ V1N 16 1.1 GI2I THI0U CHUNG 16 1.1.1 Ki n trúc t#ng quát c a h th ng l c thông tin 17 1.1.2 L c thông tin truy v!n thông tin 18 1.1.3 H c máy l c thông tin 19 1.1.4 L c thông tin h tư v!n 21 1.2 PH+ƠNG PHÁP L/C THEO N3I DUNG 24 1.2.1 Bài toán l c theo n i dung 25 1.2.2 Các phương pháp pháp l c theo n i dung 25 1.2.2.1 L c n i dung d a vào b nh 25 1.2.2.2 L c n i dung d a vào mơ hình 28 1.2.3 Nh ng v!n t n t i 29 1.3 PH+ƠNG PHÁP L/C C3NG TÁC 30 1.3.1 Bài toán l c c ng tác 30 1.3.2 Các phương pháp l c c ng tác 32 1.3.2.1 L c c ng tác d a b nh 32 1.3.2.2 L c c ng tác d a vào mơ hình 35 1.3.3 Nh ng v!n t n t i 38 1.4 PH+ƠNG PHÁP L/C K4T H5P 39 1.4.1 Bài toán l c k t h p 39 1.4.2 Các phương pháp l c k t h p 40 1.4.3 Nh ng v!n t n t i 42 1.5 K4T LU6N 42 CH+ƠNG L/C C3NG TÁC B7NG PH+ƠNG PHÁP H/C A NHI0M 2.1 8T V1N 44 2.1.1 V!n d li u thưa c a l c c ng tác 44 2.1.2 9nh hư:ng c a v!n d li u thưa 45 2.1.3 Các phương pháp h n ch v!n d li u thưa 46 2.2 L/C C3NG TÁC B7NG PHÂN LO;I 48 2.2.1 Phát bi u toán l c c ng tác b k t h p 88 3.3.2 Xây d ng liên k t ngư i dùng n i dung s n phBm 91 3.3.3 Phương pháp d oán 95 3.3.3.1 L c c ng tác d a mơ hình th> k t h p 95 3.3.3.2 L c n i dung d a mơ hình th> k t h p 95 3.3.3.3 Phương pháp l c k t h p ơn gi n 96 3.3.3.4 Phương pháp k t h p xu!t 96 3.3.4 Thu t toán lan truy n m ng 102 3.4 TH= NGHI0M VÀ K4T QU9 103 3.4.1 D li u th nghi m 104 3.4.2 Phương pháp th nghi m 105 3.4.3 So sánh ánh giá d a vào Precision, Recall F-measure 105 3.4.4 Phân tích k t qu 107 3.4.5 Trư ng h p d li u thưa 110 3.5 K4T LU6N 111 K4T LU6N 113 DANH MQC CÁC CƠNG TRÌNH CƠNG BR 116 TÀI LI0U THAM KH9O (TI4NG VI0T): 117 TÀI LI0U THAM KH9O (TI4NG ANH): 117 PHQ LQC XÂY D?NG H0 THRNG T+ V1N L?A CH/N PHIM D?A TRÊN MƠ HÌNH @ THA K4T H5P .127 DANH M C CÁC CH KÝ HI U VI T T T DI N GI I AM Aspect Model (Mô hình >nh hư ng) AU Active User (Ngư i dùng hi n th i) CBF Content-Based Filtering (L c d a n i dung) CF Collaborative Filtering (L c c ng tác) DAC Data Analyser Component (Thành ph n phân tích d li u) DBC Data-Based Concept (Nguyên lý d a vào d li u) DF Degree of Freedom (S b c t do) EM Expectation Maximization (C c FC Filtering Component (Thành ph n l c) FMM Flexible Mixture Model (Mơ hình pha tr n linh ho t) IBL Instance-Based Learning (H c d a ví d*) IDF Inverse Document Frequency (T n su!t xu!t hi n ngư c) IE Information Extraction (CDch thông tin) IF Information Filtering (L c thông tin) IO Information Overload (Quá F i thông tin) IR Information Retrieval (Truy v!n thông tin) KNN K Neareast Neighbor (K ngư i láng gi ng g n nh!t) KPC i kS v ng) KNN Pearson Correlation (Phương pháp K ngư i láng gi ng g n nh!t d a tương quan Pearson) LC Learning Component (Thành ph n h c) LL Lazy Learning (H c lư i) LSE Least Square Estimation (+ c lư ng bình phương t i thi u) LSM Latent Semantic Model (Mơ hình ng ngh a Bn) MAE Mean Absolute Error (Trung bình giá tr> t MBF Memory-Based Filtering (L c d a vào b nh ) MC Multiclass Classification (Phân lo i nhi u l p) MDBF Model-Based Filtering (L c d a vào mơ hình) ML Machine Learning (H c máy) MM Multinomial Model (Mơ hình a th c) i l i) MMM Multinomial Mixture Model (Mơ hình pha tr n a th c) MTL Multi Task Learning (H c a nhi m) PCA Principal Components Analysis (Phân tích thành ph n chính) RS Recommender System (H th ng tư v!n) SD Standard Deviation ( SDP Sparsity Data Problem (V!n SE Standard Error (L i chuBn) STL Single Task Learning (Phương pháp h c ơn l%) SVD Singular Value Decomposition (Phân TUEgiá tr> riêng) SVM Support Vector Machine (VDy h Etr EWXctơ) TF Term Frequency (T n su!t) UMC User-Model Component (Thành ph n mơ hình ngư i dùng) URP User Rating Profile (H Esơ Dnh OPDEngư i HIng) l ch chuBn) d li u thưa) DANH M C CÁC HÌNH Hình 1.1 Ki n trúc t#ng quát c a h th ng l c thơng tin .17 Hình 1.2 Các thành ph n c a h th ng l c c ng tác 31 Hình 2.1 Thu t toán GentleBoost 52 Hình 2.2 Phương pháp STL cho b n toán phân lo i c l p .58 Hình 2.3 Phương pháp h c MTL cho b n toán phân lo i ng th i 58 Hình 2.4 Thu t tốn MC-Boost c i ti n s d*ng Yc trưng chung cho nhi u toán 62 Hình 2.5 Phương pháp t t p tốn phân lo i 64 Hình 3.1 th> Ngư i dùng- S n phBm 76 Hình 3.2 th> G+ bi u di"n ánh giá thích h p 79 Hình 3.3 th> G- bi u di"n ánh giá khơng thích h p 80 Hình 3.4 Thu t tốn d oán EFG>EG+ 81 Hình 3.5 Thu t tốn d ốn EFG>EG- 84 Hình 3.6 Thu t toán d oán t!t c ánh giá 86 Hình 3.7 th> k t h p ngư i dùng n i dung s n phBm .90 Hình 3.8 th> thi t l p liên k t gi a ngư i dùng Yc trưng n i dung 94 Hình 3.9 Thu t tốn d ốn th> k t h p .99 Hình 3.10 Thu t toán lan truy n m ng .103 Hình 3.11 Giá tr> F-Measure : m c thưa th t d li u 111 DANH M C CÁC B NG B ng 1.1 Phân lo i phương pháp tư v!n m t s nghiên c u i n hình 23 B ng 1.2 Ví d* v ma tr n ánh giá c a l c c ng tác 31 B ng 2.1 Ma tr n ánh giá ngư i dùng .45 B ng 2.2 Ma tr n u vào c a l c c ng tác 49 B ng 2.3 Ma tr n u vào toán phân lo i theo ngư i dùng 50 B ng 2.4 Ma tr n u vào toán phân lo i theo s n phBm 50 B ng 2.5 K t qu th nghi m v i MovieLens .68 B ng 2.6 K t qu th nghi m v i EachMovie .68 B ng 2.7 Các tham s th ng kê v i K=5 ánh giá bi t trư c 70 c a t p d li u MovieLens 70 B ng 2.8 Các tham s th ng kê v i K=10 ánh giá bi t trư c 70 c a t p d li u MovieLens 70 B ng 2.9 Các tham s th ng kê v i K=20 ánh giá bi t trư c 71 c a t p d li u MovieLens 71 B ng 2.10 Các tham s th ng kê v i K=5 ánh giá bi t trư c 71 c a t p d li u EachMovie .71 B ng 2.11 Các tham s th ng kê v i K=10 ánh giá bi t trư c 71 c a t p d li u EachMovie .71 B ng 2.12 Các tham s th ng kê v i K=20 ánh giá bi t trư c 72 c a t p d li u EachMovie .72 B ng 3.1 Ma tr n ánh giá R .74 B ng 3.2 Ma tr n S n phBm – N i dung Y 74 B ng 3.3 Ma tr n X bi u di"n ánh th> Ngư i dùng- S n phBm 76 + B ng 3.4 Ma tr n X bi u di"n LDc ánh giá thích h p 79 B ng 3.5 Ma tr n X- bi u di"n LDc ánh giá khơng thích h p 80 B ng 3.6 Ma tr n ánh giá R .89 B ng 3.7 Ma tr n Ngư i dùng- S n phBm X 89 B ng 3.8 Ma tr n S n phBm- N i dung Y 90 B ng 3.9 Giá tr> Precision, Recall, F-Measure ki m nghi m t p MovieLens1 106 B ng 3.10 Giá tr> Precision, Recall, F-Measure ki m nghi m t p MovieLens2 107 B ng 3.11 K t qu ki m nghi m paired t-test v i K=10 s n phBm c n tư v!n t p MovileLens1 108 B ng 3.12 K t qu ki m nghi m paired t-test v i K=20 s n phBm c n tư v!n t p MovileLens1 109 B ng 3.13 K t qu ki m nghi m paired t-test v i K=50 s n phBm c n tư v!n t p MovieLens1 109 B ng 3.14 K t qu ki m nghi m paired t-test v i K=10 s n phBm c n tư v!n t p MovileLens2 109 B ng 3.15 K t qu ki m nghi m paired t-test v i K=20 s n phBm c n tư v!n t p MovileLens2 110 B ng 3.16 K t qu ki m nghi m paired t-test v i K=50 s n phBm c n tư v!n t p MovileLens2 110 10 [53] J.A Konstan, B.N Miller, D Maltz, J.L Herlocker, L.R Gordon, and J Riedl (1997), “GroupLens: Applying Collaborative Filtering to Usenet News”, Comm ACM, vol 40, No 3, pp 77-87, 1997 [54] J.B Schafer, J.A Konstan, and J Riedl (2001), “E-Commerce Recommendation Applications,” Data Mining and Knowledge Discovery, vol 5, pp 115-153 [55] J.L Herlocker, J.A Konstan, and J Riedl (2000), “Explaining Collaborative Filtering Recommendations”, Proc ACM Conf Computer Supported Cooperative Work [56] J.L Herlocker, J.A Konstan, L.G Terveen, and J.T Riedl (2004), “Evaluating Collaborative Filtering Recommender Systems”, ACM Trans Information Systems, vol 22, No 1, pp 5-53 [57] J.Wang, A.P de Vries, M.J.T Reinders (2006), “Unifying user-based and item-based collaborative filtering approaches by similarity fusion”, Proc of SIGIR’06 [58] J Roderick, A Little, B Donald Statistical analysis with missing data John Wiley & Sons, Inc., 1987 [59] J Wang, A P de Vries, M J T Reinders (2008), “Unified relevance models for rating prediction in collaborative filtering,” ACM Transactions on Information Systems, vol 26, No 3, pp 1–42 [60] J.Weston, A Elisseeff, D Zhou, C.S Leslie, and W.S.Noble: Protein ranking: From local to global structure in the protein similarity network Proceedings of National Academy of Science Vol 101(17) pp: 6559-6563 (2004) [61] K Crammer, and Y Singer (2002), “Pranking with ranking”, Advances in Neural Information Processing Systems, Vol 14, pp 641-647 [62] K Goldberg, T Roeder, D Gupta, and C Perkins (2001), “Eigentaste: A Constant Time Collaborative Filtering Algorithm”, Information Retrieval J., vol 4, No 2, pp 133-151 [63] K Yu, A Schwaighofer, V Tresp, X Xu, and H.-P Kriegel (2004), “Probabilistic Memory-Based Collaborative Filtering”, IEEE Trans Knowledge and Data Eng., vol 16, No 1, pp 56-69 [64] K Yu, X Xu, J Tao, M Ester, and H.-P Kriegel (2002), “Instance Selection Techniques for Memory-Based Collaborative Filtering”, Proc Second SIAM Int’l Conf Data Mining (SDM ’02) [65] L Getoor and M Sahami (1999), “Using Probabilistic Relational Models for Collaborative Filtering”, Proc Workshop Web Usage Analysis and User Profiling (WEBKDD ’99) 121 [66] L Si and R Jin (2003), “Flexible Mixture Model for Collaborative Filtering”, Proc 20th Int’l Conf Machine Learning [67] L Terveen, W Hill, B Amento, D McDonald, and J Creter (1997), “PHOAKS: A System for Sharing Recommendations”, Comm ACM, vol 40, No 3, pp 59-62 [68] L.H Ungar and D.P Foster (1998), “Clustering Methods for Collaborative Filtering”, Proc Recommender Systems, Papers from 1998 Workshop, Technical Report WS-98-08 1998 [69] M Balabanovic and Y Shoham (1997), “Fab: Content-Based, Collaborative Recommendation”, Comm ACM, vol 40, No 3, pp 66-72 [70] M Claypool, A Gokhale, T Miranda, P Murnikov, D Netes, and M Sartin (1999), “Combining Content-Based and Collaborative Filters in an Online Newspaper”, Proc ACM SIGIR ’99 Workshop Recommender Systems: Algorithms and Evaluation [71] M Condliff, D Lewis, D Madigan, and C Posse (1999), “Bayesian Mixed-Effects Models for Recommender Systems”, Proc ACM SIGIR ’99 Workshop Recommender Systems: Algorithms and Evaluation [72] M Deshpande and G Karypis (2004), “Item-Based Top-N Recommendation Algorithms”, ACM Trans Information Systems, vol 22, No 1, pp 143-177 [73] M Pazzani and D Billsus (1997), “Learning and Revising User Profiles: The Identification of Interesting Web Sites”, Machine Learning, vol 27, pp 313-331 [74] M Pazzani (1999), “A Framework for Collaborative, Content-Based, and Demographic Filtering”, Artificial Intelligence Rev., pp 393-408 [75] N.J Belkin and B Croft (1992), “Information Filtering and Information Retrieval” Comm ACM, vol 35, No 12, pp 29-37 [76] N Good, J.B Schafer, J.A Konstan, A Borchers, B Sarwar, J.L Herlocker, and J Riedl (1999), “Combining Collaborative Filtering with Personal Agents for Better Recommendations”, Proc Conf Am Assoc Artificial Intelligence (AAAI-99), pp 439-446 [77] N Littlestone, M Warmuth (1994), “The Weighted Majority Algorithm”, Information and Computation, vol 108, No 2, pp 212-261 [78] N Ramakrishnan, B.J Keller, B.J Mirza, A.Y Grama, and G.Karypis (2001), “Privacy Risks in Recommender Systems”, IEEE Internet Computing, vol 5, No 6, pp 54-62 122 [79] N Srebro, T Jaakola (2003), “Weighted low-rank approximations”, In Proceedings of the Twentieth International Conference on Machine Learning (ICML-2003) [80] Nguyen Duy Phuong, Le Quang Thang, Tu Minh Phuong (2008), “A Graph-Based for Combining Collaborative and Content-Based Filtering” PRICAI 2008: 859-869 [81] Nguyen Duy Phuong, Tu Minh Phuong (2008), “Collaborative Filtering by Multi-Task Learning” RIVF 2008: 227-232 [82] P Melville, R.J Mooney, and R Nagarajan (2002), “Content-Boosted Collaborative Filtering for Improved Recommendations”, Proc 18th Nat’l Conf Artificial Intelligence [83] P Resnick, N Iakovou, M Sushak, P Bergstrom, and J Riedl (1994), “GroupLens: An Open Architecture for Collaborative Filtering of Netnews”, In Proceedings of ACM, pp 175-186 [84] R Baeza-Yates and B Ribeiro-Neto (1999), “Modern Information Retrieval” Addison-Wesley [85] R Burke (2000), “Knowledge-Based Recommender Systems”, Encyclopedia of Library and Information Systems, A Kent, ed., vol 69, Supplement 32, Marcel Dekker [86] R Bell, Y Koren (2007), “Improved neighborhood-based collaborative filtering”, in Proceedings of KDD Cup and Workshop [87] R Caruana (1997), “Multi–task learning”, Machine Learning, 28, pp 41– 75 [88] R Jin, L Si, and C Zhai (2003), “Preference-Based Graphic Models for Collaborative Filtering”, Proc 19th Conf Uncertainty in Artificial Intelligence (UAI 2003) [89] R Kumar, P Raghavan, S Rajagopalan, and A Tomkins (2001), “Recommendation Systems: A Probabilistic Analysis”, J Computer and System Sciences, vol 63, No 1, pp 42-61 [90] R Schaback and H Wendland (2001), “Characterization and Construction of Radial Basis Functions”, Multivariate Approximation and Applications, N Dyn, D Leviatan, D Levin, and A Pinkus, eds., Cambridge Univ Press, 2001 [91] R Schapire (2001), “The Boosting Approach to Machine Learning: An Overview”, Proc MSRI Workshop Nonlinear Estimation and Classification [92] R.J Mooney and L Roy (1999), “Content-Based Book Recommending Using Learning for Text Categorization”, Proc ACM SIGIR ’99 Workshop Recommender Systems: Algorithms and Evaluation 123 [93] S.E Middleton, N.R Shadbolt, and D.C de Roure (2004), “Ontological User Profiling in Recommender Systems”, ACM Trans Information Systems, vol 22, No 1, pp 54-88 [94] S M McNee, J Riedl, J A Konstan (2006), “Accurate is not always good: how accuracy metrics have hurt recommender systems,” in Proceedings of the ACM Conference on Human Factors in Computing Systems (CHI '06) [95] T Hofmann (2003), “Collaborative Filtering via Gaussian Probabilistic Latent Semantic Analysis”, Proc 26th Ann Int’l ACM SIGIR Conf [96] T Hofmann (2004), “Latent Semantic Models for Collaborative Filtering”, ACM Trans Information Systems, vol 22, No 1, pp 89-115 [97] T Mitchell (1997), “Machine Learning”, ed McGraw Hill [98] T Tran and R Cohen (2000), “Hybrid Recommender Systems for Electronic Commerce”, Proc Knowledge-Based Electronic Markets, Papers from the AAAI Workshop, Technical Report WS-00-04, AAAI Press [99] U Hanani, B Shapira, P Shoval (2001), “Information Filtering: Overview of Issues, Research and Systems”, User Modeling and User-Adapted Interaction, vol 11, No.3, pp.203-209 [100] U Shardanand and P Maes (1995), “Social Information Filtering: Algorithms for Automating ‘Word of Mouth’”, Proc Conf Human Factors in Computing Systems [101] W Wade (2003), “A Grocery Cart that Holds Bread, Butter, and Preferences”, New York Times [102] W.W Cohen, R.E Schapire, and Y Singer (1999), “Learning to Order Things”, J Artificial Intelligence Research, vol 10, pp 243-270, 1999 [103] X Su and T M Khoshgoftaar (2006), “Collaborative filtering for multiclass data using belief nets algorithms”, in Proceedings of the International Conference on Tools with Artificial Intelligence (ICTAI '06), pp 497–504 [104] X Su, R Greiner, T M Khoshgoftaar, X Zhu (2007), “Hybrid collaborative filtering algorithms using a mixture of experts” in Proceedings of the IEEE/WIC/ACM International Conference on Web Intelligence (WI '07), pp 645–649, Silicon Valley, Calif, USA [105] X Su, T M Khoshgoftaar, R Greiner (2008), “A mixture imputationboosted collaborative filter”, in Proceedings of the 21th International Florida Artificial Intelligence Research Society Conference (FLAIRS '08), pp 312–317, Coconut Grove, Fla, USA [106] X Su, T M Khoshgoftaar, X Zhu, R Greiner (2008), “Imputationboosted collaborative filtering using machine learning classifiers,” in 124 Proceedings of the 23rd Annual ACM Symposium on Applied Computing (SAC '08), pp 949–950, Ceará Fortaleza, Brazil [107] X Su, T M Khoshgoftaar (2009), “A Survey of Collaborative Filtering Techniques” Advances in Artificial Intelligence, vol 2009, pp.1-20 [108] Y Koren (2008), “Tutorial on recent progress in collaborative filtering”, in Proceedings of the the 2nd ACM Conference on Recommender Systems [109] Y Koren (2008), “Factorization meets the neighborhood: a multifaceted collaborative filtering model” in Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD '08), pp 426–434, Las Vegas, Nev, USA [110] Y Freund and R Schapire (1996), “Experiments with a new boosting algorithm” In Machine Learning: Proceedings of the Thirteenth International Conference, pp.148-156 [111] Y Freund, R Iyer, R.E Schapire, and Y Singer (1998), “An Efficient Boosting Algorithm for Combining Preferences”, Proc 15th Int’l Conf Machine Learning [112] Y Zhang and J Callan (2001), “Maximum Likelihood Estimation for Filtering Thresholds”, Proc 24th Ann Int’l ACM SIGIR Conf [113] Y Zhang, J Callan, and T Minka (2002), “Novelty and Redundancy Detection in Adaptive Filtering”, Proc 25th Ann Int’l ACM SIGIR Conf, pp 81-88 [114] Y.-H Chien and E.I George (1999), “A Bayesian Model for Collaborative Filtering”, Proc Seventh Int’l Workshop Artificial Intelligence and Statistics [115] Y Park, A Tuzhilin: The long tail of recommender systems and how to leverage it RecSys 2008: 11-18 [116] Z Huang, D Zeng, H Chen (2007), “Analyzing Consumer-product Graphs: Empirical Findings and Applications in Recommender Systems”, Management Science, 53(7), 1146-1164 [117] Z Huang, D Zeng, H Chen (2007), “A Comparison of CollaborativeFiltering Recommendation Algorithms for E-commerce”, IEEE Intelligent Systems, 22(5): 68-78 [118] Z Huang, D Zeng (2005), “Why Does Collaborative Filtering Work? Recommendation Model Validation and Selection by Analyzing Random Bipartite Graphs”, The Fifteenth Annual Workshop on Information Technologies and Systems (WITS 2005), Best Paper Nominee [119] Z Huang, H Chen, D Zeng (2004), “Applying Associative Retrieval Techniques to Alleviate the Sparsity Problem in Collaborative Filtering”, ACM Transactions on Information Systems, vol 22(1) pp 116–142 125 [120] Z Huang, W Chung, H Chen (2004), “ A Graph Model for E-Commerce Recommender Systems”, Journal of The American Society for Information and Technology (JASIST), 55(3):259–274 [121] Z Huang, W Chung, T Ong, , And H Chen (2002), “A graph-based recommender system for digital library” In Proceedings of the 2nd ACM/IEEECS Joint Conference on Digital Libraries (Portland, Ore.) ACM, New York, 65–73 [122] Z Huang (2005), “Graph-based Analysis for E-commerce Recommendation”, PhD Thesis, The University of Arizona (ACM SIGMIS Best Dissertation Award 2005) 126 PH L C XÂY D%NG H THMNG TƯ V N L%A CH N PHIM D%A TRÊN MƠ HÌNH < TH= K T H)P H th ng tư v!n l a ch n phim (Film Recommendation System) c xây d ng d a vào mơ hình th> k t h p ã c trình bày Chương H th ng cho phép ngư i dùng xem phim, tra c u n i dung phim, ánh giá phim, tìm ki m n i dung phim, tư v!n phim m t s ch c n &ng c p nh t thông tin v phim thơng tin ngư i dùng Tồn b h th ng c xây d ng d a công ngh JSP v i giao di n Web thân thi n, 'p d" s d*ng 1.1 KI N TRÚC T NG QUÁT CNA H THMNG Ki n trúc c a h th ng c thi t k theo mơ hình ba t ng: T ng trình bày, t ng logic t ng d li u Ngồi ra, có th tương tác gi a t ng trình bày t ng logic, h th ng s d*ng kh i i u n qu n lý lu ng th c thi công vi c Nhi m v* chi ti t c a m i t ng c mơ t Hình 1.1.1 T ng trình bày Là t ng có nhi m v* giao ti p tr c ti p v i ngư i dùng T ng c xây d ng dư i d ng m t website Nhi m v* c a t ng cung c!p giao di n cho ngư i dùng, g i yêu c u tư v!n, tìm ki m, ánh giá cho t ng bên d i thông qua kh i i u n 1.1.2 T ng Logic ây t ng x lý nh ng công vi c quan tr ng nh!t c a h th ng, bao g m nhi m v* h c, l c t o nên tư v!n cho ngư i dùng K t qu ch c n&ng t ng giao ti p thông qua kh i i u n chuy n n t ng giao di n sinh t v!n cho ngư i dùng hi n th i Khi c kích ho t, ch c n&ng s Z l !y d li u c n thi t, th c hi n tính toán hi n th> k t qu Trong t ng Logic, hai ch c n&ng c thi t l p ó ch c n &ng h c c th c hi n 127 offline (“Pha Offline”) ch c n&ng d oán c th c hi n online (“Pha Online”) T ng trình bày GIAO DI0N NG+zI DÙNG Trang JSP PHA ONLINE T ng logic Recommendations UI_Path I.U KHIyN Controller PHA OFFLINE Learning Method CombinedGraph QU9N LÝ DB T ng d$ li u ánh giá ng dùng DAO i 3c tr ng n'i dung phim D$ li u phim, D$ li u ng i dùng Hình Ki n trúc h th ng • Ch c n&ng h c có nhi m v* xây d ng mơ hình d a d li u ánh giá phim c a ngư i dùng, k t h p v i Yc trưng n i dung c a phim c th> ã trình bày Ch ương Trong ch c xây d ng theo mơ hình n &ng này, mơ th> c xây d ng kh i “CombinedGraph”, sau ó th c hi n tính tốn theo thu t tốn m ng lan truy n cho m i ngư i dùng k t h p lưu l i k t qu kh i “ Yc trưng n i dung phim” 128 • Ch c n&ng “T v!n”: Khi có yêu c u tư v!n t m t ngư i dùng c g i t kh i i u n, ch c n&ng sZ s d*ng d li u c xây d ng t pha ng i Top-N phim có tr ng s cao nh!t h c offline tìm tr ng s dài L cao nh!t (UI_Path) ch n tư v!n cho khách hàng (Top – N) 1.1.3.T ng d$ li u Có nhi m v* qu n tr> s: d li u c a h th ng bao g m: d li u v ngư i dùng, n i dung phim, ánh giá ngư i dùng cho phim, Yc trưng n i dung phim k t qu tính tốn theo mơ hình m ng lan truy n nh n c t ch c n&ng h c 1.2 CÁC CHOC NPNG CHÍNH CNA H THMNG H th ng c thi t k th c hi n H i u hành Windows XP s d*ng ngôn ng l p trình Java mơi trư ng PHP H th ng s d*ng t p d li u MovieLens, c thi t k MySql Toàn b h th ng c thi t k m t Website v i nh ng ch c n &ng sau: Qng nh p: Trang ch c a h th ng c > nh danh ba ch Website, ngư i dùng có th &ng nh p thông qua >a ch Web truy nh p vào trang ch c a h th ng N u ngư i dùng ã có tài kho n h th ng, ngư i dùng sZ nh n c danh sách phim h th ng tư v!n cho h N u ngư i dùng m i &ng ký tài kho n l n u vào h th ng, h th ng sZ yêu c u ngư i dùng ánh giá t i thi u 20 phim trư c th c hi n cung c!p d>ch v* tư v!n phim Sau &ng nh p, ngư i dùng c phép s d*ng d> ch v* h th ng FRM cung c!p, như: Tìm ki m thông tin v phim, xem danh sách phim, danh sách phim m i, xem phim, tóm t t n i dung phim, vai óng phim, nh ng bình lu n v phim, ánh giá cho phim, ánh giá nhân v t c a tháng, phim c a tháng Tìm ki m: Ch c n&ng cung c!p cơng c* tìm ki m thơng tin v phim Ngư i dùng có th di"n viên, ưa tùy ch n c a thơng qua l a ch n: T khóa, o di"n, th lo i phim 129 Danh sách phim: Ch c n&ng cung c!p danh sách phim theo th lo i, nư c s n xu!t, hãng phim, công ty phát hành, d ng m t tùy ch n ngư i dùng ch c a th lo i phim (Hành o di"n hoYc di"n viên dư i >nh Ngư i dùng có th ưa l a ch n ng, tình c m, vi"n tư:ng, ho t hình ), theo nư c s n xu!t (Anh, M^, Ca-na- a, Trung Qu c ) hoYc theo hãng s n xu!t, công ty phát hành, di"n viên óng Nh ng thơng tin cung c!p cho ngư i dùng nh

Ngày đăng: 01/08/2020, 21:06

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan