Hệ thống hỗ trợ cá nhân hóa các trang tin tức tiếng Việt

21 166 0
Hệ thống hỗ trợ cá nhân hóa các trang tin tức tiếng Việt

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Cá nhân hóa là tiến trình thu thập và lưu trữ thông tin về người dùng website,phân tích thông tin và dựa trên những phân tích đó để gợi ý những thông tin phù hợp với mỗi người dùng Lượng thông tin cung cấp mỗi ngày của các trang tin tức rất lớn và phong phú, khó khăn khi tìm kiếm tin Các trang tin tức tiếng việt nổi tiếng hiện nay như vnexpress.net, 24h.com,… chưa có chức năng cá nhân hóa Phải xây dựng một hệ thống hỗ trợ cá nhân hóa các trang tin tức tiếng việt

[...]... hệ thống cá nhân hóa  Kiến trúc hệ thống: client–server  Server  Client chạy hệ thống gợi ý (kết nối với server) hiển thị nội dung tin bài và các gợi ý tin bài (links) liên quan Cài đặt hệ thống cá nhân hóa Hạn chế của hệ thống  Hạn chế của cá nhân hóa nội dung:  Gợi ý các tin tức (links) có nội dung quá giống với tin hiện tại  Để hệ thống gợi ý chính xác, người dùng phải đọc lượng tin đủ lớn... khóa trong hồ sơ người dùng Tính toán tập gợi ý  Với người dùng u, tin bài đang đọc i, thì hệ thống sẽ tính tập gợi ý các tin bài (links) liên quan như sau:  Tính giá trị hàm score(i*,i,u) cho mỗi tin bài i*  Sắp xếp các tin bài i* theo giá trị giảm dần đối với giá trị hàm score  Lựa chọn các tin bài có giá trị hàm score > ngưỡng α (Các tin bài nằm ở đầu của danh sách đã sắp xếp.) Cài đặt hệ thống. .. liệu CSDL tin tức Việc thu thập và tiền xử lý dữ liệu gồm 2 bước Tính tần xuất xuất hiện mỗi từ khóa trong tin  Tính trọng số của mỗi từ khóa theo công  thức TF-IDF  Biểu diễn sở thích của người dùng Các tin tức người dùng đã đọc  Cập nhật biểu diễn sở thích người dùng Hồ sơ người dùng Việc cập nhật biểu diễn sở thích người dùng gồm 2 bước:  Tính  Cập tần xuất xuất hiện mỗi từ khóa trong tin nhật... (1 − α )u score(i*,i,u) :hàm tiện ích xác định độ phù hợp của tin bài i* đối với người dùng u và tin bài đang đọc i score(i*, i, u ) =cos(u ', i*) =  Chọn tập tin i* có score cao nhất u '.i * u' i * Kiến trúc hệ thống gợi ý links  Máy cá nhân hóa Hồ sơ ngườ  Quản i lí hs dùng ngườ i dùng   Tập  Thu tin thập &xử  ww lí w  Hiển thị tin liên quan  Thu thập sở thích ngườ i Thu thập và tiền xử... từ khóa ki  wuki:  ti : tần xuất xuất hiện của từ khóa ki trong lịch sử đọc tin của người dùng ti  Từ đó : wuki= (t j ) 2 ∑ j =1 n Tính toán tập tin liên quan     u = (wu1, wu2, …, wuN):biểu diễn hồ sơ sơ thích người dùng = (wi1, wi2, …, wiN) :biểu diễn tin bài đang đọc i =(wi*1 ,wi*2,…wi*N) : biểu diễn tập tin bài i*  N:tập các từ khóa  Kết hợp hồ sơ sở thích người dùng và nội dung tin: ... đọc lượng tin đủ lớn Hướng phát triển trong tương lai  Cải tiến những hạn chế của hệ thống đã nêu trong slide trước  Phát triển thêm chức năng xem trước tin tức khi người dùng di chuột vào môt link tin tức:  Hiện một cửa sổ pop-up chứa mô tả tóm tắt nội dung tin  Nội dung hiển thị trong cửa sổ pop-up được cá nhân hóa cho mỗi người dùng tại mỗi ngữ cảnh Tài liệu tham khảo

Ngày đăng: 26/09/2014, 10:48

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan