Bài toán khai thác thông tin về sản phẩm từ web

59 21 0
Bài toán khai thác thông tin về sản phẩm từ web

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Đồ án tốt nghiệp Trường ĐHDL Hải Phòng MỤC LỤC MỤC LỤC DANH SÁCH CÁC HÌNH GIỚI THIỆU CHƯƠNG 1: CƠ SỞ LÝ THUYẾT 1.1CÁC KHÁI NIỆM CƠ BẢN 1.2 KHÁM PHÁ TRI THỨC TRONG CƠ SỞ DỮ LIỆU 1.3 CÁC KỸ THUẬT ÁP DỤNG TRONG KHAI PHÁ DỮ LIỆU 11 1.3.1 Các kỹ thuật tiếp cận Khai phá liệu 11 1.3.2 Các dạng liệu khai phá 12 1.4TÌM KIẾM THƠNG TIN TRÊN INTERNET 12 1.5 PHÂN LOẠI THƠNG TIN TÌM KIẾM 15 1.6TỔ CHỨC LƯU TRỮ THƠNG TIN TÌM KIẾM 17 1.7XỬ LÝ THÔNG TIN 17 CHƯƠNG 2: KHAI PHÁ VÀ TỔNG HỢP DỮ LIỆU 19 2.1 PHÂN CỤM DỮ LIỆU 19 2.2 CÁC ỨNG DỤNG CỦA PHÂN CỤM DỮ LIỆU 20 2.3 CÁC KIỂU DỮ LIỆU VÀ ĐỘ ĐO TƯƠNG TỰ 21 2.3.1 Phân loại kiểu liệu dựa kích thước miền 21 2.3.2 Phân loại kiểu liệu dựa hệ đo 21 2.4 CÁC YÊU CẦU CẦN THIẾT CHO TẠO DỤNG KỸ THUẬT PCDL 22 2.5 MỘT SỐ THUẬT TOÁN PHÂN CỤM DỮ LIỆU ĐIỂN HÌNH .24 2.5.1 Họ thuật toán phân hoạch 24 2.5.2 Các thuật toán phân cụm phân cấp 28 2.5.3 Các thuật toán phân cụm dựa mật độ 31 CHƯƠNG 3: HỆ THỐNG ĐÁNH GIÁ THÔNG TIN SẢN PHẨM .35 3.1 Phát biểu toán 35 3.2 Xác định mơ hình nghiệp vụ 36 3.2.1 Các chức nghiệp vụ 36 3.2.2 Biểu đồ Use Case tổng quan 37 3.2.3 Mô tả khái quát hệ 38 3.2.4 Các mơ hình ca sử dụng chi tiết 39 3.3 Phân tích hệ thống 43 3.3.2 Phân tích gói ca sử dụng “Cập nhật danh mục” 43 3.3.3 Phân tích gói ca sử dụng “Tìm kiếm” .49 3.3.4 Phân tích gói ca sử dụng “Báo cáo” 51 3.4 Thiết kế hệ thống 52 3.5 Thiết kế chương trình 53 3.5.1 Giao diện chương trình .53 3.5.2 Giao diện cập nhật sản phẩm 53 3.5.3 Giao diện cập nhật loại sản phẩm .54 3.5.4 Giao diện cập nhật nhóm sản phẩm 55 3.5.5 Giao diện tìm kiếm thơng tin sản phẩm 56 3.5.6 Kết chương trình minh họa 56 KẾT LUẬN 57 Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp Trường ĐHDL Hải Phòng TÀI LIỆU THAM KHẢO 58 Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp Trường ĐHDL Hải Phịng DANH SÁCH CÁC HÌNH Hình 1.1:Các bước thực trình khám phá tri thức 10 Hình 1.2 Các lĩnh vực liên quan đến Khám phá tri thức CSDL 11 Hình 1.3: Sơ đồ khối Khối truy vấn 13 Hình1.4: Sơ đồ khối Đánh mục 14 Hình2.1:Hình minh họa phân cụm liệu 19 Hình2.2: Hình dạng cụm liệu khám phá k-means 25 Hình 2.3:Cây CF sử dụng thuật toán BIRCH 28 Hình 2.4:Các cụm liệu khám phá CURE 30 Hình 2.5: Hình minh họa phân cụm OPTICS 33 Hình 2.6:Hình minh họa DENCLUE với hàm phân phối Gaussian 34 Hình 3.1: Biểu đồ Use Case tổng quan 37 Hình 3.2: Biểu đồ ca sử dụng gói “Cập nhật” 39 Hình 3.3: Biểu đồ ca sử dụng gói “Tìm kiếm” 39 Hình 3.4: Biểu đồ ca sử dụng gói “Báo cáo” 41 Hình 3.5: Biểu đồ thực thi ca sử dụng “Cập nhật nhóm sản phẩm” 44 Hình 3.6: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật nhóm sản phẩm” 44 Hình 3.7: Biểu đồ thực thi ca sử dụng “Cập nhật loạisản phẩm” 45 Hình 3.8: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật loạisản phẩm” 45 Hình 3.9: Biểu đồ thực thi ca sử dụng “Cập nhật sản phẩm” 46 Hình 3.10: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật sản phẩm” 46 Hình 3.11: Biểu đồ thực thi ca sử dụng “Cập nhật Search Engine” 47 Hình 3.12: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật Search Engine” 47 Hình 3.13: Biểu đồ thực thi ca sử dụng “Cập nhật thơng số tìm kiếm” .48 Hình 3.14: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật thông số tìm kiếm” 48 Hình 3.15: Mơ hình phân tích gói ca “Cập nhật” 49 Hình 3.16: Biểu đồ thực thi ca sử dụng “Tìm kiếm” 49 Hình 3.17: Biểu đồ cộng tác thực thi ca sử dụng “Tìm kiếm” 50 Hình 3.18: Mơ hình phân tích gói ca”Tìm kiếm” 50 Hình 3.19: Biểu đồ thực thi ca sử dụng “Lập báo cáo” 51 Hình 3.20: Biểu đồ cộng tác thực thi ca sử dụng “Báo cáo” 51 Hình 3.21: Mơ hình phân tích gói ca”Báo cáo” 51 Hình 3.22: Mơ hình lớp thiết kế hệ thống 52 Hình 3.23 Giao diện chương trình 53 Hình 3.24: Giao diện cập nhật sản phẩm 53 Hình 3.25: Giao diện cập nhật loại sản phẩm 54 Hình 3.26: Giao diện cập nhật nhóm sản phẩm 55 Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp Trường ĐHDL Hải Phịng Hình 3.27: Giao diện tìm kiếm thông tin sản phẩm 56 Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp Trường ĐHDL Hải Phòng DANH SÁCH BẢNG BIỂU Bảng 3.1: Bảng xác định chức nghiệp vụ hệ thống 36 Bảng 3.2: Bảng xác định tác nhân hệ thống 37 Bảng 3.3: Bảng mô tả ca sử dụng tác nhân 38 Bảng 3.4: Bảng mơ tả ca sử dụng cập nhật nhóm sản phẩm 39 Bảng 3.5: Bảng mô tả ca sử dụng cập nhật loại sản phẩm 40 Bảng 3.6: Bảng mô tả ca sử dụng cập nhật sản phẩm 40 Bảng 3.7: Bảng mô tả ca sử dụng câp nhật Search Engine 41 Bảng 3.8: Bảng mô tả ca sử dụng cập nhật thơng số tìm kiếm 41 Bảng 3.9: Bảng mơ tả ca sử dụng tìm kiếm 42 Bảng 3.10: Bảng mô tả ca sử dụng báo cáo 43 Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp Trường ĐHDL Hải Phòng GIỚI THIỆU Web kho tài nguyên liệu khổng lồ, không ngừng tăng trưởng với tốc độ cao Ngày nhiều thông tin sống đưa lên Internet Trong đó, Internet chứa nhiều thơng tin có giá trị liên quan đến cộng đồng nói chung, hoạt động sản xuất kinh doanh nói riêng.Xuất phát từ thực tế đó, có phương pháp nào? Chúng ta khai thác thơng tin từ Internet để phục vụ sống Hiện có nhiều cơng trình nghiên cứu phương pháp khai thác thông tin từ Internet Xuất phát từ toán thực tế hoạt động kinh doanh thương mại, liệu có phương pháp đánh giá thông tin sản phẩm thông qua nhận xét người dùng Internet? Đây tốn khó cần kết hợp nhiều kiến thức để giải tốn Do em chọn đề tài: “Bài tốn khai thác thơng tin sản phẩm từ Web”.Khóa luận tập trung tìm hiểu lý thuyết liên quan nhằm phần giải vấn đề đặt Một hệ thống tổng hợp thông tin từ Internet cho phép người dùng đưa vào thông tin cần đánh giá sản phẩm quan tâm Sau đó, hệ thống đưa thơng tin liên quan đến sản phẩm để hỗ trợ doanh nghiệp có thêm kênh thơng tin sản phẩm thị trường Hệ thống mô tả sau: Nhập thông tin sản phẩm:Người dùng nhập thuật ngữ thông tin sản phẩm vào ô thông tin sản phẩm cần đánh giá Hệ thống trả thông tin sản phẩm mà hệ thống khai thác, phân loại, thống kê thơng qua máy tìm kiếm Tìm kiếm thơng tin:Hệ thống dựa vào thông tin sản phẩm nhập vào gửi vào máy tìm kiếm để tìm Ý kiến người dùng sản phẩmhoặc Xu hướng Hỗ trợ đánh giá:Kết trả từ máy tìm kiếm đem phân loại, thống kê thông tin cần thiết sản phẩm nhằm đánh giá cảm nhận người tiêu dùng sản phẩm đưa vào đánh giá Báo cáo:Hệ thống đưa báo cáo ý kiến người sử dụng sản phẩm số liệu theo chuyên môn Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp Trường ĐHDL Hải Phòng Giao diện hệ thống:Hệ thống có giao diện thân thiện, thuận lợi cho người dùng người quản lý Qua cách đặt vấn đề trên, khóa luận trình bày sau: Giới thiệu: Giới thiệu chung toán phạm vi khóa luận Chương 1:Trình bày sở lý thuyết để thục khóa luận Chương 2:Trình bày kiến thức liên quan đến tốn tìm kiếm thông tin Internet dùng để trợ giúp hoạt động kinh doanh Chương 3:Trình bày phần phân tích thiết kế ứng dụng mang tính chất thử nghiệm Kết luận Tài liệu tham khảo Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp Trường ĐHDL Hải Phòng CHƯƠNG 1: CƠ SỞ LÝ THUYẾT 1.1CÁC KHÁI NIỆM CƠ BẢN Khai phá liệu hướng nghiên đời thập niên trở lại đây.Các kỹ thuật áp dụng lĩnh vực phần lớn thừa kế từ lĩnh vực Cơ sở liệu,học máy, trí tuệ nhân tạo, lý thuyết thơng tin, xác suất thống kê, tính tốn hiệu cao Do phát triển nhanh Khai phá liệu phạm vi áp dụng phương pháp tìm kiếm tri thức, nên có nhiều quan điểm khác Khai phá liệu Tuy nhiên, mức trừu tượng định, theo [1] khái niệm Khai phá liệu sau: “Khai phá liệu q trình tìm kiếm, phân tích, phát tri thức mới, tiềm ẩn, hữu dụng sở liệu lớn.” Trong lĩnh vực khai phá liệu, có nhiều hướng nghiên cứu đưa có số hướng nhiều nhà nghiên cứu quan tâm Khai phá liệu văn bản,Web, Trích chọn thơng tin, Phân tích mạng xã hội, khai phá quan điểm, Phân tích liệu kinh tế - tài chính, Khai phá liệu sinh học, y tế,… Khóa luận hướng đến việc tìm hiểu xây dựng hệ thống thống nhằm khai thác thông tin sản phẩm mà người tiêu dùng đánh giá Internet, cụ thể trang web Người tiêu dùng có mua, sử dụng sản phẩm họ có cảm nhận suy nghĩ sản phẩm Đơi lúc họ đưa cảm nhận sản phẩm lên trang web cá nhân, diễn đàn, … Internet Bài tốn mà khóa luận tìm cách giải tìm cách khai thác thơng tin sản phẩm cụ thể Internet, thống kê để phục vụ cho công tác khảo sát đánh giá sản phẩm thị trường Sau số khái niệm sử dụng Thông tin sản phẩm: Là thông tin mô tả nguồn gốc, tính kỹ thuật, tính chất lý hóa tính, cơng dụng chính, giá thành, màu sắc, hình dáng, kích thước, … sản phẩm Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp Trường ĐHDL Hải Phòng Ý kiến người dùng sản phẩm: Là thông tin người dùng phản ánh sản phẩm thể qua từ đánh giá ưu điểm như: Tốt, thuận tiện, tiết kiệm, bền, rẻ, đẹp, phong phú, đa dạng, mượt mà, mịn, … đánh giá nhược điểm: Xấu, kém, mau hỏng, hàng giả, hàng nhái, … thể mong muốn sản phẩm qua từ như: giá như, giá mà, cần, phải, để tốt hơn, … Xu hướng: Là từ liên quan đến mong muốn người dùng sản phẩm Được chi thành xu hướng tốt xấu không thiện cảm + Xu hướng tốt: Xu hướng đánh giá thông tin sản phẩm tốt + Xu hướng xấu: Xu hướng đánh giá thông tin sản phẩm xấu + Xu hướng không thiện cảm: Xu hướng không khen, không chê sản phẩm Người tiêu dùng: Là người mua người sử dụng sản phẩm người có ý định mua hay sử dụng sản phẩm có gửi thơng tin lên Internet Người dùng: Người có tương tác với hệ thống Người quản trị: Người có nhiệm vụ quản lý hệ thống Máy tìm kiếm:Các cỗ máy tìm kiếm thơng tin Internet: Google, Yahoo, Bing, … Sản phẩm: Là tất mặt hàng tiêu thụ thị trường bao gồm thị trường nước nước 1.2 KHÁM PHÁ TRI THỨC TRONG CƠ SỞ DỮ LIỆU Khai phá liệu lĩnh vực có liên quan đến nhiều ngành khác như: thống kê, học máy, tính tốn phân tán,cơ sở liệu, thuật tốn, mơ hình hóa liệu, … Mục tiêu khai phá liệu khám phá tri thức từ dùng hỗ trợ định, lĩnh vực hẹp chia thành số giai đoạn [3][4]:  Trích chọn liệu: bước trích liệu cần khám phá từ hệ thống liệu (databases, data warehouses, data repositories) ban đầu theo số tiêu chí định Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp Trường ĐHDL Hải Phòng  Tiền xử lý liệu:Bước làm liệu (xử lý liệu dư thừa, nhiễu, v.v.), rút gọn liệu (áp dụng thuật toán lấy mẫu, v.v.), rời rạc hóa liệu Kết liệu quán, đầy đủ, rút gọn, rời rạc hóa  Biến đổi liệu:Đây bước chuẩn hóa liệu, tinh chỉnh liệu để đưa liệu dạng chuẩn để giúp kỹ thuật khai phá liệu bước sau  Khai phá liệu: Áp dụng kỹ thuật phân tích nhằm để trích chọn thơng tin, mối liên hệ đặc biệt liệu Bước quan trọng cần nhiều tài ngun tồn q trình khai phá trin thức  Đánh giá biểu diễn tri thức: Các mẫu tin quan hệ chúng rút trích bước mã hóa biểu diễn theo dạng dễ quan sát đồ thị, cây, bảng biểu, luật, v.v Bước cung cấp thông tin cho nhà quản trị định Các giai đoạn KDD thể trực quan hình đây: Hình 1.1:Các bước thực trình khám phá tri thức Nguyễn Văn Huy – CT1301 10 Đồ án tốt nghiệp Trường ĐHDL Hải Phòng 3.3.2.2 Ca sử dụng “Cập nhật loại sản phẩm” Biểu đồ thực thi ca sử dụng Hình 3.7: Biểu đồ thực thi ca sử dụng “Cập nhật loạisản phẩm” Biểu đồ cộng tác thực thi ca sử dụng Hình 3.8: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật loạisản phẩm” 3.3.2.3 Ca sử dụng “Cập nhật sản phẩm” Biểu đồ thực thi ca sử dụng Nguyễn Văn Huy – CT1301 45 Đồ án tốt nghiệp Trường ĐHDL Hải Phịng Hình 3.9: Biểu đồ thực thi ca sử dụng “Cập nhật sản phẩm” Biểu đồ cộng tác thực thi ca sử dụng Hình 3.10: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật sản phẩm” Nguyễn Văn Huy – CT1301 46 Đồ án tốt nghiệp Trường ĐHDL Hải Phòng 3.3.2.4 Ca sử dụng “Cập nhật Search engine” Biểu đồ thực thi ca sử dụng Hình 3.11: Biểu đồ thực thi ca sử dụng “Cập nhật Search Engine” Biểu đồ cộng tác thực thi ca sử dụng Hình 3.12: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật Search Engine” Nguyễn Văn Huy – CT1301 47 Đồ án tốt nghiệp Trường ĐHDL Hải Phịng 3.3.2.5 Ca sử dụng “Cập nhật thơng số tìm kiếm” Biểu đồ thực thi ca sử dụng Hình 3.13: Biểu đồ thực thi ca sử dụng “Cập nhật thơng số tìm kiếm” Biểu đồ cộng tác thực thi ca sử dụng Hình 3.14: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật thông số tìm kiếm” Nguyễn Văn Huy – CT1301 48 Đồ án tốt nghiệp Trường ĐHDL Hải Phịng 3.3.2.6 Mơ hình phân tích gói ca sử dụng “Cập nhật” Hình 3.15: Mơ hình phân tích gói ca “Cập nhật” 3.3.3 Phân tích gói ca sử dụng “Tìm kiếm” 3.3.3.1 Ca sử dụng “Nhận lệnh tìm kiếm” Biểu đồ thực thi ca sử dụng Hình 3.16: Biểu đồ thực thi ca sử dụng “Tìm kiếm” Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp 49 Trường ĐHDL Hải Phòng Biểu đồ cộng tác thực thi ca sử dụng Hình 3.17: Biểu đồ cộng tác thực thi ca sử dụng “Tìm kiếm” 3.3.3.2 Mơ hình phân tích gói ca sử dụng “Tìm kiếm” Hình 3.18: Mơ hình phân tích gói ca”Tìm kiếm” Nguyễn Văn Huy – CT1301 50 Đồ án tốt nghiệp Trường ĐHDL Hải Phịng 3.3.4 Phân tích gói ca sử dụng “Báo cáo” 3.3.4.1 Ca sử dụng “Lập báo cáo” Biểu đồ thực thi ca sử dụng Hình 3.19: Biểu đồ thực thi ca sử dụng “Lập báo cáo” Biểu đồ cộng tác thực thi ca sử dụng Hình 3.20: Biểu đồ cộng tác thực thi ca sử dụng “Báo cáo” 3.3.4.2 Mô hình phân tích gói ca sử dụng “Báo cáo” Hình 3.21: Mơ hình phân tích gói ca”Báo cáo” Nguyễn Văn Huy – CT1301 51 Đồ án tốt nghiệp Trường ĐHDL Hải Phịng 3.4 Thiết kế hệ thống Hình 3.22: Mơ hình lớp thiết kế hệ thống Nguyễn Văn Huy – CT1301 52 Đồ án tốt nghiệp Trường ĐHDL Hải Phòng 3.5 Thiết kế chương trình Chương trình viết ngơn ngữ lập trình C# Chương trình sử dụng hệ quản trị sở dũ liệu SQL 2008 3.5.1 Giao diện chương trình Hình 3.23 Giao diện chương trình Giao diện cung cấp thơng tin chương trình menu thực cơng việc 3.5.2 Giao diện cập nhật sản phẩm Hình 3.24: Giao diện cập nhật sản phẩm Giao diện mở từ menu “Sản phẩm” giao diện Nguyễn Văn Huy – CT1301 53 Đồ án tốt nghiệp Trường ĐHDL Hải Phòng Khi cập nhật sản phẩm cần chọn tên nhóm từ “tên nhóm”, tên loại sản phẩm từ “tên loại”, nhập tên sản phẩm vào ô “tên sản phẩm”, nhập đặc điểm sản phẩm vào ô “đặc điểm” Nút “lưu” để lưu thông tin Nhấn nút “thêm” để nhập sản phẩm Nhấn chuột phải vào loại sản phẩm , chọn “Xóa” muốn xóa sản phẩm, chọn “Sửa” muốn sửa sản phẩm 3.5.3 Giao diện cập nhật loại sản phẩm Hình 3.25: Giao diện cập nhật loại sản phẩm Giao diện gọi từ menu “Loại sản phẩm ” giao diện Khi cập nhật loại sản phẩm cần chọn tên nhóm sản phẩm từ “tên nhóm”, nhập tên loại sản phẩm vào “loại sản phẩm” Nhấn nút “Lưu” để lưu thông tin Nút thêm để thêm loại Nhấn chuột phải vào loại sản phẩm , chọn “Xóa” muốn xóa nhóm sản phẩm, chọn “Sửa” muốn sửa loại sản phẩm Nguyễn Văn Huy – CT1301 54 Đồ án tốt nghiệp Trường ĐHDL Hải Phịng 3.5.4 Giao diện cập nhật nhóm sản phẩm Hình 3.26: Giao diện cập nhật nhóm sản phẩm Giao diện gọi từ menu “Nhóm SP” từ giao diện Khi cập nhật nhóm sản phẩm cần nhập tên nhóm vào “tên nhóm” Nút lưu để lưu thơng tin Nhấn nút “Thêm” để thêm nhóm Nhấn chuột phải vào nhóm sản phẩm , chọn “Xóa” muốn xóa nhóm sản phẩm, chọn “Sửa” muốn sửa nhóm sản phẩm Nguyễn Văn Huy – CT1301 55 Đồ án tốt nghiệp Trường ĐHDL Hải Phòng 3.5.5 Giao diện tìm kiếm thơng tin sản phẩm Hình 3.27: Giao diện tìm kiếm thơng tin sản phẩm Ơ “Số KQ Google” dung để nhập số kết tìm kiếm mong muốn Chọn nhóm sản phẩm từ “Tên nhóm”, chọn tên loại sản phẩm từ ô “Tên loại”, chọn sản phẩm từ “Tên sản phẩm”, tích chọn đặc điểm ô đặc điểm Nút “ ” để sửa sản phẩm chọn Nhấn “Tim kiếm” để bắt đâu tìm kiếm Chọn chuỗi tìm kiếm “Chuỗi tìm kiếm”, nhấn nút “Thống kê” để xem kết thống kê cho chuỗi tìm kiếm Nút “Thốt” để khỏi giao diện trở giao diện 3.5.6 Kết chương trình minh họa - Chương trình giải vấn đề mà toán đưa tìm kiếm đánh giá vế sản phẩm web Chương trình xây dựng chức mà toán đưa  Cập nhật, thêm mới, xóa lưu thơng tin sản phẩm, chuỗi tìm kiếm, kết tìm kiếm  Cho phép tìm kiếm đánh giá tự động Có chức hiển thị số lượng đánh giá Nguyễn Văn Huy – CT1301 56 Đồ án tốt nghiệp Trường ĐHDL Hải Phịng KẾT LUẬN Đề tài tìm kiếm thông tin sản phẩm Web công việc thú vị Nó thể rõ việc áp dụng công nghệ thông tin vào lĩnh vực khác đem lại kết cao Khóa luận đạt số kết sau: Trình bày khái niệm lĩnh vực khai phá liệu từ giúp cho việc hiểu rõ tốn cần giải Khóa luận tổng hợp số thuật toán liên quan đến lĩnh vực khai phá liệu phân tích,thiết kế, xây dựng chương trình minh họa ứng dụng tìm kiếm thông tin sản phẩm Web, nhằm giúp nhà quản lý định tốt sản phẩm nhóm sản phẩm họ định triển khai thị trường Với cách trình bày từ khái niệm đến cách thức xây dựng hệ thống tìm kiếm thơng tin sản phẩm Web giúp cho em bổ sung nhiều kiến thức liên quan đến thực tế nghề nghiệp Nguyễn Văn Huy – CT1301 57 Đồ án tốt nghiệp Trường ĐHDL Hải Phòng TÀI LIỆU THAM KHẢO Tiếng Việt [1] Hà Quang Thụy, Phan Xuân Hiếu - Đoàn Sơn - Nguyên Trí Thành Nguyễn Thu Trang - Nguyễn Cầm Tú, Giáo trình khai phá liệu web, NXBGDVN, 2009, 313 tr [2] Lê Văn Phùng, Quách Xuân Trưởng, Khai phá liệu, NXB TT-TT, 2012, 320 tr Tiếng Anh [3] W Bruce Croft,Donald Metzler,Trevor Strohman, Search Engines: Information Retrieval in Practice,Addison-Wesley, 2008,524p [4] Alan Rea, Data Mining – An Introduction The Parallel Computer Centre, Nor of The Queen’s University of Belfast, 1995 [5] Jiawei Han and Micheline Kamber, Data Mining:Concepts andTechniques, Hacours Science and Technology Company, USA, 2005 [6] Usama M Fayyad, Gregory Piatetsky-Shapiro, Padhraic Smyth, and Ramasamy Uthurusamy, Advances in Knowledge Discovery and Data Mining, AAAI Press- The MIT Press, 1996 [7] Jiawei Han and Micheline Kamber (2001), Data Mining: Concepts and Techniques, Hacours Science and Technology Company, USA [8] J.Han, M.Kamber and A.K.H Tung (2002), Spatial Clustering Methods in Data mining: A Survey, Simon Fraster University, Canada Nguyễn Văn Huy – CT1301 58 ... nhiều nhóm sản phẩm, mỗi nhóm sản phẩm có nhiều loại sản phẩm Thơng tin nhóm sản phẩm miêu tả sau: Mã nhóm sản phẩm, Tên nhóm sản phẩm Thơng tin loại sản phẩm: Mã loại sản phẩm, Tên loại sản phẩm Trong... loại sản phẩmthì có nhiều sản phẩm Thơng tin sản phẩmgồm có: Mã sản phẩm, Tên sản phẩm Khi người dùng đăng nhập vào hệ thơng kê khai sản phẩm mà cần tìm kiếm Thơng tin sản phẩm gồm có: Mã sản phẩm. .. thống mô tả sau: Nhập thông tin sản phẩm: Người dùng nhập thuật ngữ thông tin sản phẩm vào ô thông tin sản phẩm cần đánh giá Hệ thống trả thông tin sản phẩm mà hệ thống khai thác, phân loại, thống

Ngày đăng: 29/08/2020, 19:13

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan