Nghiên cứu phát triển phương pháp khai phá luật kết hợp mờ biểu thị bằng thông tin ngôn ngữ và ứng dụng (Luận án tiến sĩ)

109 55 0
Nghiên cứu phát triển phương pháp khai phá luật kết hợp mờ biểu thị bằng thông tin ngôn ngữ và ứng dụng (Luận án tiến sĩ)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nghiên cứu phát triển phương pháp khai phá luật kết hợp mờ biểu thị bằng thông tin ngôn ngữ và ứng dụng (Luận án tiến sĩ)Nghiên cứu phát triển phương pháp khai phá luật kết hợp mờ biểu thị bằng thông tin ngôn ngữ và ứng dụng (Luận án tiến sĩ)Nghiên cứu phát triển phương pháp khai phá luật kết hợp mờ biểu thị bằng thông tin ngôn ngữ và ứng dụng (Luận án tiến sĩ)Nghiên cứu phát triển phương pháp khai phá luật kết hợp mờ biểu thị bằng thông tin ngôn ngữ và ứng dụng (Luận án tiến sĩ)Nghiên cứu phát triển phương pháp khai phá luật kết hợp mờ biểu thị bằng thông tin ngôn ngữ và ứng dụng (Luận án tiến sĩ)Nghiên cứu phát triển phương pháp khai phá luật kết hợp mờ biểu thị bằng thông tin ngôn ngữ và ứng dụng (Luận án tiến sĩ)Nghiên cứu phát triển phương pháp khai phá luật kết hợp mờ biểu thị bằng thông tin ngôn ngữ và ứng dụng (Luận án tiến sĩ)Nghiên cứu phát triển phương pháp khai phá luật kết hợp mờ biểu thị bằng thông tin ngôn ngữ và ứng dụng (Luận án tiến sĩ)Nghiên cứu phát triển phương pháp khai phá luật kết hợp mờ biểu thị bằng thông tin ngôn ngữ và ứng dụng (Luận án tiến sĩ)Nghiên cứu phát triển phương pháp khai phá luật kết hợp mờ biểu thị bằng thông tin ngôn ngữ và ứng dụng (Luận án tiến sĩ)Nghiên cứu phát triển phương pháp khai phá luật kết hợp mờ biểu thị bằng thông tin ngôn ngữ và ứng dụng (Luận án tiến sĩ)

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ - Nguyễn Tuấn Anh NGHIÊN CỨU PHÁT TRIỂN PHƯƠNG PHÁP KHAI PHÁ LUẬT KẾT HỢP MỜ BIỂU THỊ BẰNG THÔNG TIN NGÔN NGỮ VÀ ỨNG DỤNG LUẬN ÁN TIẾN SĨ TOÁN HỌC Hà Nội – Năm 2020 BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ - Nguyễn Tuấn Anh NGHIÊN CỨU PHÁT TRIỂN PHƯƠNG PHÁP KHAI PHÁ LUẬT KẾT HỢP MỜ BIỂU THỊ BẰNG THÔNG TIN NGÔN NGỮ VÀ ỨNG DỤNG Chuyên ngành: CƠ SỞ TOÁN HỌC CHO TIN HỌC Mã sỗ: 62.46.01.10 LUẬN ÁN TIẾN SĨ TOÁN HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TSKH Nguyễn Cát Hồ TS Trần Thái Sơn Hà Nội – Năm 2020 LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu riêng Các kết viết chung với tác giả khác đồng ý đồng tác giả trước đưa vào luận án Các kết luận án trung thực chưa cơng bố cơng trình khác Tác giả Nguyễn Tuấn Anh LỜI CẢM ƠN Luận án hồn thành hướng dẫn tận tình PGS TSKH Nguyễn Cát Hồ TS Trần Thái Sơn Lời đầu tiên, tác giả xin bày tỏ lòng kính trọng biết ơn sâu sắc tới hai thầy Tác giả gửi lời cảm ơn chân thành tới Ban lãnh đạo Học viện Khoa học Công nghệ, Viện Công nghệ thông tin, khoa Công nghệ thông tin truyền thông tạo điều kiện thuận lợi q trình học tập, nghiên cứu hồn thành luận án Xin cảm ơn Ban giám hiệu trường Đại học Công nghệ thông tin Truyền thông - ĐHTN, Ban chủ nhiệm khoa Công nghệ thông tin quan tâm giúp đỡ, tạo điều kiện tốt công việc để tác giả có thời gian tập trung nghiên cứu Cảm ơn đồng nghiệp thuộc Khoa Công nghệ thông tin - Trường Đại học Công nghệ thông tin Truyền thông – Đại học Thái Nguyên, anh chị nhóm nghiên cứu đại số gia tử động viên, khích lệ trao đổi kiến thức kinh nghiệm q trình hồn thành luận án Cuối cùng, tác giả xin chân thành cảm ơn bố mẹ, chị em, đặc biệt vợ con, người ln dành cho tác giả tình cảm chia sẻ lúc khó khăn sống, ln động viên giúp đỡ tác giả trình nghiên cứu Luận án quà tinh thần mà tác giả trân trọng gửi tặng đến thành viên gia đình MỤC LỤC DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT DANH MỤC HÌNH BẢNG BIỂU DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ MỞ ĐẦU CHƯƠNG MỘT SỐ KIẾN THỨC CƠ SỞ 17 1.1 Tập mờ phép toán tập mờ 17 1.1.1 Tập mờ (fuzzy set) 17 1.1.2 Biến ngôn ngữ 18 1.1.3 Phân hoạch mờ .19 1.2 Đại số gia tử 21 1.2.1 Khái niệm Đại số gia tử 21 1.2.2 Một số tính chất ĐSGT tuyến tính 22 1.2.3 Định lượng ngữ nghĩa giá trị ngôn ngữ .23 1.2.4 Khoảng mờ 24 1.2.5 Độ đo tính mờ giá trị ngôn ngữ 25 1.3 Giải thuật di truyền 27 1.4 Bài toán khai phá luật kết hợp 29 1.4.1 Một số khái niệm 29 1.4.2 Bài toán khai phá luật kết hợp mờ 31 1.5 Một số hướng nghiên cứu luật kết hợp 34 1.6 Kết luận chương 37 CHƯƠNG KHAI PHÁ LUẬT KẾT HỢP MỜ THEO HƯỚNG TIẾP CẬN SỬ DỤNG ĐẠI SỐ GIA TỬ 38 2.1 Đặt vấn đề 38 2.2 Khai phá luật kết hợp mờ theo hướng tiếp cận ĐSGT .39 2.2.1 Mờ hóa sở liệu giao dịch .39 2.2.2 Quan hệ khoảng cách giao dịch .41 2.2.3 Xây dựng bảng định lượng 42 2.3 Nén sở liệu giao dịch 43 2.4 Thuật toán trích xuất luật kết hợp mờ .46 2.5 Kết thử nghiệm 48 2.5.1 Thử nghiệm với CSDL FAM95 .48 2.5.2 Thử nghiệm với CSDL STULONG 51 2.6 Kết luận chương 54 CHƯƠNG PHÂN HOẠCH MỜ CHO THUỘC TÍNH DỰA TRÊN BIỂU DIỄN THỂ HẠT CỦA ĐSGT 56 3.1 Phân hoạch cho miền giá trị thuộc tính .56 3.1.1 Đặt vấn đề 56 3.1.2 Rời rạc hóa thuộc tính định lượng 57 3.1.3 Phân chia miền giá trị thuộc tính theo cách tiếp cận lý thuyết tập mờ 60 3.2 Phương pháp phân hoạch mờ biểu diễn thể hạt với ĐSGT 63 3.2.1 Phân hoạch giá trị miền thuộc tính sử dụng biểu diễn đơn thể hạt 64 3.2.2 Phân hoạch giá trị miền thuộc tính sử dụng biểu diễn đa thể hạt 66 3.3 Phương pháp tối ưu tham số mờ ĐSGT cho toán khai phá luật kết hợp .70 3.3.1 Mơ hình giải thuật di truyền CHC 71 3.3.2 Mã hóa tập MF 72 3.3.3 Đánh giá nhiễm sắc thể 73 3.4 Thuật tốn tìm kiếm phân hoạch mờ tối ưu luật kết hợp 75 3.5 Kết thử nghiệm 77 3.5.1 Cơ sở liệu sử dụng thử nghiệm 77 3.5.2 Phân tích đánh giá kết thử nghiệm với biểu diễn liệu dạng đơn thể hạt 78 3.5.3 Phân tích đánh giá kết thử nghiệm với biểu diễn liệu dạng đa thể hạt 93 3.6 Kết luận chương 97 KẾT LUẬN VÀ KIẾN NGHỊ 99 CÁC CƠNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN 101 TÀI LIỆU THAM KHẢO 102 DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT Các ký hiệu 𝒜𝒳 Đại số gia tử tuyến tính 𝒜𝒳 ∗ Đại số gia tử tuyến tính đầy đủ 𝜇 (ℎ ) Độ đo tính mờ gia tử h 𝑓𝑚(𝑥) Độ đo tính mờ gia tử x 𝑣 (𝑥 ) Hàm định lượng giá trị ngôn ngữ biến x 𝜇𝐴 (𝑥) Hàm xác định độ thuộc giá trị x vào tập mờ A 𝑙 (𝑥 ) Độ dài từ ngôn ngữ x ℑ𝑓𝑚 Khoảng tính mờ giá trị ngơn ngữ 𝑋𝑘 Tập hạng từ có độ dài k 𝑋(𝑘) Tập hạng từ có độ dài ≤ 𝑘 Các từ viết tắt AR DB, CSDL Luật kết hợp (association rule) Cơ sở liệu ĐLNN Định lượng ngữ nghĩa ĐSGT Đại số gia tử FRBS Fuzzy Rule-based Systen GA Giải thuật di truyền (Genetic Algorithms) KB Knowledge Base MF Hàm thuộc (Membership function) RB Fuzzy-based SQM Min Supp Semantically Quantifying Mapping Độ hỗ trợ tối thiểu DANH MỤC HÌNH BẢNG BIỂU Bảng 2.1: Cơ sở liệu ví dụ 41 Bảng 2.2: Mờ hóa liệu Bảng 2.1 41 Bảng 2.3: Bảng định lượng sở liệu Bảng 2.2 43 Bảng 2.4: Số lượng luật kết hợp thu với độ tin cậy 80% 48 Bảng 2.5: Luật kết hợp thu với độ hỗ trợ 60% độ tin cậy 80% 49 Bảng 2.6: Luật kết hợp thu với độ hỗ trợ 70% độ tin cậy 80% 49 Bảng 2.7: Số lượng luật kết hợp thu với độ tin cậy 80% 51 Bảng 2.8: So sánh thời gian thực khai phá luật kết hợp với độ tin cậy 80% 52 Bảng 2.9: Luật kết hợp thu với độ hỗ trợ 85% độ tin cậy 80% 52 Bảng 2.10: Luật kết hợp thu với độ hỗ trợ 90% độ tin cậy 80% 53 Bảng 3.1: CSDL thống kế dân số 10 gia đình 58 Bảng 3.2: Rời rạc hóa thuộc tính định lượng 58 Bảng 3.3: Ví dụ rời rạc hóa thuộc tính "Tuổi" 59 Bảng 3.4: CSDL thử nghiệm 77 Bảng 3.5: Các tham số mờ ĐSGT tối ưu 10 thuộc tính với phương pháp sử dụng biểu diễn đơn thể hạt 78 Bảng 3.6: Kết thử nghiệm biểu diễn đơn thể hạt .79 Bảng 3.7: Quan hệ độ thú vị trung bình luật 82 Bảng 3.8: Bảng số lượng tập phổ biến 1-ItemSet .86 Bảng 3.9: Bảng Độ thú vị trung bình 90 Bảng 3.10: Các tham số mờ ĐSGT tối ưu 10 thuộc tính với phương pháp sử dụng biểu diễn đa thể hạt 94 Bảng 3.11: Quan hệ số lượng tập mục Min supp 94 Bảng 3.12: Quan hệ số lượng 1-ItemSet Min Supp .95 DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ Hình 1.1: Hàm thuộc cho tập mờ thể tuổi người là: Trẻ, Trung niên, Già .19 Hình 1.2: Một cấu trúc phân hoạch mờ dạng đơn thể hạt 20 Hình 1.3: Một cấu trúc phân hoạch mờ dạng đa thể hạt 20 Hình 1.4: Khoảng tính mờ hạng từ biến TRUTH 25 Hình 1.5: Độ đo tính mờ biến TRUTH 26 Hình 1.6: Lưu đồ giải thuật di truyền .28 Hình 2.1: Xây dựng phân hoạch mờ dựa ĐSGT .40 Hình 2.2: Tổng quan thuật toán nén CSDL giao dịch 43 Hình 2.3: Thời gian thực với CSDL nén CSDL khơng nén 50 Hình 2.4: Thời gian thực với CSDL nén 50 Hình 2.5: Thời gian thực với CSDL nén CSDL không nén 54 Hình 3.1: Xây dựng phần hoạch miền xác định thuộc tính theo cách tiếp cận ĐSGT 65 Hình 3.2: Phân hoạch miền giá trị thuộc tính dựa biểu diễn đơn thể hạt 65 Hình 3.3: Cấu trúc hạt thể nhiều mức .67 Hình 3.4: Phân hoạch miền giá trị thuộc tính dựa biểu diễn đa thể hạt 69 Hình 3.5: Lược đồ tìm kiếm phân hoạch tối ưu cho miền xác định thuộc tính khai phái luật kết hợp 70 Hình 3.6: Mơ hình giải thuật di truyền CHC 72 Hình 3.7: Tập MF cho mục Ij 74 Hình 3.8: Hai tập hàm thuộc phân bố không tốt 75 Hình 3.9: Quan hệ độ phù hợp (Suit) hàm thuộc Min Supp 80 Hình 3.10: Quan hệ giá trị hàm mục tiêu Min Supp 81 Hình 3.11: Quan hệ độ hỗ trợ tập mục 1-ItemSet Min Supp .81 Hình 3.12: Quan hệ số lượng 1-ItemSet Min Supp .82 Hình 3.13: Quan hệ độ thú vị trung bình Min Supp 83 Hình 3.14: Tập hàm thuộc thu sau thực GA với phương pháp Herrera sử dụng lý thuyết tập mờ 85 Hình 3.15: Tập hàm thuộc thu sau thực GA với phương pháp sử dụng biểu diễn đơn thể hạt ĐSGT 86 Hình 3.16: Quan hệ số lượng 1-ItemSet Min Supp với CSDL Pollution 88 Hình 3.17: Quan hệ số lượng 1-ItemSet Min Supp với CSDL Stulong 88 Hình 3.18: Quan hệ số lượng 1-ItemSet Min Supp với CSDL Basketball 89 Hình 3.19: Quan hệ số lượng 1-ItemSet Min Supp với CSDL Quake 89 Hình 3.20: Quan hệ số lượng 1-ItemSet Min Supp với CSDL stock 90 Hình 3.21: Quan hệ Độ thú vị trung bình Min Supp với CSDL Pollution 91 Hình 3.22: Quan hệ Độ thú vị trung bình Min Supp với CSDL Stulong 92 Hình 3.23: Quan hệ Độ thú vị trung bình Min Supp với CSDL Basketball 92 Hình 3.24: Quan hệ Độ thú vị trung bình Min Supp với CSDL Quake 92 Hình 3.25: Quan hệ Độ thú vị trung bình Min Supp với CSDL Stock 93 Hình 3.26: Quan hệ số lượng tập phố biến Min Supp 95 Hình 3.27: So sánh số lượng tập phổ biến Min Supp 95 Hình 3.28: Tập hàm thuộc thu sau thực GA với phương pháp sử dụng biểu diễn đa thể hạt ĐSGT 97 93 Độ thú vị trung bình PP đề xuất PP Herrera PP Hong 0.7 0.6 0.5 0.4 0.3 0.2 0.1 10 Min support (%) 15 20 25 30 Hình 3.25: Quan hệ Độ thú vị trung bình Min Supp với CSDL Stock Trong thử nghiệm, độ thú vị luật tính theo cơng thức 2.5 mục 1.4.1 Từ kết Bảng 3.9 cho thấy độ thú vị trung bình luật kết hợp thu phương pháp sử dụng ĐSGT cao sấp sỉ hai phương pháp lại 3.5.3 Phân tích đánh giá kết thử nghiệm với biểu diễn liệu dạng đa thể hạt Với thuộc tính CSDL phân chia miền mờ sử dụng biểu diễn đa thể hạt thuộc tính sử dụng cấu trúc ĐSGT trình bày mục 3.5.2.2 Các kết thử nghiệm so sánh với kết công bố trước Bảng 3.10, thống kê số lượng tập phố biến với mỗ độ hỗ trợ khác từ 20% đến 80% Bảng 3.11 kết thử nghiệm với ba phương pháp: phương pháp đề xuất sử dụng biểu diễn đa thể hạt, phương pháp biểu diễn đơn thể hạt đề xuất chương phương pháp Herrera (2009) Kết cho thấy phương pháp sử dụng biểu diễn Đa thể hạt cho số lượng 1-ItemSet tốt số với hai phương pháp lại (như Hình 4.3) Ở đây, (liệt kê thuộc tính dùng so sánh: độ phủ, chồng lấn trình bày mục 3.3.3) phương pháp dùng để so sánh thực với biểu diễn đơn thể hạt Các kết thử nghiệm cho thấy ưu việt việc sử dụng biểu diễn đa thể hạt ĐSGT, củng cố thêm cho kết nghiên cứu liên quan đến sử dụng 94 biểu diễn đa thể hạt (một số cơng trình cơng bố số năm gần sử dụng biểu diễn đa thể hạt [37, 66-68, 82, 84]) Bảng 3.10: Các tham số mờ ĐSGT tối ưu 10 thuộc tính với phương pháp sử dụng biểu diễn đa thể hạt Thuộc tính 10 Thuộc tính Thuộc tính Thuộc tính Thuộc tính Thuộc tính Thuộc tính Thuộc tính Thuộc tính Thuộc tính 𝜇(𝐿) 0.531 0.203 0.445 0.548 0.208 0.233 0.202 0.200 0.212 0.204 𝜇(𝑉) 0.469 0.797 0.555 0.452 0.792 0.767 0.798 0.800 0.788 0.796 𝑓𝑚(𝐶 − ) 0.202 0.501 0.562 0.457 0.617 0.316 0.800 0.798 0.586 0.651 𝑓𝑚(𝐶 + ) 0.798 0.499 0.438 0.543 0.383 0.684 0.200 0.202 0.414 0.349 Có thể thấy dùng biểu diễn đa thể hạt cho kết tốt hẳn Ngồi ra, nói trên, mặt ngữ nghĩa, dùng biểu diễn đa thể hạt cho luật mang tính khái quát cao luật chi tiết Luận án tiến hành thử nghiệm phương pháp Herrera với việc phân chia vậy, kết có tăng số phương pháp đề xuất (xem đồ thị so sánh Hình 3.27:) Cần nhấn mạnh rằng, với phương pháp luận án đề xuất, việc tính tốn liên quan đến biểu diễn đa thể hạt tăng thêm không đáng kể mặt phức tạp mặt thời gian mà kết nhận lại tốt nhiều Bảng 3.11: Quan hệ số lượng tập mục Min supp Min Supp 20% 30% 40% 50% 60% 70% 80% 1-ItemSet 59 50 38 29 26 22 17 2-itemset 974 675 456 371 285 187 78 3-itemset 8890 4806 3111 2660 2518 772 150 4-itemset 50242 20719 13095 11890 4708 1774 167 5-itemset 187379 57461 36432 34995 9506 2528 167 Trong Bảng 3.11 tham số mờ ĐSGT 10 thuộc tính số thu sau chạy giải thuật di truyền Các tham số sử dụng để xây dựng hàm thuộc theo dạng biểu diễn đa thể hạt trình bày mục 3.2.2 95 Bảng 3.12: Quan hệ số lượng 1-ItemSet Min Supp Min Supp 20% 30% 40% 50% 60% 70% 80% 90% PP biểu diễn Đa thể hạt 54 46 35 27 23 14 12 PP biểu diễn Đơn thể hạt 21 17 13 PP Herrera cộng 25 21 15 10 Tập lớn 1-Itemset 1-itemset 2-itemset 1500 1000 500 20% 30% 40% 50% 60% Min support 70% 80% Hình 3.26: Quan hệ số lượng tập phố biến Min Supp Phương pháp biểu diễn Đa thể hạt Tập lớn 1-Itemset Phương pháp biểu diễn Đơn thể hạt PP Herrera cộng 60 40 20 20% 30% 40% 50% 60% Min support 70% 80% Hình 3.27: So sánh số lượng tập phổ biến Min Supp 90% 96 97 Hình 3.28: Tập hàm thuộc thu sau thực GA với phương pháp sử dụng biểu diễn đa thể hạt ĐSGT Hình 3.28 tập hàm thuộc biểu diễn dạng đa thể hạt 10 thuộc tính thu sau thực tối ưu giải thuật GA Có thể thấy hàm thuộc xây dựng dựa ĐSGT thuộc tính có phân bố tốt, đảm bảo độ bao phủ toàn miền giá trị độ chồng lấn hợp lý 3.6 Kết luận chương Chương luận án đề xuất phương pháp khai luật kết hợp mờ sử dụng ĐSGT dựa sở phân chia mờ miền giá trị thuộc tính với biểu diễn đơn thể hạt đa thể hạt Với thuộc tính số sử dụng cấu trúc ĐSDT để xây dựng hàm thuộc dạng đơn thể hạt đa thể hạt Luận án sử dụng giải thuật di truyền để tìm kiếm thuộc tối ưu (hay xác định tham số cấu trúc ĐSGT) dựa CSDL cho trước Kết nghiên cứu cho thấy phương pháp xây dựng tập hàm thuộc để phân chia tập mục mờ tốn khai phá luật kết hợp mờ, cơng đoạn quan trọng mà đầu tư nghiên cứu Việc mở rộng ĐSGT (khơng có hạng từ) để đáp ứng yêu cầu toán tối ưu hóa số lượng lẫn thơng số MF nêu vừa giải tốt toán khai phá liệu, vừa phát huy mạnh ĐSGT Sử dụng ĐSGT tăng dễ dàng số hạng từ mà đảm bảo có phân hoạch mạnh dùng phân chia miền xác định mục Nội dung chương công bố cơng trình [iii, iv] Kết luận án thử nghiệm với CSDL gồm: FAM95, pollution, stulong, basketball, quake, stock Các CSDL lấy từ kho liệu UCI (https://archive.ics.uci.edu) 98 Phương pháp đơn giản hiệu việc xây dựng tập mờ phân chia miền giá trị thuộc tính Cách phân chia miền mờ vừa đảm bảo đáp ứng tốt tiêu chí hệ tập mờ, vừa mang lại đáp ứng tốt mặt ngữ nghĩa cho luật khai phá Luận án thử nghiệm với hai phương pháp biểu diễn liệu: biểu diễn đơn thể hạt biểu diễn đa thể hạt Các luật khai phá bao gồm luật mang tính khái quát cao luật chi tiết, phụ thuộc vào tầng biểu diễn liệu cấu trúc đa thể hạt ta xây dựng thông qua ĐSGT 99 KẾT LUẬN VÀ KIẾN NGHỊ Với mục tiêu tìm kiếm phương pháp luận cho phép phát tri thức dạng luật mờ, luật kết hợp mờ, luật mờ dạng ngôn ngữ,… từ kho liệu số Luận án sử dụng ĐSGT thay cho lý thuyết tập mờ để nghiên cứu số vấn đề khai phá luật kết hợp mờ Luận án đề xuất phương pháp nhằm giảm thời gian, đề xuất giải pháp tìm kiếm phân hoạch mờ tối ưu cho thuộc tính định lượng dựa vào CSDL đầu vào theo số ràng buộc cho trước Luận án đề xuất sử dụng lý thuyết ĐSGT giải thuật GA áp dụng tốn khai phá luật kết hợp mờ thay sử dụng lý thuyết tập mờ phương pháp đề xuất trước Kết nghiên cứu luận án là: - Nhằm mục đích giảm thời gian khai phá luật kết hợp, luận án đề xuất phương pháp sử dụng ĐSGT giải pháp nén CSDL mờ Các giao dịch mờ gần gộp với để tạo thành giao dịch Ưu điểm phương pháp giúp CSDL có kích thước nhỏ CSDL ban đầu giúp thời gian khai phá luật kết hợp giảm - Luận án đề xuất sử dụng lý thuyết ĐSGT giải thuật di truyền tìm kiếm hàm thuộc dựa vào CSDL giao dịch đầu vào số mục tiêu toán khai phá luật kết hợp mờ Phương pháp lập luận mờ sử dụng ĐSGT cần tập trung đến độ đo tính mờ hay tối ưu số gia tử, số lượng tham số so với số phương pháp đề xuất trước mà tác giả sử dụng lý tuyết tập mờ giúp thời gian tối ưu nhanh Luận án sử dụng biểu diễn tập mờ dạng đơn thể hạt để tính tốn độ thuộc liệu vào miền mờ Kết thu tập hàm thuộc cho thuộc tính định lượng tập luật kết hợp mờ - Luận án sử dụng biểu diễn đa thể hạt ĐSGT cho toán khai phá luật kết hợp mờ Về mặt ngữ nghĩa, dùng biểu diễn đa thể hạt cho luật kết hợp vừa có tính khái qt có tính chi tiết Với phương pháp luận án đề xuất, việc tính tốn liên quan đến biểu diễn đa thể hạt tăng thêm không đáng kể mặt phức tạp mặt thời gian mà kết nhận lại tốt nhiều Mặc dù luận án đạt kết tốt, nhiên kết nghiên cứu chủ yếu tập trung vào giải pháp nén liệu giao dịch phân hoạch miền xác định thuộc tính thành miền mờ dạng biểu diễn đơn thể hạt đa thể 100 hạt theo hướng tiếp cận sử dụng ĐSGT cho toán khai phá luật kết hợp mờ Song, số nội dung liên quan đến toán khai phá luật kết hợp cần tiếp tục nghiên cứu hoàn chỉnh hơn: giải tốn tìm luật kết hợp phủ định, luật kết hợp có trọng số, luật kết hợp song song,… Đó vấn đề đặt cho chúng tơi cần phải có nghiên cứu thời gian tới 101 CÁC CƠNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN i) Trần Thái Sơn, Nguyễn Tuấn Anh, Nâng cao hiệu khai phá luật kết hợp mờ theo hướng tiếp cận đại số gia tử, Kỷ yếu hội nghị quốc gia lần VI nghiên cứu ứng dụng công nghệ thông tin (Fair) - Huế, 6/2013 ii) Tran Thai Son, Nguyen Tuan Anh, Improve efficiency fuzzy association rule using hedge algebra approach, Journal of Computer Science and Cybernetics, Vol 30, No 4, 2014 iii) Tran Thai Son, Nguyen Tuan Anh, Hedges Algebras and fuzzy partition problem for qualitative attributes, Journal of Computer Science and Cybernetics, V.32, N.4, 2016 iv) Tran Thai Son, and Nguyen Tuan Anh, Partition fuzzy domain with multi-granularity representation of data based on Hedge Algebra approach, Journal of Computer Science and Cybernetics, vol 34, pp 63-76, 2018 102 TÀI LIỆU THAM KHẢO TIẾNG VIỆT [1] [2] [3] [4] B C Cường, and N D Phước, Hệ mờ, mạng nơron ứng dụng, Nhà xuất Khoa học kỹ thuật, 2006 N C Hào, and N C Đoàn, Luật kết hợp mờ dựa ngữ nghĩa đại số gia tử, Tạp chí khoa học - Đại học Huế, vol 74A, no 5, 2012 T T Sơn, Đ N Tiến, and P Đ Phong, Luật kết hợp theo cách tiếp cận Đại số gia tử, Journal of Computer Science and Cybernetics, vol 27, no 4, 2012 H V Thông, N C Hồ, and N Đ Dư, Một phương pháp sinh hệ luật mờ Mamdani cho toán hồi quy với ngữ nghĩa Đại số gia tử, Tin học điều khiển học, vol 30, no 3, pp 227-238, 2014 TIẾNG ANH [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] C.-M Lin, Y.-L Hsieh, K.-C Yin, M.-C Hung, and D.-L Yang, ADMiner: An Incremental Data Mining Approach Using a Compressed FP-tree, Journal of Software, vol 8, no 8, 2013 R J Kuo, C M Chao, and Y Chiu, Application of particle swarm optimization to association rule mining, Applied Soft Computing, vol 11, no 1, pp 326-336, 2011 A Agarwal, and N Nanavati, Association rule mining using hybrid GA-PSO for multi-objective optimisation, Computational Intelligence and Computing Research (ICCIC), 2016 IEEE International Conference on, IEEE, 2016 R J Miller, and Y Yang, Association rules over interval data, ACM SIGMOD Record, vol 26, no 2, pp 452-461, 1997 U Can, and B Alatas, Automatic Mining of Quantitative Association Rules with Gravitational Search Algorithm, International Journal of Software Engineering and Knowledge Engineering, vol 27, no 03, pp 343-372, 2017 L J Eshelman, The CHC adaptive search algorithm: How to have safe search when engaging in nontraditional genetic recombination, Foundations of genetic algorithms, pp 265-283: Elsevier, 1991 C.-H Chen, V S Tseng, and T.-P Hong, Cluster-based evaluation in fuzzygenetic data mining, IEEE transactions on fuzzy systems, vol 16, no 1, pp 249-262, 2008 M Kaya, and R Alhajj, A clustering algorithm with genetically optimized membership functions for fuzzy association rules mining, Fuzzy Systems, 2003 FUZZ'03 The 12th IEEE International Conference on, IEEE, 2003 L A Zadeh, The concept of a linguistic variable and its application to approximate reasoning—I, Information sciences, vol 8, no 3, pp 199-249, 1975 H B Yadav, and D K Yadav, Construction of membership function for software metrics, Procedia Computer Science, vol 46, pp 933-940, 2015 C Mencar, M Lucarelli, C Castiello, and A M Fanelli, Design of Strong Fuzzy Partitions from Cuts, EUSFLAT Conf., 2013 103 [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] P Pulkkinen, and H Koivisto, A dynamically constrained multiobjective genetic fuzzy system for regression problems, IEEE Transactions on Fuzzy Systems, vol 18, no 1, pp 161-177, 2010 R T Ng, and J Han, Efficient and Effective Clustering Methods for Spatial Data Mining, Proceedings of VLDB, Citeseer, 1994 J.-Y Dai, D.-L Yang, J Wu, and M.-C Hung, An efficient data mining approach on compressed transactions, World Academy of Science, Engineering and Technology, vol 3, pp 76-83, 2008 N C Ho, and W Wechler, Extended hedge algebras and their application to fuzzy logic, Fuzzy sets and systems, vol 52, no 3, pp 259-281, 1992 D Meng, and Z Pei, Extracting linguistic rules from data sets using fuzzy logic and genetic algorithms, Neurocomputing, vol 78, no 1, pp 48-54, 2012 R Agrawal, and R Srikant, Fast algorithms for mining association rules, Proc 20th int conf very large data bases, VLDB, 1994 C.-H Chen, T.-P Hong, Y.-C Lee, and V S Tseng, Finding Active Membership Functions for Genetic-Fuzzy Data Mining, International Journal of Information Technology & Decision Making, vol 14, no 06, pp 12151242, 2015 A Fu, M H Wong, S C Sze, W C Wong, W L Wong, and W K Yu, Finding fuzzy sets for the mining of fuzzy association rules for numerical attributes, Proceedings of the first international symposium on intelligent data engineering and learning, 1998 A Mangalampalli, and V Pudi, FPrep: Fuzzy clustering driven efficient automated pre-processing for fuzzy association rule mining, Fuzzy Systems (FUZZ), 2010 IEEE International Conference on, IEEE, 2010 N C Ho, and N V Long, Fuzziness measure on complete hedge algebras and quantifying semantics of terms in linear hedge algebras, Fuzzy Sets and Systems, vol 158, no 4, pp 452-471, 2007 N C Ho, T T Son, T D Khang, and L X Viet, Fuzziness Measure, Quantified Sematic Mapping and Interpolative Method of Approximate Reasoning in Medical Expert Systems, Journal of Computer Science and Cybernetics, vol 18, no 3, pp 237-252, 2002 A Gyenesei, A fuzzy approach for mining quantitative association rules, Acta Cybern., vol 15, no 2, pp 305-320, 2001 J Alcala-Fdez, R Alcala, and F Herrera, A fuzzy association rule-based classification model for high-dimensional problems with genetic rule selection and lateral tuning, IEEE Transactions on Fuzzy Systems, vol 19, no 5, pp 857-872, 2011 A Mangalampalli, and V Pudi, Fuzzy association rule mining algorithm for fast and efficient performance on very large datasets, Fuzzy Systems, 2009 FUZZ-IEEE 2009 IEEE International Conference on, IEEE, 2009 C Kuok, A Fu, and M Wong, Fuzzy association rules in large databases with quantitative attributes, ACM SIGMOD Records, 1998 C Kuok, A Fu, and M Wong, Fuzzy association rules in large databases with quntitative attributes, ACM SIGMOD Records, 1998 C A Kumar, Fuzzy Clustering-Based Formal Concept Analysis for Association Rules Mining, Applied Artificial Intelligence, vol 26, no 3, pp 274-301, 2012 104 [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] C.-H Chen, A.-F Li, and Y.-C Lee, A fuzzy coherent rule mining algorithm, Applied Soft Computing, vol 13, no 7, pp 3422-3428, 2013 C.-W Lin, T.-P Hong, and W.-H Lu, Fuzzy data mining based on the compressed fuzzy fp-trees, Fuzzy Systems, 2009 FUZZ-IEEE 2009 IEEE International Conference on, IEEE, 2009 W Siler, and J J Buckley,Fuzzy expert systems and fuzzy reasoning: John Wiley & Sons, 2005 K Loquin, and O Strauss, Fuzzy histograms and density estimation, Soft methods for integrated uncertainty modelling, pp 45-52: Springer, 2006 G Castellano, A M Fanelli, and C Mencar, Fuzzy Information Granulation with Multiple Levels of Granularity, Granular Computing and Intelligent Systems, pp 185-202: Springer, 2011 G Pradeep, and V Ravi, Fuzzy Multi-Objective Association Rule Mining Using Evolutionary Computation, Handbook of Research on Intelligent Techniques and Modeling Applications in Marketing Analytics, pp 119, 2016 H Ishibuchi, and T Yamamoto, Fuzzy rule selection by multi-objective genetic local search algorithms and rule evaluation measures in data mining, Fuzzy Sets and Systems, vol 141, no 1, pp 59-88, 2004 L A Zadeh, Fuzzy sets, Information and control, vol 8, no 3, pp 338-353, 1965 J C Bezdek, D Dubois, and H Prade,Fuzzy sets in approximate reasoning and information systems: Springer Science & Business Media, 2012 T.-P Hong, C.-H Chen, Y.-C Lee, and Y.-L Wu, Genetic-fuzzy data mining with divide-and-conquer strategy, IEEE Transactions on Evolutionary Computation, vol 12, no 2, pp 252-265, 2008 C.-H Chen, T.-P Hong, V S Tseng, and C.-S Lee, A genetic-fuzzy mining approach for items with multiple minimum supports, Soft Computing, vol 13, no 5, pp 521-533, 2009 K Deb, Genetic Algorithm in Search and Optimization, Indian Institute of Technology, Kanpur, India, 1998 W Wang, and S Bridges, Genetic algorithm optimization of membership functions for mining fuzzy association rules, Department of Computer Science Mississippi State University, vol 2, 2000 C.-K Ting, T.-C Wang, R.-T Liaw, and T.-P Hong, Genetic algorithm with a structure-based representation for genetic-fuzzy data mining, Soft Computing, vol 21, no 11, pp 2871-2882, 2016 N C Ho, W Pedrycz, D T Long, and T T Son, A genetic design of linguistic terms for fuzzy rule based classifiers, International Journal of Approximate Reasoning, vol 54, no 1, pp 1-21, 2012 R Alcalá, J Alcalá-Fdez, M J Gacto, and F Herrera, Genetic learning of membership functions for mining fuzzy association rules, Fuzzy Systems Conference, 2007 FUZZ-IEEE 2007 IEEE International, IEEE, 2007 N C Ho, and W Wechler, Hedge algebras: an algebraic approach to structure of sets of linguistic truth values, Fuzzy sets and systems, vol 35, no 3, pp 281-293, 1990 M Martínez-Ballesteros, A Troncoso, F Martínez-Álvarez, and J C Riquelme, Improving a multi-objective evolutionary algorithm to discover 105 [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] quantitative association rules, Knowledge and Information Systems, vol 49, no 2, pp 481-509, 2015 M J Gacto, R Alcalá, and F Herrera, Interpretability of linguistic fuzzy rulebased systems: An overview of interpretability measures, Information Sciences, vol 181, no 20, pp 4340-4360, 2011 M Antonelli, P Ducange, B Lazzerini, and F Marcelloni, Learning concurrently data and rule bases of Mamdani fuzzy rule-based systems by exploiting a novel interpretability index, Soft Computing, vol 15, no 10, pp 1981-1998, 2011 J Alcalá-Fdez, R Alcalá, M J Gacto, and F Herrera, Learning the membership function contexts for mining fuzzy association rules by using genetic algorithms, Fuzzy Sets and Systems, vol 160, no 7, pp 905-921, 2009 R Agrawal, T Imieliński, and A Swami, Mining association rules between sets of items in large databases, Acm sigmod record, ACM, 1993 T.-P Hong, C.-S Kuo, and S.-C Chi, Mining association rules from quantitative data, Intelligent data analysis, vol 3, no 5, pp 363-376, 1999 C H Cai, A W.-C Fu, C Cheng, and W Kwong, Mining association rules with weighted items, Database Engineering and Applications Symposium, 1998 Proceedings IDEAS'98 International, IEEE, 1998 K C Chan, and W.-H Au, Mining fuzzy association rules, Proceedings of the sixth international conference on Information and knowledge management, ACM, 1997 S.-z Li, and S.-l Chen, Mining fuzzy association rules by using nonlinear particle swarm optimization, Quantitative Logic and Soft Computing 2010, pp 621-630: Springer, 2010 C M Kuok, A Fu, and M H Wong, Mining fuzzy association rules in databases, ACM Sigmod Record, vol 27, no 1, pp 41-46, 1998 C.-K Ting, R.-T Liaw, T.-C Wang, and T.-P J M C Hong, Mining fuzzy association rules using a memetic algorithm based on structure representation, Memetic Computing, vol 10, no 1, pp 15-28, 2018 W Zhang, Mining fuzzy quantitative association rules, Tools with Artificial Intelligence, 1999 Proceedings 11th IEEE International Conference on, IEEE, 1999 D L Olson, and Y Li, Mining fuzzy weighted association rules, System Sciences, 2007 HICSS 2007 40th Annual Hawaii International Conference on, IEEE, 2007 B Minaei-Bidgoli, R Barmaki, and M Nasiri, Mining numerical association rules via multi-objective genetic algorithms, Information Sciences, vol 233, pp 15-24, 2013 M Kaya, and R Alhajj, Mining optimized fuzzy association rules using multiobjective genetic algorithm, 8th IEEE International Conference on Intelligent Engineering Systems, Cluj-Napoca, Romania, 2004 R Srikant, and R Agrawal, Mining quantitative association rules in large relational tables, Acm Sigmod Record, ACM, 1996 G Wang, J Xu, Q Zhang, and Y Liu, Multi-granularity intelligent information processing, Rough Sets, Fuzzy Sets, Data Mining, and Granular Computing, pp 36-48: Springer, 2015 106 [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] M Antonelli, P Ducange, B Lazzerini, and F Marcelloni, Multi-objective evolutionary design of granular rule-based classifiers, Granular Computing, vol 1, no 1, pp 37-58, 2015 M Antonelli, P Ducange, B Lazzerini, and F Marcelloni, Multi-objective evolutionary learning of granularity, membership function parameters and rules of Mamdani fuzzy systems, Evolutionary Intelligence, vol 2, no 1-2, pp 21, 2009 C.-H Chen, T.-P Hong, V S Tseng, and L.-C Chen, Multi-objective geneticfuzzy data mining, International Journal of Innovative Computing Information and Control, vol 8, no 10A, pp 6551-6568, 2012 M Kaya, Multi-objective genetic algorithm based approaches for mining optimized fuzzy association rules, Soft computing, vol 10, no 7, pp 578-586, 2006 A Ghosh, and B Nath, Multi-objective rule mining using genetic algorithms, Information Sciences, vol 163, no 1-3, pp 123-133, 2004 H R Qodmanan, M Nasiri, and B Minaei-Bidgoli, Multi objective association rule mining with genetic algorithm without specifying minimum support and minimum confidence, Expert Systems with applications, vol 38, no 1, pp 288-298, 2011 M J Zaki, S Parthasarathy, M Ogihara, and W Li, New Algorithms for Fast Discovery of Association Rules, KDD, 1997 H Kalia, S Dehuri, A Ghosh, and S.-B Cho, On the mining of fuzzy association rule using multi-objective genetic algorithms, International Journal of Data Mining, Modelling and Management, vol 8, no 1, pp 1-31, 2016 A Gupta, S Jain, and A J A a S Tiwari, Optimization and Improvement of association rule mining using genetic algorithm and fuzzy logic, 2019 U K Patel, Optimization of Association Rule Mining Using Genetic Algorithm, Conference Proceeding of International Conference on Recent Innovation in Science, Technology and Management, 2016 M Saggar, A K Agrawal, and A Lad, Optimization of association rule mining using improved genetic algorithms, Systems, Man and Cybernetics, 2004 IEEE International Conference on, IEEE, 2004 H Zheng, J He, G Huang, and Y Zhang, Optimized fuzzy association rule mining for quantitative data, Fuzzy Systems (FUZZ-IEEE), 2014 IEEE International Conference on, IEEE, 2014 Z Makani, S Arora, and P Kanikar, A Parallel Approach to Combined Association Rule Mining, International Journal of Computer Applications, vol 62, no 15, 2013 S Mishra, D Mishra, and S K Satapathy, Particle swarm optimization based fuzzy frequent pattern mining from gene expression data, Computer and Communication Technology (ICCCT), 2011 2nd International Conference on, IEEE, 2011 M Fazzolari, R Alcala, Y Nojima, H Ishibuchi, and F Herrera, A review of the application of multiobjective evolutionary fuzzy systems: Current status and further directions, IEEE Transactions on Fuzzy systems, vol 21, no 1, pp 45-65, 2013 107 [82] [83] [84] [85] Y Yao, A triarchic theory of granular computing, Granular Computing, vol 1, no 2, pp 145-157, 2016 T.-P Hong, C.-H Chen, Y.-L Wu, and Y.-C Lee, Using divide-and-conquer GA strategy in fuzzy data mining, Computers and Communications, 2004 Proceedings ISCC 2004 Ninth International Symposium on, IEEE, 2004 L Yan, Z Pei, and F Ren, Constructing and Managing Multi-Granular Linguistic Values Based on Linguistic Terms and Their Fuzzy Sets, IEEE Access, vol 7, pp 152928-152943, 2019 N C Ho, T T Son, H V Thong, and N V Long, LFoC-Interpretability of Linguistic Rule Based Systems and its Applications To Solve Regression Problems, International Journal of Computer Technology & Applications, vol 8, no 2, pp 94-117, 2017 ... cứu phương pháp biểu thị ngữ nghĩa khái niệm mờ (các từ ngôn ngữ mờ) thông qua hàm thuộc (tập mờ) phương pháp toán học khác cho biểu thị ngữ nghĩa khái niệm phù hợp Việc nghiên cứu đòi hỏi nghiên. .. tóm tắt về tốn khai phá luật kết hợp số khái niệm liên quan đến toán khai phá luật kết hợp Chương 2: Phát triển thuật toán theo hướng tiếp cận ĐSGT cho toán khai phá luật kết hợp mờ Thay cách tiếp... vậy, phương pháp luận phát tri thức luật gắn với phương pháp lập luận mờ: hệ tri thức luật mờ tốt, phù hợp sở tri thức luật phát tạo sở cho lập luận hiệu Vì phương pháp lập luận mờ nội dung nghiên

Ngày đăng: 04/03/2020, 08:23

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan