VỀ TÍNH HIỆU QUẢ CỦA CÁC THUẬT TOÁN TỐI ƢU TIẾN HÓA CHO PHÂN CỤM MỜ VÀ ỨNG DỤNG TRONG PHÂN TÍCH NHU CẦU KHÁCH HÀNG

23 1.1K 0
VỀ TÍNH HIỆU QUẢ CỦA CÁC THUẬT TOÁN TỐI ƢU TIẾN HÓA CHO PHÂN CỤM MỜ VÀ ỨNG DỤNG TRONG PHÂN TÍCH NHU CẦU KHÁCH HÀNG

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ NHƢ NA VỀ TÍNH HIỆU QUẢ CỦA CÁC THUẬT TOÁN TỐI ƢU TIẾN HÓA CHO PHÂN CỤM MỜ VÀ ỨNG DỤNG TRONG PHÂN TÍCH NHU CẦU KHÁCH HÀNG LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội – 2015 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ NHƢ NA VỀ TÍNH HIỆU QUẢ CỦA CÁC THUẬT TOÁN TỐI ƢU TIẾN HÓA CHO PHÂN CỤM MỜ VÀ ỨNG DỤNG TRONG PHÂN TÍCH NHU CẦU KHÁCH HÀNG Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60.48.01.04 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: TS Lê Hoàng Sơn Hà Nội – 2015 LỜI CAM ĐOAN Tôi xin cam đoan công trình nghiên cứu độc lập riêng tôi, không chép công trình luận văn, luận án tác giả khác Các số liệu, kết nêu luận văn trung thực chưa công bố công trình khác Các trích dẫn, số liệu kết tham khảo dùng để so sánh có nguồn trích dẫn rõ ràng Tôi xin hoàn toàn chịu trách nhiệm chịu hình thức kỷ luật theo quy định cho lời cam đoan Hà Nội, tháng năm 2015 Tác giả luận văn Nguyễn Thị Nhƣ Na i LỜI CẢM ƠN Để hoàn thành tốt luận văn này, em xin bày tỏ lòng biết ơn chân thành sâu sắc đến Tiến sĩ Lê Hoàng Sơn, người tận tình trực tiếp hướng dẫn em suốt trình triển khai nghiên cứu đề tài, tạo điều kiện để em hoàn thành luận văn Thứ hai, em xin bày tỏ lòng biết ơn chân thành tới toàn thể thầy cô giáo khoa Công nghệ thông tin, trường Đại học Công nghệ Hà Nội, Đại học Quốc gia Hà Nội dạy bảo tận tình em suốt trình em học tập khoa Thứ ba, em xin gửi lời cảm ơn tới thầy cô, anh chị bạn Trung tâm Tính toán Hiệu cao, trường Đại học Khoa học tự nhiên giúp đỡ em suốt thời gian làm luận văn Cuối em xin chân thành cảm ơn tới gia đình, bạn bè, đồng nghiệp bên em cổ vũ, động viên, giúp đỡ em suốt trình học tập thực luận văn Luận văn thực tài trợ đề tài NAFOSTED, mã số: 102.05-2014.01 Mặc dù cố gắng hoàn thành luận văn phạm vi khả cho phép chắn không tránh khỏi thiếu sót Em mong góp ý chân thành thầy cô bạn để em hoàn thiện luận văn Xin chân thành cảm ơn! Hà Nội, ngày tháng năm 2015 Học viên Nguyễn Thị Như Na ii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH SÁCH HÌNH VẼ vi DANH SÁCH BẢNG vi DANH MỤC CÁC KÝ HIỆU VIẾT TẮT vii 1/ ĐẶT VẤN ĐỀ 2/ MỤC ĐÍCH CỦA LUẬN VĂN 3/ BỐ CỤC CỦA LUẬN VĂN CHƢƠNG 1: TỔNG QUAN VỀ PHÂN CỤM MỜ 1.1 Tập mờ 1.1.1 Lý thuyết mờ 1.1.2 Tập mờ 1.2 Giới thiệu phân cụm mờ 1.2.1 Khái quát phân cụm 1.2.2 Độ đo gần gũi 10 1.2.3 Các bước phân cụm Error! Bookmark not defined 1.2.4 Phân cụm mờ Error! Bookmark not defined 1.3 Thuật toán Fuzzy C – Means (FCM) Error! Bookmark not defined 1.3.1 Thuật toán Fuzzy C - Means Error! Bookmark not defined 1.3.2 Cài đặt chương trình Error! Bookmark not defined 1.4 Kết luận chương Error! Bookmark not defined iii CHƢƠNG 2: CÁC THUẬT TOÁN TỐI ƢU TIẾN HÓA CHO PHÂN CỤM MỜ Error! Bookmark not defined 2.1 Tính toán tiến hóa Error! Bookmark not defined 2.2 Các dạng thuật toán tiến hóa Error! Bookmark not defined 2.2.1 Thuật toán lập trình tiến hóa Error! Bookmark not defined 2.2.2 Chiến lược tiến hóa Error! Bookmark not defined 2.2.3 Thuật toán di truyền Error! Bookmark not defined 2.2.4 Lập trình di truyền Error! Bookmark not defined 2.2.5 Tiến hóa vi phân Error! Bookmark not defined 2.2.6 Thuật toán văn hóa Error! Bookmark not defined 2.3 Một số thuật toán cụ thể Error! Bookmark not defined 2.3.1.Tìm kiếm cục Error! Bookmark not defined 2.3.2 Thuật toán tìm kiếm Tabu Error! Bookmark not defined 2.3.3 Tìm kiếm lân cận biến đổi (VNS) Error! Bookmark not defined 2.3.4 Tối ưu bầy đàn PSO Error! Bookmark not defined 2.4 Áp dụng thuật toán tối ưu tiến hóa cho phân cụm mờ .Error! Bookmark not defined 2.4.1 Thuật toán Fuzzy J – Means heuristic (FJM) Error! Bookmark not defined 2.4.2 Thuật toán VNS Error! Bookmark not defined 2.4.3 Thuật toán tối ưu bầy đàn cho phân cụm mờ (FPSO) Error! Bookmark not defined Cài đặt chương trình Error! Bookmark not defined 2.5 Kết luận chương Error! Bookmark not defined iv CHƢƠNG 3: SO SÁNH HIỆU NĂNG THUẬT TOÁN TỐI ƢU TIẾN HÓA Error! Bookmark not defined 3.1 Thiết lập môi trường thực nghiệm Error! Bookmark not defined 3.1.1 Dữ liệu Error! Bookmark not defined 3.1.2 Cấu hình cài đặt Error! Bookmark not defined 3.1.3 Kết thực nghiệm Error! Bookmark not defined 3.1.4 So sánh hiệu thuật toán Error! Bookmark not defined 3.2 Ứng dụng Error! Bookmark not defined 3.2.1 Bài toán Error! Bookmark not defined 3.2.2 Dữ liệu Error! Bookmark not defined 3.2.3 Kết chạy thực nghiệm toán Error! Bookmark not defined 3.3 Kết luận chương Error! Bookmark not defined KẾT LUẬN Error! Bookmark not defined TÀI LIỆU THAM KHẢO 11 v DANH SÁCH HÌNH VẼ Hình 1.1 Tập mờ biểu diễn tập mờ Hình 1.2 Ví dụ tập mờ Hình 1.3 Số mờ hình thang Hình 1.4 Số mờ hình tam giác Hình 1.5 Các dạng hình học khác cụm không gian R Hình 2.1 Cá thể cập nhật vị trí Hình 3.1 Minh họa liệu đầu vào thử nghiệm lưu tệp excel Hình Tóm tắt trường liệu đầu vào Hình 3 Tóm tắt trường liệu đầu vào Hình Tóm tắt trường liệu đầu vào Hình 3.5 Minh họa liệu đầu vào cho toán ứng dụng lưu tệp exel Hình 3.6 Ma trận mờ thuộc DANH SÁCH BẢNG Bảng 3.1: Kêt thực nghiệm trường hợp Bảng 3.2: Kêt thực nghiệm trường hợp Bảng 3.3: Kêt thực nghiệm trường hợp Bảng 3.4: Kêt thực nghiệm trường hợp vi Bảng 3.5: Bệnh viện thuộc cụm Bảng 3.6: Bệnh viện thuộc cụm Bảng 3.7: Bệnh viện thuộc cụm Bảng 3.8: Không gian tham chiếu thuộc tính DANH MỤC CÁC KÝ HIỆU VIẾT TẮT Từ cụm từ Từ Từ Tiếng Anh viết tắt Phân cụm mờ C - Means FCM Fuzzy C – Means Phân cụm mờ J - Means FJM Fuzzy J – Means Tìm kiếm lân cận biến đổi VNS Variable neighbourhood search Tối ưu bầy đàn PSO vii Particle Swarm Optimization Tối ưu bầy đàn mờ FPSO Fuzzy Particle Swarm Optimization Lập trình tiến hóa EP Evolutionary Programming Chiến lược tiến hóa ES Evolutionary Strategies Thuật toán di truyền GA Genetic Algorithms Thuật toán tiến hóa EA Evolutionary Algorithms Tập mờ FS Fuzzy Set Thuật toán tìm kiếm Tabu TS Tabu search viii MỞ ĐẦU 1/ ĐẶT VẤN ĐỀ Trong năm gần đây, công nghệ thông tin có chuyển biến mạnh mẽ, tác động lớn đến phát triển xã hội Sự bùng nổ thông tin đem đến lượng liệu khổng lồ Chúng ta có nhu cầu khám phá kho liệu phục vụ cho nhu cầu người, điều đòi hỏi người phải biết khai thác liệu xử lý thông tin thành tri thức có ích Một kỹ thuật quan trọng trình khai phá liệu xử lý liệu lớn kỹ thuật phân cụm liệu Phân cụm đặc biệt hiệu ta thông tin cụm, ta quan tâm tới thuộc tính cụm mà chưa biết biết thông tin Phân cụm coi công cụ độc lập để xem xét phân bố liệu, làm bước tiền xử lý cho thuật toán khác Việc phân cụm liệu có nhiều ứng dụng lập quy hoạch đô thị, nghiên cứu trái đất, địa lý, khai phá Web v.v Ngày nay, với kỹ thuật phân cụm kết hợp với lý thuyết mờ Zadeh phương pháp phân cụm mờ phát triển ứng dụng rộng rãi thực thực tiễn, ví dụ phân tích nhu cầu khách hàng, phân đoạn ảnh, nhận dạng mặt người, nhận dạng cử điệu bộ, phân tích rủi ro, dự báo nguy phá sản cho ngân hàng nhiều toán khác Những vấn đề quan tâm nhiều phân cụm nói chung phân mờ nói riêng nâng cao chất lượng phân cụm, tính toán thông qua số độ đo chất lượng cụ thể Những nhược điểm phân cụm mờ liên quan đến việc xác định số cụm tự động, học đo khoảng cách thích nghi, lựa chọn tham số tối ưu, xây dựng tập mờ tập mờ mở rộng, v.v quan tâm nghiên cứu nhiều thời gian gần Tuy nhiên, nghiên cứu chưa quan tâm đến việc xác định nghiệm tối ưu toàn cục toán phân cụm, hàm mục tiêu toán hay cách thức phân chia liệu sử dụng chung cho toán Để xác định nghiệm tối ưu toàn cục toán phân cụm, thuật toán tối ưu tiến hóa thuật toán di truyền, tối ưu bầy đàn, v.v áp dụng việc tìm nghiệm tối ưu toàn cục toán tối ưu Và khuôn khổ luận văn tìm hiểu vấn đề sở khảo sát số thuật toán tối ưu tiến hóa cho toán phân cụm mờ, cụ thể thuật toán Fuzzy J Means, Variable Neighbourhood Search Fuzzy Particle Swarm Optimization 2/ MỤC ĐÍCH CỦA LUẬN VĂN Trong luận văn khảo sát môt số thuật toán tối ưu tiến hóa cho toán phân cụm mờ, cụ thể thuật toán Fuzzy J – Means (FJM), Variable Neighbourhood Search (VNS) Fuzzy Particle Swarm Optimization (FPSO) Các thuật toán áp dụng cho toán phân tích nhu cầu khách hàng – mục tiêu quan trọng doanh nghiệp việc xác định khách hàng tiềm năng, nhu cầu nhóm khách hàng mức độ hài lòng sản phẩm dịch vụ Từ hỗ trợ doanh nghiệp đưa định chiếm lược kinh doanh tương lai dựa vào kết trình phân tích khách hàng tiềm năng, nhu cầu nhóm khách hàng mức độ hài lòng sản phẩm dịch vụ doanh nghiệp Cụ thể với sở liệu mẫu thống kê doanh doanh số bán hàng công ty kinh doanh thiết bị y tế cho khoảng 500 bệnh viện [26] sử dụng làm liệu đầu vào cho thuật toán Qua đây, tính hiệu thuật toán tối ưu tiến hóa cho toán phân cụm mờ theo tiêu chí chất lượng thời gian tính toán làm rõ đồng thời phác họa chi tiết chức toán phân tích nhu cầu khách hàng 3/ BỐ CỤC CỦA LUẬN VĂN Luận văn gồm chương, có phần mở đầu, phần kết luận, phần mục lục, phần tài liệu tham khảo Các nội dung luận văn trình bày theo cấu trúc sau: Chƣơng 1: Tổng quan phân cụm mờ Trong chương này, luận văn trình bày tổng quan tập mờ, toán phân cụm phân cụm mờ thuật toán giải vấn đề phân cụm tập mờ thuật toán Fuzzy C – Means (FCM) Từ thuật toán khảo sát thuật toán tối ưu tiến hóa cho toán phân cụm mờ Chƣơng 2: Các thuật toán tối ƣu tiến hóa cho phân cụm mờ Trong chương này, khái niệm tối ưu tiến hóa nhắc lại đầu chương Tiếp theo, trình bày thuật toán Fuzzy J – Means (FJM) phát triển từ thuật toán Fuzzy C – Means (FCM) việc tìm nghiệm tối ưu cho toán, từ có nhận xét hiệu toán phân cụm mờ áp dụng thuật toán Tiếp theo, khảo sát thuật toán Variable Neighbourhood Search (VNS) phát triển tiếp từ thuật toán Fuzzy J – Means phần cuối chương trình bày thuật toán Fuzzy Particle Swarm Optimization (FPSO) lai hai phương pháp Fuzzy C – Means Particle Swarm Optimization (PSO) Nhận xét chung thuật toán nhắc chương Chƣơng 3: So sánh hiệu thuật toán tối ƣu tiến hoá Trong chương này, cài đặt đánh giá hiệu thuật toán: FCM, FJM, VNS FPSO theo tiêu chí chất lượng phân cụm thông qua giá trị hàm mục tiêu thời gian tính toán Từ đây, hiệu thuật toán tối ưu tiến hóa cho phân cụm mờ khẳng định CHƢƠNG 1: TỔNG QUAN VỀ PHÂN CỤM MỜ 1.1 Tập mờ 1.1.1 Lý thuyết mờ Trong lý thuyết tập hợp kinh điển (do Cantor khởi xướng), giá trị phần tử tập hợp 1, tức với phần tử có hai khả thuộc không thuộc tập hợp Do đó, lý thuyết xử lý liệu có tính không chắn, không rõ ràng Lotfi A Zadeh Dieter Klaua người sáng lập lý thuyết tập mờ [25], mở đầu báo “Fuzzy Sets” tạp chí “Information and Control” năm 1965 Ý tưởng lý thuyết tập mờ Zadeh từ khái niệm trừu tượng, không chắn thông tin độ tuổi (trẻ – già), chiều cao (cao – thấp), nhiệt độ (nóng – lạnh), v.v ông tìm cách biểu diễn khái niệm toán học gọi tập mờ FS, khái quát khái niệm tập hợp Bằng phương pháp tiếp cận khác nhau, nhà nghiên cứu Dubois, Prade, Mamdani, Tagaki, Sugeno, Ishibuchi, Herrera, v.v đưa kết lý thuyết ứng dụng toán điều khiển mờ, khai phá liệu mờ, sở liệu mờ, hệ hỗ trợ định Tập mờ FS định nghĩa sau: 1.1.2 Tập mờ Định nghĩa 1.2 [25]: Cho tập X x phần tử tập X Một tập mờ F tập X định nghĩa hàm thành viên hay gọi hàm thuộc  F  x  (degree of membership), đo “mức độ” mà phần tử x thuộc tập F thỏa mãn điều kiện với  x  X ,  F  x  1 F  x,  F  x  x  X  Khi F  x  = x  F hoàn toàn Khi F  x  =  x  F hoàn toàn Tập mờ F rỗng F  x  = với  x  X Tập mờ F toàn phần F  x  = với  x  X Như vậy, khái niệm tập mờ tổng quát hóa khái niệm tập rõ hàm thuộc lấy giá trị khoảng [0, 1], tập rõ tập mờ đặc biệt hàm thuộc F  x  nhận hai giá trị Ví dụ 1.3: X = {X1, X2, X3, X4} Hàm thuộc không mang Biểu diễn tập mờ theo đồ thị giá trị tuyệt đối hay 1, mà giá trị thuộc đoạn [0,1] Hình 1.1: Tập mờ biểu diễn tập mờ Ví dụ 1.4: Cho tập X gồm người x , x , x , x , x  tương ứng có tuổi 50, 10, 15, 55, 70, xác định tập F tập hợp người “Trẻ”? Ta xây dựng hàm thuộc sau: µF(50)=0.35, µF(10)=0.95, µF(15)=0.75, µF(55)=0.30, µF(70)=0.05 Khi tập mờ F = {(50, 0.35) (10, 0.95) (15, 0.75) (55, 0.30)(70, 0.05)} F biểu diễn Hình 1.2 sau: Hình 1.2: Ví dụ tập mờ * Số mờ Xét tập mờ F tập số thực R Về nguyên tắc, ràng buộc chặt việc xây dựng tập mờ để biểu thị ngữ nghĩa khái niệm ngôn ngữ Tuy nhiên, để đơn giản xây dựng tập mờ tính toán tập mờ, người ta đưa khái niệm tập mờ có dạng đặc biệt, gọi số mờ để biểu thị khái niệm mờ số gần 10, khoảng 15, lớn nhiều so với 10,v.v Trong điều khiển, với mục đích sử dụng hàm thuộc cho khả tích hợp chúng đơn giản, người ta thường quan tâm đến hai dạng số mờ hình thang số mờ hình tam giác Số mờ hình thang Hàm thành viên có dạng sau [1]: 0, x  ac   x  a  c / c, a  c  x  a    F  x    1, a xb  b  d  x  / d , b  x  b  d  0, d d  x  Hình 1.3 Số mờ hình thang Số mờ hình tam giác Số mờ hình tam giác trường hợp đặc biệt số mờ hình thang Hàm thành viên có dạng sau: xa b  a , a  x  b  c  x F  x    , bxc cb otherwise  0,   Hình 1.4 Số mờ hình tam giác 1.2 Giới thiệu phân cụm mờ 1.2.1 Khái quát phân cụm Phân cụm kỹ thuật quan trọng khai phá liệu, thuộc lớp phương pháp học không giám sát học máy, nhằm tìm kiếm, phát cụm, mẫu liệu tự nhiên tiềm ẩn quan trọng tập liệu lớn để từ cung cấp thông tin, tri thức cho việc định Có nhiều định nghĩa khác kỹ thuật này, chất ta hiểu phân cụm qui trình tìm cách nhóm đối tượng cho vào cụm, cho đối tượng cụm tương tự đối tượng khác cụm không tương tự [23] Mục đích phân cụm tìm chất bên nhóm nội bên liệu nhãn Tuy nhiên, tiêu chí xem tốt để đánh giá hiệu phân tích phân cụm, điều phụ thuộc vào mục đích cuối phân cụm liệu Do đó, người sử dụng phải cung cấp tiêu chuẩn, theo cách mà kết phân cụm phù hợp với nhu cầu người sử dụng cần Định nghĩa 1.1: Cho X tập liệu gồm N vector: x , x , , x N  Bài toán phân cụm chia tập liệu X , c cụm liệu Z  z , z , , z c  Thỏa mãn điều kiện sau:  zi   , i  1, 2, , c  X  zi c z i 1 i z j   với i  j ; i, j  1, 2, , c Phân cụm đóng vai trò quan trọng nghành khoa học: - Thương mại: Phân cụm liệu giúp nhà cung cấp biết nhóm khác hàng quan trọng có đặc trưng tương đồng đặc tả họ từ mẫu sở liệu khách hàng - Sinh học: Phân cụm liệu sử dụng để xác định loại sinh vật, phân loại Gen với chức tương đồng thu cấu trúc mẫu - Phân tích liệu không gian: Do đồ sộ liệu không gian liệu thu từ hình ảnh chụp từ vệ tinh, thiết bị y học hệ thống thông tin địa lý (GIS), v.v, làm cho người dùng khó để kiểm tra liệu không gian cách chi tiết Phân cụm liệu trợ giúp người dùng tự động phân tích xử lý liêu không gian nhận dạng chiết xuất đặc tính mẫu liệu quan tâm tồn sở liệu không gian - Lập quy hoạch đô thị: Nhận dạng nhóm nhà theo kiểu vị trí địa lý, v.v, nhằm cung cấp thông tin cho quy hoạch đô thị - Nghiên cứu trái đất: Phân cụm để theo dõi tâm động đất nhằm cung cấp thông tin cho nhận dạng vùng nguy hiểm - Địa lý: Phân lớp động vật, thực vật đưa đặc trưng chúng - Khai phá Web: Phân cụm liệu khám phá nhóm tài liệu quan trọng, có nhiều ý nghĩa môi trường Web Các lớp tài liệu trợ giúp cho việc khám phá tri thức từ liệu Web, khám phá mẫu truy cập khách hàng đặc biệt hay khám phá cộng đồng Web, v.v 1.2.2 Độ đo gần gũi Trong định nghĩa toán phân cụm, đưa cụm từ “đối tượng tương tự nhau” Vậy hai đối tượng để gọi tương tự để đo mức độ tương tự chúng Định nghĩa: Một độ đo không tương tự  X hàm:  :XX R Sao cho:   R :     x, x     x, y   , x, y  R   x, y     y, x  , x, y Ngoài nếu:   x, x   x  y   x, y     x, z     z, y  10 TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt [1] Bùi Công Cường, Nguyễn Doãn Phước (2006), Hệ mờ, mạng nơron ứng dụng, Nhà xuất Khoa học kỹ thuật [2] Đường Võ Hùng (2014), "Ứng dụng giải thuật Tabu cho toán cân dây chuyền sản xuất dạng 2", tạp chí phát triển KH&CN, tập 14, số [3] Huỳnh Văn Nam (1999), Một sở đại số cho logic mờ Zadeh tính toán từ, Luận án tiến sĩ khoa học, Trường Đại học Bách khoa Hà Nội [4] Nguyễn Tấn Trần Minh Khang, Triệu Tráng Khôn, Đặng Thị Thanh Nguyên, Trần Thị Huệ Nương (2011), “Khảo sát số giải thuật Tabu giải toán Xếp thời khóa biểu”, Tạp chí trường ĐH Sài Gòn [5] Phan Tấn Quốc Nguyễn Đức Nghĩa (2013), "Thuật toán tìm kiếm TABU giải toán khung với chi phí định tuyến nhỏ nhất", Tập V-1, Số 10 (30), tháng 12/2013, Các công trình nghiên cứu, phát triển ứng dụng CNTT-TT Tài liệu tiếng Anh [6] Angeline, P J (1995) Adaptive and self-adaptive evolutionary computations In Computational intelligence: a dynamic systems perspective [7] Babuška, R (2005) Perspectives of fuzzy systems and control Fuzzy clustering algorithms, 156(3), 432-444 [8] Bezdek, J C (1981) Pattern recognition with fuzzy objective function algorithms Kluwer Academic Publishers [9] Brimberg, J., Hansen, P., Mladenovic, N., & Taillard, E D (2000) Improvements and comparison of heuristics for solving the uncapacitated multisource Weber problem Operations Research, 48(3), 444-460 11 [10] Du Merle, O., Hansen, P., Jaumard, B., & Mladenovic, N (1999) An interior point algorithm for minimum sum-of-squares clustering SIAM Journal on Scientific Computing, 21(4), 1485-1505 [11] Fischetti, M., Lancia, G., & Serafini, P (2002) Exact algorithms for minimum routing cost trees Networks, 39(3), 161-173 [12] Hall, L O., Ozyurt, I B., & Bezdek, J C (1999) Clustering with a genetically optimized approach Evolutionary Computation, IEEE Transactions on, 3(2), 103-112 [13] Hansen, P., & Jaumard, B (1997) Cluster analysis and mathematical programming Mathematical programming, 79(1-3), 191-215 [14] Hansen, P., & Mladenović, N (1999) An introduction to variable neighborhood search (pp 433-458) Springer US [15] Hansen, P., & Mladenović, N (2001) J-means: a new local search heuristic for minimum sum of squares clustering Pattern recognition, 34(2), 405413 [16] Hansen, P., & Mladenović, N (2001) Variable neighborhood search: Principles and applications European journal of operational research, 130(3), 449-467 [17] Ho, N C., & Wechler, W (1990) Hedge algebras: an algebraic approach to structure of sets of linguistic truth values Fuzzy sets and systems, 35(3), 281293 [18] Ho, N C., & Wechler, W (1992) Extended hedge algebras and their application to fuzzy logic Fuzzy sets and systems, 52(3), 259-281 [19] Horst, R., & Tuy, H (1996) Global optimization: Deterministic approaches Springer Science & Business Media [20] Mladenović, N., & Hansen, P (1997) Variable neighborhood search.Computers & Operations Research, 24(11), 1097-1100 12 [21] Mustafa Mohammed Rashid (2013), Tabu search, University of Gaziantep [22] Siddique, N., & Adeli, H (2013) Computational intelligence: synergies of fuzzy logic, neural networks and evolutionary computing John Wiley & Sons [23] Stefanowski, J (2009) Data Mining-Clustering University of Technology, Poland [24] Sri Phani Venkata Siva Krishna Madani (2010), Fuzzy Clustering Analysis, Blekinge Institute of Technology [25] Zadeh, L A (1965) Fuzzy sets Information and control, 8(3), 338-353 [26] http://www.rci.rutgers.edu/~cabrera/sc/cs8/cs8.html 13 [...]... vấn đề phân cụm trên tập mờ đó là thuật toán Fuzzy C – Means (FCM) Từ thuật toán này chúng tôi sẽ khảo sát các thuật toán tối ưu tiến hóa cho bài toán phân cụm mờ Chƣơng 2: Các thuật toán tối ƣu tiến hóa cho phân cụm mờ Trong chương này, các khái niệm cơ bản về tối ưu tiến hóa sẽ được nhắc lại ở đầu chương Tiếp theo, chúng tôi sẽ trình bày thuật toán Fuzzy J – Means (FJM) được phát triển từ thuật toán. .. (PSO) Nhận xét chung các thuật toán cũng được nhắc trong chương này Chƣơng 3: So sánh hiệu năng thuật toán tối ƣu tiến hoá Trong chương này, chúng tôi cài đặt và đánh giá hiệu năng các thuật toán: FCM, FJM, VNS và FPSO theo các tiêu chí về chất lượng phân cụm thông qua giá trị hàm mục tiêu và thời gian tính toán Từ đây, hiệu quả của các thuật toán tối ưu tiến hóa cho phân cụm mờ được khẳng định 3 4... khách hàng và mức độ hài lòng về sản phẩm và dịch vụ của doanh nghiệp Cụ thể với một cơ sở dữ liệu mẫu về thống kê doanh doanh số bán hàng của một công ty kinh doanh thiết bị y tế cho khoảng 500 bệnh viện [26] được sử dụng làm dữ liệu đầu vào cho các thuật toán trên Qua đây, tính hiệu quả của các thuật toán tối ưu tiến hóa cho bài toán phân cụm mờ theo các tiêu chí về chất lượng và thời gian tính toán. .. thuật toán này sẽ được áp dụng cho bài toán phân tích nhu cầu khách hàng – là mục tiêu quan trọng của bất kỳ doanh nghiệp nào trong việc xác định các khách hàng tiềm năng, nhu cầu của nhóm khách hàng đó và mức độ hài lòng về sản phẩm và dịch vụ Từ đó hỗ trợ doanh nghiệp đưa ra quyết định trong chiếm lược kinh doanh trong tương lai dựa vào kết quả của quá trình phân tích khách hàng tiềm năng, nhu cầu của. .. kỹ thuật phân cụm kết hợp với lý thuyết mờ của Zadeh phương pháp phân cụm mờ đã và đang phát triển và được ứng dụng rộng rãi trong thực thực tiễn, ví dụ như phân tích nhu cầu khách hàng, phân đoạn ảnh, nhận dạng mặt người, nhận dạng cử chỉ và điệu bộ, phân tích rủi ro, dự báo nguy cơ phá sản cho ngân hàng và nhiều bài toán khác Những vấn đề chính được quan tâm nhiều trong phân cụm nói chung và phân mờ. .. cụm, và hàm mục tiêu của bài toán hay cách thức phân chia dữ liệu vẫn được sử 1 dụng chung cho mọi bài toán Để xác định nghiệm tối ưu toàn cục của bài toán phân cụm, các thuật toán tối ưu tiến hóa như thuật toán di truyền, tối ưu bầy đàn, v.v được áp dụng trong việc tìm nghiệm tối ưu toàn cục của bài toán tối ưu Và trong khuôn khổ luận văn này sẽ tìm hiểu vấn đề đó trên cơ sở khảo sát một số thuật toán. .. tiết về các chức năng chính của bài toán phân tích nhu cầu khách hàng 2 3/ BỐ CỤC CỦA LUẬN VĂN Luận văn gồm 3 chương, có phần mở đầu, phần kết luận, phần mục lục, phần tài liệu tham khảo Các nội dung cơ bản của luận văn được trình bày theo cấu trúc như sau: Chƣơng 1: Tổng quan về phân cụm mờ Trong chương này, luận văn sẽ trình bày tổng quan về tập mờ, bài toán phân cụm và phân cụm mờ và thuật toán. .. toán tối ưu tiến hóa cho bài toán phân cụm mờ, cụ thể là thuật toán Fuzzy J Means, Variable Neighbourhood Search và Fuzzy Particle Swarm Optimization 2/ MỤC ĐÍCH CỦA LUẬN VĂN Trong luận văn này chúng tôi khảo sát môt số thuật toán tối ưu tiến hóa cho bài toán phân cụm mờ, cụ thể là thuật toán Fuzzy J – Means (FJM), Variable Neighbourhood Search (VNS) và Fuzzy Particle Swarm Optimization (FPSO) Các thuật. .. dữ liệu và xử lý dữ liệu lớn là kỹ thuật phân cụm dữ liệu Phân cụm đặc biệt hiệu quả khi ta không biết về thông tin của các cụm, hoặc khi ta quan tâm tới những thuộc tính của cụm mà chưa biết hoặc biết rất ít về những thông tin đó Phân cụm được coi như một công cụ độc lập để xem xét phân bố dữ liệu, làm bước tiền xử lý cho các thuật toán khác Việc phân cụm dữ liệu có rất nhiều ứng dụng như trong lập... Mục đích của phân cụm là tìm ra bản chất bên trong các nhóm nội tại bên trong của bộ dữ liệu không có nhãn Tuy nhiên, không có tiêu chí nào là được xem là tốt nhất để đánh giá hiệu quả của phân tích phân cụm, điều này phụ thuộc vào mục đích cuối cùng của phân cụm dữ liệu Do đó, người sử dụng phải cung cấp tiêu chuẩn, theo cách như vậy mà kết quả của phân cụm sẽ phù hợp với nhu cầu của người sử dụng cần

Ngày đăng: 10/04/2016, 02:20

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan