Phương pháp sinh luật mờ phân lớp dựa trên đại số gia tử và ứng dụng phân lớp dữ liệu sinh viên

78 1 0
  • Loading ...
1/78 trang

Thông tin tài liệu

Ngày đăng: 07/05/2020, 23:25

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN ĐẠI HỌC MỞ HÀ NỘI Style Definition: CAP3: Indent: First line: 0" LUẬN VĂN THẠC SĨ PHƯƠNG PHÁP SINH LUẬT MỜ PHÂN LỚP DỰA TRÊN ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG PHÂN LỚP DỮ LIỆU SINH VIÊN NGUYỄN VIẾT BÌNH CHUYÊN NGÀNH: CÔNG NGHỆ THÔNG TIN MÃ SỐ: 60480201 HƯỚNG DẪN KHOA HỌC :TS DƯƠNG THĂNG LONG HÀ NỘI - 2017 i LỜI CAM ĐOAN Tôi xin cam đoan luận văn cơng trình nghiên cứu riêng cá nhân tơi, khơng chép tự nghiên cứu, đọc, dịch tài liệu, tổng hợp thực Nội dung lý thuyết trong luận văn tơi có sử dụng số tài liệu tham khảo trình bày phần tài liệu tham khảo Các số liệu, chương trình phần mềm kết luận văn trung thực chưa công bố cơng trình khác Hà Nội, ngày 250tháng 121 năm 2017 Học viên thực Nguyễn Viết Bình i LỜI CẢM ƠN Lời đầu tiên, em xin gửi lời biết ơn sâu sắc đến TS Dương Thăng Long người tận tình hướng dẫn, bảo, giúp đỡ em suốt trình làm luận văn Em xin gửi lời cảm ơn đến thầy cô giảng dạy thầy cô Khoa Đào Tạo Sau Đại Học truyền đạt kiến thức giúp đỡ em suốt trình học Và cuối em xin gửi lời cảm ơn tới đồng nghiệp, gia đình bạn bè người ủng hộ, động viên tạo điều kiện giúp đỡ để em có kết ngày hơm Hà Nội, ngày 250tháng 121 năm 2017 Học viên thực Nguyễn Viết Bình i MỤC LỤC LỜI CAM ĐOAN ii LỜI CẢM ƠN iii MỤC LỤC iv DANH MỤC CÁC THUẬT NGỮ, KÝ HIỆU VIẾT TẮT vi DANH MỤC CHỮ VIẾT TẮT vi DANH SÁCH BẢNG vii DANH SÁCH HÌNH VẼ viii MỞ ĐẦU CHƯƠNG 1: KIẾN THỨC CƠ SỞ VỀ TẬP MỜ, ĐẠI SỐ GIA TỬ VÀ KHAI PHÁ DỮ LIỆU 1.1 Kiến thức sở tập mờ, đại số gia tử 1.1.1 Tập mờ logic mờ 1.1.1.1.Tập mờ 1.1.1.2 Logic mờ 1.1.2 Biến ngôn ngữ 1.1.3 Đại số gia tử 12 1.2 Bài toán phân lớp khai phá liệu 151516 1.2.1 Mô tả toán 151516 1.2.2 Một số phương pháp giải toán 19 1.2.2.1 Cây định 19 1.2.2.2 Bayer 22 1.2.2.3 Phân lớp liệu Fuzzy C- MEANS (FCM) 24 1.3 Kết luận 25 CHƯƠNG 2: PHƯƠNG PHÁP SINH HỆ LUẬT MỜ PHÂN LỚP DỰA TRÊN ĐẠI SỐ GIA TỬ 26 2.1 Hệ luật mờ phân lớp dựa đại số gia tử 26 2.1.1 Hệ luật mờ phân lớp 26 iv 2.1.2 Phương pháp lập luận dựa hệ luật mờ 28 2.2 Phân hoạch hệ khoảng tính mờ Đại số gia tử miền thuộc tính 31 2.3 Hàm định lượng ngữ nghĩa 41 2.4 Thuật toán sinh luật từ tập liệu 424243 2.5 Kết luận 515152 CHƯƠNG 3: ỨNG DỤNG THỬ NGHIỆM CHO BÀI TOÁN PHÂN LỚP DỮ LIỆU SINH VIÊN 525253 3.1 Phát biểu toán thu thập liệu 525253 3.1.1 Phát biểu toán 525253 3.1.2 Phương pháp thu thập liệu 555556 3.2 Cài đặt chương trình 61 3.3 Kết thử nghiệm đánh giá 66 3.4 Kết luận 676766 KẾT LUẬN 686867 TÀI LIỆU THAM KHẢO 696968 v DANH MỤC CÁC THUẬT NGỮ, KÝ HIỆUVIẾT TẮT Ký hiệu Ý nghĩa AX Đại số gia tử tuyến tính AX Đại số gia tử tuyến tính đầy đủ µ(h),fm(x) Độ đo tính mờ gia tử h hạng từ x v Giá trị định lượng theo điểm giá trị ngôn ngữ µA(v) sm(x,y) Hàm định lượng giá trị ngôn ngữ A (đo độ thuộc v) Hàm xác định mức độ gần hai hạng từ x y ℑ Khoảng tính mờ giá trị ngơn ngữ Xk Tập cách hạng từ có độ dài k X(k) Tập hạng từ có độ dài khơng q k Ik Hệ khoảng tính mờ mức k giá trị ngơn ngữ I(k) Hệ khoảng tính mờ mức từ đến mức k giá trị ngôn ngữ DANH MỤC CHỮ VIẾT TẮT Các chữ viết Tiếng anh tắt Tiếng Việt ĐSGT Đại số gia tử Đại số gia tử CSDL Database Cơ sở liệu IFRG Initial Fuzzy Rules Generation Tạo hệ luật luật mờ ban đầu Rule Base Luật sở RB vi DANH SÁCH BẢNG Bảng 1.1: Bảng mua máy tính sinh viên 20 Formatted: Font: No underline Bảng 2.1: Danh sách sinh viên kết môn học 45 Formatted: Indent: Left: -0.25", First line: 0", Space Before: pt, After: pt, Line spacing: 1.5 lines Bảng 2.2: Kết môn học sinh viên đoạn [0, 1] 46 Bảng 2.3: Tham số mờ gia tử thuộc tính Mơn học 47 Bảng 2.4: Kết học tập sinh viên độ thuộc thuộc tính 49 Bảng 2.5: Danh sách luật sinh thuật toán IFRG cho toán 50 Bảng 3.2: Mô tả liệu sinh viên trường làm việc chuyên ngành 60 Bảng 3.3: Hệ luật thu từ tập mẫu liệu kết học tập sinh viên 66 Bảng 3.4: Danh sách luật sinh thuật toán IFRG cho toán phân lớp Sinh viên 66 Bảng 3.5: Bảng đánh giá kết thử nghiệm hiệu hệ luật 67 Bảng 1.2: Bảng mua máy tính sinh viên 20 Bảng 2.1: Danh sách sinh viên kết môn học 46 Bảng 2.2: Kết môn học sinh viên đoạn [0, 1] 47 Bảng 2.3: Tham số mờ gia tử thuộc tính Mơn học 48 Bảng 2.4: Kết học tập sinh viên độ thuộc thuộc tính 50 Bảng 2.5: Danh sách luật sinh thuật toán IFRG cho toán 51 Bảng 3.2: Mô tả liệu sinh viên trường làm việc chuyên ngành 60 Bảng 3.3: Hệ luật thu từ tập mẫu liệu kết học tập sinh viên 66 Bảng 3.4: Bảng đánh giá kết thử nghiệm hiệu hệ luật 66 vii Formatted: Indent: Left: -0.5" DANH SÁCH HÌNH VẼ Hình 1.1: Mơ hình huấn luyện 17 Hình 1.2: Mơ hình kiểm tra đánh giá 18 Hình 1.3: Cây định mua máy tính sinh viên 202021 Hình 2.1: Độ đo tính mờ biến TRUTH 323233 Hình 2.2: Khoảng tính mờ hạng từ biến TRUTH 35 Hình 2.3: Lưới phân hoạch mờ miền thuộc tính 393940 Hình 2.4: Phương pháp phân hoạch mờ scatter-partition 404041 Hình 2.5: Hàm định lượng ngữ nghĩa dạng tam giác 42 Hình 2.6: Phân hoạch thuộc tính Mơn 484849 Hình 2.7: Phân hoạch thuộc tính Mơn 484849 Hình 3.1: Mơ hình sinh hệ luật mờ phân lớp từ tập CSDL mẫu 545455 Hình 3.2: Mơ hình phân lớp sinh viên dựa kết học tập 545456 Hình 3.3: Giao diện đăng nhập hệ thống 62 Hình 3.4: Biểu đồ hoạt động user case đăng nhập 62 Hình 3.5: Giao diện chương trình sinh luật mờ phân lớp dựa ĐSGT 63 Hình 3.6: Biểu đồ training sinh hệ luật mờ phân lớp dựa ĐSGT 6463 Hình 3.7: Giao diện training sinh hệ luật mờ phân lớp dựa ĐSGT 64 Hình 3.8: Biểu đồ mờ phân lớp Sinh viên dựa ĐSGT 6564 Hình 3.9: Giao diện phân lớp liệu Sinh viên 65 viii MỞ ĐẦU 1.Tính cấp thiết đề tài Công nghệ Logic mờ giáo sư Lotfi Zadeh công bố lần Mỹ vào năm 1965 Sự bùng nổ thời đại thông tin nay, lượng thông tin tạo hàng ngày lớn Nhu cầu cần thiết đến q trình tự động tìm kiếm thơng tin hữu ích, quan hệ phát tri thức Để làm điều nhà nghiên cứu đề xuất nghiên cứu lĩnh vực phân lớp nhận dạng mẫu, hồi quy dự báo, phân cụm dựa tâp mờ Lý thuyết tập mờ coi tảng lập luận xấp xỉ, lý thuyết tập mờ chưa mô đầy đủ, hồn chỉnh cấu trúc ngơn ngữ mà người sử dụng Vì năm 1990 N.C.Ho & W.Wechler khởi xướng phương pháp tiếp cận đại số dựa miền giá trị biến ngôn ngữ Thực tế cho thấy khái niệm mờ luôn tồn tại, ứng dụng toán cách thức suy luận người Bằng phương pháp tiếp cận khác nhà nghiên cứu đưa kết lý thuyết ứng dụng toán điều khiển mờ, hệ hỗ trợ định Vậy để làm điều luận văn trình bày ngữ nghĩa thơng tin mờ, tìm cách biểu diễn chúng khái niệm toán học tập mờ, xem xét đại số gia tử cấu trúc chặt chẽ ngơn ngữ xét tốn phân lớp Một toán đặt lĩnh vực nghiên cứu cho trước Cơ sở liệu (thường CSDL số, tức giá trị CSDL số thực), từ đó, phương pháp xử lý định, rút hệ tri thức phản ánh quy luật chứa CSDL số Các quy luật biểu diễn dạng hệ luật IF X is A and Y is B THEN Z is C, X, Y, Z biến mờ (thường biến ngôn ngữ), A, B, C giá trị biến ngôn ngữ (thường tập mờ) Ví dụ luật IFđường xa vàtốc độdi chuyển trung bình THEN thời gian đến đích lâu Để sinh luật vậy, ta phải chuyển hóa miền giá trị thuộc tính “khoảng cách”, “tốc độ”, “thời gian” thành miền mờ, hay nói cách khác phân chia miền giá trị thành miền mờ cho Formatted: Footer distance from edge: 0.44" bước xử lý Chẳng hạn, chia miền giá trị thuộc tính độ dài (có giá trị min, max tương ứng chẳng hạn 0km, 200km) thành miền mờ “gần” (0km- 50km), “trung bình” (51km-100km), “xa” (100km-200km) Trong lý thuyết tập mờ, miền mờ coi tập mờ ứng với hàm thuộc (MF- membership function) nhằm xác định độ “thuộc” giá trị biến vào tập mờ cho Khi đó, giá trị thuộc tính CSDL ứng với tập giá trị hàm thuộc ứng với với tập mờ thuộc tính Và ta xây dựng hệ luật mờ dựa việc xử lý tập giá trị độ thuộc thay xử lý thân giá trị ban đầu CSDL Việc xây dựng phân hoạch khoảng tính mờ thuộc tính bước quan trọng quy trình xây dựng hệ luật mờ có sở phân chia hợp lý khoảng tính mờ thuộc tính ta có tập mờ ngơn ngữ phản ánh tương đối xác ngữ nghĩa định tính nhãn ngôn ngữ dùng hệ luật xây dựng tiếp theo.Phương pháp tiếp cận theo lý thuyết tập mờ cho ta cách xử lý liệu mềm dẻo, nhanh chóng so với phương pháp xử lý số cổ điển Đại số gia tử (ĐSGT) đời dựa cấu trúc thứ tự tốt tập giá trị ngơn ngữ biến ngơn ngữ khắc phục phần điểm yếu Luận văn đặt mục tiêu sử dụng cách tiếp cận ĐSGT phương pháp sinh hệ luật mờ phân lớp dựa tập CSDL mẫu, để xây dựng hệ luật mờ tốt bước nhằm giải toán quan tâm lĩnh vực khai phá liệu hay điều khiển mờvì định chọn đề tài: “Phương pháp sinh luật mờ phân lớp dựa đại số gia tử ứng dụng phân lớp liệu sinh viên” Mục tiêu nghiên cứu Luận văn nghiên cứu phương pháp sinh luật mờ dựa phân hoạch hệ khoảng tính mờ Đại số gia tử giải toán phân lớp miền xác định thuộc tính tác giả nước giới, ưu, khuyết điểm phương pháp có nghiên cứu cách giải toán theo cách tiếp cận Đại số gia tử - Tìm hiểu kiến thức sở tập mờ, logic mờ, ĐSGT, phương pháp khai liệu ... Phương pháp sinh luật mờ phân lớp dựa đại số gia tử ứng dụng phân lớp liệu sinh viên Mục tiêu nghiên cứu Luận văn nghiên cứu phương pháp sinh luật mờ dựa phân hoạch hệ khoảng tính mờ Đại số. .. 1.2.2.3 Phân lớp liệu Fuzzy C- MEANS (FCM) 24 1.3 Kết luận 25 CHƯƠNG 2: PHƯƠNG PHÁP SINH HỆ LUẬT MỜ PHÂN LỚP DỰA TRÊN ĐẠI SỐ GIA TỬ 26 2.1 Hệ luật mờ phân lớp dựa đại số. .. 3.5: Giao diện chương trình sinh luật mờ phân lớp dựa ĐSGT 63 Hình 3.6: Biểu đồ training sinh hệ luật mờ phân lớp dựa ĐSGT 6463 Hình 3.7: Giao diện training sinh hệ luật mờ phân lớp dựa ĐSGT
- Xem thêm -

Xem thêm: Phương pháp sinh luật mờ phân lớp dựa trên đại số gia tử và ứng dụng phân lớp dữ liệu sinh viên , Phương pháp sinh luật mờ phân lớp dựa trên đại số gia tử và ứng dụng phân lớp dữ liệu sinh viên

Gợi ý tài liệu liên quan cho bạn