Một phương pháp thiết kế ngữ nghĩa dạng tập mờ của từ ngôn ngữ dựa trên đại số gia tử mở rộng và ứng dụng xây dựng FRBS giải bài toán hồi qui

Các cơng trình nghiên cứu phát triển Cơng nghệ Thơng tin Truyền thông Một phương pháp thiết kế ngữ nghĩa dạng tập mờ từ ngôn ngữ dựa đại số gia tử mở rộng ứng dụng xây dựng FRBS giải tốn hồi qui Hồng Văn Thơng1 , Nguyễn Đức Dư1 , Nguyễn Cát Hồ2 Công nghệ Thông tin, Trường Đại học Giao thông Vận tải Trung tâm Nghiên cứu Phát triển, Trường Đại học Duy Tân Khoa E-mail: thonghv@utc.edu.vn, nducdu@utc.edu.vn, ncatho@gmail.com Tác giả liên hệ: Hồng Văn Thơng Ngày nhận: 12/07/2017, ngày sửa chữa: 16/10/2017, ngày duyệt đăng: 17/10/2017 Tóm tắt: Trong báo này, đề xuất phương pháp thiết kế ngữ nghĩa dạng tập mờ hàm S đại số gia tử mở rộng cho từ ngôn ngữ sử dụng hệ dựa luật mờ (FRBS) Áp dụng phương pháp thiết kế này, phương pháp sinh luật từ liệu C H Nguyen cộng thuật tốn tiến hóa (2+2)M-PAES Knowles Corne, chúng tơi phát triển thuật tốn xây dựng FRBS giải toán hồi qui Kết thử nghiệm cho thấy thuật toán sinh FRBS có độ xác cao thuật tốn đối sánh Từ khóa: Hàm thuộc, hệ dựa luật mờ, đại số gia tử, toán hồi qui Title: Abstract: Keywords: A Method to Design Semantic of Linguistics based on the Enlarged Hedge Algebra and Applied to Building FRBS for Solving Regression This paper proposes a method to design semantic of linguistics based on fuzzy set using S-function and the enlarged hedge algebra for words included in fuzzy rule based systems (FRBSs) By using this method, the method generating rules from data of C H Nguyen et al., and the evolution algorithm M-PAES(2+2) of Knowles and Corne, we develop an algorithm to build FRBSs for solving regressions Experimental results showed that the proposed algorithm generated FRBSs that are more accurate than those by other algorithms Membership function, fuzzy rule based systems, hedge algebras, regression problems I MỞ ĐẦU [1, 2, 4, 6–10] tính dễ giải nghĩa Một số sử dụng hàm thuộc hình chng (bell-function) [11] hay hàm hình thang [5] Việc thiết kế FS theo hướng tiếp cận dựa lý thuyết FS chủ yếu dựa kinh nghiệm chuyên gia, nhiên thiếu phương pháp hình thức đầy đủ để xác định FS từ tập từ ngôn ngữ Hệ dựa luật mờ (FRBS: Fuzzy Rule Based System) ứng dụng thành công số lĩnh vực điều khiển [1], hay số phương pháp phân lớp [2–6], hồi qui [7–11] Nền tảng FRBS dựa lý thuyết tập mờ (FS: Fuzzy Set) Vào năm 1965, [12], lần Zadeh đề xuất phương pháp biểu diễn ngữ nghĩa tính tốn từ ngơn ngữ FS Mỗi FS biểu diễn hàm toán học có giá trị biến thiên liên tục đoạn [0, 1], gọi hàm thuộc (membership function) Chúng ta sử dụng nhiều dạng hàm tốn học khác để biểu diễn FS Việc sử dụng FS có dạng khác FRBS ảnh hưởng đến độ xác (accuracy) tính giải nghĩa (interpretability) FRBS toán cụ thể Hầu hết ứng dụng FRBS sử dụng hàm thuộc có dạng tam giác Một hướng tiếp cận khác xác định ngữ nghĩa tính tốn từ ngơn ngữ C H Nguyen W Wechler đề xuất [13] vào năm 1990 Trong đó, C H Nguyen cộng xây dựng đại số, gọi đại số gia tử (ĐSGT) (hedge algebras), bao gồm xây dựng ánh xạ từ tập từ ngôn ngữ vào đoạn [0, 1] Ánh xạ gọi ánh xạ ngữ nghĩa giá trị giá trị định lượng từ (ngữ nghĩa toán học từ) Dựa giá trị định lượng từ xác định ánh xạ định lượng ngữ nghĩa, C H Nguyen cộng đề xuất phương pháp xác định ngữ nghĩa FS 51 Các cơng trình nghiên cứu phát triển Công nghệ Thông tin Truyền thơng tốn hồi qui hệ luật mờ Mamdani, mục IV trình bày thuật tốn tiến hóa, mục V trình bày kết thử nghiệm, mục VI kết luận báo 0 II PHƯƠNG PHÁP THIẾT KẾ NGỮ NGHĨA FS VÀ PHÂN HOẠCH MỜ DỰA TRÊN ĐSGT MỞ RỘNG Hình Hình dạng tập mờ biểu diễn ngữ nghĩa từ Trong mục này, đề xuất phương pháp thiết kế ngữ nghĩa FS dựa ĐSGT mở rộng hàm S tam giác phân hoạch đơn thể đa thể hạt [4, 6] Theo hướng tiếp cận này, ngữ nghĩa dạng FS xác định phương pháp hình thức đầy đủ từ tập từ sử dụng biến ngôn ngữ số tham số mờ ngôn ngữ Phương pháp thiết kế áp dụng để giải tốn phân lớp hồi qui, cơng bố cơng trình [4, 6, 10], cho kết tốt phương pháp đối sánh có hướng tiếp cận theo lý thuyết FS Tuy nhiên, việc sử dụng FS tam giác biểu diễn ngữ nghĩa từ dường không thực phù hợp với ngữ nghĩa thực từ, FS tam giác có điểm có giá trị hàm thuộc Trong thực tế, thấy hầu hết từ ngôn ngữ có nhiều giá trị chắn thuộc vào nó, ví dụ giá trị old biến tuổi Age, với người có tuổi lớn 90 chắn thuộc vào old, hay nói cách khác hàm thuộc giá trị phải Trong [14], tác giả đưa khái niệm hạt thông tin khẳng định điều Như vậy, FS phù hợp với ngữ nghĩa từ phải có nhiều điểm có giá trị hàm thuộc 1, ví dụ FS hình thang Với ĐSGT mở rộng AX en = (Xen, C, G, Hen, ≤), C = {0, 1, w} tập giá trị với ý nghĩa phần tử bé nhất, phần tử lớn phần tử trung hòa (neutral) X, G = {c−, c+ } tập phần tử sinh, Hen tập gia tử, Hen = {h0 } ∪ {Little, Very}, Little (L) gia tử âm, Very (V) gia tử dương Tập từ ngôn ngữ sinh AX en , ngữ nghĩa định lượng khoảng từ xác định định lý 5.2 5.3 [5] Áp dụng phương pháp thiết kế phân hoạch dạng đa thể hạt đề xuất [6], thực thiết kế ngữ nghĩa FS từ sau Giả sử ta có từ ngôn ngữ A j−1 , A j , A j+1 ∈ Xk (tập từ có độ dài k), giá trị cận trái Lft(v f m (A j−1 )), Lft(v f m (A j )), Lft(v f m (A j+1 )) độ dài khoảng ngữ nghĩa v f m (A j−1 ), v f m (A j ), v f m (A j+1 ) Trong độ dài khoảng ngữ nghĩa từ x xác định theo công thức: v f m (x) = J (h0 x), với J (h0 x) khoảng tính mờ từ x giá trị cận trái v f m (x) xác định theo định lý 5.3 [5]: Cho ĐSGT mở rộng AX en với H + = {h j : ≤ j ≤ p} p H − = {h j : −1 ≤ j ≤ −q}, đặt β = j=1 µ(h j ) −q α = j=−1 µ(h j ), ta có α + β + µ(h0 ) = Để xây dựng FS hình thang, [5], C H Nguyen cộng phát triển ĐSGT gọi ĐSGT mở rộng Trong đó, tác giả xây dựng ánh xạ ngữ nghĩa định lượng khoảng, giá trị ngữ nghĩa gọi ngữ nghĩa lõi Dựa ngữ nghĩa lõi từ, tác giả xây dựng FS hình thang, áp dụng giải tốn phân lớp Sử dụng FS hình thang biểu diễn ngữ nghĩa tốn học từ ngơn ngữ phù hợp so với FS tam giác Tuy nhiên, theo chúng tôi, sử dụng tam giác hay hình thang biến thiên chưa thực mềm dẻo ngữ nghĩa vốn có từ, cạnh hàm tuyến tính Để FS biểu diễn phù hợp ngữ nghĩa vốn có từ biến thiên phải phi tuyến Trong báo này, đề xuất phương pháp thiết kế ngữ nghĩa FS dựa ĐSGT mở rộng hàm S (S-function) Dựa chúng tơi phát triển thuật toán, viết tắt EnHA-PAES-SF Cũng thuật tốn này, chúng tơi cải tiến tốn tử đột biến thêm luật thuật toán HA-PAES-MG-Kmax [6] Kết thử nghiệm cho thấy, FRBS sinh với phương pháp đề xuất có độ xác cao phương pháp Alcalá cộng [7], hay phương pháp C H Nguyen cộng [6, 10] 1) Với từ có độ dài Lft(v f m (0)) = 0; Lft(v f m (c− )) = f m(0) + β f m(c− ); Lft(v(W)) = f m(0) + f m(c− ); Lft(v f m (c+ )) = Lft(v f m (W)) + f m(W) + α f m(c+ ) Lft(v f m (1)) = − f m(1) 2) Với từ có độ dài lớn Lft(v f m (h j x)) = ν(x) + sign(h j x) f m(x) 1/2(1 + sign(h j x))µ(h0 ) j + i=sign(j) µ(hi ) − σ(x)µ(h j ) Khi xây dựng FS biểu diễn ngữ nghĩa từ A j có dạng Hình Đỉnh FS đoạn [c, d] = ν f m (A j ) Nửa bên trái hàm S, xác định  0,     (x − a)2     (b − a)(c − a) ,  Sleft (x, a, b, c) = (x − c)2    1− ,   (c − b)(c − a)    1,  Bài báo bố cục sau: Mục II đề xuất phương pháp thiết kế ngữ nghĩa từ ngôn ngữ, mục III trình bày 52 ≤ x ≤ a, a ≤ x ≤ b, b ≤ x ≤ c, x ≥ c, (1) Tập V-2, Số 18 (38), 12/2017 thuộc (thuộc tính đầu ra) XF+1 , N số mẫu liệu Từ tập liệu mẫu D, xây dựng hệ mờ cho phép tính giá trị yˆ ∈ UF+1 ứng với giá trị đầu vào d ∈ U = U1 ×· · ·×UF 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Hệ luật mờ Mamdani Phân hoạch mức-0, tập mờ tương ứng với từ 00 , w, 10 Hệ luật mờ Mamdani với từ ngôn ngữ sinh ĐSGT mở rộng tập luật, gồm M luật, có dạng Rm: if X1 is A1, jm and and XF is AF, jm then Y is AF+1, jm , m = 1, , M 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 Phân hoạch mức-1, tập mờ tương ứng với từ 01 , 0.9 c− , c+ , 11 (3) A f , jm ∈ L f = { A f ,0 } ∪ Xk f = { A f ,1, , A f , |Xk f | } , f = 1, , F + 1, Xk f tập từ ngơn ngữ có độ dài khơng q k f sinh ĐSGT mở rộng AX en , dùng để xây dựng phân hoạch thuộc tính thứ f , ví dụ Hình 2, A f ,0 kí hiệu giá trị Don’t care với hàm thuộc đồng Lưu ý rằng, LF+1 không chứa giá trị Don’t care 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Phân hoạch mức-2, tập mờ tương ứng với từ 02 , Vc− , Lc− , Lc+ , Vc+ , 12 Hình Một ví dụ phân hoạch đa thể hạt với tập mờ S-function đề xuất báo Giải toán hồi qui hệ luật mờ Mamdani xây dựng hệ luật mờ với luật dạng (3) để dự đoán giá trị đầu yˆ ứng với giá trị đầu vào x có F chiều Đánh giá độ xác hệ luật dựa giá trị trung bình phương sai (MSE: Mean Squared Error) [6–8, 11], theo công thức a = Lft(v f m (A j−1 )) + v f m (A j−1 ), c = Lft(v f m (A j )) b = a + (c − a)/4 Nửa bên phải hàm S, xác định  1,     (x − d)2     − (d − e)(d − f ) ,  Sright (x, d, e, f ) = (x − f )2    ,    (e − d)( f − d)   0,  MSE = ≤ x ≤ d, d ≤ x ≤ e, 2N N i=1 ( yî − yi )2 , (4) yî giá trị suy diễn từ hệ luật với giá trị đầu vào xi Tương tự đề xuất [7, 8], sử dụng phương pháp trung bình trọng số để suy diễn, (2) e ≤ x ≤ f, M x ≥ f, d = c + v f m (A j ), f = Lft(v f m (A j+1 )) e = d + ( f − d)/4 yî = Ví dụ, Hình minh họa thiết kế phân hoạch FS dựa ĐSGT mở rộng hàm S, với tham số mờ ĐSGT f m(0) = 0, 006352412, f m(c−j ) = 0, 4404566, f m(w j ) = 0, 0004077147, f m(c+j ) = 0, 4801931, f m(1) = 0, 07259017, µL = 0, 6891874, µh0 = 0, 001883381 k = m=1 µm (xi ) A¯ F+1, jm M m=1 , i = 1, , N, (5) µm (xi ) F µm (xi ) = f =1 µ A F +1, j m (xi f ), (6) độ đốt cháy luật thứ m mẫu liệu xi , A¯ F+1, jm giá trị định lượng hạng từ AF+1, jm µ A F +1, j m (·) hàm M thuộc từ ngôn ngữ A f , jm Trong (5), m=1 µm (xi ) = 0, có nghĩa hệ luật khơng phủ mẫu liệu xi , yî suy diễn theo phương pháp đề xuất [7] III BÀI TOÁN HỒI QUI VÀ HỆ LUẬT MỜ MAMDANI Bài tốn hồi qui IV THUẬT TỐN TIẾN HĨA ĐA MỤC TIÊU Cho tập mẫu liệu D = {(di, yi ), i = 1, , N }, di véc tơ F chiều có dạng (di1, di2, , diF ), di j ∈ U j ⊂ R (tập số thực) miền xác định biến độc lập X j (thuộc tính đầu vào) tốn, với j = 1, , F, yi ∈ UF+1 ⊂ R miền xác định biến phụ Trong mục này, chúng tơi trình bày tóm tắt thuật tốn tiến hóa áp dụng để sinh FRBS với phân hoạch mờ thiết kế mục II Chúng gọi thuật tốn đề xuất EnHA-PAES-SF, tóm tắt Thuật tốn 53 Các cơng trình nghiên cứu phát triển Cơng nghệ Thơng tin Truyền thơng Cµ µ(h01 ) µ(L1 ) f m(01 ) f m(c− ) f m(W1 ) f m(11 ) µ(h0,F +1 ) µ(LF +1 ) f m(0F +1 )f m(c− F +1 )f m(WF +1 )f m(1F +1 ) r1 CRB k11 rM k1(F +1) kM kM (F +1) Hình Cấu trúc mã hóa cá thể Mã hóa cá thể Chúng tơi sử dụng gia tử âm L j (Little) gia tử dương Vj (Very) biến X j mục tiêu cần tối ưu tham số tính mờ ĐSGT RB Do cá thể quần thể mã hóa gồm hai phần (Cµ, CRB ), Hình 3, đó: ◦ Cµ : Biểu diễn tham số tính mờ ĐSGT mở rộng AX en tương ứng với biến, véc tơ π = (π1, , πn+1 ), π j = {µh0 j , µL j , f m(0 j ), f m(c−j ), f m(w j ), f m(1 j )}, j = 1, , F + Như Cà gm ì (F + 1) gen cỏc s thực ◦ CRB : Biểu diễn RB, luật mã hóa véc tơ gồm F+1 số nguyên Giả thiết tập từ sử dụng biến J j ∪ {Don’t care} đánh số sau: J j ∪{Don’t care} = {w jk : k = 0, 1, , T }, j = 1, , F+1, w j0 = “Don’t care”, có nghĩa số từ “Don’t care” “0” Khi đó, luật rq mã hóa véc tơ (k q1, , k qF , k q(F+1) ) Các luật RB sinh hàm sinh luật GenRule(d, π, lmax ) [6], d mẫu liệu chọn ngẫu nhiên tập liệu huấn luyện, π tham số tính mờ Cµ lmax chiều dài tối đa luật người dùng xác định trước Để giảm khơng gian tìm kiếm tăng tính giải nghĩa RB sinh, ta giới hạn số luật RB nằm khoảng [Mmin, Mmax ] Gắn với cá thể véc tơ hàm mục tiêu gồm hai thành phần (MSE, Comp), MSE biểu thị độ xác hệ luật xác định theo (4) Comp tổng độ dài luật RB i = 1, , 6(F+1), để sinh cá thể v1 v2 gen zi phần Cµ chúng chọn ngẫu nhiên đoạn [li, ui ], li = max{ai, cmin − I} ui = min{bi, cmax + I}, với cmin = min{xi, yi }, cmax = max{xi, yi } I = (cmax − cmin )α ◦ Trên CRB : thực lai ghép one-point crossover, điểm lai ghép chọn ngẫu nhiên đoạn [1, ρmin − 1], ρmin số luật hai sở luật p1 p2 Lưu ý: Nếu CRB toán tử lai ghép khơng thực đột biến ln xảy Đối với toán tử đột biến, với cá thể v1 , v2 , thực đột biến theo thứ tự độc lập Cµ CRB ◦ Trên Cµ : Lựa chọn ngẫu nhiên số nguyên [1, 6(F + 1)], thực thay gen vị trí chọn giá trị chọn ngẫu nhiên đoạn [µh0min, µh0max ] gen chọn biểu diễn giá trị µh0; chọn ngẫu nhiên đoạn [µmin, µmax ], gen chọn biểu diễn giá trị µL j , chọn ngẫu nhiên đoạn [ f mh0min, f mh0max ] gen chọn biểu diễn giá trị f m(0 j ), chọn ngẫu nhiên đoạn [ f mwmin, f mwmax ] gen chọn biểu diễn giá trị f m(w j ), chọn ngẫu nhiên đoạn [ f m1min, f m1max ] gen chọn biểu diễn giá trị f m(1 j ), chọn ngẫu nhiên đoạn [ f mCmin, f mCmax ] gen chọn biểu diễn giá trị f m(c−j ) Lưu ý: Khi lai ghép đột biến phần Cµ : 1) Nếu lai ghép/đột biến gen µL j µh0 j mà − µL j − µh0 j < µmin phải thực lại thỏa mãn bất đẳng thức − µL j − µh0 j ≥ µmin (điều kiện nhằm đảm bảo µVj ∈ [µmin, µmax ]); 2) Nếu lai ghép/đột biến gen f m(0 j ), f m(w j ), f m(1 j ) f m(c−j ) mà − f m(0 j ) − f m(w j ) − f m(1 j ) − f m(c−j ) < f mCmin phải thực lại thỏa mãn bất đẳng thức − f m(0 j ) − f m(w j ) − f m(1 j ) − f m(c−j ) ≥ f mCmin (điều kiện nhằm đảm bảo f m(c+j ) ∈ [ f mCmin, f mCmax ]) Các toán tử di truyền Tương tự thuật toán đề xuất [6, 7, 10], sử dụng lai ghép BLX-α phần tham số Cµ lai ghép one-point crossover phần CRB Với hai cá thể cha mẹ p1 p2 , thực lai ghép để tạo thể v1 , v2 : ◦ Trên Cµ : giả sử gen thứ i phần Cµ hai thể tương ứng xi yi , với xi , yi ∈ [ai, bi ) ⊂ [0, 1], 54 Tập V-2, Số 18 (38), 12/2017 Thuật toán 1: EnHA-PAES-SF begin β ← φ; Khởi tạo cá thể i1 , i2 testAdd(β, i1, size); testAdd(β, i2, size); for i ← t to maxGen [p1, p2 ] ← chọn ngẫu nhiên cá thể β v1 ← p1 ; v2 ← p2 ; if random() < Pcµ then [v1 Cµ, v2 Cµ ] ← BLX-α -Crossover(p1 Cµ, p2 Cµ ) end if tmpPmRB ← 1; if random() < PcRB then [v1 CRB, v2 CRB ] ← onepoint -Crossover(p1 CRB, p2 CRB ) tmpPmRB ← PmRB end if loop j = 1, if random() < Pmµ then mutation(v j Cµ ) end if if random() < tmpPmRB then if random() > PmAdd then mutationvm1 (v j CRB ) else mutationvm2 (v j CRB ) end if end if remove_zero_length(v j CRB ) remove_duplicate_rule(v j CRB ) testAdd(β, v1, size); testAdd(β, v2, size); end loop end for return β end Các khoảng ràng buộc tham số xác định trước người dùng để bảo toàn ngữ nghĩa gia tử, từ phần tử sinh ◦ Trên CRB : Áp dụng hai toán tử sau cá thể, tức áp dụng tốn tử thứ khơng áp dụng tốn tử thứ hai ngược lại: 1) Toán tử vm1 thay đổi giá trị δ gen CRB : Lựa chọn ngẫu nhiên số nguyên δ đoạn [1, δmax ], δmax xác định trước, sau chọn ngẫu nhiên δ gen CRB Thay đổi giá trị gen chọn giá trị ngẫu nhiên, {0, 1, , T } gen tương ứng với biến j F + 1, {1, , T } gen tương ứng với biến j = F + 1; 2) Toán tử vm2 bổ sung γ luật vào RB có M luật biểu diễn CRB : Chọn ngẫu nhiên số nguyên γ [1, γmax ], γmax xác định trước người dùng Nếu M +γ > Mmax bổ sung γ = min{γ, Mmax − M } luật sinh hàm GenRule(d, π, lmax ) Trong đó, d chọn từ tập mẫu huấn luyện D (tập mẫu liệu không phủ RB), d chọn từ tập mẫu huấn luyện D toán tử lai ghép xảy CRB D = φ Lưu ý: Trong trình tiến hóa, luật trở nên có độ dài 0, tức phần tiền đề “Don’t care”, bị loại bỏ Nếu RB có luật trùng giữ lại Việc thực làm cho RB có hội giảm độ phức tạp Thuật tốn tiến hóa đa mục tiêu Mặt Pareto, ký hiệu β, chứa cá thể cần lữu trữ Thuật toán phát triển dựa lược đồ tiến hóa (2+2)M-PAES [9] Trong Thuật toán 1, hàm testAdd(β, i j , size) [9] bổ sung cá thể i j vào mặt Pareto β i j không bị trội cá thể β, cá thể β bị trội i j bị loại khỏi β Nếu bổ sung i j vào làm số cá thể β lớn size loại bỏ ngẫu nhiên cá thể có β RB ứng với 30 lần thử Mặt Pareto trung bình xác định sau: lần thử nghiệm tạo mặt xấp xỉ tối ưu Pareto, xếp điểm mặt Pareto theo thứ tự tăng dần mục tiêu MSE tập huấn luyện Trên mặt Pareto ta giữ lại số cá thể số cá thể mặt Pareto có số cá thể 30 mặt Pareto, tính trung bình 30 mặt Pareto để tạo mặt Pareto trung bình V KẾT QUẢ THỬ NGHIỆM Chúng tiến hành thử nghiệm thuật toán EnHA-PAESSF 12 toán hồi qui Bảng I, lấy từ http://archive.ics.uci.edu/ml/datasets.html, với #P số mẫu, #A số thuộc tính Các tham số thiết lập Bảng II Phương pháp thử nghiệm 5-Fold (5-phần), phần để học, phần để kiểm tra Mỗi phần thử nghiệm lần, số lần thực nghiệm tổng cộng × = 30 lần Ký hiệu MSETr , MSETs , σTr , σTs , tTr , tTs giá trị MSE trung bình, độ lệch chuẩn, kết thống kê tập liệu huấn luyện (Tr) tập liệu kiểm tra (Ts); Comp #R trung bình độ phức tạp trung bình số luật hệ luật Kết thu biểu thị mặt xấp xỉ tối ưu Pareto trung bình theo hai mục tiêu MSE Comp 55 Các cơng trình nghiên cứu phát triển Cơng nghệ Thơng tin Truyền thơng CÁC BÀI TỐN TT kết tốt nhất, “=” thể khơng có khác biệt thống kê dòng tương ứng với kết tốt Bảng I SỬ DỤNG THỬ NGHIỆM Bài toán #P #A Electrical Length (ELE1) 495 2 Electrical Maintainance (ELE2) 1056 Weather Ankara (WA) 1609 Weather Izmir (WI) 1461 Treasury (TR) 1049 15 Abalone (AB) 4177 Mortgage (MTG) 1049 15 Computer Activity (CA) 8192 21 Pole Telecommunication (PT) 15000 26 10 AutoMPG6 (MPG6) 392 11 Baseball (BB) 337 16 12 Stock (ST) 950 Từ Bảng III ta thấy, mục tiêu độ xác FRBS, tập huấn luyện giá trị MSETr thuật toán đề xuất tốt toán (ELE1, TR, AB, MTG, PT, MPG6, BB, ST) kết phân tích thống kê cho thấy có khác biệt toán Trên tập kiểm tra giá trị MSETs thuật toán đề xuất tốt toán (WA, TR, AB, MTG, PT, MPG6, BB, ST), kết phân tích thống kê cho thấy có khác biệt với tất thuật toán so sánh toán PT BB Có khác biệt tốn so với thuật toán PAES-KB Mặc dù giá trị MSETs tập kiểm tra thuật toán đề xuất thuật toán tốt toán sai khác khơng nhiều, cụ thể với tốn ELE1 203525,234 (so với 194028,00), ELE2 10986,576 (so với 10460,014), WI 0,925 (so với 0,846), CA 5,120 (so với 4,8662) Kết phân tích thống kê so sánh với kết tốt khơng có khác biệt Trong số toán, giá trị MSETs tập kiểm tra thuật toán đề xuất tốt nhiều, chẳng hạn toán PT 58,171 (so với 66,57; 73,474 89), ST 0,540 (so với 0,708 0,759) Kết lập luận tập liệu kiểm tra FRBS có tính ổn định cao thuật toán so sánh Điều thể giá trị độ lệch chuẩn σTs , độ lệch chuẩn thuật toán đề xuất tốt toán Bảng II CÁC THAM SỐ THỬ NGHIỆM µmin = 0,3 size = 64; M axGen = 300000 µmax = 0,7 kmax = 3; γmax = 5; δmax = Mmin = Mmax = 30; f mwmin = 0; f mwmax = 0,1 f m0min = f m0max = 0,1; f mCmin = 0,3; f mCmax = 0,7 PcRB = 0,3 Xác suất lai ghép C R B Pcµ = 0,5 Xác suất lai ghép C µ PmRB = 0,1 Xác suất đột biến C R B P Ad d = 0,75 Xác suất đột biến thêm luật C R B Pmµ = 0,3 Xác suất đột biến C µ α = 0,5 lmax = Về mục tiêu tính giải nghĩa hệ luật, FRBS xây dựng thuật toán đề xuất báo có độ phức tạp (Comp) tốt toán Các từ sử dụng FRBS từ ngôn ngữ sinh ĐSGT, nên góp phần làm cho FRBS dễ hiểu với người dùng VI KẾT LUẬN Chúng thực đối sánh kết thu thuật toán đề xuất với thuật toán thuật toán HA-PAES-MGKmax [6] với ngữ nghĩa từ dạng FS tam giác, thuật toán EnHA-0-MG [10] với ngữ nghĩa từ dạng FS hình thang 12 toán, thuật toán PAES-KB [7] toán điểm đại diện mặt Pareto Điểm ứng với hệ luật có MSETr nhỏ kí hiệu FIRST, MSETr trung bình kí hiệu MEDIAN MSETr lớn ký hiệu LAST Bên cạnh đối sánh giá trị thu được, để khẳng định có khác biệt phương pháp đối sánh, chúng tơi thực phân tích thống kê phương pháp t-test giá trị MSETr MSETs Do khơng gian trình bày báo bị hạn chế nên phần trình bày kết so sánh chi tiết điểm FIRST điểm có độ xác cao Bảng III, điểm MEDIAN LAST cho kết tương tự điểm FIRST Các ký hiệu bảng sử dụng tương tự [8], “*” thể dòng tương ứng cho kết tốt với chữ in đậm, “+” thể kết dịng tương ứng Trích rút FRBS từ tập liệu giải toán hồi qui toán phức tạp, đòi hỏi phải giải nhiều tốn: thiết kế ngữ nghĩa từ ngơn ngữ, sinh luật, tìm kiếm FRBS Nhiều nghiên cứu đề xuất tiếp cận theo lý thuyết FS lý thuyết ĐSGT Trong báo này, đề xuất phương pháp thiết kế ngữ nghĩa dạng FS cho từ ngôn ngữ sử dụng FRBS sinh ĐSGT mở rộng hàm S Áp dụng phương pháp thiết kế ngữ FS đề xuất, thuật toán sinh luật từ mẫu liệu [6] lược đồ tiến hóa (2+2)M-PAES [9], chúng tơi phát triển thuật toán EnHA-PAES-SF Từ kết thử nghiệm thuật tốn đề xuất, kết luận phương pháp thiết kế ngữ nghĩa dạng FS từ ngôn ngữ đề xuất sinh FRBS giải tốn hồi qui có độ xác cao ngữ nghĩa dạng tam giác, hình thang Các phương pháp tiếp cận dựa ĐSGT sinh FRBS có độ xác tính giải nghĩa cao tiếp cận dựa lý thuyết tập mờ 56 Tập V-2, Số 18 (38), 12/2017 Bảng III SO SÁNH KẾT QUẢ THỬ NGHIỆM THUẬT TOÁN E N HA-PAES-SF (E N HA-SF) VỚI CÁC THUẬT TOÁN HA-PAES-MG-Kmax (HA-TG ), E N HA-0-MG (E N HA-T Z ), PAES-KB TẠI ĐIỂM FIRST Bài toán ELE1 ELE2 WA WI TR AB MTG CA PT MPG6 BB ST Thuật toán #R σTr tTr PAES-KB 27,00 46,00 145995,000 3855,000 + 194028,000 24745,000 * HA-Tg 27,27 46,13 141666,344 5618,006 + 202590,688 35321,180 = EnHA-Tz 17,33 28,03 146715,328 5401,636 + 201659,063 38816,035 = EnHA-SF 25,80 43,53 134296,125 5393,771 * 203525,234 34480,344 = PAES-KB 30,00 65,00 11043,000 2771,000 = 12606,000 3105,000 + HA-Tg 29,93 66,97 8813,093 1533,687 = 10685,542 3113,682 = EnHA-Tz 26,60 60,90 8476,874 2077,039 * 10460,014 3577,895 * EnHA-SF 29,57 57,80 8814,062 1484,897 = 10986,576 2239,502 = PAES-KB 28,00 103,00 1,640 0,040 + 3,920 9,270 + HA-Tg 25,00 60,03 1,032 0,071 + 1,247 0,172 = EnHA-Tz 24,83 74,83 0,964 0,065 * 1,136 0,154 = EnHA-SF 24,37 53,60 1,018 0,079 + 1,103 0,130 * PAES-KB 25,00 91,00 1,300 0,270 + 1,490 0,260 + HA-Tg 24,87 61,30 0,792 0,043 + 0,964 0,127 + EnHA-Tz 23,17 72,77 0,718 0,045 * 0,846 0,136 * EnHA-SF 25,00 51,57 0,773 0,048 + 0,925 0,110 + PAES-KB 11,00 40,00 0,080 0,040 + 0,140 0,150 + HA-Tg 15,00 29,40 0,031 0,004 + 0,045 0,022 + EnHA-Tz 25,23 84,70 0,028 0,006 + 0,044 0,028 = EnHA-SF 29,60 70,97 0,023 0,002 * 0,034 0,010 * PAES-KB 29,00 107,00 2,320 0,080 + 2,480 0,180 = HA-Tg 19,80 59,57 2,314 0,050 + 2,411 0,165 = EnHA-Tz 18,10 72,60 2,325 0,072 + 2,451 0,190 = EnHA-SF 28,73 109,47 2,215 0,045 * 2,404 0,151 * PAES-KB 12,00 49,00 0,050 0,020 + 0,090 0,100 + HA-Tg 15,00 28,13 0,016 0,004 + 0,022 0,012 = EnHA-Tz 17,57 37,07 0,013 0,002 = 0,021 0,011 = EnHA-SF 18,00 26,70 0,012 0,003 * 0,018 0,005 * PAES-KB 10,00 30,00 11,990 2,990 + 13,430 4,660 + HA-Tg 13,80 44,67 4,577 0,369 = 4,862 0,630 * EnHA-Tz 10,53 35,70 4,506 0,337 * 4,905 0,760 = EnHA-SF 11,60 41,07 4,867 0,467 + 5,120 0,545 = PAES-KB 14,00 53,00 87,000 26,000 + 89,000 25,000 + HA-Tg 13,33 38,30 71,887 17,422 + 73,474 17,016 + EnHA-Tz 15,53 45,70 62,584 13,044 + 66,577 15,747 + EnHA-SF 14,13 44,67 55,510 7,792 * 58,171 9,530 * PAES-KB - - - HA-Tg 30,00 69,23 2,119 0,174 + 4,201 0,844 = EnHA-Tz 48,37 142,53 1,946 0,187 + 4,098 1,136 = EnHA-SF 49,40 116,03 1,702 0,144 * 4,086 1,042 * Comp MSETr - - MSETs - - σTs tTs - PAES-KB - - HA-Tg 24,00 86,50 111254,578 6668,565 + 300933,594 55664,977 = EnHA-Tz 18,90 43,13 108939,016 10566,872 + 290203,406 112402,539 = EnHA-SF 19,93 38,70 98882,602 11293,128 * 289854,875 76645,250 * PAES-KB - - HA-Tg 23,43 83,30 0,682 0,130 + 0,759 0,164 + EnHA-Tz 29,80 112,93 0,504 0,061 + 0,708 0,186 + EnHA-SF 48,73 154,23 0,363 0,043 * 0,540 0,140 * - - - 57 - - - Các cơng trình nghiên cứu phát triển Cơng nghệ Thông tin Truyền thông LỜI CẢM ƠN [11] P Pulkkinen and H Koivisto, “A dynamically constrained multiobjective genetic fuzzy system for regression problems,” IEEE Transactions on Fuzzy Systems, vol 18, no 1, pp 161–177, 2010 [12] L Sadeh, “Fuzzy set,” Information and Control, vol 8, pp 338–353, 1965 [13] N C Ho and W Wechler, “Hedge algebras: an algebraic approach to structure of sets of linguistic truth values,” Fuzzy Sets and Systems, vol 35, no 3, pp 281–293, 1990 [14] C Mencar and A M Fanelli, “Interpretability constraints for fuzzy information granulation,” Information Sciences, vol 178, no 24, pp 4585–4618, 2008 Nghiên cứu nằm khuôn khổ đề tài “Nghiên cứu phát triển phương pháp thao tác trực tiếp từ ngôn ngữ dựa đại số gia tử để giải số vấn đề lĩnh vực trích rút tri thức, tăng cường chất lượng ảnh sở liệu mờ”, mã số 102.01-2017.06, tài trợ Quỹ phát triển khoa học công nghệ quốc gia (NAFOSTED) TÀI LIỆU THAM KHẢO Hồng Văn Thơng sinh năm 1979 Ninh Bình Ơng tốt nghiệp Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội, năm 2001 nhận Tiến sĩ, năm 2016, Học viện Khoa học công nghệ, Viện Hàn lâm Khoa học Công nghệ Việt Nam Hiện nay, ông giảng viên Khoa Công nghệ Thông tin, Trường Đại học Giao thông Vận tải Lĩnh vực nghiên cứu ông khai phá liệu, lô gic mờ, hệ mờ, tính tốn mềm, tính tốn với từ, học máy [1] D Vukadinović, M Baˇsić, C H Nguyen, N L Vu, and T D Nguyen, “Hedge-algebra-based voltage controller for a selfexcited induction generator,” Control Engineering Practice, vol 30, pp 78–90, 2014 [2] H Ishibuchi and Y Nojima, “Analysis of interpretabilityaccuracy tradeoff of fuzzy systems by multiobjective fuzzy genetics-based machine learning,” International Journal of Approximate Reasoning, vol 44, no 1, pp 4–31, 2007 [3] ——, “Repeated double cross-validation for choosing a single solution in evolutionary multi-objective fuzzy classifier design,” Knowledge-Based Systems, vol 54, pp 22–31, 2013 [4] C H Nguyen, W Pedrycz, T L Duong, and T S Tran, “A genetic design of linguistic terms for fuzzy rule based classifiers,” International Journal of Approximate Reasoning, vol 54, no 1, pp 1–21, 2013 [5] C H Nguyen, T S Tran, and D P Pham, “Modeling of a semantics core of linguistic terms based on an extension of hedge algebra semantics and its application,” KnowledgeBased Systems, vol 67, pp 244–262, 2014 [6] C H Nguyen, V T Hoang, and V L Nguyen, “A discussion on interpretability of linguistic rule based systems and its application to solve regression problems,” Knowledge-Based Systems, vol 88, pp 107–133, 2015 [7] R Alcalá, P Ducange, F Herrera, B Lazzerini, and F Marcelloni, “A multiobjective evolutionary approach to concurrently learn rule and data bases of linguistic fuzzy-rule-based systems,” IEEE Transactions on Fuzzy Systems, vol 17, no 5, pp 1106–1122, 2009 [8] M Antonelli, P Ducange, B Lazzerini, and F Marcelloni, “Learning concurrently data and rule bases of Mamdani fuzzy rule-based systems by exploiting a novel interpretability index,” Soft Computing, vol 15, no 10, pp 1981–1998, 2011 [9] J D Knowles and D W Corne, “Approximating the nondominated front using the pareto archived evolution strategy,” Evolutionary Computation, vol 8, no 2, pp 149–172, 2000 [10] C H Nguyen, V T Hoang, T S Tran, and V L Nguyen, “LFoC-Interpretability of Linguistic Rule Based Systems and its Applications To Solve Regression Problems,” International Journal of Computer Technology & Applications, vol 8, no 2, pp 94–117, 2017 Nguyễn Đức Dư sinh năm 1979 Nam Định Ông tốt nghiệp Cử nhân năm 2001, Thạc sĩ năm 2004, Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà nội Hiện nay, ông giảng viên Khoa Công nghệ Thông tin, Trường Đại học Giao thông Vận tải Lĩnh vực nghiên cứu ông khai phá liệu, lô gic mờ, tính tốn mềm, tính tốn với từ Nguyễn Cát Hồ sinh năm 1941 Hà Nội Ông tốt nghiệp Trường Đại học Tổng hợp Hà Nội, năm 1960; nhận Tiến sỹ Trường Đại học Tổng hợp Vacsava, Ba Lan, năm 1971 nhận Tiến sĩ Khoa học Trường Đại học Tổng hợp Kỹ thuật Dresden, Đức, năm 1987 Hiện nay, ông cán nghiên cứu, Trung tâm Nghiên cứu Phát triển, Trường Đại học Duy Tân Lĩnh vực nghiên cứu ông lơ gic đại số, lơ gic mờ, tính tốn mềm, tính tốn với từ, hệ mờ sở liệu mờ 58 ... cận này, ngữ nghĩa dạng FS xác định phương pháp hình thức đầy đủ từ tập từ sử dụng biến ngôn ngữ số tham số mờ ngôn ngữ Phương pháp thiết kế áp dụng để giải toán phân lớp hồi qui, cơng bố cơng... EnHA-PAES-SF Từ kết thử nghiệm thuật tốn đề xuất, kết luận phương pháp thiết kế ngữ nghĩa dạng FS từ ngôn ngữ đề xuất sinh FRBS giải tốn hồi qui có độ xác cao ngữ nghĩa dạng tam giác, hình thang Các phương. .. mở rộng Trong đó, tác giả xây dựng ánh xạ ngữ nghĩa định lượng khoảng, giá trị ngữ nghĩa gọi ngữ nghĩa lõi Dựa ngữ nghĩa lõi từ, tác giả xây dựng FS hình thang, áp dụng giải tốn phân lớp Sử dụng

Một phương pháp thiết kế ngữ nghĩa dạng tập mờ của từ ngôn ngữ dựa trên đại số gia tử mở rộng và ứng dụng xây dựng FRBS giải bài toán hồi qui

Thông tin tài liệu

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan