Luận án tiến sĩ phương pháp tối ưu đàn kiến và ứng dụng (TT)

28 432 0
Luận án tiến sĩ phương pháp tối ưu đàn kiến và ứng dụng (TT)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐỖ ĐỨC ĐÔNG PHƯƠNG PHÁP TỐI ƯU ĐÀN KIẾN VÀ ỨNG DỤNG Chuyên ngành: Khoa học máy tính Mã số: 62.48.01.01 TÓM TẮT LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN Hà nội - 2012 Công trình hoàn thành tại: Trường Đại học Công nghệ - ĐH Quốc gia Hà nội Người hướng dẫn khoa học: PGS.TS Hoàng Xuân Huấn Phản biện 1: PGS.TS Phan Trung Huy Trường Đại học Bách khoa Hà Nội Phản biện 2: PGS.TS Hà Quang Thụy Trường Đại học Công nghệ, ĐHQGHN Phản biện 3: PGS.TS Đỗ Trung Tuấn Trường Đại học Khoa học Tự nhiên, ĐHQGHN Luận án bảo vệ trước hội đồng cấp nhà nước chấm luận án tiến sĩ họp tại: Phòng 212-E3, Trường Đại học Công nghệ, 144 Xuân Thuỷ, Cầu Giấy, Hà Nội Vào hồi giờ, ngày 18 tháng 12 năm 2012 Có thể tìm hiểu luận án tại: - Thư viện Quốc gia Việt nam - Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà nội MỞ ĐẦU Tính cấp thiết luận án Trong thực tế xây dựng hệ thông tin, ta thường gặp toán tối ưu tổ hợp (TƯTH) Trong phải tìm giá trị cho biến rời rạc để làm cực trị hàm mục tiêu Đa số toán thuộc lớp NP-khó Trừ toán cỡ nhỏ tìm lời giải cách tìm kiếm vét cạn, lại thường tìm lời giải tối ưu Đối với toán cỡ lớn phương pháp giải đúng, đến người ta dùng cách tiếp cận sau: 1) Tìm kiếm heuristic để tìm lời giải đủ tốt; 2) Tìm kiếm cục để tìm lời giải tối ưu địa phương; 3) Tìm lời giải gần nhờ thuật toán mô tự nhiên như: mô luyện kim, giải thuật di truyền, tối ưu bầy đàn,… Hai cách tiếp cận đầu thường cho lời giải nhanh cải thiện thêm lời giải tìm được, nên cách tiếp cận thứ ba sử dụng rộng rãi cho toán cỡ lớn Trong phương pháp mô tự nhiên, tối ưu đàn kiến (Ant Colony Optimization - ACO) cách tiếp cận m tah uristic tương đối mới, giới thiệu b i origo n m 1 nghiên cứu ứng dụng rộng rãi cho toán TƯTH khó Các thuật toán ACO sử dụng kết hợp thông tin kinh nghiệm (h uristic) học t ng cường qua vết mùi kiến nhân tạo để giải toán TƯTH cách đưa toán tìm đường tối ưu đồ thị cấu trúc tương ứng toán Phương pháp áp dụng rộng rãi để giải nhiều toán khó hiệu trội chúng so với phương pháp mô tự nhiên khác chứng tỏ thực nghiệm Khi áp dụng thuật toán tối ưu đàn kiến thông dụng ACS MMAS, người ta phải tìm lời giải đủ tốt, s xác định tham số cho cận cận vết mùi Điều gây nhiều khó kh n áp dụng thuật toán cho toán Ngoài ra, lượng mùi cập nhật cho thành phần đồ thị tỷ lệ với giá trị hàm mục tiêu lời giải chứa liệu có phản ánh thông tin học t ng cường hay thảo luận Việc nghiên cứu sâu thuật toán ACO ứng dụng nhiều người quan tâm Từ n m đến nay, n m có hội nghị quốc tế phương pháp tổ chức Brussels Mục tiêu luận án 1) Phân tích xu biến thiên vết mùi thuật toán ACO, s đề xuất quy tắc cập nhật mùi dễ sử dụng hiệu 2) Đề xuất thuật toán giải số toán thời Các đóng góp luận án ựa phân tích toán học, luận án đề xuất quy tắc cập nhật mùi: Đa mức (MLAS), Max Min trơn (SMMAS) Ưu điểm trội thuật toán kiểm định thực nghiệm toán chuẩn như: lập lịch sản xuất (Job Shop Scheduling - JSS), người chào hàng (Traveling Salesman Problem - TSP), quy hoạch toàn phương nhị phân không ràng buộc (Unconstrained Binary Quadratic Programming - UBQP) Trường hợp thông tin h uristic có ảnh hư ng nhiều tới kết tìm kiếm, luận án đề xuất quy tắc mức (3-LAS) kiểm định hiệu qua toán người chào hàng Thực nghiệm cho thấy hiệu quy tắc quy tắc SMMAS đơn giản dễ sử dụng hơn, thích hợp cho ứng dụng rộng rãi Nhờ quy tắc cập nhật mùi SMMAS, luận án đề xuất thuật toán ứng dụng cho toán suy diễn haplotyp , toán tìm tập hạt giống tối ưu Ngoài ra, luận án đưa lược đồ ứng dụng ACO, thuật toán di truyền xác định tham số dùng phương pháp SVM (Support Vector Machine - SVM) cho toán dự báo hoạt động điều hòa g n Ưu điểm trội đề xuất kiểm nghiệm thực nghiệm liệu tin cậy Bố cục luận án Ngoài phần kết luận, luận án tổ chức sau Chương 1: Luận án giới thiệu phát biểu toán tối ưu tổ hợp dạng tổng quát để tiện dụng sau Chương 2: Những nét phương pháp tối ưu đàn kiến giới thiệu chương Chương 3: Dựa phân tích toán học biến thiên vết mùi, luận án đề xuất thuật toán MLAS, SMMAS 3-LAS, hiệu thuật toán kiểm nghiệm hai toán cổ điển TSP UBQP Chương 4: Trình bày thuật toán ACOHAP giải toán suy diễn haplotype Chương 5: Trình bày thuật toán AcoS giải toán tìm tập hạt giống tối ưu ứng dụng tìm kiếm tương đồng chuỗi sinh học Chương 6: Giới thiệu thuật toán GASVM ACOSVM để cải tiến dự báo hoạt động điều tiết g n Chương Tối ưu tổ hợp 1.1 Bài toán tối ưu tổ hợp tổng quát ), Về mặt hình thức, toán TƯTH ứng với ba ( tập hữu hạn trạng thái (lời giải tiềm n ng hay phương án), hàm mục tiêu xác định tập ràng buộc Mỗi phương án thỏa mãn ràng buộc gọi phương án (hay lời giải) chấp nhận Mục đích ta tìm phương án chấp nhận tối ưu hóa toàn cục hàm mục tiêu Đối với { } cho toán, tồn tập hữu hạn gồm thành phần phương án biểu diễn nhờ liên kết thành phần Cụ thể hơn, tập có đặc tính sau 1) Ký hiệu tập v ctơ độ dài không { }, phương án xác định nhờ v ctơ điểm 2) Tồn tập ánh xạ từ lên cho ( ) không rỗng với Trong tập xây dựng từ tập nhờ m rộng 3) Từ m rộng thành th o thủ tục tuần tự: i) m rộng với ii) Giả sử m rộng chưa thuộc Từ tập ràng ( ) buộc , xác định tập ( ) , cho với m rộng iii) Với , thủ tục m rộng nêu xây dựng phần tử Như vậy, toán TƯTH xem toán cực trị hàm biến, biến nhận giá trị tập hữu hạn kể giá trị rỗng Một cách nhìn khác, toán tìm kiếm v ctơ độ dài không đồ thị đầy có đỉnh có nhãn tập 1.2 Các ví dụ Hai toán người chào hàng (TSP) quy hoạch toàn phương nhị phân không ràng buộc (UBQP) giới thiệu làm ví dụ cho toán TƯTH 1.3 Các cách tiếp cận Các cách tiếp cận tìm kiếm h uristic, tìm kiếm cục bộ, metaheuristic thuật toán m m tic cần dùng sau giới thiệu mục Chương Phương pháp tối ưu đàn kiến Tối ưu đàn kiến (ACO) phương pháp m tah uristic dựa ý tư ng mô cách tìm đường từ tổ tới nguồn thức n kiến tự nhiên Đến cải tiến đa dạng có nhiều ứng dụng Trước giới thiệu phương pháp ACO, luận án giới thiệu phương thức trao đổi thông tin gián tiếp kiến thực mô hình kiến nhân tạo 2.1 Từ kiến thực đến kiến nhân tạo Trên đường đi, kiến để lại chất hóa học gọi vết mùi dùng để đánh dấu đường Bằng cách cảm nhận vết mùi, kiến lần th o đường đến nguồn thức n kiến khác khám phá th o phương thức chọn ngẫu nhiên có định hướng th o nồng độ vết mùi để xác định đường ngắn từ tổ đến nguồn thức n Mô kiến tự nhiên, người ta dùng đa tác tử (multiagent) làm đàn kiến nhân tạo, kiến có nhiều khả n ng kiến tự nhiên Mỗi kiến nhân tạo (về sau gọi kiến) có nhớ riêng, có khả n ng ghi nhớ đỉnh th m hành trình tính độ dài đường chọn Ngoài kiến trao đổi thông tin có với nhau, thực tính toán cần thiết, cập nhật mùi… Nhờ kiến nhân tạo (về sau gọi đơn giản kiến) Dorigo (1991) xây dựng hệ kiến (AS) giải toán người chào hàng, hiệu so với phương pháp mô tự nhiên khác SA, GA kiểm chứng thực nghiệm phát triển, ứng dụng phong phú với tên gọi chung phương pháp ACO 2.2 Phương pháp ACO cho toán TƯTH tổng quát Mục giới thiệu tóm lược phương pháp tối ưu đàn kiến Trước mô tả thuật toán tổng quát, ta cần tìm hiểu đồ thị cấu trúc cho toán tối ưu tổ hợp 2.2.1 Đồ thị cấu trúc Xét toán TƯTH tổng quát nêu mục 1.1 dạng toán cực tiểu hoá ( ), tập hữu hạn trạng thái, hàm mục tiêu xác định ràng buộc để xác định qua thành phần tập hữu hạn liên kết tập Các tập có đặc tính nêu chương Như nói chương trước, toán TƯTH x m toán tìm kiếm v ctơ độ dài không đồ thị đầy, đỉnh có nhãn tập Để tìm lời giải chấp nhận được, ta xây dựng đồ thị đầy với tập đỉnh mà đỉnh tương ứng với thành phần Các lời giải chấp nhận v ctơ xây dựng th o thủ tục bước ngẫu nhiên mô tả chi tiết mục 2.2.2 Thông thường, toán thuộc loại NP-khó, người ta có phương pháp h uristic để tìm lời giải đủ tốt cho toán Các thuật toán ACO kết hợp thông tin h uristic với phương pháp học t ng cường nhờ mô hành vi đàn kiến để tìm lời giải tốt Giả sử với cạnh nối đỉnh có trọng số h uristic để định hướng chọn thành phần m rộng thành phần cuối th o thủ tục ( ( )) Ký hiệu v ctơ trọng số h uristic cạnh tương ứng (trong toán TSP v ctơ mà thành phần nghịch đảo độ dài cạnh tương ứng), v ctơ biểu thị thông tin học t ng cường (về sau gọi vết mùi, ban đầu kh i tạo >0) định hướng m rộng với thành phần cuối nhờ thêm thành phần th o thủ tục Trường hợp đặc biệt, phụ thuộc vào thông tin để đỉnh tương ứng Không giảm tổng quát, ta xét cho trường hợp thông tin cạnh Khi ta gọi đồ thị ( ) đồ thị cấu trúc toán tối ưu tổ hợp xét, tập đỉnh, thông tin nói tập cạnh đồ thị cho từ cạnh xây dựng tập nhờ m rộng tập th o thủ tục Nếu thông tin heuristic ta xem có thành phần 2.2.2 Mô tả thuật toán ACO tổng quát Với điều kiện kết thúc chọn (có thể số bước lặp thời gian chạy cho trước), người ta dùng đàn kiến thực lặp xây dựng lời giải đồ thị ( ) sau Trong lần lặp, kiến chọn ngẫu cấu trúc nhiên đỉnh làm thành phần kh i tạo { } thực xây dựng lời giải th o thủ tục bước ngẫu nhiên để xây dựng lời giải ựa lời giải tìm đàn kiến thực cập nhật mùi th o cách học t ng cường Thủ tục bước ngẫu nhiên Giả sử m rộng được, từ ràng buộc xác định ( ) tập ( ) cho với m rộng ( ) rỗng Đỉnh để m rộng chọn với xác suất ( ) sau: () {∑ [ ] [ ( )[ ] ] [ ( ] ) (2.1) ̅ ( ) Quá trình m rộng tiếp tục kiến tìm lời giải chấp nhận ( ) ( ) ( ( )) Để tiện trình bày, sau ta xem ( ) ( ) không phân biệt với Cập nhật mùi Tùy th o chất lượng lời giải tìm mà vết mùi cạnh điều chỉnh t ng giảm tùy th o đánh giá mức độ ưu tiên tìm kiếm sau Vì vậy, quy tắc cập nhật mùi dùng làm tên gọi thuật toán thường có dạng: ( ) ( ) ( ) (2.2) Các bước thực thuật toán ACO mô tả hình 2.4 Procedure Thuật toán ACO; Begin Kh i tạo tham số, ma trận mùi, kh i tạo kiến; repeat for to Kiến xây dựng lời giải; end-for Cập nhật mùi; Cập nhật lời giải tốt nhất; until (Điều kiện kết thúc); Đưa lời giải tốt nhất; End; Hình 2.4: Thuật toán ACO Nhận xét chung thuật toán ACO Nhờ kết hợp thông tin h uristic, thông tin học t ng cường mô hoạt động đàn kiến, thuật toán ACO có ưu điểm sau: 1) Việc tìm kiếm ngẫu nhiên dựa thông tin h uristic làm cho phép tìm kiếm linh hoạt mềm dẻo miền rộng phương pháp h uristic sẵn có, cho ta lời giải tốt tìm lời giải tối ưu 2) Sự kết hợp học t ng cường thông qua thông tin cường độ vết mùi cho phép ta bước thu hẹp không gian tìm kiếm mà không loại bỏ lời giải tốt, nâng cao chất lượng thuật toán Chú ý Khi áp dụng phương pháp ACO cho toán cụ thể, có ba yếu tố định hiệu thuật toán: 1) Xây dựng đồ thị cấu trúc thích hợp Việc xây dựng đồ thị cấu trúc để tìm lời giải cho toán th o thủ tục không khó Khó kh n với toán cỡ lớn không gian tìm kiếm rộng, đòi hỏi ta sử dụng ràng buộc cách hợp lý để giảm miền tìm kiếm cho kiến Cách xử lý toán suy diễn haplotyp chương minh họa cho điều 2) Chọn thông tin heuristic Thông tin h uristic tốt t ng hiệu thuật toán Tuy nhiên, nhiều toán ta thông tin đánh giá chúng Khi lúc ban đầu, thuật toán đơn chạy th o phương thức tìm kiếm ngẫu nhiên, vết mùi thể định hướng học t ng cường thuật toán thực 3) Chọn quy tắc cập nhật mùi Quy tắc cập nhật mùi thể chiến lược học thuật toán Nếu đồ thị cấu trúc thông tin h uristic phụ thuộc vào toán cụ thể quy tắc cập nhật mùi yếu tố phổ dụng thường dùng để đặt tên cho thuật toán Có nhiều quy tắc cập nhật mùi đề xuất, luận án tìm quy tắc thích hợp cho hai loại toán tùy th o thông tin heuristic ảnh hư ng nhiều hay tới thủ tục tìm kiếm lời giải 2.3 Phương pháp ACO giải toán TSP Bài toán người chào hàng (Traveling Salesman Problem - TSP) toán có nhiều ứng dụng thực tế, phát biểu sau: người giới thiệu sản phẩm muốn tìm hành trình ngắn nhất, xuất phát từ thành phố mình, qua tất thành phố mà khách hàng cần giới thiệu sản phẩm sau tr thành phố xuất phát với điều kiện thành phố khách hàng qua lần Bài toán TSP thuộc loại NP-khó x m toán chuẩn để đánh giá hiệu thuật toán giải toán TƯTH Thuật toán ACO gọi hệ kiến (Ant System - AS), thuật toán ACO sau cải tiến AS dùng toán TSP để thử nghiệm chất lượng Trong mục giới thiệu thuật toán để giải toán ví dụ minh họa cho phương pháp ACO Hệ kiến (AS) Trong bước lặp, sau tất kiến xây dựng xong hành trình, vết mùi cập nhật Việc thực sau: trước tiên tất cạnh bị bay th o tỉ lệ không đổi, sau cạnh có kiến qua thêm lượng mùi Việc cập nhật mùi thực sau: ∑ ( ) ( ) , (2.5) lượng mùi kiến cập nhật cạnh mà kiến qua Giá trị bằng: { ( ) (2.6) độ dài hành trình kiến xây dựng, giá trị tính tổng độ dài cạnh thuộc hành trình Theo công thức (2.6), cạnh thuộc hành trình tốt cập nhật nhiều Nói chung, cạnh có nhiều kiến sử dụng cạnh thuộc hành trình ngắn cập nhật mùi nhiều kiến lựa chọn nhiều vòng lặp sau Hiệu thuật toán AS so với phương pháp m tah uristic khác có xu hướng giảm kích thước toán t ng có nhiều nghiên cứu tập chung cải tiến thuật toán AS Hệ đàn kiến (ACS) Thuật toán ACS (Dorigo & Gambardella, 1997) khác với AS ba điểm - Thứ nhất, khai thác kinh nghiệm tìm kiếm mạnh AS thông qua việc sử dụng quy tắc lựa chọn dựa thông tin tích lũy nhiều - Thứ hai, việc bay mùi để lại mùi cạnh thuộc vào lời giải tốt đến lúc G-best (cập nhật mùi toàn cục) - Thứ ba, lần kiến qua cạnh ( ) để di chuyển từ đến , vết mùi bị giảm cạnh ( ) để t ng cường việc th m dò đường (cập nhật mùi cục bộ) Hệ kiến Max-Min Thuật toán MMAS (Stutzle & Hoos 2000) đề xuất với bốn điểm thay đổi so với AS - Thứ nhất, để t ng cường khám phá lời giải tốt tìm được: kiến có lời giải tốt tìm lần lặp (I-best) tốt đến lần lặp (G-best) cập nhật mùi - Thứ hai, MMAS giới hạn vết mùi thuộc [ ] - Thứ ba vết mùi ban đầu kh i tạo hệ số bay nhỏ nhằm t ng cường khám phá giai đoạn đầu - Điểm thay đổi cuối vết mùi kh i tạo lại tắc nghẽn không tìm lời giải tốt số bước 2.4 Một số vấn đề khác áp dụng ACO Gutjahr kh i đầu cho nghiên cứu đặc tính hội tu thuật toán MMAS thông tin heuristic Ký hiệu ( ) xác suất tìm thấy lời giải thuật toán MMAS vòng phép lặp, ( ) lời giải tốt bước lặp Nhờ sử dụng mô hình Markov không nhất, Gutjahr chứng minh với xác suất ta có : 1) ( ) , ( ) (2.12) 2) = với cạnh ( ) thuộc lời giải tối ưu tìm (2.13) Mô hình Gutjahr không áp dụng cho ACS Trường hợp MMAS thông tin h uristic, Stützl origo chứng minh rằng: với đủ lớn ( ) , (2.14) lượng o ta quan tâm tới cách cập nhật mùi để nâng cao chất lượng thuật toán ưới đây, sau nhận xét chung đặc tính khai thác khám phá thuật toán, luận án nhận xét quy tắc cập nhật mùi nêu đưa số đề xuất Tính khai thác việc tập trung tìm kiếm lời giải quanh phạm vi cạnh ( ) thuộc lời giải tốt biết tới thời điểm xét tính khám phá tìm kiếm phạm vi khác Trong cách cập nhật mùi G-b st, ta biết ( ) nên việc tìm kiếm quanh hạn chế nhiều tính khám phá cập nhật th o Ib st m rộng miền Vì thực hành cập nhật th o I-b st tốt G-best Trong toán tối ưu tổ hợp, thường xác suất để phương án cho trước kiến tìm phép lặp bé Vì sau số bước lặp cường độ vết mùi cạnh không thuộc ( ) bé giảm khả n ng khám phá chúng chúng hứa hẹn thuộc lời giải tốt Chẳng hạn, với toán TSP ta có mệnh đề sau Mệnh đề 3.2 Trong toán TSP không định hướng, chu trình Hamilton (đường liền) qua cạnh ( ) không qua cạnh ( ) đổi nhiều cạnh để có chu trình qua cạnh ( ) mà không qua ( ) Các điểm hạn chế ACO Mệnh đề cho thấy thuật toán bắt đầu, vết mùi kh i tạo cạnh ( ) “tốt hơn” cạnh ( ), thuộc chu trình dài đảo ngược cách ngẫu nhiên Khi cạnh ngẫu nhiên mà không cập nhật mùi sau số bước cường độ mùi nhanh chóng bị giảm xuống khó kiến chọn sau “chất lượng” chưa “xấu” Nếu kh i tạo mùi không dùng thông tin h uristic xác suất cạnh kiến cho sử dụng lần lặp đầu , xác suất bé lớn Như tùy th o loại toán mà tỷ lệ có ý nghĩa để cân tính khám phá khai thác thuật toán Các lượng mùi cập nhật ACS MMAS phụ thuộc vào giá trị hàm mục tiêu lời giải mà kiến xây dựng bược lặp Việc xác định giá trị , hay phụ thuộc vào tương quan với giá trị chưa xác định trước toán thuật toán tốt 3.4 Đề xuất phương pháp cập nhật mùi ựa phân tích trên, luận án đề xuất quy tắc cải tiến ACS MMAS a) Phương pháp cập nhật mùi đa mức: MLAS 12 ựa vào nhận xét mục trước, thay cho việc bay vết mùi thành phần không thuộc lời giải kiến lần cập nhật mùi bước lặp ta cho t ng dần Độ lệch cho phép ta điều khiển tính hội tụ khám phá Nếu thấy lời giải tốt thay đổi cho gần để t ng tính khám phá ngược lại cho dịch xa lời giải tập trung tìm kiếm quanh lời giải tốt tìm Quy tắc thử nghiệm cho toán TSP JSS cho kết khả quan so với MMAS Tuy nhiên việc điều khiển độ lệch khó cho toán cụ thể nên thay b i phương pháp 3-LAS trình bày phần c) b) Phương pháp Max-Min trơn: SMMAS ựa vào nhận xét mục trên, ta thấy không nên giảm vết mùi cạnh không thuộc lời giải tốt nhanh quy tắc MMAS mà nên dùng quy tắc Max-Min trơn sau: ( ) ( ) ( ) với (3.16) { ( ) ( ) Khi cài đ t, lấy c) Phương pháp 3-LAS Đối với toán mà thông tin h uristic ảnh hư ng nhiều tới chất lượng tìm kiếm lời giải, chẳng hạn toán TSP phương pháp 3-LAS tương tự ACS dễ dùng hiệu tốt Phương pháp dùng thêm tham số thuộc khoảng ( ) cập nhật mùi tương tự SMMAS cho cạnh có kiến sử dụng thuộc ( ), cụ thể là: ( ) ( với { ( )̅ ( ) ) ( ) (3.17) 3.5 Nhận xét thuật toán Trong ba phương pháp cập nhật mùi trên, hai phương pháp SMMAS 3LAS đơn giản dễ sử dụng nên luận án nêu ưu điểm hai thuật toán sử dụng nhận xét tính bất biến chúng Ưu điểm sử dụng Ta thấy thuật toán SMMAS 3-LAS có số ưu điểm trội sau so với ACS MMAS 13 1) Với ACS MMAS, để xác định hay người ta cần tìm lời giải th o phương pháp h uristic dựa vào giá trị hàm mục tiêu Vì giá trị hàm mục tiêu nhận ngẫu nhiên, nên khó xác định tốt tham số cho học t ng cường Quy tắc cập nhật cho phép ta xác định tham số đơn giản hợp lý hơn, cụ thể: SMMAS 3-LAS ta không cần xác định xác giá trị mà cần xác định tỉ lệ Trong thực nghiệm, luận án thiết đặt xác định qua tỉ lệ Cần nhấn mạnh rằng, việc cần lựa chọn tỉ lệ đơn giản thời gian thực nghiệm nhiều so với việc lựa chọn cụ thể hai tham số 2) Việc thêm mùi cho cạnh thuộc lời giải tốt bước lặp thuật toán ACS MMAS, ta phải xây dựng hàm để tính lượng mùi thêm dựa chất lượng lời giải kiến xây dựng Ví dụ, toán TSP, ACS MMAS sử dụng hàm nghịch đảo độ dài đường kiến xác định Điều khó kh n áp dụng ACS (hoặc MMAS) toán Tuy nhiên, SMMAS 3-LAS không cần phải xây dựng hàm 3) ễ dàng kiểm tra thuật toán có độ phức tạp MMAS ACS, phép toán MMAS tính hàm mục tiêu lượng mùi cập nhật so sánh để giới hạn vết mùi khoảng Th o cách cập nhật SMMAS 3-LAS, vết mùi khoảng Tính bất biến Hai toán TƯTH ( ) ( ), ta gọi chúng hai thể tương ứng toán ( ) ( ( )) với thuộc hàm đơn điệu t ng chặt Với giả thiết tính lặp máy tạo số giả ngẫu nhiên ta có kết luận Định lý 3.5 Giả sử hai thể toán TƯTH tùy ý giải hai thuật toán SMMAS 3-LAS với số lần lặp nhờ dùng máy phát lặp cho ta dãy lời giải v ctơ vết mùi 3.6 Kết thực nghiệm cho hai toán TSP UBQP Luận án thực nghiệm thuật toán cho toán TSP so sánh với MMAS Ngoài ra, luận án so sánh SMMAS với MMAS cho toán UBQP Thực nghiệm cho thấy SMMAS đơn giản mà tốt MLAS, 3-LAS phương pháp đề xuất tốt MMAS 14 Chương Thuật toán ACOHAP giải toán suy diễn haplotype Suy diễn haplotyp giúp ta hiểu cấu trúc di truyền quần thể dựa liệu kiểu g n (g notyp ) tổ chức lưỡng bội Th o tiêu chuẩn tìm tập haplotyp nhỏ (pur parsimony), toán suy diễn haplotyp tr thành toán tối ưu tổ hợp thuộc lớp NP-khó Chương này, luận án đề xuất thuật toán hiệu có tên ACOHAP giải toán suy diễn haplotyp th o tiêu chuẩn pur parsimony Thực nghiệm liệu chuẩn liệu thực cho thấy ưu điểm trội so với phương pháp tốt thời 4.1 Bài toán suy diễn haplotype tiêu chuẩn pure parsimony Trong tổ chức lưỡng bội, hầu hết nhiễm sắc thể có hai “bản sao” không giống Một haplotyp g notyp tổ chức lưỡng bội, mang thông tin cho phép nghiên cứu triệu chứng tác nhân gây bệnh di truyền Bài toán suy diễn haplotype từ tập g notyp có độ dài , xác định tập haplotyp cho cặp kết hợp từ chúng tạo nên tập g notyp xét Hiện nay, toán suy diễn haplotp thách thức quan trọng nghiên cứu di truyền sinh vật lưỡng bội nói chung người nói riêng Trong biễu diễn dạng toán học toán suy diễn haplotyp , genotype biễu diễu xâu độ dài ký tự thuộc tập {0, 1, 2} Các ký tự thể hiển all n g notyp vị trí tương ứng đồng hợp tử, ký tự biểu thị all n dạng tự nhiên (wild typ ) ký tự biểu thị all n dạng biến dị (mutant), ký tự biểu thị cặp allen vị trí tương ứng dị hợp tử Mỗi haplotype xâu độ dài ký tự thuộc tập {0,1} Tại vị trí dị hợp tử, g notyp kết hợp từ hai haplotyp mà vị trí có dạng tự nhiên có dạng biến dị Với g notyp , ta cần tìm cặp không thứ tự haplotyp giải thích th o định nghĩa sau: Định nghĩa 4.1 (Giải thích g notyp ) Cho genotype , nói cặp haplotyp không thứ tự giải thích (hay giải thích b i ) ký hiệu chúng thỏa mãn điều kiện sau với vị trí :  ,  ,  ( ) ( ) Với g notyp , ký tự cặp haplotype vị trí đồng hợp tử hoàn toàn xác định ký tự vị trí dị hợp tử có hai khả n ng nhận giá trị Nếu 15 genotype có vị trí dị hợp tử có cặp không thứ tự haplotyp giải thích Với danh sách genotype ( ) có độ dài cho, ( ) { } với , ta định nghĩa haplotyp giải thích sau Định nghĩa 4.2 (giải thích tập g notyp ) Cho danh sách genotype ( ) có độ dài , ta nói danh sách haplotype ( ) giải thích giải thích b i cặp haplotyp với Suy diễn haplotype theo tiêu chuẩn pure parsimony Như vậy, với danh sách genotype ( ) có độ dài , toán suy diễn haplotype tìm danh sách haplotype ( ) giải thích hợp lý genotype Hiện có hai cách tiếp cận cho toán phương pháp tổ hợp thống kê Lời giải cho toán tùy thuộc vào mô hình di truyền tiêu chuẩn cho xác định tập haplotyp Trong phương pháp tổ hợp, tiêu chuẩn pure parsimony nhằm tìm tập hap lotyp nhỏ giải thích Gusfi ld đề xuất nhiều người sử dụng Bài toán th o tiêu chuẩn ký hiệp HIPP (Haplotype Inference by Pure Parsimony) 4.2 Thuật toán ACOHAP giải toán HIPP Trong thuật toán ACO truyền thống, kiến xây dựng lời giải theo thủ tục bước ngẫu nhiên đường liên tục Ở thuật toán đồ thị cấu trúc đồ thị nhị phân độ sâu Chúng xác định động th o kiến bước lặp Mỗi mức đồ thị biểu thị cho vị trí haplotyp mà kiến xây dựng lời giải 4.2.1 Đồ thị cấu trúc Về hình thức, đồ thị cấu trúc nhị phân đầy đủ có độ sâu Tuy nhiên để tránh bùng nổ tổ hợp lớn, kiến bước ta thị nhị phân đầy đủ trích nhờ trình xây dựng lời giải với nút gốc mức nút mức Các biểu thị khác (động) phù hợp với trình xây dựng lời giải kiến lần lặp có đặc điểm sau - Mỗi nút mức có hai nút mức Nhánh từ sang bên trái có nhãn (gọi nhánh 0) Tương tự, nhánh từ sang bên phải có nhãn (gọi nhánh 1) 16 - Nhãn nhánh đường từ nút gốc đến nút tạo thành nhãn nút Nhãn nút mức ký tự haplotype (nhãn nút haplotyp độ dài ) - Mỗi nút có danh sách kết hợp haplotyp xây dựng nhờ đường đến nút Như nút gốc có danh sách kết hợp , nút đường từ gốc đến có danh sách tương ứng giảm dần - Mỗi đường từ gốc đến xác định haplotyp có danh sách tương ứng nút nhãn nút xác định nội dung haplotyp Như đồ thị có nhiều nút biểu thị haplotyp cần tìm có nút nhị phân đầy đủ Đồ thị không xác định từ đầu mà hiển thị dần th o trình xây dựng lời giải (sẽ nói rõ phần dưới) Hình 4.2 mô tả độ dài giúp xây dựng cặp haplotype giải thích genotype Thủ tục xây dựng lời giải kiến giúp hiểu rõ tính mềm dẻo đồ thị cấu trúc cách xây dựng Hình 4.2 Đồ thị cấu trúc giải toán HIPP 4.2.2 Thủ tục xây dựng lời giải kiến Thuật toán xây dựng đồng thời haplotype kiến theo vị trí để suy diễn genotype Để thực xây dựng lời giải, nút có danh sách haplotyp kết hợp có ý nghĩa haplotyp danh sách nhận giá trị nhãn nút cho vị trí từ trước Ban đầu, nút gốc kh i tạo có danh sách kết hợp gồm haplotype ( ) thực lần lặp, lần lặp thứ xác định giá trị vị trí thứ cho tất haplotype tạo danh sách kết hợp cho nút mức (trước danh sách rỗng) Mỗi lần lặp, kiến thực hai bước: bước thứ xử lý đồng hợp tử bước thứ hai xử lý dị hợp tử 17 Bước thứ nhất: xử lý đồng hợp tử Các genotype mà vị trí thứ đồng hợp tử cặp haplotyp tương ứng vị trí thứ nhận giá trị giá trị vị trí thứ g notyp mà chúng giải thích Cụ thể, nhận giá trị 0/1 Khi đó, thêm vào danh sách nút th o nhánh 0/1 tương ứng Bước thứ hai: xử lý dị hợp tử Các genotype mà vị trí thứ dị hợp tử giá trị hai haplotyp tương ứng vị trí thứ có giá trị khác nhau, xác định giá trị thứ haplotype thứ tính giá trị thứ haplotyp thứ hai Cụ thể, lựa chọn 1, Nếu danh sách nút mức ( ) chứa kiến lựa chọn ngẫu nhiên th o xác suất sau: ( ) ( ) ( ) ( ) ( ) ( ) ( ) Trong α hai tham số dương cho trước điều khiển ảnh hư ng thông tin vết mùi thông tin h uristic Thông tin heuristics Ý tư ng để xác định thông tin h uristic cho nút xét ước lượng số nút có danh sách kết hợp khác rỗng mức tương thích với haplotyp xét Cập nhật vết mùi Sử dụng quy tắc SMMAS Sử dụng tìm kiếm cục Để t ng hiệu thuật toán, lần lặp luận án sử dụng thuật toán tìm kiếm cục cho lời giải tìm th o chiến lược tốt lân cận khoảng cách 1-Hamming (1-Hamming distance neighborhood) Gasp ro Roli đề xuất 4.3 Kết thực nghiệm Luận án tiến hành làm thực nghiệm liệu chuẩn (gồm 32 t st) liệu thực CEU (nhiễm sắc thể 20 người da trắng châu Âu Utah) để so sánh với phương pháp RPoly phương pháp CollHap RPoly phương pháp giải tốt CollHap phương pháp xấp xỉ tốt Kết thực nghiệm cho thấy ACOHAP cho kết tối ưu RPoly nhiều trường hợp ACOHAP hiệu trội hẳn CollHap Chương Thuật toán AcoSeeD tìm tập hạt giống tối ưu Tìm kiếm đoạn tương tự chuỗi sinh học công việc thường gặp quan trọng tin sinh học Sử dụng tập hạt giống có cách nâng cao chất lượng tìm kiếm Tuy nhiên, tìm tập hạt giống có cách tối ưu toán thuộc lớp NP-khó Chương này, luận án đề xuất thuật toán AcoS có đồ thị cấu trúc hợp lý, dùng quy tắc cập nhật mùi SMMAS kỹ thuật tìm kiếm 18 cục định hướng hàm mục tiêu xấp xỉ nhanh thay cho hàm mục tiêu phương pháp ACO Kết thực nghiệm cho thấy AcoS cải thiện đáng kể hiệu so với thuật toán tốt nay: SpEE fast 5.1 Bài toán tìm tập hạt giống có cách tối ưu số vấn đề liên quan 5.1.1 Bài toán tìm tập hạt giống tối ưu Việc so khớp địa phương hai hay nhiều chuỗi sinh học đưa xét toán miền tương đồng (homologous region) biểu diễn xâu nhị phân có độ dài , ký tự vị trí R biểu thị không khớp (mismatch) ký tự biểu thị khớp (match) Chuỗi gọi chuỗi so khớp Ta xét hạt giống biểu diễn xâu ký tự gồm ký tự *, ký tự biểu thị khớp ký tự * biểu thị khớp không khớp vị trí tướng ứng hạt giống đối sánh với R Định nghĩa 5.1 (Tính hợp hạt giống) Với miền tương đồng biểu thị b i chuỗi so khớp cho, hạt giống ( độ dài hạt giống) gọi hợp được(hit) tồn vị trí R cho với ta có: { (5.1) Số lượng ký tự hạt giống gọi trọng số Một tập hạt giống gồm hạt giống có trọng số gọi hợp tồn hạt giống hợp Bây ta xét chuỗi so khớp hai chuỗi sinh học có xác suất khớp vị trí chuỗi , tức ký tự vị trí i chuỗi nhận giá trị với xác suất : P( ) , (5.2) gọi mức tương tự (similarity level) Bài toán tìm tập giống tối ưu sau: Với chuỗi so khớp có mức tương tự cho, tìm tập gồm hạt giống có trọng số cho xác suất mà tập hợp chuỗi lớn (xác suất để tập hạt giống S hợp chuỗi gọi độ nhạy S) Bài toán tìm tập hạt giống tối ưu xét hai trường hợp: độ dài hạt giống biết chưa biết Trong hai trường hợp, Li cộng chứng minh toán thuộc lớp NP-khó, đặc biệt việc tính hàm mục tiêu thuộc lớp NP-khó 5.1.2 Các cách tiếp cận Bài toán tìm tập hạt giống tối ưu có nhiều thuật toán giải công bố Trong phải kể đến thuật toán h uristic tham n Li cộng đề xuất n m 19 2004, thuật toán l o đồi Sun Buhl r đề xuất n m 2005 Do đặc điểm toán thời gian tính độ nhạy tập hạt giống lớn nên Ili cộng đề xuất thuật toán l o đồi sử dụng cách tính hàm mục tiêu xấp xỉ nhanh OC (Overlap Compl xity) thay cho tính độ nhạy bước tính toán N m 2011, Ili cộng công bố phần mềm SpEE cho phần mềm thể thuật toán tìm tập hạt giống tốt Phiên phần mềm SpEE fast công bố n m 2012 Nhược điểm thuật toán SpEE (hay SpEE fast) sử dụng thuật toán l o đồi đơn giản sử dụng hàm mục tiêu OC tìm kiếm 5.2 Thuật toán AcoSeeD giải toán tìm tập hạt giống 5.2.1 Mô tả thuật toán Thuật toán AcoS áp dụng phương pháp ACO th o lược đồ có sử dụng tìm kiếm cục cho lời giải tìm bước lặp Vì thuật toán tính độ nhạy tốn nhiều thời gian chạy nên dùng để đánh giá chất lượng lời giải sau áp dụng tìm kiếm cục bộ, trình tìm kiếm cục hàm OC áp dụng để định hướng tìm kiếm Với tham số cho số vòng lặp thời gian chạy xác định trước, thuật toán AcoS xác định tập hạt giống tối ưu cho trường hợp chưa biết độ dài mô tả hình 5.2 Trong trường hợp độ dài hạt giống xác định thủ tục xác định độ dài hạt giống bỏ qua Procedure AcoSeeD; Dữ liệu vào: , độ dài hạt giống biết Kết ra: tập hạt giống độ nhạy; Begin Kh i tạo tập A gồm kiến, ma trận mùi, tham số while (chưa kết thúc) for =1 to Kiến thứ xác định độ dài hạt giống; Kiến thứ xây dựng tập hạt giống; Cải tiến lời giải tìm kiến cục nhờ hàm mục tiêu OC; Tính độ nhạy tập hạt giống kiến xây dựng; end-for Cập nhật mùi dựa lời giải có độ nhạy lớn tìm được; Cập nhật lời giải tốt nhất; end-while Đưa lời giải tốt nhất; End; Hình 5.1: Thuật toán AcoSeeD 20 5.2.2 Thuật toán xác định độ dài hạt giống Trong trường hợp, độ dài hạt giống chưa biết thuộc khoảng [ ] cho kiến phải thực thủ tục xác định độ dài hạt giống tập nhờ đồ thị cấu trúc mô tả hình 5.2 Ngoài hai đỉnh đồ thị gồm cột xếp từ phải sang trái, cột có nút gán nhãn từ đến biểu thị cho độ dài hạt giống có thứ tự cột tương ứng Như vậy, nút xếp thành ( ) hàng cột Ta xếp hạt giống theo thứ tự t ng dần độ dài, đường xuất phát từ đỉnh , qua cột (chỉ sang ngang lên đỉnh cột tiếp theo) kết thúc đỉnh cho phương án xác định độ dài tập giống Hình 5.3: Đồ thị cấu trúc để xác định độ dài hạt giống 5.2.3 Thuật toán xây dựng hạt giống Đồ thị cấu trúc để xây dựng lời giải tìm tập giống mô tả hình 5.3.A, gồm hình chữ nhật kích thước ( ) Kiến xây dựng hạt giống cách xuất phát từ đỉnh (đỉnh trái hình chữ nhật thứ nhất) có toạ độ ( ), số thứ số thứ tự hình chữ nhật, số thứ hai số cột hình chữ nhật (đánh số từ trái qua phải), số thứ ba số hàng hình chữ nhật (đánh số từ lên trên) di chuyển qua phải ) (đỉnh phải hình lên đến đỉnh có toạ độ ( chữ nhật thứ thứ ) 5.2.4 Cập nhật mùi Sau tất kiến xây dựng xong lời giải lời giải áp dụng kỹ thuật tìm kiếm cục sử dụng hàm mục tiêu OC lời giải có độ nhạy lớn dùng để cập nhật mùi cho hai giai đoạn xác định độ dài hạt giống giai đoạn xây dựng hạt giống AcoS sử dụng cách cập nhật mùi SMMAS 21 Hình 5.3: Đồ thị cấu trúc xây dựng hạt giống Hình (A) Đồ thị cấu trúc xây dựng hạt giống có trọng số Hình (B) Hướng kiến di chuyển đỉnh (C) Ví dụ xây dựng hạt giống trọng số độ dài 5.3 Kết thực nghiệm Hiệu AcoS so sánh thực nghiệm với hai phương pháp tốt SpEE SpEE fast Để khách quan với SpEE SpEE fast, AcoS chạy liệu số lời giải Ili làm Kết thực nghiệm cho thấy AcoS tốt SpEE , SpEEDfast AcoS tìm tập hạt giống có độ nhạy cao SpEE fast tìm Chương Ứng dụng phương pháp ACO cải tiến hiệu dự đoán hoạt động điều tiết gen 6.1 Bài toán dự đoán hoạt động điều tiết gen Hiểu chế điều chỉnh biểu gen qua yếu tố phiên mã (Transcription Factors-TFs) nhiệm vụ trung tâm sinh học phân tử Người ta biết trạng thái biểu g n thành lập thông qua tích hợp mạng tín hiệu phiên mã hội tụ thành phần t ng cường, gọi mô-đun điều tiết (Cis-Regulatory Module – CRM) Các mô-đun điều tiết đoạn NA, 22 liên kết yếu tố phiên mã để điều tiết biểu diễn g n liên quan Mỗi mô-đun điều tiết nhiều g n Gần đây, Zinz n cộng giới thiệu mô hình dự báo điều tiết ruồi dấm Drosophila Ruồi giấm rosophila mẫu sinh vật dùng để nghiên cứu phát triển phôi thai sinh học Zinz n cộng đề xuất sử dụng phương pháp ChIP (Chromatin Immunoprecipitation) để thu liệu yếu tố phiên mã quan trọng ruồi giấm rosophila (Twist, TinMan, M f2, Bagpip Biniou) thời điểm trình phát triển phôi Bài toán dự đoán đưa toán học có giám sát với đối tượng có 15 đặc trưng nhận giá trị tập nhãn gồm giá trị 6.2 Thuật toán di truyền tối ưu đàn kiến tìm tham số cho SVM dùng dự đoán hoạt động điều tiết gen Zinz n sử dụng phương pháp tìm kiếm lưới để xác định tham hai tham ‖ ‖ số phát hàm nhân dạng Gauss phương pháp SVM (Support Vector Machine - SVM) để áp dụng cho toán dự đoán điều tiết Luận án dùng mã nhị phân 51 bit để biễu diễn hai tham số Tham số nhận giá trị từ 10-2 đến 105 biểu diễn dãy 24 bit, γ nhận giá trị 10-6 đến 102 biểu diễn dãy 27 bit Hình 6.3: Một nhiễm sắc thể biểu diễn C ựa cách mã hóa này, luận án xây dựng áp dụng phương pháp ACO thuật toán di truyền cổ điển cho xác định hai tham số thu tương ứng hai hệ dự đoán ACOSVM GASVM Thực nghiệm cho thấy hai hệ có hiệu phương pháp Zinz n ACO tốt so với GA Kết luận Các toán TƯTH khó có nhiều ứng dụng quan trọng thực tiễn, đặc biệt toán sinh học Phương pháp ACO kết hợp thông tin h uristic thông tin học t ng cường nhờ mô hoạt động đàn kiến có ưu điểm trội sau: 1) Việc tìm kiếm ngẫu nhiên dựa thông tin h uristic cho phép tìm kiếm linh hoạt mềm dẻo miền rộng phương pháp h uristic sẵn có, cho ta lời giải tốt tìm lời giải tối ưu 23 2) Sự kết hợp học t ng cường thông qua thông tin cường độ vết mùi cho phép ta bước thu hẹp không gian tìm kiếm mà không loại bỏ lời giải tốt, nâng cao chất lượng thuật toán Thực nghiệm chứng tỏ khả n ng trội phương pháp ACO ứng dụng cho nhiều toán phương pháp sử dụng rộng rãi Khi dùng phương pháp ACO, quy tắc cập nhật mùi đóng vai trò quan trọng, định hiệu thuật toán dùng Luận án đề xuất quy tắc cập nhật mùi mới: SMMAS, MLAS 3-LAS Các thuật toán bất biến phép biến đổi đơn điệu hàm mục tiêu, thực nghiệm toán TSP, UBQP, lập lịch sản xuất với liệu chuẩn cho thấy thuật toán đề xuất có hiệu dễ sử dụng so với thuật toán thông dụng ACS MMAS Trong thuật toán này, SMMAS đơn giản, dễ sử dụng nên dùng rộng rãi Thuật toán MLAS cho phép điều tiết linh hoạt khả n ng khám phá t ng cường thuật toán th o thời điểm Tuy thực nghiệm toán TSP cho kết hứa hẹn khó áp dụng Thuật toán 3-LAS thích hợp với toán có thông tin h uristic tốt, sử dụng chúng ảnh hư ng nhiều tới chất lượng kết tìm kiếm, chẳng hạn toán TSP Bên cạnh phát triển thuật toán mới, luận án đề xuất giải pháp cho ba toán quan trọng sinh học phân tử: suy diễn haplotyp , tìm tập hạt giống tối ưu dự báo hoạt động điều tiết g n Đối với toán suy diễn haplotyp , luận án đề xuất thuật toán ACOHAP Kết thực nghiệm cho thấy ACOHAP cho kết tối ưu RPoly (phương pháp xác tốt nay) nhiều trường hợp, nữa, ACOHAP hiệu trội hẳn CollHap (phương pháp xấp xỉ tốt nay) Đối với toán tìm tập hạt giống tối ưu, luận án đề xuất thuật toán AcoS Kết thực nghiệm cho thấy AcoS cho kết tốt hai phương pháp tốt SpEE SpEE fast Đối với toán dự báo hoạt động điều tiết g n, dựa phương pháp đề xuất Zinz n cộng sự, luận án đề xuất hai thuật toán m tah uristic: GASVM ACOSVM Các thuật toán tương ứng sử dụng phương pháp GA ACO để tìm tham số tốt cho học SVM Thực nghiệm cho thấy hiệu cách tiếp cận áp dụng phương pháp tìm kiếm lưới Zinz n Hiện hệ ACOHAP, AcoS , GASVM ACOSVM có ích cho nhà nghiên cứu sinh học người quan tâm Trong tương lai, với nhóm nghiên cứu Tin-Sinh Đại học Công nghệ ứng dụng đề xuất cho toán khác 24 DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN 1) Huy Q Dinh, Dong Do Duc, and Huan X Hoang (2006), “Multi-Level Ant System - A new approach through the new pheromone update for Ant Colony Optimization”, Proc of the 4th IEEE International Conference in Computer Sciences, Research, Innovation, and Vision for Future, pp 55-58 2) D Do Duc, Huy.Q Dinh, and H Hoang Xuan (2008), “On the pheromone update rules of ant colony optimization approaches for the job shop scheduling problem,” Proc of the Pacific Rim Int Workshop on Multi-Agents, 2008, pp 153-160 3) Hoàng Xuân Huấn Đỗ Đức Đông (2010), “Về vết mùi thuật toán ACO khung cảnh mới”, Kỷ yếu hội thảo quốc gia vấn đề chọn lọc CNTT lần thứ XII, tr 534-547 4) Dong Do Duc, Huan Hoang Xuan (2010), “Smoothed and Three-Level Ant Systems: Novel ACO Algorithms for the Traveling Salesman Problem”, Ad Cont to the IEEE RIFV2010, pp 37-39 5) Đỗ Đức Đông Hoàng Xuân Huấn (2011), “Về biến thiên vết mùi phương pháp ACO thuật toán mới”, Tạp chí Tin học điều khiển học, Tập 27, tr 263-275 6) Dong Do Duc and Hoang Xuan Huan (2011), “ACOHAP: A novel Ant Colony Optimization algorithm for haplotype inference problem”, Proc of the Third International Conference on Knowledge and Systems Engineering, pp 128-134 7) Dong Do Duc, Tri-Thanh Le, Trung Nghia Vu, Huy Q Dinh, Hoang Xuan Huan (2012), “GA_SVM: A genetic algorithm for improving gene regulatory activity prediction”, Proc of the 9th IEEE-RIVF International Conference on Computing and Communication Technologies, pp 234237 8) Dong Do Duc, Huan Hoang Xuan, and Huy Q Dinh (2012), “METAREG: A computational meteheuristic method to improve the regulatory activity prediction”, Proc of the 4th International Conference on the Development of Biomedical Engineering, pp 450-453 9) Dong Do Duc, H Q Dinh, T.H Dang, K Laukens, and H Hoang Xuan (2012), “AcoSeeD: an Ant Colony Optimization for finding optimal spaced seeds in biological sequence search”, Proc Of the ANTS2012: Eighth Int Conf on swarm intelligence, pp 204-211 [...]... toán mới Trong ba phương pháp cập nhật mùi trên, hai phương pháp SMMAS và 3LAS đơn giản và dễ sử dụng hơn nên luận án sẽ nêu ra các ưu điểm của hai thuật toán này khi sử dụng và nhận xét về tính bất biến của chúng Ưu điểm khi sử dụng Ta thấy thuật toán SMMAS và 3-LAS có một số ưu điểm nổi trội sau so với ACS và MMAS 13 1) Với ACS và MMAS, để xác định hay và người ta cần tìm một lời giải th o phương pháp. .. một dãy lời giải và các v ctơ vết mùi 3.6 Kết quả thực nghiệm cho hai bài toán TSP và UBQP Luận án thực nghiệm các thuật toán mới cho bài toán TSP và so sánh với MMAS Ngoài ra, luận án cũng so sánh SMMAS với MMAS cho bài toán UBQP Thực nghiệm cho thấy SMMAS đơn giản nhất mà tốt như MLAS, 3-LAS và các phương pháp mới đề xuất đều tốt hơn MMAS 14 Chương 4 Thuật toán ACOHAP giải bài toán suy diễn haplotype... tham số này và thu được tương ứng hai hệ dự đoán ACOSVM và GASVM Thực nghiệm cho thấy hai hệ này có hiệu quả hơn phương pháp của Zinz n và ACO tốt hơn so với GA Kết luận Các bài toán TƯTH khó có nhiều ứng dụng quan trọng trong thực tiễn, đặc biệt là trong các bài toán sinh học Phương pháp ACO kết hợp thông tin h uristic và thông tin học t ng cường nhờ mô phỏng hoạt động của đàn kiến có các ưu điểm nổi... phát triển phôi Bài toán dự đoán được đưa về bài toán học có giám sát với đối tượng có 15 đặc trưng và nhận giá trị trong tập nhãn gồm 5 giá trị 6.2 Thuật toán di truyền và tối ưu đàn kiến tìm tham số cho SVM dùng trong dự đoán hoạt động điều tiết gen Zinz n đã sử dụng phương pháp tìm kiếm trên lưới để xác định tham hai tham ‖ ‖ số phát và của hàm nhân dạng Gauss trong phương pháp SVM (Support Vector... trên phương pháp đề xuất của Zinz n và các cộng sự, luận án đề xuất hai thuật toán m tah uristic: GASVM và ACOSVM Các thuật toán này tương ứng sử dụng phương pháp GA hoặc ACO để tìm tham số tốt nhất cho bộ học SVM Thực nghiệm cho thấy hiệu quả hơn cách tiếp cận áp dụng phương pháp tìm kiếm trên lưới của Zinz n Hiện tại hệ ACOHAP, AcoS , GASVM và ACOSVM sẽ có ích cho các nhà nghiên cứu sinh học và những... ACOHAP cho kết quả tối ưu như RPoly (phương pháp chính xác tốt nhất hiện nay) trong nhiều trường hợp, hơn nữa, ACOHAP hiệu quả nổi trội hơn hẳn CollHap (phương pháp xấp xỉ tốt nhất hiện nay) Đối với bài toán tìm tập hạt giống tối ưu, luận án đề xuất thuật toán AcoS Kết quả thực nghiệm cho thấy AcoS cho kết quả tốt hơn hai phương pháp tốt nhất hiện nay là SpEE và SpEE fast Đối với bài toán dự báo hoạt... Machine - SVM) để áp dụng cho bài toán dự đoán điều tiết này Luận án dùng mã nhị phân 51 bit để biễu diễn hai tham số và Tham số nhận giá trị từ 10-2 đến 105 được biểu diễn bằng một dãy 24 bit, và γ nhận giá trị 10-6 đến 102 được biểu diễn bằng một dãy 27 bit Hình 6.3: Một nhiễm sắc thể biểu diễn C và ựa trên cách mã hóa này, luận án xây dựng áp dụng phương pháp ACO và thuật toán di truyền cổ điển... bài toán có thông tin h uristic tốt, khi sử dụng chúng ảnh hư ng nhiều tới chất lượng của kết quả tìm kiếm, chẳng hạn như bài toán TSP Bên cạnh phát triển thuật toán mới, luận án cũng đề xuất các giải pháp cho ba bài toán quan trọng trong sinh học phân tử: suy diễn haplotyp , tìm tập hạt giống tối ưu và dự báo hoạt động điều tiết g n Đối với bài toán suy diễn haplotyp , luận án đề xuất thuật toán ACOHAP... (pur parsimony), bài toán suy diễn haplotyp tr thành bài toán tối ưu tổ hợp thuộc lớp NP-khó Chương này, luận án đề xuất một thuật toán hiệu quả có tên là ACOHAP giải bài toán suy diễn haplotyp th o tiêu chuẩn pur parsimony Thực nghiệm trên dữ liệu chuẩn và dữ liệu thực cho thấy ưu điểm nổi trội của nó so với các phương pháp tốt nhất hiện thời 4.1 Bài toán suy diễn haplotype và tiêu chuẩn pure parsimony... các thuật toán đề xuất có hiệu quả và dễ sử dụng hơn so với các thuật toán thông dụng nhất hiện nay như ACS và MMAS Trong các thuật toán này, SMMAS đơn giản, dễ sử dụng hơn nên có thể dùng rộng rãi Thuật toán MLAS cho phép điều tiết linh hoạt khả n ng khám phá và t ng cường của thuật toán th o từng thời điểm Tuy thực nghiệm trên bài toán TSP cho kết quả hứa hẹn nhưng khó áp dụng hơn Thuật toán 3-LAS thích

Ngày đăng: 14/09/2016, 23:12

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan