điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi

Thông tin tài liệu

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG KHOA QUỐC TẾ & ĐÀO TẠO SAU ĐẠI HỌC    MÔN HỌC: KỸ THUẬT TỐI ƯU CHUYÊN ĐỀ: ĐIỀU KHIỂN LUỒNG THÔNG MINH THEO KHUÔN KHỔ LÝ THUYẾT TRÒ CHƠI GVHD: TS. Lê Nhật Thăng HV: Lớp: M11CQCK01-B Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 2 Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 3 MỤC LỤC MỤC LỤC 3 MỞ ĐẦU 13 Sự phức tạp trong phạm vi rộng lớn của các mạng viễn thông hiện đại ngày nay cung cấp cho chúng ta nhiều thách thức cũng như những cơ hội mới. Trong chương này, chủ yếu chúng ta tập chung vào những thách thức liên quan tới việc tối ưu hóa trong mạng viễn thông 15 Vậy tối ưu hóa mạng viễn thông là gì? 15 Đó là việc tìm ra phương pháp “tốt nhất” trong các phương pháp có thể giải quyết được bài toán. Ví dụ, có một số phương pháp để thiết kế cấu trúc liên kết của mạng dữ liệu khu vực cho một công ty lớn. Làm thế nào để tìm ra một phương pháp đặc biệt tốt trong tất cả các phương pháp trên? ví dụ khác là làm thế nào tìm ra cách tốt nhất để gán các kênh tần số cho người dùng trong mạng di động. Tuy rằng mỗi phương pháp đều có hạn chế nhưng cuối cùng chúng ta vẫn sẽ tìm ra một phương pháp “tốt nhất” 15 Đặc biệt, có một số các công nghệ phần mềm mới được nhắm vào các giải pháp tối ưu hóa hiện đang được sử dụng trong các ngành công nghiệp, có tiềm năng và hiệu quả rất lớn giải quyết nhiều vấn đề trong ngành viễn thông. Các kỹ thuật sử dụng bao gồm các phương pháp tìm kiếm cục bộ như mô phỏng luyện kim (Aarts and Korst, 1989), tìm kiếm tabu (Glover, 1989; 1989a), các kỹ thuật tìm kiếm ‘population-based’ như thuật toán di truyền (Holland, 1975; Goldberg, 1989), quá trình tiến hóa chiến lược (Schwefel, 1981; Back, 1996), lập trình tiến hóa (Fogel, 1995), lập trình di truyền (Koza, 1992). Chúng ta sẽ tìm hiểu lần lượt qua những chủ đề này ở các phần dưới của chương này 15 II. VẤN ĐỀ ĐỘNG VÀ SỰ THÍCH ỨNG 15 Một khía cạnh cơ bản của các bài toán tối ưu hóa trong ngành viễn thông trên thực tế rất năng động. Điều có thể là giải pháp tốt nhất bây giờ nhưng không thể là giải pháp lý tưởng trong một vài giờ, hoặc thậm chí một vài phút. Ví dụ: các nhà cung cấp của một dịch vụ cơ sở dữ liệu phân tán cố gắng đảm bảo chất lượng tốt các dịch vụ cho mỗi khách hàng. Thực hiện chuyển hướng truy cập cơ sở dữ liệu của khách hàng đến các máy chủ khác nhau tại các thời điểm khác nhau để thích hợp cân bằng tải giữa các máy chủ. Kỹ thuật tối ưu hóa hiện đại có thể được sử dụng để phân phối tải trọng một cách thích hợp trên các máy chủ, tuy nhiên giải pháp này trở nên không hợp lệ ngay sau khi có sự thay đổi vừa phải trong mô hình truy cập cơ sở dữ liệu của khách hàng. 15 Một ví dụ khác là định tuyến gói chung trong một mạng lưới rộng lớn điểm-điểm cơ bản. Theo truyền thống, các bảng định tuyến tại mỗi nút được sử dụng để tìm hop tiếp theo là tốt nhất cho một gói tin dựa vào điểm đến cuối cùng của nó. Chúng ta có thể tưởng tượng một kỹ thuật tối ưu hóa áp dụng cho vấn đề này, như việc nhìn vào các mô hình giao thông tổng thể để xác định các bảng định tuyến thích hợp cho mỗi nút, vì vậy mà sự tắc nghẽn và sự chậm trễ có thể được giảm thiểu 16 Chạy lặp các các kỹ thuật tối ưu hóa là một trong những cách có thể để tiếp cận vấn đề năng động, nhưng nó là một cách không thích hợp cho lắm khi giải pháp tốt cần nắm bắt rất nhanh, khi môi trường thay đổi rất nhanh chóng. Thay vào đó, một phạm vi khác của kỹ thuật tính toán hiện đại thường thích hợp cho các vấn đề như vậy. Chúng ta gọi kỹ thuật này là kỹ thuật thích ứng. 16 Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 4 Một loạt các phương pháp nổi tiếng trong lĩnh vực nghiên cứu tối ưu hoá, như lập trình động, lập trình số nguyên, dó là các phương pháp truyền thống được sử dụng để giải quyết các loại khác nhau của các vấn đề tối ưu hóa. Tuy nhiên, một cộng đồng lớn gồm các nhà khoa học máy tính và các nhà nghiên cứu trí tuệ nhân tạo đã dành rất nhiều nỗ lực đưa ra thành những ý tưởng hiện đại được gọi là "metaheuristics" hoặc "heuristic ". Sự khác biệt cơ bản của phương pháp hiện đại là dễ dàng được áp dụng hơn so với các phương pháp cổ điển 16 Đó không thể nói là phương pháp hiện đại tốt hơn phương pháp cổ điển mà phải tùy theo các trường hợp mà có thể áp dụng cả hai phương pháp: 16 • Một chuyên gia metaheuristics so sánh hai loại kỹ thuật: các phương pháp hiện đại nhanh hơn so với phương pháp cổ điển 16 • Một chuyên gia nghiên cứu hoạt động phương pháp cổ điển so sánh hai loại kỹ thuật: các phương pháp cổ điển tốt hơn các phương pháp hiện đại 16 Quan sát này được dựa trên một khía cạnh quan trọng của việc giải quyết vấn đề tối ưu hóa. Bạn càng biết về một kỹ thuật đặc biệt mà bạn đang áp dụng, có thể sẽ tốt hơn khi bạn điều chỉnh và khai thác bằng cách khác nó để có được kết quả tốt nhất. 17 Trong phần này chúng ta chỉ cung cấp cơ sở chi tiết của một vài thuật toán tối ưu hiện đại, không đưa ra thông tin đầy đủ đề giải các bài toán cụ thể. Các kỹ thuật chủ yếu rơi vào hai nhóm: tìm kiếm cục bộ và tìm kiếm dựa trên quần thể 17 Hãy tưởng tượng bạn đang cố gắng để giải quyết một vấn đề P, và bạn có một tập lớn S các giải pháp tiềm năng cho vấn đề này. Bạn không thực sự có tập hợp S, vì nó là quá lớn để liệt kê đầy đủ. Tuy nhiên, bạn có một số cách tạo ra các giải pháp từ nó. Ví dụ, S có thể là một tập hợp các kết nối cấu trúc liên kết cho một mạng, ứng cử viên của giải pháp là s, s', s", và như vậy, là ứng cử viên cụ thể cấu trúc liên kết mà bạn đã đưa ra bằng cách nào đó. Ngoài ra, hãy tưởng tượng rằng bạn có hàm chức năng f(s) cho một số điểm, đưa ra một ứng cử viên giải pháp. Các số điểm, các giải pháp tốt hơn. Ví dụ, nếu chúng ta cố gắng để tìm thấy các cấu trúc liên kết mạng đáng tin cậy nhất, sau đó f(s) có thể tính toán xác suất của liên kết thất bại giữa hai nút đặc biệt quan trọng 17 Dưới đây chúng tôisẽ mô tả cơ bản tìm kiếm cục bộ. Trước khi tìm hiểu về chúng thì ta hãy xem xét một trong những phương pháp tìm kiếm đơn giản cục bộ, được gọi là hillclimbing (leo núi), theo các bước dưới đây: 17 Bước 1(Bắt đầu): tạo ra một giải pháp, ứng cử viên ban đầu (có lẽ là ngẫu nhiên); gọi giải pháp này là giải pháp hiện hành c, Đánh giá c 17 Bước 2: Biến đổi c để tạo ra một m đột biến, và đánh giá các m 17 Bước 3: Nếu hàm f(m) là tốt hơn hoặc bằng với hàm f(c), thì ta thay thế c bởi m (tức là c bây giờ là một bản sao của m) 17 Bước 4:Đến khi đạt được một tiêu chuẩn thì ta kế thúc kết thúc, sau đó quay trở về bước 2 17 Bây giờ chúng ta sẽ đi tìm hiểu qua các thuật toán cục bộ chính: 17 Phương pháp luyện thép giống như phương pháp leo đồi (hillclimbing). Sự khác biệt chỉ là ở việc nó dùng một cặp thông số, thêm vào bước 1 và ở điểm chính trong bước 3chúng được thay đổi việc sử dụng các tham số: 18 Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 5 Bắt đầu: Tạo và đánh giá một giải pháp ban đầu (có lẽ là ngẫu nhiên); gọi là giải pháp hiện hành c, tham số nhiệt độ khởi tạo T, độ làm mát r (0 <r <1) 18 Thuật toán bao gồm 4 bước chính như sau: 18 Bước 1: Biến đổi c để tạo ra một m đột biến, đánh giá m 18 Bước 2: Nếu hàm test(f(m), f(c), T) đánh giá đúng sự thật, thì thay thế c bởi m(Ví dụ: c bây giờ là một bản sao của m) 18 Bước 3: Cập nhật các thông số nhiệt độ (ví dụ như T trở thành rT) 18 Bước 4:Khi đạt được tiêu chí thì dừng sau đó trở về bước 2 18 Câu hỏi đặt ra là liệu điều gì sẽ xảy ra trong quá trình mô phỏng luyện kim khi chúng ta cho phép có sự biến đổi(ngay cả khi giải pháp đó không tốt hơn các giải pháp hiện hành). Chúng ta sẽkhông thực hiện điều này bới có ít có khả năng để thực hiện nếu như đột biến như thế xảy ra. Thuật toán có hiệu quả toàn cục, có cơ hội tốt thoát khỏi cục bộ tối ưu, do đó có thể tìm kiếm các khu vực tốt hơn của các không gian sau. Điều cơ bản là phải hướng đến các vùng tốt hơn. Điều này được thể hiện ở hàm test trong bước 3 18 Ví dụ một hàm test được thực hiện như sau: e( f (m)-f (c))/T 18 Giả định là chúng ta đang cố gắng để tối đa hóa chi phí (Nếu không chỉ cần chuyển đổi hai hàm f(m) và f(c)). Nếu như giải pháp biến đổi tốt hơn hoặc bằng giải pháp hiện hành, biểu thức trên sẽ lớn hơn hoặc bằng 1. Nếu biến đổi không tốt thì kết quả sẽ nhỏ hơn 1, và biến đổi không tốt hơn sẽ gần đến 0. Do đó, kết quả củabiểu thức này được sử dụng như xác suất. Một số ngẫu nhiên được tạo ra(rand), 0 < rand < 1, test ở bước 3 sẽ kiểm tra biểu thức trên nhỏ hơn hoặc bằng rand (chúng ta chấp nhận biến đổi). T là tham số "nhiệt độ". Nó bắt đầu tăng cao và giảm dần (xem bước 4) với thời gian. Như ta có thể cho biết từ biểu thức trên, điều này có nghĩa là xác suất chấp nhận đột biến tồi tệ hơn cũng sẽ giảm theo thời gian. Chính bởi thế mà mô phỏng luyện kim là phương pháp rất mạnh, mặc dù khá khó khăn để có được các thông số đúng (xem thêm Dowsland (1995)) 18 Một cách khác để thực hiện việc tối ưu cục bộ được cung cấp bởi công cụ tìm kiếm Tabu (Glover năm 1989; 1989a; Glover và Laguna, 1997). Có rất nhiều khía cạnh tinh tế để tìm kiếm Tabu, ở đây chúng tôi sẽ chỉ ra một số điểm thiết yếu về kỹ thuật. Một giới thiệu rõ ràng và đầy đủ được cung cấp trong Glover và Laguna (1995, 1997). Trong chương sau chúng ta sẽ đi chi tiết vào kỹ thuật tìm kiếm này nhiều hơn cũng như các ứng dụng của nó 19 Tìm kiếm Tabu cũng giống như một số phương pháp tìm kiếm cục bộ khác mà chúng ta không thảo luận ở đây, chủ yếu chúng xem xét một số lân cận của một giải pháp hiện tại và cuối cùng để chọn hướng di chuyến đến.Các tính năng phân biệt của tìm kiếm Tabu là làm thế nào lựa chọn được việc thực hiện này. 19 Chú ý tìm kiếm Tabukhông phải là chỉ đơn giản là một vấn đề của việc lựa chọn các lân cận của những thử nghiệm thích hợp nhất.Tìm kiếm Tabu cũng sẽ đưa bạn vào một tài khoản và tập các đột biến. Ví dụ, nếu vị trí lân cận tốt nhất của giải pháp hiện tại của bạn là có thể đạt được bằng cách thay đổi đầu kia của một liên kết đang nổi lên từ nút k, nhưng chúng tôi một động thái đã được thực hiên gần đây như vậy trong một phiên trước đó, sau đó một người hàng xóm khác nhau có thể là lựa chọn thay thế. Sau đó, một lần nữa, ngay cả khi di chuyển tốt nhất hiện nay là của một loại đã được sử dụng gần đây, và thường là không được phép (tức là coi là "điều Tabu '), tìm kiếm Tabu cung cấp một cơ chế dựa trên tiêu Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 6 chuẩn nguyện vọng, mà sẽ cho phép chúng ta lựa chọn mà nếu những lân cận trong câu hỏi là đủ tốt hơn so với các giải pháp hiện tại (nói tới) 19 Do đó bất kỳ thực hiện tìm kiếm Tabu nào duy trì một số hình thức của bộ nhớ, ghi lại các thuộc tính nhất định của động thái gần đây.Những thuộc tính này phụ thuộc nhiều vào vấn đề, và điều này là một phần của nghệ thuật ứng dụng tìm kiếm Tabu. 19 Ví dụ, nếu chúng ta đang cố gắng để tối ưu hóa một cấu trúc liên kết mạng, một loại đột biến của nhà điều hành sẽ làm thay đổi các hệ thống cáp liên kết với các liên kết giữa các nút 1 và b. Trong thực hiện tìm kiếm Tabu của chúng ta, chúng ta có lẽ sẽ ghi lại chỉ có một thực tế rằng chúng ta đã di chuyển một thay đổi hệ thống cáp 'lặp đi lặp lại tôi, hoặc nếu không, chúng ta có thể hoặc bổ sung, chỉ cần ghi lại thực tế rằng chúng ta đã thực hiện một thay đổi kết hợp với một nút và khác liên kết với nút b. Nếu chúng ta chỉ ghi lại các loại cũ của thuộc tính, sau đó trong tương lai gần có thể thay đổi hệ thống cáp, di chuyển sẽ không được phép, độc lập với những gì các nút đã được tham gia.Nếu chúng ta ghi nhận chỉ có các loại sau của thuộc tính, sau đó gần như thay đổi tiềm năng trong tương lai liên quan đến a / và b có thể là không được phép, nhưng thay đổi hệ thống cáp, di chuyển, cho mỗi gia nhập sẽ được chấp nhận. 19 Ghi chú ngắn gọn của chúng tôi về loại tìm kiếm mô phòng và Tabu minh họa rằng các khía cạnh quan trọng của một phương pháp tìm kiếm cục bộ tốt là quyết định mà người hàng xóm để di chuyển đến. Tất cả các phương pháp tìm kiếm cục bộ sử dụng các ý tưởng cơ bản mà di chuyển cục bộ gần như luôn luôn là một ý tưởng tốt, tức là nếu bạn có một giải pháp tốt hiện nay, có thể là một một tốt hơn gần đó, và có thể dẫn đến những cái tốt hơn, và vv. Tuy nhiên, nó cũng rõ ràng mà đôi khi, có lẽ thường, chúng ta phải chấp nhận thực tế rằng chúng ta chỉ có thể tìm thấy các cải thiện các giải pháp hiện tại bằng cách tạm thời chúng ta hy vọng di chuyển đến những người tồi tệ hơn. Mô phỏng luyện kim và tìm kiếm Tabu là hai cách tiếp cận chính để đối phó với vấn đề này. Thật không may, tuy nhiên, nó gần như là không bao giờ rõ ràng, đưa ra một vấn đề cụ thể, cách tốt nhất để thiết kế và thực hiện phương pháp là gì. Có nhiều sự lựa chọn để thực hiện, đầu tiên là quyết định làm thế nào để đại diện cho một giải pháp ứng cử viên ở nơi đầu tiên 20 Ví dụ, một cấu trúc liên kết mạng có thể được biểu diễn như là một danh sách các liên kết, nơi mà mỗi liên kết là một cặp của các nút (a, b). Giải mã một danh sách vào một cấu trúc liên kết mạng chỉ đơn giản là số tiền để vẽ một liên kết điểm-điểm cho mỗi cặp nút trong danh sách. Ngoài ra, chúng ta có thể đại diện cho một cấu trúc liên kết mạng như là một chuỗi nhị phân, có chứa nhiều bit như là các liên kết có thể. EAC h vị trí trong chuỗi bit sẽ giới thiệu cụ thể một liên kết điểm-điểm tiềm năng, Vì vậy, một giải pháp candidiate như '10010'chỉ ra rằng có một liên kết điểm-điểm giữa các nút 1 và 2, không có giữacác nút 1 và 3, 1 và 4, nhưng có một trong giữa nút 1 và 5, và vv… Nói chung, có rất nhiều cách sáng tạo ra một phương pháp để đại diện cho các giải pháp cho một vấn đề. Sự lựa chọntất nhiêncũng ảnh hưởng đến thiết kế của các nhà khai thác khu vực. 20 Trong ví dụ trên việc loại bỏ một liên kết từ cấu trúc liên kết liên quan đến hai loại khác nhau của hoạt động trong hai đại diện. Trong trường hợp danh sách các node đôi, chúng ta cần phải thực sự loại bỏ một cặp từ danh sách. Trong trường hợp nhị phân, chúng ta thay đổi một 1 đến 0 trong một vị trí đặc biệt trong chuỗi. Xây dựng các cơ quan đại diện và các nhà khai thác là một phần của nghệ thuật sử dụng hiệu quả tìm kiếm cục bộ để giải quyết các vấn đề tối ưu hóa cứng. Một phần quan trọng của nghệ thuật này, tuy nhiên, là sử dụng kiến thức vấn đề cụ thể hoặc chẩn đoán hiện tại nơi có thể 21 Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 7 Ví dụ, một vấn đề với một trong hai đại diện chúng tôi đã ghi nhận cho đến nay mạng lưới cấu trúc liên kết là một ngẫu nhiên tạo ra điển hình cấu trúc liên kết cũng có thể là không có liên quan. Đó là, một giải pháp ứng cử viên có thể chỉ đơn giản là không có đường dẫn giữa mỗi cặp của các nút. Thông thường, chúng ta sẽ chỉ quan tâm đến mạng lưới kết nối, vì vậy bất kỳ nỗ lực tìm kiếm thuật toán chi tiêu trong kết nối với mạng không có liên quan đánh giá có vẻ khá lãng phí. Đây là nơi mà kiến thức cơ bản miền và chẩn đoán hiện tại sẽ đến trong hữu ích 21 Đầu tiên, bất kỳ nhà thiết kế mạng lưới tốt sẽ biết về các khái niệm lý thuyết đồ thị khác nhau, chẳng hạn như cây kéo dài, hortest các thuật toán tìm đường, và vv. Nó không phải là khó khăn để đưa ra một thay đổi danh sách các đại diện nút đôi, đảm bảo rằng tất cả các giải pháp ứng cử viên có chứa một cây bao trùm cho mạng, và do đó hiện đang kết nối. Một cách để làm điều này là liên quan đến việc giải thích đầu tiên cặp node gián tiếp. Thay vì (a, b) chỉ ra rằng mạng lưới này có chứa một liên kết giữa a và b, nó thay vào đó sẽ có nghĩa là nút ATH kết nối sẽ được kết nối với các nút không có liên quan BTH. Bằng cách này, mỗi cặp nút tiếp theo cho thấy làm thế nào để tham gia vào một nút như được nêu ra không sử dụng một cây trải rộng đang phát triển. Khi tất cả các nút được kết nối như vậy, còn lại nút cặp có thể được giải thích trực tiếp 21 Vấn đề còn tốt hơn nữa là chúng ta có thể có địa chỉ có thể sẽ liên quan đến vấn đề chi phí, và chi phí của các liên kết cụ thể sẽ đóng một vai trò quan trọng trong chức năng hoặc trung tâm. Sau đó cho chúng ta biết rằng một số thuật toán cũng được biết đến và nhanh chóng thoát ra mà tìm thấy một cây minmal đề cập tới vấn đề chi phí kéo dài (Kruskal, 1956; Prim, 1957). Vì vậy, để tốt hơn là tùy thuộc vào các chi tiết khác nhau của vấn đề trong tay ta có, để khởi tạo mỗi giải pháp ứng cử viên với một cây chi phí tối thiểu, và tất cả những gì chúng ta cần để đại diện cho các liên kết mà chúng ta thêm lên cây này 21 Có một số cách khác trong lĩnh vực kiến thức hoặc chẩn đoán hiện tại có thể được sử dụng để hưởng lợi một cách tiếp cận tìm kiếm cục bộ cho một vấn đề tối ưu hóa. Một cái gì đó về vấn đề này có thể cho chúng ta biết, ví dụ như là những loại đột biến có một cơ hội tốt hơn dẫn đến lân cận tốt. Một phương pháp khám phá hiện có, nhanh chóng phân công các kênh trong một mạng lưới điện thoại di động, có thể được sử dụng để cung cấp điểm khởi đầu cho một tìm kiếm cục bộ cố gắng tìm giải pháp tốt hơn 22 Đây là một phương cách của thuật toán thay thế, bây giờ trở nên rất phổ biến, được xây dựng trên ý tưởng tìm kiếm địa phương bằng cách sử dụng quần thể. Có hai phương cách để tăng cường các cơ hội của việc tìm kiếm giải pháp tốt. Đầu tiên, kể từ khi chúng tôi có một quần thể, chúng ta có thể dành nhiều thời gian tìm kiếm trong các khu vực khác nhau cùng một lúc. Một thuật toán dựa trên quần thể có xu hướng chia sẻ các nỗ lực tính toán đến các giải pháp ứng cử khác nhau . Một phần thời gian sẽ được chi tiêu tìm kiếm trong khu vực của các giải pháp trung bình và điều này sẽ dẫn đến việc tìm kiếm được đột biến đặc biệt , sau đó cân bằng tải nỗ lực tính toán sẽ được sửa đổi phù hợp. 22 Một cơ hội khác được cung cấp bởi các kỹ thuật dựa trên quần thể là chúng ta có thể thử vận hành tái tổ hợp. Đây là những cách sản xuất đột biến, nhưng lần này từ hai hay nhiều giải pháp, chứ không phải chỉ một. Do đó kết quả có thể được gọi là tái tổ hợp, chứ không phải là một đột biến. Tái tổ hợp là một phương pháp cung cấp một cách lựa chọn tốt trong không gian rộng lớn của khả năng. 22 Ví dụ, nếu hai giải pháp cha mẹ là mỗi một vector của các yếu tố k, một nhà điều hành tái tổ hợp được gọi là thống nhất chéo sẽ xây dựng một trẻ em từ cha mẹ, cho mỗi phần tử lần lượt, ngẫu nhiên giá trị của nó từ một trong hai nơi. Đứa trẻ có thể có được 50% khác nhau từ mỗi cha mẹ của nó. 22 Dưới đây là các bước cho một thuật toán dựa trên quần thể chung 22 Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 8 Bước 1(Bắt đầu): tạo ra một kế cận ban đầu của các giải pháp ứng cử viên. Đánh giá mỗi người trong số họ 23 Bước 2: Chọn một số dân là cha mẹ 23 Bước 3: Áp dụng các nhà khai thác tái tổ hợp và đột biến để các bậc cha mẹ để sản xuất một số trẻ em. 23 Bước 4: Kết hợp các trẻ em vào kế cận 23 Bước 5: Cho đến khi đạt được một tiêu chí chấm dứt, trở về bước 2 23 Đặc điểm của các bước cụ thể như sau: 23 Bước 2: thường sử dụng một sự tồn tại của các fittest chiến lược, đây là nơi mà tải chia sẻ, thảo luận ở trên đi vào chơi. Fitter một giải pháp ứng cử viên, cơ hội nhiều hơn nó có là một người mẹ, và do đó cơ hội có được rằng các thuật toán sẽ khám phá các vùng lân cận. Có một số lựa chọn kỹ thuật khác nhau, hầu hết trong số đó có thể được parameterised để làm thay đổi mức độ mà cha mẹ fitter được ưa thích (áp lực chọn lọc). 23 Bước 3 áp dụng hoặc tái tổ hợp hoặc điều hành đột biến, hoặc cả hai.Có tất cả các loại tiêu chuẩn vận hành tái tổ hợp và đột biến, nhưng - như chúng tôi gợi ý ở trên - các lợi ích thực sự đến khi nghĩ rằng một số đã được đưa vào thiết kế các loại cụ thể của các nhà điều hành bằng cách sử dụng kiến thức miền. . 23 Bước 4: chúng ta đang gần như luôn luôn duy trì một quy mô kế cận cố định. Vì vậy, nếu chúng ta có một kế cận 100, nhưng 20 trẻ em để kết hợp, sau đó 20 những 120 phải được loại bỏ. Một cách tiếp cận chung là chỉ cần loại bỏ ít nhất 20 phù hợp với các nhóm kết hợp, nhưng có một vài cách tiếp cận khác, chúng tôi có thể sử dụng một kỹ thuật gọi là "tràn ngập", ví dụ như De Jong (1975), trong đó đa dạng đóng một vai trò quan trọng trong các quyết định về những gì các giải pháp ứng cử viên để loại bỏ 23 Ví dụ, chúng tôi chắc chắn sẽ thích để loại bỏ giải pháp trong lợi của một t giải pháp phù hợp không, nếu nó xảy ra là trường hợp đó đã có một bản sao trong kế cận, nhưng t là 'mới'. 23 Bước 5: chúng ta nên chỉ ra một số vấn đề thuật ngữ. Có những thuật toán dựa trên kế cận nhiều, và trong thực tế, họ thường được gọi là thuật toán tiến hóa (địa bàn) 23 Một thuật ngữ phổ biến khác sử dụng thuật toán di truyền, đó đúng là một gia đình của các phương pháp như vậy mà luôn luôn sử dụng một nhà điều hành tái tổ hợp (Hà Lan, năm 1965, Goldberg, năm 1989), trong khi các tổ chức khác của các thuật toán gọi là tiến hóa lập trình (Fogel, 1995) và sự tiến hóachiến lược (Quay lui, năm 1996), xu hướng sử dụng đột biến, nhưng được bỏ eclever về cách họ sử dụng nó. Trong mọi trường hợp, một giải pháp ứng cử viên có xu hướng được gọi là nhiễm sắc thể và các yếu tố của nó được gọi là gen 23 Để giải quyết nhu cầu tối ưu hóa vốn có của môi trường viễn thông, việc trực tiếp sử dụng các kỹ thuật tối ưu hóa địa phương hoặc dân số dựa trên đôi khi có thể là khá phù hợp. Bởi vì nó có thể mất quá lâu để đưa một giải pháp tốt, và như vậy từ thời gian đến giải pháp, vấn đề đã được thay đổi ! 24 Những gì chúng ta cần thay vì trong bối cảnh này là một cách để đưa ra quyết định rất nhanh, nhưng rất tốt,. Ví dụ, để quyết định những bước nhảy tiếp theo tốt nhất là cho một gói tin đến một nút đích d, chúng ta có lẽ có thể chạy một mô phỏng của các mạng cho các mô hình tầng vận chuyểnhiện hành hiện nay và ước tính thời gian đến khả năng ở các điểm đến cho cho có thể bước nhảy tiếp theo. Kết quả mô phỏng như vậy sẽ cung cấp cho chúng tôi với một sự lựa chọn đầy đủ thông tin, và sau đó chúng tôi có Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 9 thể gửi các gói dữ liệu một cách thích hợp trên con đường của nó. Bây giờ, nếu chúng tôi có thể ở trên trong một vài micro giây, chúng ta sẽ có một chiến lược định tuyến gói tin phù hợp và rất có lợi nhuận. 24 Tuy nhiên, kể từ khi nó có thể sẽ mất vài giờ để làm một mô phỏng chính xác bằng cách sử dụng các loại sức mạnh xử lý và bộ nhớ thường có sẵn các thiết bị chuyển mạch mạng, trong thực tế nó là một ý tưởng vô lý! Thay vào đó, chúng tôi cần một số cách làm cho quyết định đúng đắn một cách nhanh chóng, nhưng quyết định bằng cách nào đó sẽ đưa vào tài khoản các trường hợp hiện hành. Lý tưởng nhất, chúng tôi đang tìm kiếm một 'hộp đen', khi cho ăn với một câu hỏi và một số chỉ tiêu môi trường, cung cấp một câu trả lời hợp lý và ngay lập tức. Một ví dụ của một hộp đen như là một bảng định tuyến của các loại thường thấy trong các mạng chuyển mạch gói. Câu hỏi được hỏi bởi một gói tin truyền thông là: cuối cùng tôi muốn để có được d, vì vậy mà tôi nên đi tiếp theo? Bảng định tuyến, thông qua một tra cứu đơn giản được lập chỉ mục của d, rất nhanh chóng cung cấp một câu trả lời và gửi nó theo cách của mình. 24 Những rắc rối với điều này, tất nhiên, là nó về cơ bản là không thích nghi. Trừ khi các giao thức quản lý mạng tiên tiến nhất định trong hoạt động, bảng định tuyến sẽ luôn luôn cung cấp cho các câu trả lời tương tự, ngay cả khi các liên kết trở đi từ hop tiếp theo đề nghị d được rất nhiều tắc nghẽn tại thời điểm này. Hộp đen của chúng tôi do đó thường được thay đổi bằng cách nào đó, và thích nghivới điều kiện hiện hành. Trong thực tế, chương tám và chín cả hai thảo luận về cách làm điều này liên quan đến các bảng định tuyến trong các mạng chuyển mạch gói 25 Vì vậy, kỹ thuật thích nghi trong bối cảnh viễn thông có xu hướng liên quan đến các hộp đen, hoặc các mô hình, bằng cách nào đó tìm hiểu và thích nghivới 'offline' nhưng có thể phản ứng rất nhanh chóng và thích hợp khi được hỏi về quyết định. Trong một số chương có liên quan đến thích ứng, các kỹ thuật sử dụng chúng tôi đã thảo luận đã có trong mục 1.3, nhưng thay đổi một cách thích hợp trong ánh sáng của sự cần thiết phải quyết định nhanh chóng. Mặc dù, trong những người khác, một số các kỹ thuật hiện đại quan trọng được tuyển dụng, mà bây giờ chúng ta sẽ một thời gian ngắn giới thiệu. Đây là những trung tâm tính toán, logic mờ và lý thuyết trò chơi. Vai trò của trung tâm tính toán trong bối cảnh này là để phát triển một diễn đàn mô hình, mà học(ví dụ) làm thế nào để làm cho các quyết định đúng đắn trong các bộ khác nhau của hoàn cảnh. Kết quả đào tạo mạng lưới trung tâm sau đó được sử dụng trực tuyến như là nhà sản xuất ision tháng mười hai. Vai trò của logic mờ là cung cấp một cách sản xuất các quy tắc mạnh mẽ đó cung cấp các quyết định. Điều này về cơ bản sản xuất một decisionmaker hộp đen, giống như một mạng lưới trung tâm, nhưng với hoạt động nội bộ khác nhau. Cuối cùng, lý thuyết trò chơi cung cấp một cách khác để tìm kiếm kịch bản phức tạp, mạng lưới năng động. Về cơ bản, nếu chúng ta xem một số khía cạnh của quản lý mạng như là một 'trò chơi, một tập hợp một số phương trình và các mô hình nổi tiếng đi vào chơi, mà lần lượt cung cấp xấp xỉ tốt với sự năng động của mạng thực sự. Do đó, một số quyết định quản lý mạng có thể được hỗ trợ bằng cách sử dụng những phương trình này 25 Tính toán Nơ-ron (Rumelhart và MacClelland năm 1989; Haykin năm 1998) cơ bản là một phân loại mô hình kỹ thuật, nhưng với khả năng ứng dụng rộng rãi bao la hơn cho thấy ngay từ cái nhìn đầu tiên. Sức mạnh thực sự của phương pháp này nằm trong thực tế là chúng tôi không cần phải biết làm thế nào để phân biệt một loại mô hình khác. Để xây dựng một hệ thống dựa trên nguyên tắc chuyên gia cổ điển cho các mô hình phân biệt, ví dụ, chúng tôi rõ ràng sẽ cần để có được các quy tắc, và xây dựng chúng vào hệ thống. Nếu chúng ta sử dụng tính toán trung tâm, tuy nhiên, một dạng đặc biệt của hộp đen được gọi là một mạng trung tâm cơ bản sẽ tìm hiểu các quy tắc cơ bản của ví dụ. Một ứng dụng điển hình của kỹ thuật này là trong đánh giá rủi ro tín dụng 25 Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 10 Các quy định mà cơ sở cho một quyết định về việc ai sẽ hay không sẽ là một rủi ro tín dụng tốt, giả sử rằng chúng ta bỏ qua trường hợp như vậy rõ ràng là những người có tiền có thế chấp cao, nhưng lương thấp (ieone đồng của các biên tập viên của cuốn sách này),rất phức tạp nếu thực sự họ có thể được thể hiện ở tất cả. Chúng ta có thể đào tạo một mạng lưới trung tâm để dự đoán những rủi ro xấu, tuy nhiên, chỉ đơn giản bằng cách cung cấp một bộ các ví dụ được biết đến, chẳng hạn như p người từ r khu vực với tiền lương và nghề y mặc định trên một khoản vay kích thước m; q người với mức lương t Với những thứ như p, r, s, …như đầu vào, mạng lưới trung tâm dần dần điều chỉnh trong nội bộ một cách cuối cùng sản xuất sản lượng chính xác (dấu hiệu cho thấy khả năng mặc định cho mượn) cho mỗi người trong số các ví dụ được đào tạo. Đáng chú ý, và rất hữu ích, sau đó chúng tôi có thể mong đợi các mạng trung tâm để cung cấp dự đoán tốt khi cung cấp đầu vào trước đó không thấy 26 Bên trong, một mạng lưới trung tâm là một cấu trúc rất đơn giản, nó chỉ là một bộ sưu tập của các nút với liên kết liên kết đầu vào và đầu ra, mà không xử lý đơn giản: nó cho biết thêm các con số đến thông qua các liên kết đầu vào của nó, mỗi trọng bằng một giá trị sức mạnh liên kết với các liên kết đến thông qua, sau đó quá trình này tổng hợp (thường là chỉ để biến đổi nó với một số giữa 0 và 1), và gửi kết quả qua các liên kết đầu ra của nó. Mạng lưới trung tâm của cái gọi là "thức ăn về phía trước là một bộ sưu tập của các nút, tổ chức thành các lớp. Các đầu vào vấn đề đến như là đầu vào cho mỗi lớp đầu tiên của các nút, các kết quả đầu ra từ lớp này thức ăn vào lớp thứ hai, và như vậy, mặc dù thường chỉ có ba lớp. 26 Rõ ràng, con số đó đi ra vào cuối phụ thuộc vào những gì đến các lớp đầu vào, một cách mật thiết xác định bởi trọng lượng vào các liên kết. Precisley các trọng lượng bị thay đổi dần dần trong một thời trang nguyên tắc của quá trình đào tạo. Cổ điển, điều này là một phương pháp gọi là backpropagation (Rumelhart và MacClelland, 1989), nhưng có nhiều phiên bản hiện đại. Thật vậy, các loại của mạng chúng tôi đã mô tả ngắn gọn ở đây chỉ là một trong nhiều loại có sẵn (Haykin, 1999) 26 Trong một số trường hợp, chúng ta có thể nghĩ ra các quy tắc ban đầu cho miền vấn đề của chúng ta. Ví dụ, nếu giao thông là nặng, sử dụng nút a, và nếu giao thông là rất nặng nề, sử dụng nút b. Tuy nhiên, quy định như vậy không phải là rất hữu ích mà không có một cách tốt để quyết định những gì nặng "hoặc" rất nặng "thực sự có nghĩa là sử dụng liên kết, ví dụ. Trong một phương pháp tiếp cận hệ thống cổ điển chuyên gia, chúng tôi sẽ áp dụng ngưỡng xác định trước cho những ngôn ngữ "biến" cái gọi là, và quyết định, ví dụ, đó là giao thông là nặng "có nghĩa là việc sử dụng các liên kết trong câu hỏi là giữa 70% và 85%. Điều này có thể có vẻ tốt đẹp, nhưng nó không phải là khó khăn để thấy rằng 69,5% sử dụng có thể gây ra vấn đề, trong kịch bản như vậy, các quy định có điều kiện là 'giao thông vừa phải (55% đến 70%, có lẽ) sẽ được sử dụng, nhưng nó có thể có thích hợp hơn, và mang lại một kết quả tốt hơn, sử dụng giao thông nặng 27 Logic mờ sẽ cung cấp một cách để sử dụng các biến ngôn ngữ giao dịch với các vấn đề ngưỡng một cách rất tự nhiên và mạnh mẽ. Trong thực tế, nó gần như rids chúng ta về một nhu cầu về các ngưỡng, mọi thứ thay vì giới thiệu được gọi là chức năng thành viên. Chúng tôi không còn có lưu lượng truy cập đó có thể là nặng hoặc trung bình. Thay vào đó, một giá trị lưu lượng truy cập nhất định để một số mức độ nặng, và ở một mức độ khác vừa phải. Các mức độ phụ thuộc vào các giá trị số thực tế bằng cách chức năng thành viên, đó là "chức năng hình tam giác, thường đơn giản. Ví dụ, mức độ tầng vận chuyểnnặng có thể là 0 từ 0% và 35% sử dụng, sau đó có thể tăng suốt 1 từ 35% và 75%, và sau đó thả trôi chảy là 0 một lần nữa giữa 75% và 90%, 0 từ đó. Chức năng thành viên cho các biến ngôn ngữ rất nặng nề sẽ [...]... Nơ-ron, Logic mờ và lý thuyết trò chơi CHƯƠNG 2: ĐIỀU KHIỂN LUỒNG THÔNG MINH THEO KHUÔN KHỔ LÝ THUYẾT TRÒ CHƠI Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 30 I ĐIỀU KHIỂN NHẬN KẾT NỐI DỰA TRÊN MÔ HÌNH LÝ THUYẾT TRÒ CHƠI TRONG CÁC MẠNG LƯỚI ATM 1 Sơ lược các điều khiển tắc nghẽn trong mạng ATM Asynchronous Transfer Mode (ATM) đã dần dần trở thành tiêu chuẩn trong băng thông rộng dịch vụ... băng thông có thể phân bổ giữa các loại hình lưu lượng hình thành một tập hợp các chiến lược, và kết quả của trò chơi được đánh giá với các tiện ích của hai cầu thủ cụ thể là u = {u1, Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 35 u2}, ui  R Ký hiệu U là tập hợp của tất cả các kết quả có thể xảy ra của trò chơi giữa hai người chơi, và giả định rằng U là lồi và nhỏ gọn Lưu ý rằng điều. .. băng thông tương đương đã được trình bày bằng cách sử dụng các mạng thần kinh và lý thuyết tập mờ Ví dụ, Hiramatsu (1991) đề xuất một CAC một khuôn khổ và thực thi lưu lượng bằng cách sử dụng một mạng lưới thần kinh, Chang Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 32 Cheng (1994) đề xuất một phương pháp điều chỉnh lưu lượng truy cập dựa trên một mạng lưới thần kinh mờ; Ndousse (1994)... viễn thông 29 + Các vấn đề động và thích nghi .29 + Các mô hình kỹ thuật chẩn đoán với 2 cách tìm kiếm chính: Tìm kiếm cục bộ và tìm kiếm dựa trên quần thể 29 + Kỹ thuật tính toán thích nghi giúp ta làm quen với 3 phương pháp tính toán:tính toán Nơ-ron, Logic mờ và lý thuyết trò chơi 29 Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi. .. tính toán để giải quyết các mô hình phức tạp và các vấn đề tối ưu hóa trong phân bổ tài nguyên Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 15 CHƯƠNG 1: GIỚI THIỆU CÁC KỸ THUẬT CHẨN ĐOÁN TRONG VIỄN THÔNG I TỐI ƯU HÓA TRONG VIỄN THÔNG Sự phức tạp trong phạm vi rộng lớn của các mạng viễn thông hiện đại ngày nay cung cấp cho chúng ta nhiều thách thức cũng như những cơ hội mới Trong chương... 4) với thời gian Như ta có thể cho biết từ biểu thức trên, điều này có nghĩa là xác suất chấp nhận đột biến tồi tệ hơn cũng sẽ giảm theo thời gian Chính bởi thế mà mô phỏng luyện kim là phương pháp rất mạnh, mặc dù khá khó khăn để có được các thông số đúng (xem thêm Dowsland (1995)) Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 19 1.2 Tìm kiếm Tabu Một cách khác để thực hiện việc tối... nhà cung cấp Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 29 dịch vụ khác Theo giả định, sự năng động của mạng, bao gồm bộ nhất định, ví dụ, hoạt động liên tục của người sử dụng chuyển đổi cho các nhà cung cấp dịch vụ khác nhau đôi khi dựa trên mức thuế mới được quảng cáo, sẽ chịu sự tương đồng đáng kể với các mô hình khác nhau của cuộc thi đã được phát triển trong lý thuyết sinh học,... quản lý khá phức tạp có thể cần phải được thực hiện một cách nhanh chóng và thường xuyên Ví dụ, để duy trì thị phần, mức thuế mới có thể cần phải được thiết lập theo giờ, và hoàn toàn tự động, trên cơ sở của hoạt động hiện hành về đăng ký mới, khách hàng mất hiệu lực, và tin tức của các mức thuế mới được thiết lập bởi các nhà cung cấp dịch vụ Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi. .. QoS (ví dụ tỷ lệ mất rate, sự chậm trễ tối đa chấp nhận được) và có chứa tất cả thống kê mô tả của luồng Nếu mạng có đủ băng thông và bộ đệm để truyền tải các nguồn lưu lượng truy Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 31 cập mới, sau đó nó sẽ chấp nhận điều này yêu cầu người sử dụng và phân bổ các nguồn lực cần thiết Nếu không, cuộc gọi sẽ bị chặn hoặc bị từ chối Tuy nhiên, bởi.. .Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 11 chồng chéo với điều này, vì vậy mà một giá trị lưu lượng truy cập của 82,5% có thể là "nặng" đến mức 0,5, và “rất nặng” với mức độ 0,7 .27 Với điều kiện môi trường nhất định, quy tắc khác nhau do đó sẽ áp dụng cho các mức độ khác nhau . Lê Nhật Thăng HV: Lớp: M11CQCK01-B Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 2 Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 3 MỤC LỤC MỤC LỤC 3 MỞ ĐẦU 13 Sự. toán Nơ-ron, Logic mờ và lý thuyết trò chơi 29 Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 13 MỞ ĐẦU Trong những năm gần đây, luồng điều khiển và quản lý mạng trong các mạng tốc. Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 12 đối thủ. Phương pháp tiếp cận lý thuyết trò chơi được phát triển bởi một số người đóng góp vào cuốn sách này sẽ có một vai trò

Ngày đăng: 20/06/2014, 22:43

Xem thêm: điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi