Slide môn lý thuyết trò chơi: cân bằng NASH chiến lược hỗn hợp

24 2.9K 6
Slide môn lý thuyết trò chơi: cân bằng NASH chiến lược hỗn hợp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

GAME THEORY 1 Nội dung thảo luận 1. Giới thiệu chung 2. Sự tồn tại chiến lược cân bằng Nash 3. Bài toán 2.6 2 1.Giới thiệu chung 1. Nhà toán học Nash. •. Người Mỹ (1928) •. Chuyên ngành LTTC và hình học vi phân. •. Năm 1944 đạt giải nobel về kinh tế. 2. Cân bằng Nash (NE). •. Trò chơi dạng chuẩn: G={S,u}. •. Vectơ chiến lược (s*1,…,s*n) là 1 cân bằng Nash nêu : ui(s*i, s*-i) ≥ (si, s*-i) •. Hay s*i là nghiệm của bài toán: (s*i…s*i-1,si,s*i+1…sn) 3 ax si Si M ¢ 2.Sự Tồn Tại Cân Bằng Nash • Nội Dung A. Sự tồn tại cân bằng Nash chiến lược hỗn hợp B. Trình bày ví dụ 2.6 A-Sự tồn tại cân bằng nash chiến lược hỗn hợp • Ví dụ về thiết lập bài toán để tìm chiến lược cân bằng • Bài toán tổng quát • Định nghĩa 5 +Giả sử có 2 đấu thủ: Thu hoạch của mỗi đối thủ được cho ở bảng: + Giả sử (pt,pb) là xác suất để đối thủ hàng chơi chiến lược (T,B);(pl,pr) là xác suất để đối thủ cột chơi chiến lược (L,R). => Lợi ích kỳ vọng của đấu thủ hàng là: pt*[pl*2+pr*0]+pb*[pl*0+pr*1] Lợi ích kỳ vọng của đấu thủ cột là : pl*[pt*1+pb*0]+pr*[pt*0+pb*2] =>Bài toán tìm lợi ích cực đại lợi ích kỳ vọng của đấu thủ hàng: Max pt{pl*2+pr*0}+pb{pl*0+pr*1} pt,pb với ràng buộc: pt+pb=1; pt>=0,pb>=0 Với đấu thủ cột: Max(pl,pr) pt*{pt*1+pb*0)+pr*{pt*0+pb*2) với ràng buộc pl+pr=1; pl.pr>=0 Giải ra ta được pl=1/3, pr=2/3 và pb=1/3 pt=2/3  Ví dụ: Trò chơi 2 đấu thủ Đấu thủ cột Đấu thủ hàng L R T 2,1 0,0 B 0,0 1,2 6  Bài toán tổng quát • Kí hiệu J là số chiến lược thuần túy trong và K là số chiến lược thuần túy trong • Ta viết ; và sd , để kí hiệu các chiến lược thuần túy tùy ý trong và • Nếu đấu thủ 1 tin rằng đấu thủ 2 sẽ chơi các chiến lược với các xác suất => thu hoạch kỳ vọng của đấu thủ 1 với chiến lược thuần túy là: và thu hoạch kỳ vọng của đấu thủ 1 chơi chiến lược hỗn hợp là : • Để chiến lược hỗn hợp là phàn ứng tốt nhất của đấu thủ 1 đối với chiến lược hỗn hợp của đấu thủ 2 thì phải có >0 chỉ nếu với mọi trong ≥ 7 Bài toán tổng quát (tiếp) • Làm tương tự đấu thủ 2 như đấu thủ 1 • là cân bằng Nash chiến lược hỗn hợp nếu chúng là nghiệm của bài toán : hay 0≤ 8  Định nghĩa : Cân bằng nash chiến lược hỗn hợp • Trong trò chơi dạng chuẩn của hai đấu thủ G={ S1,S2;u1,u2},các chiến lược hỗn hợp (p*1,p*2) là một cân bàng Nash nếu chiến lược hỗn hợp của mỗi đấu thủ là một phàn ứng tốt nhất đối với chiến lược của đối thủ kia. 9 3-Ví dụ 2.6 • Xét bài toán 2 người chơi, mỗi người 2 chiến lược thuần túy Xét các thu hoạch của đấu thủ 1 ở bảng: • Chiến lược hỗn hợp của 1 với (L,X) là (r,1-r) của 2 với (T,P) là (q, 1-q) • Xét 4 trường hợp I. x>z và y>w II. x<z và y<w III. x>z và y<w IV. x<z và y>w Thuần Túy (2) T P (1) L x,? y,? X z,? w ,? Hỗn Hợp (2) T(q) P(1-q) (1) L(r) x,? y,? X(1-r) z,? w,? 10 [...]... điểm cân bằng Nash • Ta cho bất kỳ 1 trong 4 hàm phản ứng tốt nhất của đấu thủ 1( r*(q)) kết hợp với bất kỳ 1 trong 4 hàm phản ứng tốt nhất của đấu thủ 2 ( q*(r)) • Ta thấy cặp phản ứng tốt nhất này cho ít nhất 1 giao điểm, do đó trò chơi có ít nhất 1 cân bằng Nash • Kiểm tra 16 cặp phản ứng có thể có ,ta có thể phân ra làm các TH để xét cân bằng Nash: Điểm NE 1 Một cân bằng Nash thuần túy: 2 Một cân bằng. .. ứng có thể có ,ta có thể phân ra làm các TH để xét cân bằng Nash: Điểm NE 1 Một cân bằng Nash thuần túy: 2 Một cân bằng Nash hỗn hợp (NE) 1 điểm NE hỗn hợp 3 Hai NE thuần, một NE hỗn hợp 4 Một NE thuần, một tập NE hỗn hợp: NE thuần 1 tập NE hỗn hợp 5.Hai NE thuần, một tập NE hỗn hợp: 4- Vài mẩu truyện vui-thảo luận • 1-Đi thẳng vào tù (Câu chuyện 2 người tù) Người nhạc trưởng dàn giao hưởng ở Liên... X T P q’=1 • Tương tự, Xét thu hoach của người chơi thứ 2 Thuần túy • Cũng như trên mỗi người chơi (2) T L (1) và chiến lược hỗn hợp của: P ?,x’ ?,y’ X đều có 2 chiến lược thuần túy ?,z’ ?,w’ (1) với (L,X) là (r,1-r) (2) với (T,P) là (q,1-q) Hỗn hợp • Tương tự trên, ta cũng xét 4 trường hợp:  x’>y’ và z’>w’  x’z và yq’ thì L là tốt nhất; qz và y> w +Rõ ràng L phản ứng tốt nhất với mọi q, tức là lên trội ngặt so với xuống +Ta có thể biểu diễn các hàm phản ứng tốt nhất của (i) bằng đồ thị: r L r*(q) (i) X T q P II- TH2: x . Tại Cân Bằng Nash • Nội Dung A. Sự tồn tại cân bằng Nash chiến lược hỗn hợp B. Trình bày ví dụ 2.6 A-Sự tồn tại cân bằng nash chiến lược hỗn hợp • Ví dụ về thiết lập bài toán để tìm chiến lược. 8  Định nghĩa : Cân bằng nash chiến lược hỗn hợp • Trong trò chơi dạng chuẩn của hai đấu thủ G={ S1,S2;u1,u2},các chiến lược hỗn hợp (p*1,p*2) là một cân bàng Nash nếu chiến lược hỗn hợp của mỗi. ít nhất 1 cân bằng Nash. • Kiểm tra 16 cặp phản ứng có thể có ,ta có thể phân ra làm các TH để xét cân bằng Nash: 1. Một cân bằng Nash thuần túy: Điểm NE 19 2. Một cân bằng Nash hỗn hợp (NE) 3.

Ngày đăng: 03/04/2015, 16:53

Từ khóa liên quan

Mục lục

  • Slide 1

  • Nội dung thảo luận

  • 1.Giới thiệu chung

  • 2.Sự Tồn Tại Cân Bằng Nash

  • A-Sự tồn tại cân bằng nash chiến lược hỗn hợp

  • Ví dụ: Trò chơi 2 đấu thủ

  • Bài toán tổng quát

  • Bài toán tổng quát (tiếp)

  • Định nghĩa : Cân bằng nash chiến lược hỗn hợp

  • 3-Ví dụ 2.6

  • TH1 x>z và y> w

  • II- TH2: x<z và y<w

  • Slide 13

  • TH3: x>z và y<w

  • TH4:x<z và y>w

  • Th đặc biệt :w=y thì q’=0; x=z thì q’=1

  • Slide 17

  • Ta có các đồ thị biểu diễn các TH trên như sau:

  • Biện luận điểm cân bằng Nash

  • Slide 20

Tài liệu cùng người dùng

Tài liệu liên quan