PHƯƠNG PHÁP MÔ PHỎNG THỐNG KÊ

72 347 1
PHƯƠNG PHÁP MÔ PHỎNG THỐNG KÊ

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN HOÀNG VĂN HÀ PHƯƠNG PHÁP MÔ PHỎNG TRONG THỐNG KÊ Chuyên ngành: Lý thuyết Xác suất và Thống kê Toán học Mã số: 60 46 15 LUẬN VĂN THẠC SĨ: TOÁN HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN BÁC VĂN TP. Hồ Chí Minh - 2010 Lời cảm ơn Tôi xin gửi lời cám ơn chân thành và sâu sắc nhất đến PGS.TS Nguyễn Bác Văn, người đã tận tình giảng dạy và dìu dắt, giúp đỡ tôi trong quá trình học tập và hoàn thành luận văn. Tôi xin trân trọng cảm ơn TS Tô Anh Dũng, các thầy cô khoa Toán- tin học và đặc biệt là các thầy cô, đồng nghiệp trong bộ môn Xác suất - Thống kê đã tạo điều kiện thuận lợi cho tôi hoàn thành khóa học. Cuối cùng, tôi xin cảm ơn gia đình, bạn bè đã tin tưởng và động viên tôi trong suốt thời gian qua. TP HCM, tháng 5 năm 2010 Hoàng Văn Hà 1 Lời nói đầu Mô phỏng là một phương pháp số để thực hiện các thí nghiệm trên máy tính. Nó cho phép ta xây dựng và kiểm tra các mô hình trong thực tế. Trong thống kê, các thí nghiệm mô phỏng thường được sử dụng để nghiên cứu những tính chất của các phương pháp thống kê. Nhiều quá trình ngẫu nhiên trong thực tế đã được mô phỏng trên máy tính với sự trợ giúp của số ngẫu nhiên. Luận văn trình bày các phương pháp mô phỏng và một áp dụng vào phương pháp bootstrap trong thống kê. Luận văn gồm năm chương:  Chương 1 trình bày các kiến thức cơ sở về biến ngẫu nhiên, một số kết quả được sử dụng trong trong luận văn.  Chương 2 trình bày các phương pháp tạo số ngẫu nhiên.  Chương 3 và 4 trình bày cách tạo biến ngẫu nhiên rời rạc và biến ngẫu nhiên liên tục.  Chương 5 giới thiệu về phương pháp bootstrap và thực hiện một thí nghiệm mô phỏng Monte Carlo để so sánh cách tính trung vị theo phương pháp bootstrap. 2 Mục lục Lời cảm ơn 1 Lời nói đầu 2 1 Kiến thức cơ bản 5 1.1 Luật số lớn . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2 Một vài biến ngẫu nhiên rời rạc cơ bản . . . . . . . . . . . 5 1.3 Biến ngẫu nhiên liên tục . . . . . . . . . . . . . . . . . . . 6 1.4 Quá trình Poisson và biến ngẫu nhiên có phân phối Gamma 8 1.5 Quan hệ đồng dư và căn nguyên thủy . . . . . . . . . . . . 10 1.6 Trung vị . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2 Số ngẫu nhiên 12 2.1 Tạo số giả ngẫu nhiên . . . . . . . . . . . . . . . . . . . . 12 2.1.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . 12 2.1.2 Phương pháp Đồng dư tuyến tính tạo số giả ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.1.3 Kiểm tra dãy số giả ngẫu nhiên . . . . . . . . . . . 15 2.2 Một số ứng dụng . . . . . . . . . . . . . . . . . . . . . . . 18 2.2.1 Tính tích phân . . . . . . . . . . . . . . . . . . . . 18 2.2.2 Ước lượng số  . . . . . . . . . . . . . . . . . . . . 20 3 Tạo biến ngẫu nhiên rời rạc 22 3.1 Phương pháp biến đổi ngược . . . . . . . . . . . . . . . . . 22 3.2 Phương pháp Bác bỏ . . . . . . . . . . . . . . . . . . . . . 28 3.3 Phương pháp hỗn hợp . . . . . . . . . . . . . . . . . . . . 30 3.4 Tạo vectơ ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . 32 3 MỤC LỤC 4 Tạo biến ngẫu nhiên liên tục 34 4.1 Phương pháp Bác bỏ . . . . . . . . . . . . . . . . . . . . . 37 4.2 Phương pháp tọa độ cực tạo biến ngẫu nhiên có phân phối chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 4.3 Tạo một quá trình Poisson . . . . . . . . . . . . . . . . . . 45 5 Ứng dụng 46 5.1 Đặt vấn đề . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 5.2 Phân phối bootstrap . . . . . . . . . . . . . . . . . . . . . 47 5.3 Phân phối bootstrap trong trường hợp đối xứng . . . . . . 51 5.4 Làm trơn mẫu bootstrap . . . . . . . . . . . . . . . . . . . 54 5.5 Thí nghiệm mô phỏng . . . . . . . . . . . . . . . . . . . . 55 Phụ lục 62 A Chương trình mô phỏng 62 B Bảng số ngẫu nhiên 66 Tài liệu tham khảo 70 4 Chương 1 Kiến thức cơ bản 1.1 Luật số lớn Định lý 1.1 (Luật yếu số lớn). Xét X 1 ; X 2 ; : : : là một dãy các biến ngẫu nhiên độc lập và có cùng phân phối với kỳ vọng . Khi đó, với mọi  > 0, P  ˇ ˇ ˇ ˇ X 1 C CX n n   ˇ ˇ ˇ ˇ >   ! 0 khi n ! 1 Một mở rộng của luật yếu số lớn là luật mạnh số lớn: trung bình của một dãy các biến ngẫu nhiên độc lập có cùng phân phối hội tụ hầu chắc chắn về kỳ vọng của các biến ngẫu nhiên đó. P  lim n!1 X 1 C CX n n D   D 1 1.2 Một vài biến ngẫu nhiên rời rạc cơ bản Biến ngẫu nhiên có phân phối nhị thức Thực hiện n phép thử độc lập, mỗi phép thử chỉ xảy ra hai khả năng: "thành công" với xác suất là p hoặc "thất bại" với xác suất 1  p. Đặt X D số lần thành công trong n phép thử, thì X gọi là có phân phối nhị thức với tham số .n; p/, ký hiệu X  B.n; p/. P .X D i/ D C i n p i .1 p/ ni ; i D 0; 1; : : : ; n với C i n D nŠ iŠ.n i/Š . Nếu X  B.n; p/ thì EX D np và VarX D np.1p/. 5 1.3 Biến ngẫu nhiên liên tục Biến ngẫu nhiên có phân phối Poisson Biến ngẫu nhiên X nhận một trong các giá trị 0; 1; 2; : : : được gọi là có phân phối Poisson với tham số  > 0, nếu hàm xác suất của nó được xác định bởi P .X D i/ D e   i iŠ ; i D 0; 1; : : : Ký hiệu X  P./, và EX D VarX D . Biến ngẫu nhiên có phân phối Hình học Xét n phép thử độc lập, mỗi phép thử có xác suất thành công là p. Đặt X D số phép thử cho đến khi lần thành công đầu tiên xảy ra, ta có P .X D n/ D p.1  p/ n1 ; n  1 Biến ngẫu nhiên X có hàm xác suất như trên gọi là có phân phối hình học với tham số p. Khi đó EX D P 1 nD1 np.1  p/ n1 D 1 p , VarX D 1 p p 2 . 1.3 Biến ngẫu nhiên liên tục Biến ngẫu nhiên có phân phối đều Biến ngẫu nhiên X gọi là có phân phối đều trên khoảng .a; b/ nếu hàm mật độ xác suất của nó được xác định bởi f .x/ D 8 < : 1 b  a nếu x 2 .a; b/ 0 nếu x … .a; b/ Kỳ vọng và phương sai của X bằng EX D b C a 2 ; VarX D 1 12 .b  a/ 2 Hàm mật độ xác suất của X, F .x/ D P .X Ä x/ D R x a .ba/ 1 dx D x  a b  a . 6 1.3 Biến ngẫu nhiên liên tục Biến ngẫu nhiên có phân phối chuẩn Biến ngẫu nhiên X gọi là có phân phối chuẩn với kỳ vọng  và phương sai  2 nếu hàm mật độ xác suất xác định bởi f .x/ D 1  p 2 e .x/ 2 =2 2 ; 1 < x < C1 Ký hiệu X  N .0; 1/, và EX D , VarX D  2 . Đồ thị của hàm mật độ phân phối chuẩn là đường cong có dạng hình chuông đối xứng qua . Đặt Z D X    thì EZ D 0 và VarZ D 1, biến ngẫu nhiên Z gọi là có phân phối chuẩn tắc, ký hiệu Z  N .0; 1/. Hàm phân phối xác suất của Z ˆ.z/ D 1 p 2 Z z 1 e z 2 =2 dz; 1 < z < C1 Biến ngẫu nhiên có phân phối mũ Biến ngẫu nhiên X gọi là có phân phối mũ với tham số  > 0 nếu hàm mật độ xác suất f .x/ D e x ; 0 < x < 1 Hàm phân phối xác suất F.x/ D R x 0 e x D 1  e x ; 0 < x < 1. Kỳ vọng EX D 1  , phương sai VarX D 1  2 . Biến ngẫu nhiên có phân phối tam giác Biến ngẫu nhiên X gọi là có phân phối tam giác nếu nó có hàm mật độ xác suất f .x/ D 8 ˆ ˆ ˆ ˆ < ˆ ˆ ˆ ˆ : 2.x a/ .b  a/.c  a/ khi a Ä x Ä c 2.b  x/ .b  a/.b  c/ khi c Ä x Ä b 0 khi x … Œa; b 7 1.4 Quá trình Poisson và biến ngẫu nhiên có phân phối Gamma với a, b lần lượt là chận dưới và chận trên a < b, c là mode của phân phối a Ä c Ä b. EX D a C b C c 3 , VarX D a 2 C b 2 C c 2  ab  ac  bc 18 . 1.4 Quá trình Poisson và biến ngẫu nhiên có phân phối Gamma Xét các sự kiện xảy ra tại một thời điểm ngẫu nhiên và đặt N.t/ là số các sự kiện xảy ra trong khoảng thời gian Œ0; t. Các sự kiện này gọi là tạo thành một quá trình Poisson với tham số  > 0, nếu (a) N.0/ D 0. (b) Số các sự kiện xảy ra trong các khoảng thời gian rời nhau là độc lập. (c) Phân phối của số các sự kiện xảy ra trong một khoảng thời gian cho trước chỉ phụ thuộc vào độ dài của khoảng đó mà không phụ thuộc vào vị trí của khoảng đó. (d) lim h!0 P .N.h/D1/ h D . (e) lim h!0 P .N.h/2/ h D 0. Ta có hai kết quả sau: 1. Những khoảng thời gian giữa các sự kiện liên tiếp của một quá trình Poisson với tham số  là các biến ngẫu nhiên độc lập có phân phối mũ với trung bình 1=. Thật vậy, gọi X n là là thời gian giữa sự kiện thứ n  1 và n, dãy fX n ; n D 1; 2; : : :g gọi là dãy các thời điểm tới. Ví dụ, nếu X 1 D 5 và X 2 D 10 thì sự kiện thứ nhất xảy ra tại thời điểm 5 và sự kiện thứ hai xảy ra tại thời điểm 15. Để tìm phân phối của X n , chú ý rằng sự kiện fX 1 > tg xảy ra khi và chỉ khi không có sự kiện nào của quá trình Poisson xảy ra trong khoảng Œ0; t, do đó P .X 1 > t/ D P .N.t/ D 0/ D e t Do đó X 1 , có phân phối mũ với trung bình 1=. Tương tự, phân phối của X 2 P .X 2 > tjX 1 D s/ D P.0 sự kiện xảy ra trong .s; s C tjX 1 D s/ D P .0 sự kiện xảy ra trong .s; s C t/ D e t 8 1.4 Quá trình Poisson và biến ngẫu nhiên có phân phối Gamma vậy X 2 cũng có phân phối mũ với trung bình 1=. Tương tự X 3 ; : : : ; X n cũng có phân phối mũ với trung bình 1=. 2. Một biến ngẫu nhiên có phân phối Gamma với tham số .n; / có thể được biểu diễn bằng tổng của n biến ngẫu nhiên độc lập X i ; i D 1; : : : ; n có cùng phân phối mũ với tham số . Chứng minh: Định nghĩa: Một biến ngẫu nhiên có hàm mật độ xác suất f .t/ D e t .t/ n1 .n 1/Š ; t > 0 thì được gọi là có phân phối gamma với tham số .n; /. Gọi S n D P n iD1 X i là thời điểm của sự kiện thứ n. Bởi vì S n sẽ bé hơn hoặc bằng t nếu và chỉ nếu có ít nhất n sự kiện xảy ra đến thời điểm t, suy ra P .S n Ä t/ D P .N.t/  n/ D 1 X j Dn e t .t/ j j Š Vế trái chính là hàm phân phối của S n , lấy đạo hàm ta thu được hàm mật độ của S n , gọi là f n .t/ f n .t/ D 1 X j Dn je t .t/ j 1 j Š  1 X j Dn e t .t/ j j Š D 1 X j Dn e t .t/ j 1 .j  1/Š  1 X j Dn e t .t/ j j Š D e t .t/ n1 .n 1/Š Như vậy, S n , thời điểm của sự kiện thứ n của một quá trình Poisson với tham số  là một biến ngẫu nhiên có phân phối gamma với tham số .n; /. Mà S n D P n iD1 X i chính là tổng các biến ngẫu nhiên độc lập có phân phối mũ với tham số . 9 [...]... trình bày phương pháp tạo số (giả) ngẫu nhiên Trong chương 3 sẽ trình bày các phương pháp tạo biến ngẫu nhiên rời rạc đi từ các số ngẫu nhiên trên (trong chương này, khi nói số ngẫu nhiên ta hiểu là số ngẫu nhiên có phân phối đều trong khoảng 0; 1/) 3.1 Phương pháp biến đổi ngược Xét một biến ngẫu nhiên có hàm phân phối xác suất F Phương pháp tổng quát để tạo một biến ngẫu nhiên, gọi là phương pháp Biến... lại ta bắt đầu kiểm từ I C 1 trở lên 3.2 Phương pháp Bác bỏ Giả sử ta có một phương pháp hiệu quả để mô phỏng biến ngẫu nhiên Y với hàm xác suất là qj D P Y D j /; j 0, và cần tạo một biến ngẫu nhiên X có hàm xác suất là pj D P X D j /; j 0 Để tạo X , ta tạo biến pY Phương ngẫu nhiên Y từ qj và chấp nhận giá trị này với xác suất cqY pháp này gọi là phương pháp Bác bỏ (hay Chấp nhận - Bác bỏ) Thuật... 4 Tạo biến ngẫu nhiên liên tục Trong chương 3, ta sử dụng hai phương pháp Biến đổi ngược và phương pháp Bác bỏ để tạo biến ngẫu nhiên rời rạc Chương 4 sẽ áp dụng các phương pháp này để tạo biến ngẫu nhiên liên tục Tiếp theo đó, mục 4:2 sẽ trình bày một phương pháp rất hiệu quả hiện nay để tạo biến ngẫu nhiên có phân phối chuẩn là phương pháp tọa độ cực Theo mệnh đề 3:1, tạo một biến ngẫu nhiên liên... dàng và tiện lợi hơn các phương pháp truyền thống Số ngẫu nhiên được tạo từ máy tính là số giả ngẫu nhiên, số giả ngẫu nhiên này có đầy đủ các tính chất thống kê như số ngẫu nhiên thực sự Những số giả ngẫu nhiên là một dãy các giá trị trông như những biến ngẫu nhiên độc lập và có phân phối đều trên khoảng 0; 1/ 2.1.2 Phương pháp Đồng dư tuyến tính tạo số giả ngẫu nhiên Phương pháp cơ bản để tạo các số... ngẫu nhiên 2.1 2.1.1 Tạo số giả ngẫu nhiên Giới thiệu Việc tạo các số ngẫu nhiên là yếu tố cơ bản trong phương pháp mô phỏng Có những phương pháp cổ điển để tạo số ngẫu nhiên như là tung đồng xu, tung xúc sắc, trộn các lá thăm, quay run-lét, hoặc dùng các thiết bị vật lý như máy đo nhiễu Các phương pháp kể trên mặc dù tạo được các số ngẫu nhiên thực sự nhưng có nhiều nhược điểm như thủ công, tốn nhiều... phân phối Fi ; i D 1; : : : ; n Để tạo F , trước hết ta tạo một biến ngẫu nhiên I với ˛i D P I D i/; i D 1; : : : ; n, từ đó tạo F từ phân phối FI Phương pháp này được gọi là phương pháp hỗn hợp 31 3.4 Tạo vectơ ngẫu nhiên 3.4 Tạo vectơ ngẫu nhiên Để mô phỏng vectơ ngẫu nhiên X D X1 ; thời F x1 ; ; Xn /0 có hàm phân phối đồng ; xn / Với F1 x/; F2 x/; : : : ; Fn x/ lần lượt là hàm phân phối của các... ngẫu nhiên rời rạc Y có phân phối đều trong 1; 2; : : : ; 5 2 Tạo một số ngẫu nhiên U 3 Nếu U Ä pY pY pY D D ; cqY 1:65 1=5 0:33 đặt X D Y , nếu không trở lại bước 1 3.3 Phương pháp hỗn hợp Giả sử ta có một phương pháp hiệu quả để mô phỏng giá trị của một biến 1/ ngẫu nhiên có cả hai hàm xác suất fpj ; j 2/ 0g hoặc fpj ; j 0g Ta muốn tạo một biến ngẫu nhiên X có hàm xác suất như sau 1/ P X D j / D ˛pj... (0.90,0.95] (0.95,1.00] 497 500 500 491 Bảng 2.1: Bảng tần số của 10000 số giả ngẫu nhiên được tạo theo phương pháp đồng dư tuyến tính 15 2.1 Tạo số giả ngẫu nhiên Hình 2.1: Biểu đồ tổ chức tần số cho 10000 số giả ngẫu nhiên tạo theo phương trình 2:1/ Kinh nghiệm, khi tạo các số giả ngẫu nhiên bằng phương pháp đồng dư tuyến tính, để xấp xỉ tốt biểu đồ tần suất của phân phối đều trong 0; 1/, nên lấy a, b,... 2.1 Tạo số giả ngẫu nhiên 2.1.3 Kiểm tra dãy số giả ngẫu nhiên Để kiểm tra dãy số giả ngẫu nhiên được tạo từ các phương pháp trên có tuân theo luật phân phối đều trong khoảng 0; 1/ hay không, ta dùng các cách sau Sử dụng các phương pháp kiểm định phân phối của một biến ngẫu nhiên (Chi bình phương, Kolmogorov - Smirnov) Vẽ biểu đồ tổ chức tần số của dãy các số giả ngẫu nhiên vừa tạo được và so sánh với... U Ä pY =cqY Ví dụ 3.7 Tạo một biến ngẫu nhiên rời rạc X nhận các giá trị trong 1; 2; : : : ; 5 với xác suất lần lượt là 0:15; 0:22; 0:33; :010; 0:20 Ta sử dụng phương pháp Bác bỏ với qY là hàm xác suất của phân phối đều trong 29 3.3 Phương pháp hỗn hợp 1; 2; : : : ; 5 Tức là, qj D 1=5; j D 1; : : : ; 5 Với cách chọn fqj g như vậy, ta chọn c bởi c D max pj D 0:33 qj 5 D 1:65 Thuật toán 1 Tạo biến ngẫu . chất của các phương pháp thống kê. Nhiều quá trình ngẫu nhiên trong thực tế đã được mô phỏng trên máy tính với sự trợ giúp của số ngẫu nhiên. Luận văn trình bày các phương pháp mô phỏng và một. Hà 1 Lời nói đầu Mô phỏng là một phương pháp số để thực hiện các thí nghiệm trên máy tính. Nó cho phép ta xây dựng và kiểm tra các mô hình trong thực tế. Trong thống kê, các thí nghiệm mô phỏng thường. HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN HOÀNG VĂN HÀ PHƯƠNG PHÁP MÔ PHỎNG TRONG THỐNG KÊ Chuyên ngành: Lý thuyết Xác suất và Thống kê Toán học Mã số: 60 46 15 LUẬN VĂN THẠC SĨ: TOÁN HỌC NGƯỜI

Ngày đăng: 08/10/2014, 18:37

Tài liệu cùng người dùng

Tài liệu liên quan