ỨNG DỤNG CỦA THỐNG KÊ BAYES TRONG PHÂN TÍCH TÀI CHÍNH

19 825 1
ỨNG DỤNG CỦA THỐNG KÊ BAYES TRONG PHÂN TÍCH TÀI CHÍNH

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA TP.HCM  TRƯỜNG ĐH KHOA HỌC TỰ NHIÊN         Họ và tên NCS: Lê Thanh Hoa            TÓM TẮT LUẬN ÁN ỨNG DỤNG CỦA THỐNG KÊ BAYES TRONG PHÂN TÍCH TÀI CHÍNH         Ngành: Toán Ứng dụng  Mã số ngành: 62460112  Khóa học năm: 2015  Người hướng dẫn khoa học:   1. TS. Phạm Hoàng Uyên    2. TS. Nguyễn Thanh Bình                  Tp. HCM, năm 2016  ĐẠI HỌC QUỐC GIA TP.HCM  TRƯỜNG ĐH KHOA HỌC TỰ NHIÊN         Họ và tên NCS: Lê Thanh Hoa        TÓM TẮT LUẬN ÁN  ỨNG DỤNG CỦA THỐNG KÊ BAYES TRONG PHÂN TÍCH TÀI CHÍNH                   Mục lục Phần 1: Tiểu luận tổng quan Tầm quan trọng Thống kê Bayes 2 Ứng dụng Thống kê Bayes Tài Thống kê Bayes với liệu nhiễu Phần 2: Tóm tắt nội dung luận án Thống kê Bayes số đặc trưng thống kê 1.1 Thống kê Bayes cho ước lượng trung bình phân phối chuẩn 1.2 Thống kê Bayes cho ước lượng tỷ lệ tổng thể .9 1.3 Thống kê Bayes cho ước lượng tham số phân phối Poisson 10 Thống kê Bayes chiều với liệu nhiễu 11 2.1 Một số vấn đề lý thuyết tâp nhiễu 11 2.2 Thống kê Bayes nhiễu cho ước lượng trung bình phân phối chuẩn .14 2.3 Thống kê Bayes cho ước lượng tỷ lệ thất bại phân phối mũ với liệu nhiễu 15 2.4 Thống kê Bayes nhiễu cho ước lượng xác suất sống sót phân phối nhị thức 15 Thống kê Bayes nhiều chiều với liệu nhiễu 16 Ứng dụng phân tích tài 16             Phần 1: Tiểu luận tổng quan Tầm quan trọng Thống kê Bayes Trong các nghiên cứu chủ  yếu sử  dụng thống kê tần suất, trong đó các tham số  được  giả  định như là các hằng số,  ví dụ  như  trung bình    của tổng thể  có phân phối chuẩn   được  ước  lượng  bằng trung bình của mẫu ngẫu nhiên.  Tuy  nhiên, khi ước lượng như  vậy dẫn đến sai lệch nhiều so với thực tế. Để hạn chế bớt sự sai lệch này, người ta giả  định lại tham số    dưới dạng một phân phối. Phương pháp thống kê  mà coi các tham  số  như là các biến ngẫu nhiên  đó chính là  thống kê Bayes.  Ưu điểm của thống kê  Bayes  là kiến thức chuyên gia  được thể hiện trong thông tin tiên nghiệm và kết quả sẽ  được kiểm nghiệm lại thông qua dữ liệu. Đối với bài toán ước lượng trung bình    của  tổng thể  có phân phối chuẩn  ở  trên, trong thống kê Bayes người ta sẽ  lấy giá trị  ước  lượng  là    trung  bình  của  phân  phối  hậu  nghiệm.  Trong  trường  hợp  không  có    bất  cứ   thông tin gì thì chúng ta coi phân phối tiên nghiệm là phân phối đều. Khi đó ước lượng  cho trung bình của tổng thể  có phân phối  chuẩn theo thống kê tần suất và thống kê  Bayes trùng nhau.  Trong [1], tác giả đã nêu lên hai tình huống liên quan đến xác suất hay gặp trong cuộc  sống. Thứ nhất đó là khi chúng ta tung đồng xu  N  lần, khi  N  lớn và thấy có khoảng  N  lần xuất hiện mặt ngửa, thì chúng ta nói rằng xác suất xuất hiện mặt ngửa là 50% khi  tung đồng xu. Sự giải thích về xác suất như vậy được gọi là Thống kê Tần suất. Mặt  khác, chúng ta cũng không thể nghe thấy trong bản tin thời tiết buổi tối có phát biểu  “Khả năng trời mưa vào ngày mai là 50%”. Phát biểu đó không thể xảy ra do thời tiết  không phải là một thử nghiệm ngẫu nhiên, do đó không sử dụng tần suất để xác định xác  suất. Hơn nữa, nó chuyển tải một phát biểu của thông tin, đó là cách Thống kê Bayes sử  dụng xác suất.   Tác giả cũng đã chỉ ra rằng Thống kê Bayes được phát triển mạnh mẽ trong những năm  gần đây và có nhiều ứng dụng rộng rãi. Kiến thức về mô hình trước khi sử dụng dữ liệu  trước về thống kê được gọi là thông tin tiên nghiệm. Thông tin tiên nghiệm này kết hợp  với thông tin thu được từ dữ liệu để đưa ra một phân phối thống kê tinh chỉnh hơn, đó  chính là phân phối hậu nghiệm.   Hiệu quả của thống kê Bayes được Arima và các cộng sự chỉ ra rằng với mô phỏng dữ  liệu thì dự báo theo Thống kê Bayes có trung bình bình phương sai số thực nghiệm nhỏ  hơn so với Thống kê Tần suất. Cụ thể [2] đã đề cập đến phương pháp Bayes cho mô hình  khu vực nhỏ (small area) khi thông tin hỗ trợ là độ đo sai số.   Hơn nữa, Thống kê Bayes đã được ứng dụng rộng rãi trong phân tích Tài chính, đặc biệt  là các trường hợp dữ liệu thưa, nếu sử dụng ước lượng theo Thống kê Tần suất sẽ dẫn  đến sai số ước lượng lớn. Để khắc phục tình trạng này Kadam và Lenk [3] đã sử dụng  kỹ thuật ước lượng Bayes – Markov chain Monte Carlo phân tích số liệu về tiềm lực tài  chính tại thời điểm cuối năm 2005, theo dữ liệu lịch sử về tỷ lệ của 112 quốc gia và 14  ngành công nghiệp.   Ứng dụng Thống kê Bayes Tài   Trong [4], tác giả đã thống kê sự phát triển mạnh mẽ của phương pháp Bayes trong thống  kê và ứng dụng trong kinh tế.  Trong Tài chính, người ta thường sử dụng mô hình thống kê, một trong những mô hình  hay được sử dụng nhiều nhất hiện nay là mô hình hồi quy GARCH. Bài báo [5] chỉ ra  rằng suy luận Bayes có thể sử dụng được trong mô hình hồi quy GARCH. Dữ liệu bài  báo sử dụng dữ liệu chỉ số chứng khoán của sàn Brussels. Các tham số cần ước lượng  biểu diễn như một vector các tham số     w, ,  , v  Từ một mẫu gồm  T  quan sát,  hàm mật độ hậu nghiệm xác định theo công thức    y       l  y                             (1)  Có một khó khăn là việc áp dụng các dữ liệu trong Tài chính không tuân theo phân phối  chuẩn, mà thường có dạng đuôi nặng, do đó nó thích hợp với phân phối Student cũng  như các phân phối đuôi nặng khác. Vì vậy, tác giả đã sử dụng mô phỏng Gibbs sampler  nhằm ước lượng các đặc trưng cho phân phối hậu nghiệm. Giả sử vector tham số    có  hai  thành  phần  là  1   và   ,  với  hàm  mật  độ  của  phân  phối  hậu  nghiệm  lần  lượt  là   1 2 , y   và    1, y    Giá trị tiếp theo   n  của hàm mật độ hậu nghiệm biên là  tổng hợp sử dụng giá trị trước đó   n1  theo chu trình sau   ~   1n ~  1 2n1 , y 2n   1n , y             (2)  Một dạng mô hình khác cũng hay được sử dụng trong Tài chính đó là mô hình tuyến tính  hỗn hợp tổng quát (GLMMs: generalized linear mixed models). Trong [6], tác giả nghiên  cứu về rủi ro tín dụng như là biến phụ thuộc trên dữ liệu Standard & Poor’s Credit Pro  với cơ sở dữ liệu 6.6 bao gồm 5676 người Mỹ từ tất cả 13 lĩnh vực công nghiệp, dạng  chu kỳ 6 tháng, gồm 40 chu kỳ từ tháng 1 năm 1981 đến tháng 12 năm 2000 với lớp các  mô hình tuyến tính hỗn hợp tổng quát (GLMMs: generalized linear mixed models). Với  mô hình này, Thống Kê Bayes được sử dụng thông qua kỹ thuật mô phỏng Gibbs sampler  nhằm ước lượng các tham số hồi quy, cho thấy hiệu quả tốt khi ước lượng. Ngoài ra,  phương pháp Bayes mở ra khả năng sử dụng các nguồn thông tin khác (cũng như các  mối tương quan) để đặt cho phân phối tiên nghiệm. Trong bài báo này, chủ yếu sử dụng  trường hợp không có thông tin tiên nghiệm cho các hệ số hồi quy, hệ số chặn và các  tham số của mô hình.   Sử dụng Thống kê Bayes thông qua phương pháp Markov chain Monte Carlo Bayes, Li  và các cộng sự qua bài báo [7] đã phát triển  cho suy luận đối với mô hình thời gian liên  tục với biến động ngẫu nhiên và hoạt động vô hạn Lévy jumps. Các nghiên cứu thực  nghiệm trên chỉ số chứng khoán S&P 500 thấy rằng đây là một mô hình rất cần thiết. Và  bài  báo  [8]  cũng  tính  toán  các  tham  số  dựa  vào  Bayes,  cụ  thể  là  sử  dụng  thuật  toán  Markov chain Monte Carlo Metropolis, của mô hình tài chính về giá thị trường, sử dụng  66 giá quyền chọn Châu Âu và chỉ số S&P 500.   Gần đây, các tác giả trong bài báo [9] chỉ ra chìa khóa để xác định các chỉ số phát triển  kinh tế của Iran với dữ liệu theo năm từ 1974 đến 2010. Họ đã sử dụng mô hình BMA  (Bayes Model Averaging). Kết quả chỉ ra rằng doanh thu từ dầu là biến quan trọng nhất  ảnh hưởng đến phát triển của nền kinh tế Iran…  Thống kê Bayes với liệu nhiễu   Các dữ liệu quan sát thường được giả định là các số thực chính xác. Tuy nhiên, trong  thực tế dữ liệu thường dưới dạng không chính xác, biểu diễn theo dạng số nhiễu. Giải  thích điều này, Huang và các cộng sự trong bài báo [10] đã chỉ ra lý do cần nghiên cứu  các công thức liên quan đến dữ liệu nhiễu. Cần có một phương pháp ước lượng thống kê  tổng quát, áp dụng cho không những số thực mà cả số nhiễu. Ngoài ra, phương pháp  Bayes đã chỉ ra tính hữu dụng ngay cả khi cỡ mẫu nhỏ. Trong bài báo này, họ đã đề nghị  một phương pháp mới xác định hàm membership cho ước lượng các tham số và hàm độ  tin cậy các phân phối của nhiều tham số.   Giả  sử  các  điểm  dữ  liệu  nhiễu  x1, x , , x n có  các  hàm  membership  tương  ứng  x ., x ., , x . , ước lượng điểm Bayes của các tham số và hàm độ tin cậy là các  số nhiễu có tính nhiễu phụ thuộc vào tính nhiễu của  n  điểm quan sát. Hàm membership  f x1 , x , , x n   là khó xác định nên họ đã đề nghị một phương pháp xác định mới là  n unimodal cực đại.  Bước 1. Giả sử    thay đổi từ 0 đến 1 với kích thước tăng thỏa mãn yêu cầu độ chính  xác.  Bước 2. Với mỗi giá trị cố định của    được chọn trong bước 1, tìm giá trị lớn nhất của  hàm  f  x1, x2 , , xn   sao cho  x  , i  1,2, , n  Ký hiệu giá trị lớn nhất này là  i f R     Bước 3. Với mỗi giá trị cố định của    được chọn trong bước 1, tìm giá trị nhỏ nhất của  hàm  f  x1, x2 , , xn   sao cho  x  , i  1,2, , n  Ký hiệu giá trị nhỏ nhất này là  i f L     Theo đòi hỏi của unimodal của hàm membership, ta có   f  f      với  f L   f  f R ,   trong đó  f L , f R   lần lượt là giá trị cận dưới và cận trên của hàm  f  tại mức cắt    cut    Theo quá trình ở trên, ta đã thu được hàm membership của hàm  f x 1, x , , x n  dưới    dạng số. Phần minh họa cho phân tích độ tin cậy Bayes cho dữ liệu nhiễu, sử dụng cho  hai trường hợp là phân phối chuẩn và phân phối Weibull.   Đối với dữ liệu nhiễu, các tham số ước lượng và các phân phối xác suất cũng được biểu  diễn dưới dạng nhiễu. Như Wu trong bài báo [11] đã chỉ ra cách suy luận tham số nhiễu  với giả định như biến ngẫu nhiên nhiễu với phân phối tiên nghiệm nhiễu. Phương pháp  ước lượng được sử dụng là ước lượng điểm Bayes nhiễu.  Người ta giả định rằng có một bộ dữ liệu thực tế của  n  thành phần. Gọi  T1 , T2 , , Tn  độc  lập và giống hệt nhau có phân phối mũ với tỷ lệ thất bại    chưa biết.  Hàm hợp lý được xác định bởi  n L     n e  t j                   (3)  j1 với    0, t j  0, j  1,2, , n    Ước lượng điểm Bayes của tỷ lệ thất bại  , được giả định như là biến ngẫu nhiên    Trong hầu hết các trường hợp sẽ sử dụng hàm phân phối tiên nghiệm cho    là phân phối  Gamma  1,  , hàm mật độ có dạng  2 f       1e                        (4)   1  1 với   , 1 , 2    Dựa vào công thức (3) và (4) ta có phân phối hậu nghiệm của   là    n   phân phối Gamma  1  n, 2   t j   Ước lượng điểm Bayes cho tỷ lệ thất bại    là  j1 trung bình của phân phối hậu nghiệm, được xác định như sau:  n  1                    (5)  n 2   T j j1 Từ phân phối Gamma   1, 2   là phân phối tiên nghiệm của tỷ lệ    và kỳ vọng của  phân phối Gamma   1, 2   là 1 , tức là 1  là số thất bại trên số các đơn vị thời gian  2   2 Như vậy, số các trường hợp không thể ghi được chính xác số các thất bại của con người  hoặc máy móc và thời gian không thể đo lường một cách chính xác trong một số tình  huống bất ngờ. Trong trường hợp đó, ta chỉ có thể nói có khoảng  1  thất bại trong khoảng  1 ” có thể được mô tả như một số nhiễu, tức là tỷ lệ  2   Theo đó, ước lượng điểm Bayes, tỷ lệ thất bại được  thất bại    được xem như số nhiễu    với hai số thực nhiễu đã biết là    và   Do đó, dữ  giả định như biến ngẫu nhiên   2  đơn vị thời gian. Cụm “khoảng liệu  thực  tế  cho  thành  phần  thứ  j   được  xem  như  biến  ngẫu  nhiên  nhiễu T j ,  với  j  1,2, , n  Ta vẫn giả định rằng  T 1,T , ,T n  là độc lập và có các phân phối giống  hệt nhau.     và     lần lượt là  Ước lượng điểm Bayes của   L L   U L n  1   U  ,    L 2    T j  L n  j 1  U n  1   U     T j  U n  j1 ,    0,1    Các công thức tương tự cũng được xây dựng cho phân phối Gamma nghịch đảo, phân  phối Beta.  Sự đa dạng của các tham số nhiễu, các dạng phân phối nhiễu được thể hiện thông qua  các bài báo như [12] cũng chỉ ra ước lượng điểm Bayes với dữ liệu nhiễu cho phân phối  Beta và phân phối Pascal, phân phối Pascal này một lần nữa lại được nghiên cứu trong  bài báo [13], cũng như từ phân phối Gamma chuyển qua phân phối Log-Gamma âm. Bài  báo [14] cũng chỉ ra ước lượng điểm Bayes với dữ liệu nhiễu cho phân phối mũ. Trong  [13], tác giả đã chỉ ra các tham số nhiễu được giả định như biến ngẫu nhiên nhiễu với  phân phối tiên nghiệm nhiễu. Phương pháp ước lượng Bayes sẽ chỉ ra ước lượng điểm  Bayes nhiễu trên cơ sở các phân phối mũ. Minh họa bằng công thức phân phối beta.  Trên cơ sở những phân tích như trên, chúng tôi thấy rằng việc áp dụng Thống kê Bayes  đối với các loại dữ liệu, nhất là dữ liệu nhiễu sẽ rất cần thiết và mang tính ứng dụng cao  trong thực tế, đặc biệt trong mảng Kinh tế và Tài chính. Vì vậy, chúng tôi chọn đề tài   “Ứng dụng Thống kê Bayes phân tích Tài chính”, với mục tiêu xây dựng  một phương pháp tính toán mới sử dụng Thống kê Bayes trong phân tích Tài chính.  Phần 2: Tóm tắt nội dung luận án Thống kê Bayes số đặc trưng thống kê 1.1 Thống kê Bayes cho ước lượng trung bình phân phối chuẩn Với  mẫu  ngẫu  nhiên Y1 , Y2 , , Yn ,  ta  có  các  quan  sát  này  là  độc  lập  với  nhau,  nên  likelihood đồng thời của mẫu được xây dựng như sau:  l Y1, Y2 , , Yn |  l Y1|l Y2 |l Yn |     Ta xét trường hợp, phân phỗi của mỗi quan sát Y j |  là phân phối chuẩn với trung bình    và phương sai đã biết   Khi đó theo công thức trên ta có   l Y1, Y2 , , Yn |  e Y1 2  e Y2  2   e Yn  2   tức là    l Y1, Y2 , , Yn |  e    2 Y1 Y2  Yn   2    Biến đổi phần trong ngoặc ta có  2 Y1    Y2     Yn    n  2 Y1  Y2   Yn   Y12  Y22   Yn2         n  2n y  Y12  Y22   Yn2   n   y   Y12  Y22   Yn2   n y 2 Thay vào biểu thức ta có   l Y1, Y2 , , Yn |  e   n  y  2  e  Y1 Y22 Yn2 ny  2   e n  y  2    Dựa vào công thức ta thấy, likelihood của mẫu ngẫu nhiên có phân phối chuẩn, tỷ lệ  với likelihood của trung bình mẫu, tức là có phân phối chuẩn với trung bình là    và  2 phương sai   n Giả sử ta có phân phối tiên nghiệm là phân phối chuẩn với trung bình m  và phương sai  s , tức là     e 2 m s2   Ta tính được phân phối hậu nghiệm là       Y1 , Y2 , ,Yn   e  y 2  n  e m s2  e   2  s  y  m2     n s2  n     Biến đổi số mũ ta có       s y   m       n    s           n   s   s   n n     Y1 , Y2 , , Yn   e 2      s y   m      n          s   s    n n  2 s e n   2 m n Do đó, phân phối hậu nghiệm là phân phối chuẩn với trung bình  m   và   s2  n  s '2 n phương sai s     s n s2 y  Thống kê Bayes ước lượng trung bình    chính là trung bình của phân phối hậu nghiệm  2 2 s y m s2 n n m      B  E  Y1, Y2 , , Yn    y 2   2 2 s  s  s  n n n   1.2 Thống kê Bayes cho ước lượng tỷ lệ tổng thể Chúng ta cần tính tổng số lần thành công trong  n  phép thử độc lập, trong đó mỗi tình  huống chỉ có hai khả năng xảy ra hoặc là thành công, hoặc là thất bại. Trung bình tỷ lệ  thành công trong phép thử thứ  i  là p , tỷ lệ trong tổng thể sẽ có đặc tính như vậy.  Phân phối có điều kiện của lần thành công trong  n  phép thử khi đã biết tham số  p  là  phân phối nhị thức B n, p   Khi đó ta có hàm hợp lý likelihood là     n y l  y|p   Cny p y 1  p  ; y  1, 2,, n; 0  p    Giả sử phân phối tiên nghiệm cho  p  là phân phối  beta  a, b có hàm mật độ là    p; a, b    a  b a1 b1 p 1  p ;  p    a b Phân phối hậu nghiệm là   n y   p|y   l  y|p   p   p y 1  p   p      b1 p a1 1  p  bn y1  p a y1 1  p ,  Phân phối hậu nghiệm có dạng phân phối beta a , b  beta a  y, b  n  y    Sử dụng ước lượng cho  p  là trung bình của phân phối hậu nghiệm  p  m  B   a y a y    a  y  b  n  y n  a  b 1.3 Thống kê Bayes cho ước lượng tham số phân phối Poisson Hàm hợp lý likelihood của một quan sát từ phân phối  Poisson  được xác định như  sau   y e l  y|   ,  y! với  y  0,1 ,   và   , nên hình dạng của hàm hợp lý likelihood là  l |y    y e   Y2,  ,  Yn , chúng  Trường hợp mẫu ngẫu nhiên độc lập có phân phối   Poisson    làY1,  ta xây dựng hàm hợp lý likelihood có hình dạng:  n n n l Y1,  Y2 ,  ,  Yn |   l Yi |    e    i 1 Yi Yi i 1 e n   i 1 Ta  nhận  thấy  hình  dạng  của  hàm  hợp  lý  likelihood  có  dạng  hàm  gamma r ,  v    với  n r   Yi  1,  v   n   i 1 Hàm tiên nghiệm cho tham số λ phân phối Poisson là  gamma r ,v   có dạng:  10 v r r 1e v   ;r ,v      r  Suy luận Bayesian cho tham số trong phân phối Poisson với hàm tiên nghiệm liên tục,  họ liên hợp cho các quan sát này là họ gamma. Định nghĩa về các phân phối tiên nghiệm liên hợp, xem trong [15].  Nếu    là lớp các phân phối mẫu  f  y|  và    là lớp các phân phối tiên nghiệm thì lớp    sẽ là liên hợp với    nếu  f |y    với mọi  f  y |     và  f      Hàm hậu nghiệm có dạng  n  |Y1,  Y2 ,  ,  Yn    r  Yi 1 i 1 e n v    tức là hàm phân phối hậu nghiệm có dạng  n    gamma r ,  v    gamma r  Yi , n  v    i 1 Sử dụng ước lượng cho     là trung bình của phân phối hậu nghiệm  n  r   Yi i1 nv   Thống kê Bayes chiều với liệu nhiễu 2.1 Một số vấn đề lý thuyết tâp nhiễu a Tập nhiễu, độ cao tập nhiễu   cut Định nghĩa tập nhiễu: Tập nhiễu  A  khác rỗng trong không gian  X , ký hiệu là  A  X , là  một tập gồm cặp  A   x,  A  x   ; x  X ,   trong đó   A : X   0,1  là một hàm membership của tập nhiễu  A    Hàm membership xác định với mỗi phần tử  x  X , số bậc thành viên của tập nhiễu  A,  biểu thị  qua ba trường hợp như sau, xem [16]  Trường hợp 1:   A  x    nghĩa là tất cả các thành viên của phần tử  x  trong tập nhiễu  A    11 Trường hợp 2:   A  x    nghĩa là không có bất cứ thành viên nào của phần tử  x  trong tập  nhiễu  A    Trường hợp 3:    A  x    có nghĩa là một phần thành viên của phần tử  x  thuộc vào tập  nhiễu  A     Trong  bài  báo  này,  chúng  tôi  sử  dụng  hàm  membership  dạng  đặc  biệt  đó  là  hàm  Gaussian  membership, công thức mô tả như sau    x  x 2   A  x   exp     ,        trong đó  x  là điểm giữa và    định nghĩa là độ rộng của đường cong Gaussian.    Định nghĩa độ cao tập nhiễu: Độ cao của tập nhiễu  A , ký hiệu là  h  A   được định nghĩa  là  h  A   sup  A  x    xX Định nghĩa   cut :     cut  của tập nhiễu  A  X , biểu thị bởi  A  là một tập không nhiễu như sau  A  x    x  X :  A    ,    0,1 ,   hoặc tập được định nghĩa bởi hàm đặc trưng, xem [16]:  1,  A  x    ;   0,  x     A   A  x    b Số nhiễu Định nghĩa số nhiễu: Một số nhiễu là một tập con nhiễu  A  của    sao cho, xem [17]:  i A  x    một số chính xác  x    ii Hỗ trợ support  x : A  x    của  A  là bị chặn.  iii Tập    cut  của  A  là khoảng đóng.  c Tổng tích số nhiễu   Mệnh đề: 12 Giả sử hai số thực nhiễu a b Khi a  b a  b số thực nhiễu Hơn nữa, biểu diễn dạng   cut , xem [11] và [12], ta có:  a  b   a  int b   a L  b L , aU  bU               a  b   a  int b      L L L U U L U U L L L U U L U U   a  b  , a  b  , a  b  , a  b  ,max a  b  , a  b  , a  b  , a  b              d Trung bình phương sai số nhiễu  , x , , x n    Giả sử mẫu ngẫu nhiên nhiễu gồm các quan sát  x Trung bình của các số nhiễu, xem [18] và [19], được xác định như sau  n x   x i                 n i 1 Hơn nữa, nếu các quan sát nhiễu  x i  có    cut  là   x  , x    thì trung bình của các số  L U i i nhiễu cũng có    cut  là     x L , x U    n x      i    n i 1   , 1n   x                  n L U i i 1 Phương sai mẫu hiệu chỉnh của các số nhiễu, xem [20], được xác định như sau    x i  x n S  i 1  n 1 Hơn nữa, nếu các quan sát nhiễu  x i  có    cut  là  chỉnh của các số nhiễu cũng có    cut  là   13                        x  , x    thì phương sai mẫu hiệu  L i U i  2  S  L U     , S   L n  n        L        x  x , i       n 1  i 1  x i  x    x i  x  i              L n L  n       max    x i  x  ,   x i  x   x i  x   i 1    n 1 i 1    2.2    U U  n   ,   x i  x   i 1     n   ,   x i  x   i 1    U     U                  Thống kê Bayes nhiễu cho ước lượng trung bình phân phối chuẩn Giả sử rằng mẫu ngẫu nhiên như là các số mờ Y , Y , , Y n , trong đó mỗi quan sát độc lập cùng    và phương sai đã biết    được giả định là các số mờ.  có phân phối chuẩn với kỳ vọng     và    được xác định lần lượt như sau:  Ước lượng điểm Bayes của     L U   sU L       n   L      n  sL    U   n      L    n  sL    U   1   sL  U   n   L    U        y ,    n  sL    U   n        s  U                   s   U    n   L    mL     s  U        mU   L       n   L   U    n  sL    U           s  14 U        y ,    0;1  ,  2.3 Thống kê Bayes cho ước lượng tỷ lệ thất bại phân phối mũ với liệu nhiễu Dữ liệu ở thành phần thứ  j  như biến ngẫu nhiên mờ  T j  với  j  1,2, , n  Ta cũng giả định  rằng  T , T , , T n  là các phân phối độc lập và giống hệt nhau.      và    , xem [11] và [19], được xác định lần lượt như sau:  Ước lượng điểm Bayes của   L L    n   U n U n L j  L j j 1  j 1 n     U   ,    0;1           T         T               U n  U n L j 2.4 L   ;           T         T                U    U L j j 1  j 1 Thống kê Bayes nhiễu cho ước lượng xác suất sống sót phân phối nhị thức Giả sử xác suất sống sót như biến ngẫu nhiên mờ   p  trong phân phối nhị thức  B n, p , với giả    định      như là số của cỡ mẫu và    như là số sống sót. Phân phối tiên nghiệm là phân  phối  Beta  với  hai  tham  số  mờ   ,   Phân  phối  hậu  nghiệm  là  phân  phối  Beta    x   , n    x     Ước lượng điểm Bayes của   p  và  p , xem [12] và [19], xác định lần lượt là  L U   L  p  U  p  x     L         1 n    2 U   U        n   x   L   L   U       U   U        n   15                  1 n    2 , L   L   ,    0;1   Thống kê Bayes nhiều chiều với liệu nhiễu Ứng dụng phân tích tài   việc ứng dụng Thống kê Bayes để phân tích Tài chính là rất cần thiết, kết quả được chúng  tôi  trình  bày  trong  bài  báo  Phạm  Hoàng  Uyên,  Nguyễn  Đình  Thiên,  Lê  Thanh  Hoa,  “Thống kê Bayes dự báo giá chứng khoán Việt Nam”, Hội nghị Toàn quốc lần thứ IV Ứng dụng Toán học,  23-25/12/2015.  Trong  bài  báo  này,  chúng  tôi  đã  sử  dụng  Thống kê Bayes của tất cả các mã cổ phiếu trên cả hai sàn giao dịch của Việt Nam là  HNX và HoSE, từ thời điểm bắt đầu lên sàn đến ngày 16/11/2015. Đánh giá hiệu quả  của dự báo cùng xu hướng với giá thực tế, tức là dự báo giá tăng thì giá thực sự tăng và  dự báo giá giảm thì giá thực sự giảm. Kết quả phân tích chỉ dựa vào giá đóng cửa thì  thấy rằng khả năng dự báo đúng 70% trở lên có 661/684 mã cổ phiếu. Trong trường hợp  giá cả tăng giảm nhanh, thì hầu như là dự báo đúng xu thế.     Tài liệu tham khảo   [1]  J. A. Scales and R. Snieder, “To Bayes or not to Bayes?,” Geophysics, vol. 62, no.  4, pp. 1045–1046, 1997.  [2]  S. Arima, G. S. Datta, and B. Liseo, “Bayesian estimators for small area models  when auxiliary information is measured with error,” Scand J Stat., vol. 42, no. 2,  pp. 518–529, 2015.  [3]  A. Kadam and P. Lenk, “Bayesian inference for issuer heterogeneity in credit  ratings migration,” J Bank Finance, vol. 32, no. 10, pp. 2267–2274, 2008.  [4]  D. J. Poirier and others, “The growth of Bayesian methods in statistics and  economics since 1970,” Bayesian Anal., vol. 1, no. 4, pp. 969–979, 2006.  [5]  L. Bauwens and M. Lubrano, “Bayesian Inference on GARCH Models Using the  Gibbs Sampler,” Econom J., vol. 1, no. 1, pp. 23–46, Jun. 1998.  [6]  A. J. McNeil and J. P. Wendin, “Bayesian inference for generalized linear mixed  models of portfolio credit risk,” J Empir Finance, vol. 14, no. 2, pp. 131–149,  2007.  [7]  H. Li, M. T. Wells, and C. L. Yu, “A Bayesian Analysis of Return Dynamics with  Lévy Jumps,” Rev Financ Stud., vol. 21, no. 5, pp. 2345–2378, Sep. 2008.  [8]  A. Gupta and C. Reisinger, “Robust calibration of financial models using  Bayesian estimators,” J Comput Finance, vol. 17, no. 4, p. 3, 2014.  [9]  M. Mehrara and S. Rezaei, “The Determinants of Economic Growth in Iran Based  on Bayesian Model Averaging,” Int Lett Soc Humanist Sci., vol. 49, pp. 1–11,  Mar. 2015.  16 [10] H.-Z. Huang, M. J. Zuo, and Z.-Q. Sun, “Bayesian reliability analysis for fuzzy  lifetime data,” Fuzzy Sets Syst., vol. 157, no. 12, pp. 1674–1686, Jun. 2006.  [11] H.-C. Wu, “Fuzzy Bayesian estimation on lifetime data,” Comput Stat., vol. 19,  no. 4, pp. 613–633, 2004.  [12] H.-C. Wu, “Fuzzy reliability estimation using Bayesian approach,” Comput Ind Eng., vol. 46, no. 3, pp. 467–493, Jun. 2004.  [13] R. Gholizadeh, A. M. Shirazi, B. S. Gildeh, and E. Deiri, “Fuzzy Bayesian system  reliability assessment based on Pascal distribution,” Struct Multidiscip Optim.,  vol. 40, no. 1–6, pp. 467–475, 2010.  [14] H.-C. Wu, “Fuzzy Bayesian system reliability assessment based on exponential  distribution,” Appl Math Model., vol. 30, no. 6, pp. 509–530, Jun. 2006.  [15] A. Gelman, J. B. Carlin, H. S. Stern, and D. B. Rubin, Bayesian data analysis, vol.  2. Taylor & Francis, 2014.  [16] R. Scherer, Multiple Fuzzy Classification Systems, vol. 288. Berlin, Heidelberg:  Springer Berlin Heidelberg, 2012.  [17] H. T. Nguyen and B. Wu, “Random fuzzy sets,” in Fundamentals of Statistics with Fuzzy Data, Springer, 2006, pp. 35–43.  [18] H. T. Nguyen, V. Kreinovich, B. Wu, and G. Xiang, “Computing statistics under  interval and fuzzy uncertainty,” Stud Comput Intell., vol. 393, 2012.  [19] R. Viertl, Statistical methods for fuzzy data. Chichester, West Sussex: Wiley,  2011.  [20] M. A. Bashar and S. Shirin, “Squares and square roots of continuous fuzzy  numbers,” Dhaka Univ J Sci, vol. 53, no. 2, pp. 131–140, 2005.    17

Ngày đăng: 05/11/2016, 14:25

Tài liệu cùng người dùng

Tài liệu liên quan