Khoá luận tốt nghiệp mô hình arima và ứng dụng

54 700 0
Khoá luận tốt nghiệp mô hình arima và ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC s ư PHẠM HÀ NỘI 2 KHỎA TOÁN = = = ío fflc 8 === LƯƠNG THỊ THOA MÔ HÌNH ARIMA VÀ ỨNG DỤNG KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC • • • C h uyên ngành: T oán ử n g dụ ng HÀ NỘI - 2015 • TRƯỜNG ĐẠI HỌC su ' PHẠM HÀ NỘI 2 KHỎA TOÁN = = = £ o tũ lG a = = = LƯƠNG THỊ THOA MÔ HÌNH ARIMA VÀ ỨNG DỤNG KHÓA LUẬN TỐT NGHIỆP ĐẠI • • • HỌC • Chuyên ngành: Toán ửng dụng Người hướng dẫn khoa học TS. TRẦN TRỌNG NGUYÊN HÀ NỘI - 2015 LỜI CẢM ƠN Trong quá trình nghiên cứu khóa luận "Mô hình ARIMA và ứng dụng" với sự cố gắng của bản thân và sự giúp đỡ nhiệt tình của các thầy cô trong tổ Toán ứng dụng, các bạn sinh viên khoa Toán em đã hoàn thành khóa luận này. Em xin chân thành cảm ơn sự giúp đỡ quý báu của các thầy cô trong tổ Toán ứng dụng, trường đại học sư phạm Hà Nội 2 và các bạn sinh viên đã tạo điều kiện cho em trong suốt thời gian làm khóa luận. Đặc biệt, em xin bày tỏ lòng biết ơn sâu sắc tới thầy hướng dẫn, Tiến sĩ Trần Trọng Nguyên, người đã hướng dẫn em tận tình và đóng góp ý kiến quý báu cho em trong quá trình thực hiện và hoàn thành khóa luận này. Hà Nội, ngày 2 tháng 5 năm 2015 Sinh viên Lương Thị Thoa LỜI CAM ĐOAN Khóa luận này là kết quả của bản thân em trong quá trình học tập và nghiên cứu. Bên cạnh đó em được sự quan tâm của các thầy cô trong khoa Toán. Đặc biệt là sự hướng dẫn của thầy: Trần Trọng Nguyên. Trong khi nghiên cứu hoàn thành khóa luận này em có tham khảo một số tài liệu đã ghi trong phần tài liệu tham khảo. Em xin cam đoan kết quả của khóa luận này không có sự trùng lặp với kết quả của tác giả khác. Hà Nội, ngày 2 tháng 5 năm 2015 Sinh viên Lương Thị Thoa MỤC LỤC LỜI MỞ Đ Ầ U .................................................................................................. 1 1. Lí do chọn đề tà i.............................................................................................. 1 2. Mục đích nghiên cứu.......................................................................................1 3. Đối tượng và phạm vi nghiên c ú n .................................................................2 4. Phương pháp và công cụ nghiên cứu............................................................ 2 5. Khái quát về nội dung và phạm vi nghiên cứu.............................................2 CHƯƠNG 1. KIẾN THỨC CHUẨN B Ị.......................................................... 3 1.1. Biến ngẫu nhiên và quy luật phân phối xác suất...................................... 3 1.1.1. Biến ngẫu nhiên một chiều...................................................................... 3 1.1.1.1. Định nghĩa biến ngẫu nhiên.......................................................... 3 1.1.1.2. Hàm phân phối xác suất.................................................................3 1.1.2. Biến ngẫu nhiên hai chiều....................................................................... 3 1.1.2.1. Định nghĩa....................................................................................... 3 1.1.2.2. Hàm phân phối xác suất.................................................................3 1.1.2.3. Sự độc lập của hai biến ngẫu nhiên...............................................4 1.1.3. Biến ngẫu nhiên nhiều chiều...................................................................4 1.1.3.1. Định nghĩa.......................................................................................4 1.1.3.2. Hàm phân phối xác suất................................................................4 1.1.3.3. Tính độc lập của nhiều biến ngẫu nhiên....................................... 5 1.1.4. Một số đặc trưng của biến ngẫu nhiên.................................................... 5 1.1.4.1. Kỳ vọng.......................................................................................... 5 1.1.4.2. Phương sai....................................................................................... 6 1.1.4.3. Hiệp phương sa i............................................................................ 6 1.1.4.4. Hệ số tương quan........................................................................... 6 1.1.5. Một số quy luật phân phối....................................................................... 7 1.1.5.1. Quy luật phân phối chuẩn.............................................................. 7 1.1.5.2. Quy luật Khi bình phương............................................................. 7 1.2. Phân tích hồi quy..........................................................................................8 1.2.1. Mô hình hồi quy tuyến tính hai b iế n ....................................................... 8 1.2.2. Hàm hồi quy tổng th ể ...............................................................................9 1.2.3. Hàm hồi quy m ẫu ..................................................................................... 9 1.2.4. Phương pháp ước lượng OLS.................................................................10 1.3. Giới thiệu về chuỗi thời gian và toán tử trễ.......................................... 11 1.3.1. Chuỗi thời gian........................................................................................ 11 1.3.2. Toán tử tr ễ ............................................................................................... 12 1.4. Quá trình ngẫu nhiên dừng và không dừng.......................................... 12 1.5. Hàm tự tương quan và hàm tự tương quan riêng..................................14 1.5.1. Hàm tự tương quan............................................................................... 14 1.5.2. Hàm tự tương quan riêng......................................................................14 1.6 . Nhiễu trắng và bước ngẫu nhiên............................................................ 15 1.6.1. Nhiễu trắng.............................................................................................. 15 1.6.2. Bước ngẫu nhiên......................................................................................15 CHƯƠNG 2. MÔ HÌNH ARIMA VÀ ỨNG DỤNG.................................17 2.1. Mô hình ARIM A.................................................................................... 17 2.1.1. Quá trình trung bình trượt (M A ).................................................17 2.1.2. Quá trình tự hồi quy (AR - Autoregressive Process)................17 2.1.3. Quá trình trung bình trượt tự hồi quy ARM A ............................18 2.1.4. Ọuá trình trung bình trượt, tích hợp tự hồi quy ARIMA...........19 2.1.5. Dự b á o ......................................................................................................19 2.1.5.1. Dự báo quá trình A R (p).............................................................. 19 2.1.5.2. Dự báo quá trình MA (q).............................................................20 2.1.5.3. Dự báo quá trình ARMA(p,q)..................................................... 21 2.1.5.4. Dự báo quá trình ARIMA(p,d,q).................................................21 2.1.6 . Kiểm định nghiệm đơn v ị...................................................................... 22 2.1.7. Phương pháp Box - Jenkins...................................................................24 2.1.7.1. Định dạng mô hình - xác định tham số p, d, q ...........................24 2.1.7.2. Ước lượng mô hình...................................................................... 30 2.1.7.3. Kiểm định tính thích hợp của mô hình....................................... 32 2.1.7.4. Dự báo và sai số dự b á o ...............................................................35 2.2. ứ ng dụng mô hình ARIMA dự báo chỉ số VNINDEX....................... 39 2.2.1. Xây dựng mô hình ARIMA cho chuỗi VNINDEX............................. 39 2.2.2. Ước lượng các tham số của mô hình.................................................... 42 2.2.3. Kiểm tra sự phù họp của mô h ìn h ........................................................ 43 2.2.4. Dự báo g iá .............................................................................................. 44 KẾT LUẬN.......................................................................................................47 DANH MỤC TÀI LIỆU THAM KH Ả O ....................................................... 48 LỜI MỞ ĐẦU 1. Lí do chọn đề tài Chuỗi thời gian đang được sử dụng như một công cụ hữu hiệu để phân tích và dự báo trong kinh tế xã hội cũng như trong nghiên cứu khoa học. Chính do tầm quan trọng của phân tích chuỗi thời gian, rất nhiều nghiên cún đã đề xuất các công cụ để phân tích và dự báo chuỗi thời gian. Trong những năm trước, công cụ để phân tích chuỗi thời gian là sử dụng các công cụ thống kê như hồi quy, phân tích Furie và một vài công cụ khác.Nhưng hiệu quả nhất là mô hình ARIMA của Box-Jenkins. Từ các công trình ban đầu về chuỗi thời gian, hiện nay mô hình này đang được dùng rất nhiều để phân tích và dự báo trong các lĩnh vực: kinh tế,tài chính, chứng khoán, giáo dục, thời tiết, dân số,... Nghiên cứu phân tích và dự báo chuỗi thời gian luôn là một bài toán gây được sự chú ý của các nhà toán học, kinh tế, xã hội học,... Các quan sát trong thực tế thường được thu thập dưới dạng chuỗi số liệu. Từ những số liệu này, người ta có thế rút ra được những quy luật của một quá trình được mô tả thông qua chuỗi số liệu. Xuất phát từ thực tế ứng dụng lớn của mô hình ARIMA, em chọn đề tài nghiên cứu về: “MÔ HÌNH ARIMA VÀ ỨNG DỤNG” làm đề tài khóa luận của mình. 2. Mục đích nghiên cứu - Nghiên cún một số khái niệm và tính chất cơ bản về chuỗi thời gian; các quá trình trung bình trượt (MA),quá trình tự hồi quy (AR), quá trình trung bình trượt tự’ hồi quy (ARMA)và quá trình trung bình trượt, tích hợp tự hồi quy (ARIMA). -ứng dụng mô hình ARIMA dự báo chuỗi chỉ số VNINDEX với sự hỗ trợ của phần mềm Eviews. 1 3. Đối tượng và phạm vi nghiên cứu - Đối tượng nghiên cứu: Mô hình ARIMA - Phạm vi nghiên cứu: Mô hình ARIMA, phương pháp Box - Jenkins, ứng dụng trong dự báo chỉ số VNINDEX 4.Phương pháp và công cụ nghiên cứu - Phương pháp so sánh, phân tích, tổng hợp kiến thức. - Phương pháp phân tích thực nghiệm với dữ liệu thực tế. - Sử dụng phần mềm Excel, Eviews. 5.Khái quát về nội dung và phạm vi nghiên cứu Nội dung của khóa luận này bao gồm 2 chương: - Chương 1. Kiến thức chuẩn bị: Chương này trình bày một số khái niệm và kiến thức cơ bản sẽ được sử dụng trong chương sau. - Chương 2.Mô hình ARIMA và ứng dụng: Chương này trình bày các lớp mô hình ARIMA và thử nghiệm ứng dụng các mô hình này để dự báo chỉ số VNINDEX. 2 CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ 1.1. Biến ngẫu nhiên và quỵ luật phân phối xác suất 1.1.1. Biến ngẫu nhiên một chiều 1.1.1.1. Định nghĩa biến ngẫu nhiên Định nghĩa 1.1: Cho (Q, F, P) là một không gian xác suất. Neu X là một ánh xạ đo được từ Q vào K thì X được gọi là một biến ngẫu nhiên (hoặc một đại lượng ngẫu nhiên). Nói cách khác: X là một hàm số thực, hữu hạn, xác định trên Q sao cho với mỗi i g ! thì ịcoe Q : X (&>)< Jt| e F. 1.1.1.2. Hàm phân phoi xác suất Định nghĩa 1.2. Hàm phân phối xác suất của biến ngẫu nhiên X được ký hiệu và xác định như sau: Fx (x) = P j í y : I ( í y ) < i Ị ,J í 6 M. Như vậy hàm phân bố xác suất là sự thu hẹp của độ đo xác suất p lên lóp các khoảng ( - 00,*) của đường thẳng thực M. Đẻ cho gọn ta sẽ ký hiệu F(x) = P (X < x ),x e IR . 1.1.2. Biến ngẫu nhỉên hai chiều ỉ. 1.2.1. Định nghĩa Định nghĩa 1.3. Cho không gian xác suất (Q, F, P) và hai biến ngẫu nhiên X và Y xác định trên nó. Khi đó hệ V = (X, Y) được gọi là một biến ngẫu nhiên 2-chiều, tức là V là một ánh xạ từ Q vào IR2 sao cho với mỗi Ú)GÍÌ thì V(cò) = (X{ũ)\Y{co)). 1.1.2.2. Hàm phân phổi xác suất Định nghĩa 1.4. (Hàm phân phối đồng thời) Hàm phân phối xác suất đồng thời của một biến ngẫu nhiên 2-chiều V = ( X , Y ) được định nghĩa như sau: 3 F(x,);) = p [ ( x < x ) ( Y < j ) ] , (~coF()^ , F 2>. . . , ^ , ^ +l>F„+2...) '---- ' M a u q u a n sát Chẳng hạn: 11 Yt = pt là giá một loại /cổ phiếu ở thời điểm t; Yt = t biến xu thế Yt = с các thành phần của chuỗi là một hằng số -Toán tử nhân: Yt = ß X t -Toán tử cộng: Yt = X t + Wr 1.3.2. Toán tử trễ Giả sử có chuỗi {X,}!^ bây giờ ta tạo ra chuỗi mới {Yt }* , Yt = X t_x. Ký hiệu Yt = LXt = X t_ị. L được gọi là toán tử trễ. L(LX,) = L ( X t_]) = X t_2. Áp dụng hai lần toán tử trễ ký hiệu là L2,L2X, = X t_2 Tổng quát, к là một số nguyên bất kỳ, LkX t = X t_k L ( ß X t) = ß ( L X t) = ß X l_]; Ц Х ' + Щ ) = Х'_]+Щ_]; Yf = (а + bL)LXt = aLXt + bL2X t = aXM + bXt_2 (1 - ị L ) ( 1- ^ L ) X t = (1 - ^ L - ^ L + Ả,Ấ1L2) X t = ( \ - { Ằ , + Ấ 1)L + ị Ấ 1I } ) X t = X t - (Л| + Ẩ2)XM + ẲiẲ2X t_2 Một biểu diễn khác (aL+bL2) được xem như là đa thức đối với toán từ L. v ề mặt đại số, nó tương tự như đathức (az+bz2), z làmột vô hướng. Nếu như: {X,}!^ ={с}!^ thì: LXt = X t_x =c; (a + ß L + e ũ ) c = {a + ß + 6)c. 1.4.Quá trình ngẫu nhỉên dừng và không dừng Xét họ các biến ngẫu nhiên Yi, Y 2,... trong đó các chỉsố là các thời điểm kế tiếp nhau. Nói chung mỗi biến có một quy luật phân bố xác suất riêng. Họ Y 1 được gọi là quá trình ngẫu nhiên. Giả sử rằng đối với 12 mỗi thời điểm, biến số tương ứng nhận một giá trị cụ thể. Khi đó ta có một chuỗi thời gian. Mặc dù chuỗi thời gian chỉ là một phép thử của một quá trình ngẫu nhiên, nhưng chúng ta cũng gọi chuỗi thời gian là một quá trình ngẫu nhiên, ký hiệu là {Yt với t = 1, 2 ,...} E(Yt), Var(Yt) là kỳ vọng và phương sai của Yt, có thể Cov(Yi, Yj) ^ 0. Nói chung đối với mỗi Yt thì kỳ vọng, phương sai và hiệp phương sai là không giống nhau. Chuỗi Yt được gọi là dừng nếu kì vọng, phương sai, hiệp phương sai không đổi theo thời gian (Engle và Granger, 1987), nghĩa là: E(Y,) = ju,\/t (1.7) Var (Yt) = E(Yt - j u ) 2 = ơ 2,Vt (1.8) ỵk = C o v i X M = E[(Yt - ụ)(Yt-k - //)], Vt (1.9) Chuỗi Yt được gọi là chuỗi không dừng nếu nó vi phạm bất kì điều kiện nào nói ở trên. p k = — chính là hệ số tương quan Yt và Yt_k. ĩo Các p k là một hàm phụ thuộc vào độ dài của trễ, hàm này được gọi là hàm tự tương quan AFC, AcF(k)=ptk =czVar(Fr) (Y::Y'-t) Điều kiện thứ ba trong định nghĩa chuỗi dừng có nghĩa là hiệp phương sai, do đó hệ số tương quan giữa Yt và Yt+k chỉ phụ thuộc vào độ dài (k) về thời gian giữa t và t+k, không phụ thuộc vàothời điểm t.Chẳng hạn: Cov(Yt, Yt+5) không đổi thìCov(Y7, Y12) = Cov(Y15, Y20) = Cov(Y30, Y35) = ... = Cov(Y,, Yí+6)không đổi. NhungCov(Yt, Yt+5) có thể khác với Cov(Y„ Y,+6) 13 1.5. Hàm tự tương quan và hàm tự tương quan riêng 1.5.1. Hàm tự tương quan Ở mục 1.4 đã nhắc đến hàm tự tương quan, sau đây sẽ trình bày khái niệm một cách đầy đủ hơn. “Tự tương quan” được hiểu như là sự tương quan giữa các thành phần của dãy số thời gian hoặc không gian. Trong mô hình hồi quy tuyến tính cố điên, ta giả định rằng không có tương quan giữa các sai số ngẫu nhiên Ujĩighĩa là: Cov(un iij) = 0 (/ ^ j ) Nói một cách khác, mô hình cổ điển giả định rằng sai số ứng với quan sát nào đó không bị ảnh hưởng bởi sai số ứng với quan sát khác. Tuy nhiên trong thực tế có thể xảy ra hiện tượng mà sai số của các quan sát lại phụ thuộc nhau, nghĩa là: Cov(Uị,Uj) 0 (/ ^ j ) khi đó xảy ra hiện tượng tự tương quan. Hàm tụ’ tương quan (ACF) với độ trễ k, kí hiệu bằng pk, được xác định như sau: A C F {k )= P t= £ 2 ^ 1 k Var(Yt) 1.5.2. Hàm tự tương quan riêng Hàm tự tương quan riêng (PACF) ký hiệu là pkk. Trong khi ACF pk, k = 1,2,..., là hệ số tương quan không điều kiện giữa Yt và Y tính đến ảnh hưởng của các quan hệ trung gian Yt.ị, Yt_2, hệ số tương quan có điều kiện. p ti =Coư(Y„Y,_k 1 ^ , , ^ , . . . , ^ , ) , k= l,2,... 14 t-k, nó không thì pkk là l.ó.Nhiễu trắng và bước ngẫu nhiên 1.6.1. Nhiễu trắng Quá trình [ut}T=-oo được gọi là nhiễu trắng nếu thành phần của chuỗi có kì vọng bằng 0 , phương sai không đổi và không tự tương quan, tức là: £(wt) = 0 ,Ví ( 1. 10) Vai(ut) = ơ2y t (1.11) Cov(ut j U t+ ầ ) = (1.12) 0,5 ^ 0, V í Đôi khi điều kiện (1.12) được thay thế bằng điều kiện mạnh hơn: ut, UT độc lập với nhau, với t T. (1-13) Quá trình thỏa mãn (1.10), (1.11) và (1.13) được gọi là nhiễu trắng độc lập. Neu các điều kiện (1.10), (1.11) và (1.13) được thỏa mãn và ut ~ N(0, ơ2) thì quá trình ngẫu nhiên được gọi là nhiễu trắng Gauss. Chú ý rằng từ (1.13) suy ra (1.12), điều ngược lại sẽ không đúng. Nhiễu trắng là một chuỗi dừng. 1.6.2.Bước ngẫu nhiên Neu Yt = yj_1 + ut , trong đó ut là nhiễu trắng, thì Yt được gọi là bước ngẫu nhiên E(Yt) = + E(ut) = E(Yt_,) (1.14) Điều này có nghĩa là kỳ vọng của Yt không đổi. Ta hãy xem phương sai của Yt: Yx =Y0 + Uị Y2 = Yị u2 = Yq Yt — Yq + Mị u2 + u2.. • 15 ut Do Y0 là hằng số, các ut không tương quan với nhau, có phương sai không đổi ơ 2, nên: Vai(Yt) = t a 2, (1.15) Điều trên chứng tỏ Yt là chuỗi không dừng. YY. Y t-t-1 t t- 1 — Yí-1 t-1 1 -\-Y. ' t-\u t Cov(Yt,Yt_ị) = Cov(Yt_i,Yt_i) + 0 = (t + ì)cr2 Cov(Yn Yt_k) = (t + k) (2 .2 4 ) thay vào (2.24) được: A7, = Ị3X+ Í32t + ÔYt_x+ 3 (F,_, - Yt_2) + 02Ợt_2 - Yt_,) + ... + 0q(Ỵt_q - Yt_q_,) + AY' = /?,+ p 2t + SYt_, + Ỳ , a iầYt-\ +£t (2-25) /= | 23 Tiêu chuẩn DF áp dụng cho (2.25) được gọi là tiêu chuẩn ADF (Augumented Dickey - Fuller). 2.1.7.Phương pháp Box - Jenkins. Mô hình ARIMA được sử dụng khá phổ biến trong dự báo ngắn hạn. Lý do là mô hình này chỉ dùng các giá trị trong quá khứ của chính biến số cần dự báo. Do sử dụng chỉ những thông tin trong quá khứ nên mô hình thích hợp với dự báo ngắn hạn. ARIMA không thích hợp để dự báo chính sách. Mô hình ARIMA đôi khi được coi là mô hình phi lý thuyết vì nó không dựa trên một lý thuyết kinh tế nào. Có hai phương pháp cơ bản để đánh giá sự phù họp của mô hình AR1MA để mô tả một chuỗi thời gian cho trước: phương pháp Box-jenkins và phương pháp lựa chọn tổ họp các tham số (p,q). Box và Jenkins (1974) đã đưa ra một tập họp các bước, các thủ tục ước lượng mô hình ARIMA cho một chuỗi thời gian. Phương pháp này đã trở nên phổ biến trong nhiều lĩnh vực: kinh tế, y thuật, kĩ thuật,... và được gọi là phương pháp Box-Jenkins. Phương pháp Box-Jenkins gồm có 3 bước: định dạng mô hình; ước lượng các tham số và kiểm định. Ba bước trên được lặp lại cho đến khi nào được một mô hình tốt. 2.1.7.1. Định dạng mô hình - xác định tham số p, d, CỊ Định dạng mô hình tức là phải tìm ra các tham số p,d và q. Công việc này 1'ất khó khăn cả về lý thuyết và thực hành. Đe tìm được d phải dùng kiểm định JB, kiểm định nghiệm đơn vị DF hoặc ADF. Neu chuỗi ban đầu không dừng, khi đó ta tính sai phân cap I. Tiếp tục kiểm định tính dừng. Từ chuỗi dừng nhận được, ta phải tìm các giá trị p và q, hay nói cách khác đi phải định dạng mô hình ARMA cho 24 chuỗi dừng. Có rất nhiều phương pháp để tìm được p và q. Không có phương pháp nào là tối ưu tuyệt đối. a) Lược đồ tương quan và tự tưong quan Dùng lược đồ tương quan và tự tương quan riêng là phương pháp hiệu quả đế xác định p và q. Lược đồ vẽ ACF và PACF theo độ dài của trễ. Đồng thời cũng vẽ đường phân giải chỉ khoảng tin cậy 95% cho giá trị bằng 0 của hệ sô tự tương quan ( Bartlett, 1946) và hệ số tự tương quan riêng (+ 1,96/Vĩĩ). Dựa trên các lược đồ này ta biết được các hệ số tương quan và các hệ số tự tương quan riêng khác không với mức ý nghĩa 5%. Từ đó có thể đưa ra các đoán nhận chuỗi dừng, các giá trị p, q của các quá trình AR(p) và MA(q). Do p kk đo mức độ kết họp giữa Yt và Yt-k sau khi đã loại bỏ ảnh hưởng của .,Yt_k+ị do đó nếu Ppp ф 0 và p kk = 0 với к > p và yơ,, i = l , 2 , . . . , giảm theo hàm mũ hoặc theo hình sin thì ta có quá trình AR(p). Neu các p u, i = 1,2, giảm dần theo hàm mũ hoặc hàm sin, p q Ф 0, p k —0 với к > q thì có quá trình MA(q), ... 25 Bảng 1: Bậc p, q của ARIMA ARIMA (p,d,0 ) AFC PAFC Giảm dạng mũ hoặc giảm Pkk = 0 với k > p hình sin (0 ,d,q) Giảm dạng mũ hoặc giảm p k = 0 với k > q hình sin (l,d ,l) P\ = 0 P\\ ^ 0 Sau đó giảm dạng mũ hoặc Sau đó giảm dạng mũ hoặc (l,d, 2 ) hình sin hình sin Pi, p 2 * 0 P\\ ^ 0 Sau đó giảm dạngmũ hoặc Sau đó giảm dạng mũ hoặc (2 ,d,l) hình sin hình sin P ị* 0 P\ 1>P 22 ^ 0 Sau đó giảm dạng mũ hoặc Sau đó giảm dạng mũ hoặc (2 ,d,2 ) hình sin hình sin P\,P1 * 0 P\ 15P 22 ^ 0 Sau đó giảm dạng mũ hoặc Sau đó giảm dạng mũ hoặc hình sin hình sin Như vậy phương pháp này Box-Jenkins tính toán các hệ số tương quan mẫu SACF và hệ số tương quan riêng mẫu SPACF, so sánh với các giá trị lý thuyết ACF và PACF. Neu có sự phù họp giữa chúng với nhau thì các tham số của mô hình sẽ được ước lượng. Ưu điểm chủ yếu của phương pháp này là áp dụng một cách hệ thống các bước trong quá trình xây dựng mô hình. Nhược điểm của phương pháp này là trong quá trình xem xét một 26 cách trực giác SACF và SPACF để xác định p và q. Kết quả sẽ mang tính chủ quan. b)Tỉêu chuân Akaike, Schwarz Phương pháp Вох-Jenkinslà phương pháp phổ biến nhất. Bên cạnh đó người ta còn dùng một số phương pháp khác, kết hợp nhiều phương pháp khác nhau để chuẩn đoán p và q của mô hình sau khi tham số đã được xác định. Một ý tưởng là người ta có thể đánh đổi một hoặc nhiều độ trễ của AR(p) với một vài độ trễ của MA(q) bằng cách xem xét chi phí về mặt thông tin đối với số tham số được cực tiểu vẫn đảm bảo sự phù họp của mô hình. Tiêu chuẩn hiển nhiên để so sánh các mô hình là phương sai của phần dư. Kí hiệu phần dư của mô hình ARMA(p,q) là et(p,q)- Ước lượng phương sai của phần dư tương ứng: _ 1 " ~ o-p,q = - Y e t ( p , q ) (2 .2 6 ) Neu dựa vào phương sai phần dư để xem xét thì hiển nhiên mô hình có nhiều tham số hơn càng phù hợp vì mỗi một tham số đưa thêm sẽ làm cho mô hình mềm dẻo hơn trong việc sấp xỉ với số liệu quan sát. Tuy nhiên nếu sử dụng quá nhiều tham số để mô tả phần MA thì khả năng dự báo ngoài mẫu sẽ kém đi. Chẳng hạn, có thể đưa vào số tham số bằng số quan sát, khi đó. Các phần dư sẽ bằng không, ước lượng của phương sai bằng không. Nhung mô hình như vậy sẽ không phù hợp vì mô hình hóa là việc mô tả đơn giản hóa thực tế, ta đã biểu diễn n điểm qua n điểm khác. Mô hình có quá nhiều tham số sẽ không phù họp với thực tế. Trường hợp khác, nếu mô hình có quá ít tham số, hiến nhiên sẽ là không phù họp. 27 Vì những điều nói trên nên tiêu chuẩn chỉ dựa trên phương sai có những khiếm khuyết nhất định. Người ta sẽ đưa ra một số tiêu chuẩn khác để khắc phục tình trạng quá nhiều tham số. Ở đây sẽ đưa ra tiêu chuẩn thông tin Akaike, Schwarz và tiêu chuẩn Akaike hiệu chỉnh. Akaike (1974) đề xuất tiêu chuẩn AIC (4): -2 AIC(p,q) = ln( Graph -> Line and sỉmbol: V N IN D E X Hình 1: Đồ thị chuỗi VNINDEX Chuỗi VNINDEX có các giá trị tuyệt đối lớn và rất biến động 39 Tiến hành kiểm nghiệm đơn vị cho chuỗi VNINDEX: Trong Eviews từ chuỗi VNINDEX chọn View -> Unit root test trong mục test stype chọn kiểu kiểm nghiệm ADF ta có kết quả cho bởi hình 2: Augmented Dickey-Fuller Unit Root Test on VNINDEX Null Hypothesis: VNINDEX has a unit root Exogenous: Constant Lag Length: 0 (Automatic based on SIC, MAXU\G=24) t-Statistic Prob* AugmentedDickey-Fullerteststatistic_____________-2.4Ũ9436 0.1395 Test critical values: 1% level -3.441674 5% level -2.866428 10% level -2.569433 t i i . . 1 Si.m - - .. correlogram và chọn 30 thời kỳ trễ. Ta được như hình 4: Sample: 1 567 Included observations: 566 Autocorrelation Partial Correlation 1 |I 1 ]' 13 c1 11 || 1 1]| 1|I : 1 1|I 1 |I 1 1' 1: t 1 11 ( 1 1I 1 |I [ 1 11 0.031 0.061 0.105 -0.069 0.003 -0.Ũ65 0.058 0.030 -0.099 10 0.040 11 11 1] 11 1 1 1 1 11 1 1 I| 1 I| 1 1 |I |[ 1 I| 1 1 |I I| 1 1 1 1 |I I| 1 |[ 1 1 || 1 1 I| 1 1 1 1 1 11 -0.022 -0.010 12 -0.019 0.001 11 I| 1 11 |[ 1 'ỉ 1 1 ]| I| 1 I| 1 1 |I I| 1 I| 1 11 11 I| 1 11 1 |I AC 1 2 3 4 5 6 7 8 9 PAC Q-Stat Prob 0.031 0.060 0.102 -0.079 -0.005 -0.069 0.079 0.029 -0.098 0.019 0.5368 2.6356 8.8940 11.583 11.588 14.042 15.944 16.465 22.138 23.057 23.342 23.552 28.003 28.003 28.149 28.888 0.464 0.268 0.031 0.021 0.041 0.029 0.026 0.036 0.008 28.919 31.170 33.695 34.691 36.103 36.980 37.478 38.258 39.670 39.771 39.891 40.787 41.000 41.799 0.035 0.028 0.020 0.022 0.021 0.024 0.029 0.033 0.032 0.041 0.052 0.056 0.069 0.074 13 0.088 0.082 14 -0.001 -0.000 15 -0.016 -0.045 16 -0.036 -0.039 17 0.007 0.027 18 19 20 21 22 23 24 25 26 27 28 29 30 -0.062 -0.Ũ66 0.041 -0.Ũ49 -0.039 0.029 -0.036 -0.049 0.013 0.014 -0.039 -0.019 0.036 -0.0 62 -0.043 0.031 -0.043 -0.0 22 0.028 -0.034 -0.056 0.026 0.009 -0.042 -0.004 0.021 0.011 0.016 0.023 0.009 0.014 0.021 0.025 Hình 4: Đồ thị của hàm ACF và PACF của chuỗi DVNINDEX Theo đồ thị ở hình 4, tại độ trễ k=3 AC và PAC đạt cực đại sau đó giảm mạnh xuống và đồ thị có xu hướng nằm gọn trong hai đường giới hạn. Do đó p và q có thế nhận các giá trị là 3. Mô hình ARIMA có thế có là ARIMA (3,1,3) 41 2.2.2. ước lượng các tham số của mô hình Trong phần mềm Eviews các bước thực hiện ước lượng tham số của mô hình ARIMA như sau: =>Trên thanh menu chọnQuick -> Estỉmate Equatỉon. =>Nhập các thông số cần ước lượng vào mục Equatỉon Speccifícation. Is^ -J Equation Estimation Specification Options Equation specification Dependent variable followed by list of regressors including ARMA and PDL termSj OR an explicit equation like Y=c(l)+c(2)*X. d(VNINDEX) AR(3) MA(3) Estimation settings Method LS - Least Squares (NL5 and ARMA) Sample: 1 567 OK I 'I -t— Il II»»— II im /— Cancel Till-!— n w 4 Hình 5: Các thông số cho mô hình ARIMA(3,1,3) =>Chọn phương pháp bình phương tối thiếu ta thu được kết quả ước lượng như sau: 42 DependentVariable: D(VNINDEX) Method: Least Squares Date: 05/03/15 Time: 15:16 Sample (adjusted): 5 567 Included observations: 563 after adjustments Convergence achieved after 22 iterations MA Backcast: 2 4 Variable Coefficient std. Error t-Statistic Prob. AR(3) MA(3) -0.766126 0.820957 0.127991 0.113142 -5.985763 7.255966 0.0 000 0.0 000 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Inverted AR Roots Inverted MA Roots 0.012504 0.010744 5.677766 18084.97 -1775.543 1.939138 46+.79Ỉ 47-81 i Mean dependent var S.D. dependentvar Aka ike info criterion Schwarz criterion Hannan-Quinn criter. .46-.79Ì .47+81Ỉ 0.232327 5.708515 6.314539 6.329932 6.320548 -.92 -.94 Hình 6 : Ket quả ước lượng các thông số của mô hình. Từ kết quả này cho ta một số thông tin như sau: => Mô hình ARMA(3,3) có dạng như sau: AVNINDEXt = -0,7 6 6 126AVNĨNDEX t_ 3 +0, 820957k, _3 =>Thống kê Durbin-Watson DW= 1,939138 ~ 2 cho thấy sai số của ước lượng là không tương quan. 2.2.3. Kiểm tra sự phù họp của mô hình Ta tiến hành kiểm tra sự phù hợp của mô hình thông qua việc kiểm định tính ngẫu nhiên của sai số ước lượng được. Đe làm việc này trên phần mềm Eviews ta thực hiện lần lượt các bước sau: =>Từ màn hình kết quả ước lượng, chọn View ->Residual test -> Correlogram -> Q-Statistics. =>Phân tích biểu đồ tự tương quan và tự tương quan riêng của sai số ước lượng được. Ket quả cho thấytất cả các hệ số tự tương quan mẫu đều 43 nằm trong hai đường giới hạn. Điều này chúng tỏ sai số của ước lượng là hoàn toàn ngẫu nhiên. Do vậy mô hình này là phù họp. Sample: 5 567 Included observations: 563 Q-statistic probabilities adjusted for 2 ARMA term(s) Autocorrelation 1 ll 1 ]l 1 ]l c 1 1 1 I| 1 Partial Correlation 1 |I 1 ]| 1 || [ 1 1 1 AC 1 11 1) 1 |I E1 2 3 4 5 6 7 8 9 1 |I 1 1 1 1 10 11 12 1: 11 II 1 ■1 1 1I 11 ( 1 I| 1 11 ll 1 l[ 1 1 |I I| 1 I| 1 1 |I 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 1]l 1ll c 1 1 ll 11 11 1]| l[ 1 ll 1 1 ll ll 1 1 1 1 1 11 II 1 1 1 1 ỊI |[ 1 I| 1 1 1 I| 1 || 1 1 |I 11 I| 1 1 1 1 |I 0.027 0.049 0.051 -0.Ũ79 0.003 -0.029 0.063 0.032 -0.119 0.Ũ36 -0.018 0.006 0.087 -0.011 -0.046 -0.Ũ50 0.001 -0.041 -0.054 0.045 -0.058 -0.048 0.018 -0.030 -0.040 0.020 0.009 -0.Ũ36 -0.020 0.040 PAC Q-Stat 0.027 0.048 0.048 -0.084 0.003 -0.023 0.073 0.025 -0.126 0.029 0.4031 1.7506 3.2097 6.7279 6.7338 7.1995 9.4440 10.048 18.146 18.876 19.058 19.080 23.451 23.518 24.752 26.210 26.210 27.204 28.903 30.097 32.053 33.391 33.582 34.122 35.058 35.286 35.332 36.119 36.359 37.310 0.001 0.022 0.070 -0.017 -0.069 -0.035 0.028 -0.048 -0.049 0.030 -0.054 -0.026 0.020 -0.031 -0.054 0.030 0.005 -0.039 -0.002 0.026 Prob 0.073 0.035 0.081 0.126 0.093 0.123 0.011 0.016 0.025 0.039 0.015 0.024 0.025 0.024 0.036 0.039 0.035 0.037 0.031 0.031 0.040 0.048 0.051 0.064 0.082 0.089 0.108 0.112 Hình 7: Biểu đồ ACF và PACF cho sai số ước lượng. 2.2.4. Dự báo giá Mở rộng bộ dữ liệu: Proc -> Structure/Resize Current Page Chọn Dated - regular frequency: Start date: 1; End date: 572 Trong mô hình ướclượng chọn: Forecast -> Forecast name: vnindef; S.E (optional): se. Ta có bieu do sau: 44 600 569 568 571 570 V N IN D E X F 572 ± 2 S .E . Hình 8 : Biểu đồ dự báo Ket quả dự báo: □ G ro up: UNTITLED W o rk file : V N IN D E X ::1\ Ị g view ỊỊProc [o b je c t] [Print][Nam e][Freeze] [D efault SE NA NA NA NA NA NA NA NA NA NA NA NA NA 5.6 791 91 8 .0 3 0 5 8 2 9 .8 3 5 4 0 1 11.51 4 7 3 1 2.9 791 4 obs 55 5 556 55 7 558 55 9 560 561 562 563 56 4 565 56 6 567 56 8 569 57 0 571 57 2 V N IN D E X 5 4 6 .9 0 0 0 5 4 7 .9 0 0 0 5 4 3 .0 0 0 0 548.1 0 0 0 5 4 7 .7 0 0 0 5 5 0 .5 0 0 0 5 5 4 .0 0 0 0 5 5 9 .5 0 0 0 5 5 8 .7 0 0 0 5 6 4 .5 0 0 0 5 6 8 .3 0 0 0 5 6 8 .3 0 0 0 5 6 5 .0 0 0 0 NA NA NA NA NA II l[Sort][Transpose] [E d it+ /-][sm p l+ /- V N IN D E X F I 5 4 6 .9 0 0 0 5 4 7 .9 0 0 0 5 4 3 .0 0 0 0 548.1 0 0 0 5 4 7 .7 0 0 0 5 5 0 .5 0 0 0 5 5 4 .0 0 0 0 5 5 9 .5 0 0 0 5 5 8 .7 0 0 0 5 6 4 .5 0 0 0 5 6 8 .3 0 0 0 5 6 8 .3 0 0 0 5 6 5 .0 0 0 0 5 6 4 .9 8 6 7 5 6 4 .9 7 6 5 5 6 4 .5 4 0 3 5 6 4 .5 5 0 5 5 6 4 .5 5 8 3 I И Hình 9: Kết quả dự báo Giá trị thực tế là: 45 I— I I__ I ТТГ г> А В С 20150427 567.8 568.5 562.4 562.4 61882580 3 AVNINDE> 20150424 563.2 567.4 561.2 565.8 61680945 4 AVNINDE> 2015Ũ423 563.2 564.5 557.6 561.2 76336705 5 AVNINDE> 20150422 562.6 565 561.5 562.5 91608120 6 AVNINDE> 20150421 563.8 567.5 562.2 562.2 8249706Ũ 7 AVNINDE> 20150420 568.5 568.8 562.7 565 65083490 Hình 10: Kết quả thực tế Từ kết quả dự báo và kết quả thực tế ta có bảng so sánh sau: Ngày Giá trị thực tê Giá trị dự báo Sai sô(%) 21/04/2015 562.2 564.9867 0.4957 22/04/2015 562.5 564.9765 0.4403 23/04/2015 561.2 564.5403 0.5952 24/04/2015 565.8 564.5505 0.2208 27/04/2015 562.4 564.5583 0.2069 Giá trị dự báo gần đúng với giá trị thực tế, mô hình là phù họp. 46 KẾT LUẬN Mô hình ARIMA có rất nhiều ứng dụng trong thực tế, đặc biệt là trong vấn đề dự báo. Dự báo được một số chỉ tiêu kinh tế vĩ mô, chỉ số thị trường, giá cả tạo cơ sở cho các nhà hoạch định chính sách đưa ra chính sách, định hướng phát triển, chiến lược phát triển công ty. Mô hình ARIMA tỏ ra dự báo trong ngắn hạn khá hiệu quả. Nó thường được sử dụng dự báo chỉ số giá tiêu dùng theo tháng, giá của một số mặt hàng xuất khẩu: giá cà phê, sản lượng xuất khẩu của một số mặt hàng xuất khẩu. Bên cạnh những ưu điểm của mô hình thì nó cũng có nhược điếm nhất định như: khi chuỗi thời gian phi tuyến thì mô hình ARIMA không dự báo được. Trong bài luận văn này, em đã đã làm được những việc như sau: trình bày lý thuyết các lớp mô hình ARIMA,lý thuyết về phương pháp phân tích chuỗi thời gian Box-Jenkins; ứng dụng của mô hình ARIMA dựa trên phương pháp Box-Jenkins, cùng với sự hỗ trợ của phần mềm Eviews để dự báo chỉ số VNINDEX. Với lượng kiến thức còn hạn chế và khoảng thời gian có hạn những vấn đề em trình bày trên đây mới chỉ là những kiến thức cũng như những kết quả dự báo bước đầu. Rõ ràng rằng các kết quả dự báo đã trình bày vẫn chưa đưa ra được nhũng kết quả thực sự đáng tin cậy để phục vụ,áp dụng thực tiễn. Trong tương lai, em sẽ tiếp tục nghiên cún bài toán dự báo bằng phương pháp chuỗi thời gian để có thể tìm ra phương pháp dự báo tốt hơn và có thể áp dụng được. 47 [...]... DF áp dụng cho (2.25) được gọi là tiêu chuẩn ADF (Augumented Dickey - Fuller) 2.1.7.Phương pháp Box - Jenkins Mô hình ARIMA được sử dụng khá phổ biến trong dự báo ngắn hạn Lý do là mô hình này chỉ dùng các giá trị trong quá khứ của chính biến số cần dự báo Do sử dụng chỉ những thông tin trong quá khứ nên mô hình thích hợp với dự báo ngắn hạn ARIMA không thích hợp để dự báo chính sách Mô hình ARIMA. .. kinh tế, y thuật, kĩ thuật, và được gọi là phương pháp Box-Jenkins Phương pháp Box-Jenkins gồm có 3 bước: định dạng mô hình; ước lượng các tham số và kiểm định Ba bước trên được lặp lại cho đến khi nào được một mô hình tốt 2.1.7.1 Định dạng mô hình - xác định tham số p, d, CỊ Định dạng mô hình tức là phải tìm ra các tham số p,d và q Công việc này 1'ất khó khăn cả về lý thuyết và thực hành Đe tìm được... tích hợp bậc d, áp dụng mô hình ARMA(p,q) cho chuỗi sai phân bậc d thì có quá trình ARIMA( p,d,q) Trong ARIMA( p,d,q), d là số lần lấy sai phân chuỗi Yt để được một chuỗi dừng, p là bậc tự hồi quy, q là bậc trung bình trượt, p và q là bậc tương ứng của chuỗi dừng AR(p) là trường họp đặc biệt của ARIMA( p,d,q) với d = 0, q = 0 MA(q) là trường hợp đặc biệt của ARIMA( p,d,q) với d = 0 và p =0 ARIMA( 2,1,2) -... Mô hình ARIMA đôi khi được coi là mô hình phi lý thuyết vì nó không dựa trên một lý thuyết kinh tế nào Có hai phương pháp cơ bản để đánh giá sự phù họp của mô hình AR1MA để mô tả một chuỗi thời gian cho trước: phương pháp Box-jenkins và phương pháp lựa chọn tổ họp các tham số (p,q) Box và Jenkins (1974) đã đưa ra một tập họp các bước, các thủ tục ước lượng mô hình ARIMA cho một chuỗi thời gian Phương... là không đối xứng 7 1.2 Phân tích hồi quy 1.2.1 Mô hình hồi quy tuyến tính hai biến Giả sử X và Y là hai biến của một tổng thể nào đó, mô hình hồi quy tuyến tính hai biến thể hiện mối quan hệ phụ thuộc giữa biến Y và biến X có dạng như sau: Y = P ,+ P 2X + u (1.1) Như vậy, mô hình hồi quy tuyến tính hai biến bao gồm các thành phần sau: • Các biến so: mô hình hồi quy gồm hai loại biến số: - Biến phụ thuộc:... khác nhau để chuẩn đoán p và q của mô hình sau khi tham số đã được xác định Một ý tưởng là người ta có thể đánh đổi một hoặc nhiều độ trễ của AR(p) với một vài độ trễ của MA(q) bằng cách xem xét chi phí về mặt thông tin đối với số tham số được cực tiểu vẫn đảm bảo sự phù họp của mô hình Tiêu chuẩn hiển nhiên để so sánh các mô hình là phương sai của phần dư Kí hiệu phần dư của mô hình ARMA(p,q) là et(p,q)-... DF được áp dụng cho các mô hình sau đây: AYt =ỔY[_] +ut (2.20) AY ' = (2 2 1 ) A Yt A + Ổ Y ^ + u , = fi+ p 2t + Ổ V^ + ut (2 2 2 ) Đối với các mô hình trên, giảthuyết cần kiểm định là: H 0 : ổ = 0; Hị : s < 0 (Chuỗi không dừng - hay nghiệm đơn vị) Dickey và Fuller đã chứng tỏ rằng phân bố giới hạn và các giá trị tới hạn của thống kê (ổ - ô)n = ổn có thể tìm được với giả thiết u t ~ IID và ngay cả... của phần dư tương ứng: _ 1 " ~ o-p,q = - Y e t ( p , q ) (2 2 6 ) Neu dựa vào phương sai phần dư để xem xét thì hiển nhiên mô hình có nhiều tham số hơn càng phù hợp vì mỗi một tham số đưa thêm sẽ làm cho mô hình mềm dẻo hơn trong việc sấp xỉ với số liệu quan sát Tuy nhiên nếu sử dụng quá nhiều tham số để mô tả phần MA thì khả năng dự báo ngoài mẫu sẽ kém đi Chẳng hạn, có thể đưa vào số tham số bằng... tham số bằng số quan sát, khi đó Các phần dư sẽ bằng không, ước lượng của phương sai bằng không Nhung mô hình như vậy sẽ không phù hợp vì mô hình hóa là việc mô tả đơn giản hóa thực tế, ta đã biểu diễn n điểm qua n điểm khác Mô hình có quá nhiều tham số sẽ không phù họp với thực tế Trường hợp khác, nếu mô hình có quá ít tham số, hiến nhiên sẽ là không phù họp 27 Vì những điều nói trên nên tiêu chuẩn chỉ... Trong hai tiêu chuẩn trên các tập p và Q đều chưa biết Hannan (1980) chỉ ra rằng nếu po và q0 là các giá trị đúng thì Pị > p ữ',ch > q{) Trên cơ sở hai tiêu chuẩn này Jefferys (1961), Poskitt và Tremayne (1987) đưa ra ý tưởng về xây dựng một lóp mô hình Cơ sở của quan niệm này là mặc dù Pi và qi đã được xác định, nhưng chưa chắc đã là các giá trị thực của mô hình và cần phải xem xét thêm bằng các tiêu ... rút quy luật trình mô tả thông qua chuỗi số liệu Xuất phát từ thực tế ứng dụng lớn mô hình ARIMA, em chọn đề tài nghiên cứu về: “MÔ HÌNH ARIMA VÀ ỨNG DỤNG” làm đề tài khóa luận Mục đích nghiên... bày số khái niệm kiến thức sử dụng chương sau - Chương 2 .Mô hình ARIMA ứng dụng: Chương trình bày lớp mô hình ARIMA thử nghiệm ứng dụng mô hình để dự báo số VNINDEX CHƯƠNG KIẾN THỨC CHUẨN BỊ 1.1... MÔ HÌNH ARIMA VÀ ỨNG DỤNG KHÓA LUẬN TỐT NGHIỆP ĐẠI • • • HỌC • Chuyên ngành: Toán ửng dụng Người hướng dẫn khoa học TS TRẦN TRỌNG NGUYÊN HÀ NỘI - 2015 LỜI CẢM ƠN Trong trình nghiên cứu khóa luận

Ngày đăng: 16/10/2015, 15:37

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan