Các Đề thi kinh tế lượng có lời giải - P7

13 22.7K 185
Các Đề thi kinh tế lượng có lời giải - P7

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Tài liệu tham khảo cho các bạn sinh viên học chuyên ngành kinh tế có tư liệu ôn thi tốt đạt kết quả cao trong các kì thi giữa kì và cuối kì

ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 1GV: Nguyễn Thị Mai Bình Môn học: KINH TẾ LƯỢNG Lớp: 04QK, 04QB, 04QB (Năm học 2006 – 2007) Gợi ý đáp án Bài tập số 2: MÔ HÌNH HỒI QUI BỘI Câu 1: (40điểm) Xem xét dữ liệu về tiêu dùng thịt gà ở Mỹ giai đọan 1960 đến 1982 được trình bày trong file Table 7.9 thuộc bộ dữ liệu của Gujarati (hoặcc file chicken demand). Trong đó: Y = lượng thịt gà tiêu thụ bình quân đầu người (pound) X2 = thu nhập khả dụng bình quân đầu người (USD) X3 = Giá bán lẻ của thịt gà (cent/pound) X4 = Giá bán lẻ của thịt bò (cent/pound) X5 = Giá bán lẻ của thịt heo (cent/pound) X6 = Giá bán lẻ bình quân trọng số của thịt bò và thịt heo (cent/pound) Các anh/chị hãy: a) Xây dựng mô hình theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô hình tối ưu. Giải thích quá trình thực hiện và các kiểm định cần thiết. (α=5%) Mô hình hồi qui tổng thể của lượng thịt gà tiêu thụ bình quân đầu người (Y) theo thu nhập khả dụng bình quân đầu người (X2), giá bán lẻ của thịt gà (X3), giá bán lẻ của thịt bò (X4), giá bán lẻ của thịt heo (X5), Giá bán lẻ bình quân trọng số của thịt bò và thịt heo (X6) (PRF): Y = β1 + β2X2 + β3X3 + β4X4 + β5X5 + β6X6 +ui Chạy Eview với mô hình trên ta có: Dependent Variable: Y Method: Least Squares Date: 04/30/07 Time: 14:23 Sample: 1960 1982 Included observations: 23 Variable Coefficient Std. Error t-Statistic Prob. C 38.59691 4.214488 9.158150 0.0000 X2 0.004889 0.004962 0.985370 0.3383 X3 -0.651888 0.174400 -3.737889 0.0016 X4 0.243242 0.089544 2.716443 0.0147 X5 0.104318 0.070644 1.476674 0.1580 X6 -0.071110 0.098381 -0.722805 0.4796 R-squared 0.944292 Mean dependent var 39.66957 Adjusted R-squared 0.927908 S.D. dependent var 7.372950 S.E. of regression 1.979635 Akaike info criterion 4.423160 Sum squared resid 66.62224 Schwarz criterion 4.719376 Log likelihood -44.86635 F-statistic 57.63303 Durbin-Watson stat 1.100559 Prob(F-statistic) 0.000000 Với kết quả của bảng trên ta thấy các hệ số P_value của các biến X2, X5, X6 đều lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với: H0: β2 = β5 = β6 = 0 H1: ít nhất một giá trị βi ≠ 0 với (i = 2, 5, 6) Chạy Eview ta kết quả: Wald Test: Equation: EQ01 Test Statistic Value df Probability F-statistic 7.852143 (3, 17) 0.0017 Chi-square 23.55643 3 0.0000 Null Hypothesis Summary: ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 2Normalized Restriction (= 0) Value Std. Err. GV: Nguyễn Thị Mai Bình C(2) 0.004889 0.004962 C(5) 0.104318 0.070644 C(6) -0.071110 0.098381 Restrictions are linear in coefficients. P_value sau khi chạy Wald test trong kiểm định trên ta có: P_value =0.0017 < α = 5% Vì vậy ta bác bỏ giả thuyết H0, vậy ít nhất một giá trị βi ≠ 0 với (i = 2, 5, 6) Để thực hiện việc xây dựng mô hình từ đơn giản đến phức tạp, ta căn cứ vào hệ số P_value của các biến độc lập. Biến được loại ra khỏi mô hình là biến hệ số P_value lớn. - Đầu tiên ta bỏ biến X6 ra khỏi mô hình vì biến này P_value = 0.4796 (P_value lớn nhất). Lúc này kết quả Eview như sau: Dependent Variable: Y Method: Least Squares Date: 04/30/07 Time: 14:42 Sample: 1960 1982 Included observations: 23 Variable Coefficient Std. Error t-Statistic Prob. C 37.23236 3.717695 10.01490 0.0000 X2 0.005011 0.004893 1.024083 0.3194 X3 -0.611174 0.162849 -3.753010 0.0015 X4 0.198409 0.063721 3.113734 0.0060 X5 0.069503 0.050987 1.363144 0.1896 R-squared 0.942580 Mean dependent var 39.66957 Adjusted R-squared 0.929821 S.D. dependent var 7.372950 S.E. of regression 1.953198 Akaike info criterion 4.366473 Sum squared resid 68.66969 Schwarz criterion 4.613320 Log likelihood -45.21444 F-statistic 73.87052 Durbin-Watson stat 1.065034 Prob(F-statistic) 0.000000 - Căn cứ vào kết quả chạy Eview sau khi bỏ biến X6, ta nhận thấy vẫn còn các biến X2, X5 P_value lớn hơn α = 5%. Ta tiếp tục bỏ biến X2 do P_value = 0.3194 (P_value lớn nhất) và được kết quả như sau: Dependent Variable: Y Method: Least Squares Date: 04/30/07 Time: 14:46 Sample: 1960 1982 Included observations: 23 Variable Coefficient Std. Error t-Statistic Prob. C 35.68084 3.399337 10.49641 0.0000 X3 -0.654097 0.157564 -4.151300 0.0005 X4 0.232528 0.054387 4.275460 0.0004 X5 0.115422 0.024303 4.749224 0.0001 R-squared 0.939235 Mean dependent var 39.66957 Adjusted R-squared 0.929641 S.D. dependent var 7.372950 S.E. of regression 1.955702 Akaike info criterion 4.336146 Sum squared resid 72.67063 Schwarz criterion 4.533624 Log likelihood -45.86568 F-statistic 97.89329 Durbin-Watson stat 1.251523 Prob(F-statistic) 0.000000 Lúc này các biến X3, X4, X6 đều P_value nhỏ hơn α = 5%. Vậy mô hình trên thể là mô hình phù hợp nhất. Tuy nhiên, để kiểm tra lại phải việc loại bỏ biến X6, và X2 ra khổi mô hình là phù hợp. Ta thực hiện lại việc kiểm định Wald với: H0: β2 = β6 = 0 H1: ít nhất một giá trị βi ≠ 0 với (i = 2, 6) Chạy Eview ta kết quả: ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 3GV: Nguyễn Thị Mai Bình Wald Test: Equation: HOIQUI_U Test Statistic Value df Probability F-statistic 0.771684 (2, 17) 0.4778 Chi-square 1.543368 2 0.4622 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(2) 0.004889 0.004962 C(6) -0.071110 0.098381 Restrictions are linear in coefficients. P_value sau khi chạy Wald test trong kiểm định trên ta có: P_value =0.4778 > α = 5% Vì vậy ta chấp nhận giả thuyết H0, điều này nghĩa việc loại bỏ 2 biến thu nhập khả dụng bình quân đầu người (X2 và giá bán lẻ bình quân trọng số của thịt bò và thịt heo (X6) ra khỏi mô hình là phù hợp Mô hình hồi qui phù hợp nhất là: Yˆ = 35.68083973 - 0.6540969702*X3 + 0.2325281315*X4 + 0.1154218668*X5 b) Giải thích ý nghĩa các tham số của mô hình phù hợp nhất: Ta có: β1 = 35.68083973 không giả thích được vì ẩn chứa những biến bỏ sót ngoài mô hình hoặc chọn hàm sai. β3 = - 0.6540969702: tác động biên của X3 lên Y. Trong điều kiện các biến khác không đổi, theo thông tin từ dữ liệu mẫu ta nếu giá bán lẻ của thịt gà tăng lên 1 cent/pound thì lượng thịt gà tiêu thụ bình quân đầu người sẽ giảm đi 0.6540969702pound β4 = 0.2325281315 tác động biên của X4 lên Y. Trong điều kiện các biến khác không đổi, theo thông tin từ dữ liệu mẫu ta nếu giá bán lẻ của thịt bò tăng lên 1 cent/pound thì lượng thịt gà tiêu thụ bình quân đầu người sẽ tăng lên 0.2325281315 pound β5 = 0.1154218668 tác động biên của X5 lên Y. Trong điều kiện các biến khác không đổi, theo thông tin từ dữ liệu mẫu ta nếu giá bán lẻ của thịt heo tăng lên 1 cent/pound thì lượng thịt gà tiêu thụ bình quân đầu người sẽ tăng lên 0.1154218668 pound (Với hệ số β4 và β5 cho thấy thịt gà thể là sản phẩm thay thế cho thịt bò và thịt heo) Câu 2: (40 điểm) Xem xét dữ liệu về các yếu tố ảnh hưởng đền giá nhà trong fike Data7-3 thuộc bộ dữ liệu Ramanathan. Trong đó: Price = giá nhà Baths = số phòng tắm Bedrms = số phòng ngủ Famroom = nhận giá trị 1 nếu nhà phòng gia đình và giá trị 0 cho trường hợp ngược lại Firepl = nhận giá trị 1 nếu nhà thiết bị báo cháy và giá trị 0 cho trường hợp ngược lại Pool = nhận giá trị 1 nếu nhà hồ bơi và giá trị 0 cho trường hợp ngược lại Sqft = diện tích nhà Các anh/chị hãy: a) Xây dựng các mô hình sau theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô hình tối ưu (xem xét các mô hình tổng quát dưới đây). Giải thích quá trình thực hiện và các kiểm định cần thiết. (α=5%) a. Price = β1 + β2 Baths + β3Bedrms + β4Famroom + β5 Firepl + β6Pool + β7Sqft Chạy mô hình trên với Eview, ta kết quả: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 15:19 ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 4Sample: 1 14 GV: Nguyễn Thị Mai Bình Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C 39.05715 89.53975 0.436199 0.6758 BATHS -0.263691 41.45465 -0.006361 0.9951 BEDRMS -7.045531 28.73627 -0.245179 0.8134 FAMROOM -21.34471 42.87340 -0.497854 0.6338 FIREPL 26.18799 53.84537 0.486355 0.6416 POOL 53.19581 22.06352 2.411030 0.0467 SQFT 0.146551 0.030101 4.868577 0.0018 R-squared 0.911504 Mean dependent var 317.4929 Adjusted R-squared 0.835650 S.D. dependent var 88.49816 S.E. of regression 35.87726 Akaike info criterion 10.30494 Sum squared resid 9010.244 Schwarz criterion 10.62447 Log likelihood -65.13456 F-statistic 12.01657 Durbin-Watson stat 2.602259 Prob(F-statistic) 0.002213 Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Famroom, Firepl đều lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với: H0: β2 = β3 = β4 = β5 = 0 H1: ít nhất một giá trị βi ≠ 0 với (i = 2, 3, 4, 5) Chạy Eview ta kết quả: Wald Test: Equation: Untitled Test Statistic Value df Probability F-statistic 0.086452 (4, 7) 0.9839 Chi-square 0.345807 4 0.9867 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(2) -0.263691 41.45465 C(3) -7.045531 28.73627 C(4) -21.34471 42.87340 C(5) 26.18799 53.84537 Restrictions are linear in coefficients. P_value sau khi chạy Wald test trong kiểm định trên ta có: P_value = 0.9839 > α = 5% Vì vậy ta chấp nhận giả thuyết H0, vậy các hệ số trước các biến Baths, Bedrms, Famroom, Firepl đều bằng 0; hay các biến số phòng tắm, số phòng ngủ, phòng gia đình, thiết bị báo cháy không ảnh hưởng đến giá nhà. Vì vậy ta thể bỏ các biến trên ra khỏi mô hình. Lúc này ta mô hình: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 15:29 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C 22.67277 29.50580 0.768417 0.4584 POOL 52.78980 16.48172 3.202931 0.0084 SQFT 0.144415 0.014185 10.18086 0.0000 R-squared 0.907132 Mean dependent var 317.4929 Adjusted R-squared 0.890247 S.D. dependent var 88.49816 S.E. of regression 29.31856 Akaike info criterion 9.781728 Sum squared resid 9455.359 Schwarz criterion 9.918669 Log likelihood -65.47210 F-statistic 53.72383 Durbin-Watson stat 2.526380 Prob(F-statistic) 0.000002 ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 5GV: Nguyễn Thị Mai Bình Với các giá trị P_value trước biến Pool và biến sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này Vậy phương trình hồi qui lúc này: PRICE = 22.67277002 + 52.78979633*POOL + 0.1444149156*SQFT + iuˆ b. Price = β1 + β2 Baths + β Bedrms + β Famroom + β3 4 5 Firepl + β Pool + β6 7Sqft + β8 Firepl* Sqft Chạy mô hình trên với Eview, ta kết quả: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 16:33 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C -391.6926 362.2206 -1.081365 0.3211 BATHS -5.049608 40.23999 -0.125487 0.9042 BEDRMS 0.068210 28.36362 0.002405 0.9982 FAMROOM -21.67260 41.42130 -0.523223 0.6196 FIREPL 437.6739 340.0121 1.287230 0.2454 POOL 65.52753 23.57464 2.779578 0.0320 SQFT 0.502063 0.291755 1.720837 0.1361 FIREPL*SQFT -0.355295 0.290125 -1.224627 0.2666 R-squared 0.929200 Mean dependent var 317.4929 Adjusted R-squared 0.846601 S.D. dependent var 88.49816 S.E. of regression 34.66139 Akaike info criterion 10.22469 Sum squared resid 7208.472 Schwarz criterion 10.58986 Log likelihood -63.57282 F-statistic 11.24945 Durbin-Watson stat 2.524457 Prob(F-statistic) 0.004472 Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Famroom, Firepl, Sqft, Firepl* Sqft đều lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với: H: β0 2 = β = β = β = β = β = 0 3 4 5 7 8 H: ít nhất một giá trị β ≠ 0 với (i = 2, 3, 4, 5, 7, 8) 1 iChạy Eview ta kết quả: Wald Test: Equation: Untitled Test Statistic Value df Probability F-statistic 12.67148 (6, 6) 0.0035 Chi-square 76.02890 6 0.0000 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(2) -5.049608 40.23999 C(3) 0.068210 28.36362 C(4) -21.67260 41.42130 C(5) 437.6739 340.0121 C(7) 0.502063 0.291755 C(8) -0.355295 0.290125 Restrictions are linear in coefficients. P_value sau khi chạy Wald test trong kiểm định trên ta có: P_value = 0.0035> α = 5% Vì vậy ta bác bỏ giả thuyết H, vậy ít nhất một giá trị β ≠ 0 với (i = 2, 3, 4, 5, 7, 8) 0 iĐể thực hiện việc xây dựng mô hình từ đơn giản đến phức tạp, ta căn cứ vào hệ số P_value của các biến độc lập. Biến được loại ra khỏi mô hình là biến hệ số P_value lớn. ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 6GV: Nguyễn Thị Mai Bình - Đầu tiên ta bỏ biến Bedrms ra khỏi mô hình vì biến này P_value = 0.9982 (P_value lớn nhất). Lúc này kết quả Eview như sau: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 16:42 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C -391.3735 312.0440 -1.254225 0.2500 BATHS -5.013808 34.61187 -0.144858 0.8889 FAMROOM -21.69964 36.90877 -0.587926 0.5751 FIREPL 437.5656 312.0188 1.402370 0.2036 POOL 65.50844 20.55132 3.187553 0.0153 SQFT 0.501915 0.264005 1.901154 0.0990 FIREPL*SQFT -0.355152 0.262910 -1.350849 0.2188 R-squared 0.929200 Mean dependent var 317.4929 Adjusted R-squared 0.868515 S.D. dependent var 88.49816 S.E. of regression 32.09023 Akaike info criterion 10.08183 Sum squared resid 7208.479 Schwarz criterion 10.40136 Log likelihood -63.57283 F-statistic 15.31173 Durbin-Watson stat 2.525083 Prob(F-statistic) 0.001044 - Căn cứ vào kết quả chạy Eview sau khi bỏ biến Bedrms, ta nhận thấy các hệ số P_value của các biến Baths, Famroom, Firepl, Sqft, Firepl* Sqft đều lớn hơn α = 5%. Ta tiếp tục bỏ biến Baths, do P_value = 0.8889 (P_value lớn nhất) và được kết quả như sau Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 16:45 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C -396.8103 290.2054 -1.367343 0.2087 FAMROOM -23.43309 32.70893 -0.716412 0.4941 FIREPL 437.8164 292.2995 1.497835 0.1726 POOL 66.06998 18.90720 3.494435 0.0081 SQFT 0.498254 0.246188 2.023872 0.0776 FIREPL*SQFT -0.354257 0.246230 -1.438725 0.1882 R-squared 0.928988 Mean dependent var 317.4929 Adjusted R-squared 0.884606 S.D. dependent var 88.49816 S.E. of regression 30.06262 Akaike info criterion 9.941969 Sum squared resid 7230.087 Schwarz criterion 10.21585 Log likelihood -63.59378 F-statistic 20.93140 Durbin-Watson stat 2.543786 Prob(F-statistic) 0.000210 - Căn cứ vào kết quả chạy Eview sau khi bỏ biến Bedrms, Baths; ta nhận thấy các hệ số P_value của các biến Famroom, Firepl, Sqft, Firepl* Sqft đều lớn hơn α = 5%. Ta tiếp tục bỏ biến Famroom, do P_value = 0.4941 (P_value lớn nhất) và được kết quả như sau: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 16:47 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C -376.6690 280.9210 -1.340836 0.2128 FIREPL 402.0001 280.0962 1.435221 0.1850 POOL 63.03432 17.92106 3.517331 0.0065 SQFT 0.482192 0.238444 2.022249 0.0739 ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 7GV: Nguyễn Thị Mai Bình FIREPL*SQFT -0.340550 0.238755 -1.426357 0.1875 R-squared 0.924432 Mean dependent var 317.4929 Adjusted R-squared 0.890846 S.D. dependent var 88.49816 S.E. of regression 29.23837 Akaike info criterion 9.861294 Sum squared resid 7693.940 Schwarz criterion 10.08953 Log likelihood -64.02906 F-statistic 27.52457 Durbin-Watson stat 2.550994 Prob(F-statistic) 0.000046 - Căn cứ vào kết quả chạy Eview sau khi bỏ biến Bedrms, Baths, Famroom; ta nhận thấy các hệ số P_value của các biến Firepl, Sqft, Firepl* Sqft đều lớn hơn α = 5%. Ta tiếp tục bỏ biến Firepl* Sqft, do P_value = 0.1875 (P_value lớn nhất) và được kết quả như sau: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 16:49 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C 21.73385 31.51070 0.689729 0.5061 FIREPL 4.317827 28.16788 0.153289 0.8812 POOL 52.95961 17.30140 3.061001 0.0120 SQFT 0.142938 0.017711 8.070628 0.0000 R-squared 0.907350 Mean dependent var 317.4929 Adjusted R-squared 0.879555 S.D. dependent var 88.49816 S.E. of regression 30.71350 Akaike info criterion 9.922238 Sum squared resid 9433.193 Schwarz criterion 10.10483 Log likelihood -65.45567 F-statistic 32.64424 Durbin-Watson stat 2.595128 Prob(F-statistic) 0.000018 - Tiếp tục bỏ biến Firepl do P_value = 0.8812 > 0.05 ta có: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 16:50 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C 22.67277 29.50580 0.768417 0.4584 POOL 52.78980 16.48172 3.202931 0.0084 SQFT 0.144415 0.014185 10.18086 0.0000 R-squared 0.907132 Mean dependent var 317.4929 Adjusted R-squared 0.890247 S.D. dependent var 88.49816 S.E. of regression 29.31856 Akaike info criterion 9.781728 Sum squared resid 9455.359 Schwarz criterion 9.918669 Log likelihood -65.47210 F-statistic 53.72383 Durbin-Watson stat 2.526380 Prob(F-statistic) 0.000002 Với các giá trị P_value trước biến Pool và biến sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này Vậy phương trình hồi qui lúc này: PRICE = 22.67277002 + 52.78979633*POOL + 0.1444149156*SQFT + iuˆ c. Price = β1 + β2 Baths + β Bedrms + β Famroom + β3 4 5 Firepl + β Pool + β6 7Sqft + β8Famroom* Bedrms Chạy mô hình trên với Eview, ta kết quả: ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 8GV: Nguyễn Thị Mai Bình Điều này nghĩa mô hình hiện tượng đa cộng tuyến hoàn hảo. Lúc này ta tạo biến mới Famroom_Bedrms và lập bảng ma trận tương quan để xác định cá biến bị đa cộng tuyến. Ta có: PRICE BATHS BEDRMS FAMROOM FIREPL POOL SQFT FAMROOM_BEDRMS PRICE 1.000000 0.669612 0.315634 0.472715 0.495681 0.179062 0.905827 0.477140 BATHS 0.669612 1.000000 0.532327 0.534885 0.457693 -0.185695 0.787318 0.615893 BEDRMS 0.315634 0.532327 1.000000 0.337350 0.547723 -0.377778 0.464730 0.532557 0.968264 FAMROOM 0.472715 0.534885 0.337350 1.000000 0.781736 0.025950 0.520220FIREPL 0.495681 0.457693 0.547723 0.781736 1.000000 -0.121716 0.551010 0.756927 POOL 0.179062 -0.185695 -0.377778 0.025950 -0.121716 1.000000 -0.124679 -0.060671 SQFT 0.905827 0.787318 0.464730 0.520220 0.551010 -0.124679 1.000000 0.559476 0.968264 FAMROOM_BEDRMS 0.477140 0.615893 0.532557 0.756927 -0.060671 0.559476 1.000000 Lúc này ta hệ số tương quan giữa hai biến FAMROOM và FAMROOM_BEDRMS bằng 0.968264 (gần bằng 1). Vậy hiện tượng đa cộng tuyến là do 2 biến trên mối quan hệ chặt chẽ với nhau vì vậy ta bỏ 1 trong 2 biến; giả sử bỏ biến FAMROOM ta kết quả chạy Eview như sau: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 17:01 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C 23.04862 96.48374 0.238886 0.8180 BATHS -0.263691 41.45465 -0.006361 0.9951 BEDRMS -1.709353 27.73050 -0.061642 0.9526 FIREPL 20.85181 46.43392 0.449064 0.6670 POOL 53.19581 22.06352 2.411030 0.0467 SQFT 0.146551 0.030101 4.868577 0.0018 FAMROOM_BEDRMS -5.336177 10.71835 -0.497854 0.6338 R-squared 0.911504 Mean dependent var 317.4929 Adjusted R-squared 0.835650 S.D. dependent var 88.49816 S.E. of regression 35.87726 Akaike info criterion 10.30494 Sum squared resid 9010.244 Schwarz criterion 10.62447 Log likelihood -65.13456 F-statistic 12.01657 Durbin-Watson stat 2.602259 Prob(F-statistic) 0.002213 Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Firepl, Famroom* Bedrms đều lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với: H: β0 2 = β = β = β = 0 3 5 8 H: ít nhất một giá trị β ≠ 0 với (i = 2, 3, 5, 8) 1 iChạy Eview ta kết quả: Wald Test: Equation: Untitled Test Statistic Value df Probability F-statistic 0.086452 (4, 7) 0.9839 ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 9GV: Nguyễn Thị Mai Bình Chi-square 0.345807 4 0.9867 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(2) -0.263691 41.45465 C(3) -1.709353 27.73050 C(4) 20.85181 46.43392 C(7) -5.336177 10.71835 Restrictions are linear in coefficients. P_value sau khi chạy Wald test trong kiểm định trên ta có: P_value = 0.9839 > α = 5% Vì vậy ta chấp nhận giả thuyết H0, vậy các hệ số trước các biến Baths, Bedrms, Firepl, Famroom* Bedrms đều bằng 0; hay các biến số phòng tắm, số phòng ngủ, thiết bị báo cháy và biến ảnh hưởng của phòng gia đình lên số lượng phòng ngủ không ảnh hưởng đến giá nhà. Vì vậy ta thể bỏ các biến trên ra khỏi mô hình. Lúc này ta mô hình: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 15:29 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C 22.67277 29.50580 0.768417 0.4584 POOL 52.78980 16.48172 3.202931 0.0084 SQFT 0.144415 0.014185 10.18086 0.0000 R-squared 0.907132 Mean dependent var 317.4929 Adjusted R-squared 0.890247 S.D. dependent var 88.49816 S.E. of regression 29.31856 Akaike info criterion 9.781728 Sum squared resid 9455.359 Schwarz criterion 9.918669 Log likelihood -65.47210 F-statistic 53.72383 Durbin-Watson stat 2.526380 Prob(F-statistic) 0.000002 Với các giá trị P_value trước biến Pool và biến sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này Vậy phương trình hồi qui lúc này: PRICE = 22.67277002 + 52.78979633*POOL + 0.1444149156*SQFT + iuˆ d. Price = β1 + β2 Baths + β Bedrms + β Famroom + β3 4 5 Firepl + β Pool + β6 7Sqft + β8Pool*Sqft Chạy mô hình trên với Eview, ta kết quả: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 17:10 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C 76.93417 64.38956 1.194824 0.2772 BATHS -10.24209 29.37901 -0.348619 0.7393 BEDRMS 4.867122 20.64732 0.235727 0.8215 FAMROOM -10.51463 30.40630 -0.345804 0.7413 FIREPL -1.107752 39.07848 -0.028347 0.9783 POOL -85.25082 50.95585 -1.673033 0.1453 SQFT 0.124680 0.022526 5.534876 0.0015 POOL*SQFT 0.074512 0.026121 2.852620 0.0291 R-squared 0.962442 Mean dependent var 317.4929 Adjusted R-squared 0.918624 S.D. dependent var 88.49816 S.E. of regression 25.24543 Akaike info criterion 9.590727 Sum squared resid 3823.992 Schwarz criterion 9.955903 ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 10Log likelihood -59.13509 F-statistic 21.96456 GV: Nguyễn Thị Mai Bình Durbin-Watson stat 2.150252 Prob(F-statistic) 0.000712 Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Famroom, Firepl, Pool đều lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với: H: β0 2 = β = β = β = β = 0 3 4 5 6 H: ít nhất một giá trị β ≠ 0 với (i = 2, 3, 4, 5, 6) 1 iChạy Eview ta kết quả: Wald Test: Equation: Untitled Test Statistic Value df Probability F-statistic 0.675681 (5, 6) 0.6581 Chi-square 3.378405 5 0.6419 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(2) -10.24209 29.37901 C(3) 4.867122 20.64732 C(4) -10.51463 30.40630 C(5) -1.107752 39.07848 C(6) -85.25082 50.95585 Restrictions are linear in coefficients. P_value sau khi chạy Wald test trong kiểm định trên ta có: P_value = 0.6581 > α = 5% Vì vậy ta chấp nhận giả thuyết H0, vậy các hệ số trước các biến Baths, Bedrms, Famroom, Firepl, Pool đều bằng 0; hay các biến số phòng tắm, số phòng ngủ, phòng gia đình, thiết bị báo cháy, hồ bơi không ảnh hưởng đến giá nhà. Vì vậy ta thể bỏ các biến trên ra khỏi mô hình. Lúc này ta mô hình: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 17:17 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C 42.79643 22.36292 1.913723 0.0820 SQFT 0.132927 0.011257 11.80854 0.0000 POOL*SQFT 0.031857 0.006697 4.757055 0.0006 R-squared 0.941294 Mean dependent var 317.4929 Adjusted R-squared 0.930620 S.D. dependent var 88.49816 S.E. of regression 23.31047 Akaike info criterion 9.323092 Sum squared resid 5977.157 Schwarz criterion 9.460032 Log likelihood -62.26164 F-statistic 88.18710 Durbin-Watson stat 2.756228 Prob(F-statistic) 0.000000 Với các giá trị P_value trước biến Pool*Sqft và biến Sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này Vậy phương trình hồi qui lúc này: PRICE = 42.7964305 + 0.132927069*SQFT + 0.03185742065*(POOL*SQFT) + iuˆ e. Price = β1 + β2 Baths + β Bedrms + β Famroom + β3 4 5 Firepl + β Pool + β6 7Sqft + β8Famroom* Bedrms + β9 Firepl* Sqft + β10Pool*Sqft + β11Firepl*Bedrms+ βPool*Baths 10Chạy mô hình trên với Eview, ta kết quả: [...]... 1.000000 -0 .056664 0.765096 0.839084 -0 .056664 1.000000 -0 .124702 0.007397 -0 .273813 0.164184 0.930736 0.108745 FIREPL_BED 0.536074 0.768273 0.715908 0.956365 -0 .225050 0.583864 0.489466 RMS POOL_BATH -0 .030708 -0 .299574 0.103549 -0 .026253 0.970620 -0 .003719 0.298262 S 0.022538 -0 .002457 0.973173 -0 .124702 0.022538 0.973173 1.000000 Lúc này ta hệ số tương quan giữa các biến sau gần bằng 1: - Hai biến... 0.457693 -0 .185695 0.787318 0.615893 0.729672 0.007397 0.536074 -0 .030708 0.532327 1.000000 0.337350 0.547723 -0 .377778 0.464730 0.532557 0.565943 -0 .273813 0.768273 -0 .299574 0.534885 0.337350 1.000000 0.781736 0.025950 0.520220 0.968264 0.714019 0.164184 0.715908 0.457693 0.547723 0.781736 1.000000 -0 .121716 0.551010 0.756927 0.838394 0.050916 0.956365 -0 .026253 -0 .185695 -0 .377778 0.025950 -0 .121716... 9.460032 Log likelihood -6 2.26164 F-statistic 88.18710 Durbin-Watson stat 2.756228 Prob(F-statistic) 0.000000 Với các giá trị P_value trước biến POOL và biến SQFT đều nhỏ hơn 5% Vì vậy chấp nhận hô hình này Kiểm định Wald lại về việc bỏ các biến: bedrms, firepl_sqft, baths, famroom_bedrms, firepl_bedrms, pool, ta có: Wald Test: Equation: Untitled Test Statistic F-statistic Chi-square Value df Probability... POOL_BATHS và POOL_SQFT bằng 0.973173 - Hai biến POOL_BATHS và POOL bằng 0.970620 - Hai biến FAMROOM và FAMROOM_BEDRMS bằng 0.968264 - Hai biến FIREPL_BEDRMS và FIREPL bằng 0.956365 - Hai biến POOL_SQFT và POOL bằng 0.930736 - Hai biến FIREPL_SQRT và SQRT bằng 0.956365 Vậy hiện tượng đa cộng tuyến là do các cặp biến trên mối quan hệ chặt chẽ với nhau vì vậy ta bỏ lần lượt các biến sau cho đến khi mô hình... -5 9.13262 F-statistic 16.02171 Durbin-Watson stat 2.159633 Prob(F-statistic) 0.003635 Với kết quả của bảng trên ta thấy tất cả các hệ số P_value của các biến đều lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với: H0: β2 = β3 = β6 = β7 = β8 = β9 = β10 = β11 = 0 H1: ít nhất một giá trị βi ≠ 0 với (i = 2, 3, 6, 7, 8, 9, 10, 11) Chạy Eview ta kết quả: Wald Test: Equation: Untitled Test Statistic F-statistic... -0 .121716 POOL SQFT 1.000000 -0 .124679 -0 .060671 -0 .123212 0.930736 -0 .225050 0.298262 0.103549 0.970620 0.787318 0.464730 0.520220 0.551010 -0 .124679 1.000000 0.559476 0.915473 0.108745 0.583864 -0 .003719 0.615893 0.532557 0.968264 0.756927 -0 .060671 0.559476 1.000000 0.727890 0.076263 0.765096 0.729672 0.565943 0.714019 0.838394 -0 .123212 0.915473 0.727890 1.000000 0.104587 0.839084 -0 .002457 0.050916 0.076263... 0.136839 -2 .662211 -0 .011903 0.073664 3.442053 0.290322 8.363818 0.283178 0.035004 112.1985 0.471334 -0 .318301 -0 .042034 2.104437 0.030678 0.6573 0.7631 0.9681 0.0892 0.9767 R-squared 0.962455 Mean dependent var 317.4929 Adjusted R-squared 0.902383 S.D dependent var 88.49816 S.E of regression 27.65010 Akaike info criterion 9.733231 Sum squared resid 3822.641 Schwarz criterion 10.14405 Log likelihood -5 9.13262... 0.8313 Value Std Err -1 0.28888 4.190055 -8 3.26236 -2 .662211 -0 .011903 3.442053 32.19667 111.7813 73.16128 8.363818 0.283178 112.1985 Null Hypothesis Summary: Normalized Restriction (= 0) C(2) C(3) C(4) C(6) C(7) C(9) Restrictions are linear in coefficients P_value sau khi chạy Wald test trong kiểm định trên ta có: P_value = 0.8078 < α = 5% Vì vậy việc bỏ các biến trên là phù hợp các biến: bedrms, firepl_sqft,... + u i Ta có: β1 = 42.7964305 không giả thích được vì ẩn chứa những biến bỏ sót ngoài mô hình hoặc chọn hàm sai β2 = 0.132927069 Tác động biên của SQFT lên PRICE là: 0.132927069 điều này nghĩa Trong điều kiện các biến khác không đổi, theo thông tin từ dữ liệu mẫu ta nếu diện tích nhà tăng lên 1 đơn vị thì giá nhà trung bình sẽ tăng lên một lượng là 0.132927069 β2 = 0.03185742065: sự khác... chạy Wald test trong kiểm định trên ta có: P_value = 0.0036> α = 5% Vì vậy ta bác bỏ giả thuyết H0, vậy ít nhất một giá trị βi ≠ 0 với (i = 2, 3, 6, 7, 8, 9, 10, 11) Để thực hiện việc xây dựng mô hình từ đơn giản đến phức tạp, ta căn cứ vào hệ số P_value của các biến độc lập Biến được loại ra khỏi mô hình là biến hệ số P_value lớn Tương tự như các câu trên, các biến được bỏ theo thứ tự: 1 BEDRMS . POOL_BATHS -0 .030708 -0 .299574 0.103549 -0 .026253 -0 .003719 0.022538 -0 .002457 -0 .124702 1.000000 0.970620 0.973173 Lúc này ta có hệ số tương quan giữa các. Coefficient Std. Error t-Statistic Prob. C -3 91.3735 312.0440 -1 .254225 0.2500 BATHS -5 .013808 34.61187 -0 .144858 0.8889 FAMROOM -2 1.69964 36.90877 -0 .587926 0.5751

Ngày đăng: 31/10/2012, 14:46

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan