tiểu luận xây dựng mô hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới

26 1.4K 7
tiểu luận xây dựng mô hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH  Môn: PHÂN TÍCH ĐNNH LƯỢNG Tiểu luận: Danh sách nhóm 7: Phạm Anh Tuấn Nguyễn Trọng An Hoàng Ngọc Lâm Đoàn Ngọc Châu Nguyễn Thành Sơn Tôn Thất Kỳ Nam 2009 DANH SÁCH CÁC THÀNH VIÊN NHÓM 7 STT MSHV HỌ VÀ TÊN 1 MBA.0832 Phạm Anh Tuấn 2 MBA.0801 Nguyễn Trọng An 3 MBA.0814 Hoàng Ngọc Lâm 4 MBA.0805 Đoàn Ngọc Châu 5 MBA.0826 Nguyễn Thành Sơn 6 MBA.0816 Tôn Thất Kỳ Nam ĐẠI HỌC MỞ BÁN CÔNG CỘNG HÒA Xà HỘI CHỦ NGHĨA VIỆT NAM TP HỒ CHÍ MINH Độc lập – Tự do – Hạnh phúc ĐỀ KIỂM TRA MÔN: PHÂN TÍCH ĐNN H LƯỢN G LỚP: MBA8 Ghi chú: Sinh viên làm bài theo nhóm Yêu cầu: Sử dụng dữ liệu trong file World 95 Tieng Viet.sav đính kèm, bạn hãy tự xây dựng cho mình một hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới. Bạn được tự do lựa chọn các biến giải thích để đưa vào hình cũng như tự quyết định dạng thức của các liên hệ giữa biến giải thích và biến kết quả. Hãy tả chi tiết quá trình xây dựng hình của bạn và tăng tính thuyết phục của hình này bằng các công cụ chNn đoán và đánh giá hình. Giải thích ý nghĩa các kết quả của hình rút ra. Sản phẩm nộp: 1. Bài làm dạng file Word (có ghi tên các thành viên của nhóm ở trang đầu) 2. File output SPSS Cả 2 file được đặt tên như sau MBA8_KT_nhomX (X là số thứ tự nhóm) Hình thức: File Word định dạng khổ giấy A4 (canh lề 2cm mỗi phía), font chữ Time N ew Roman, cỡ 12 points Cách đoạn (Spacing before) 6 points, giãn dòng (line spacing) 1.2 Chúc thành công! Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 Mục Lục LỜI N ÓI ĐẦU. I. HÌN H HỒI QUI ĐƠN TUYẾN TÍN H: 1. Xây dựng phương trình của hình hồi đơn tuyến tính từ dữ liệu mẫu. 2. Đánh giá độ phù hợp của hình. 3. Kiểm định các giả thiết. a. Kiểm định giả thiết về độ phù hợp của hình (phân tích phương sai) b. Kiểm định giả thiết về ý nghĩa của hệ số hồi qui. 4. Vận dụng để xây dựng một hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới. II. HÌN H HỒI QUI TUYẾN TÍN H BỘI: 1. Xem xét ma trận hệ số tương quan. 2. Xây dựng hình. 3. Đánh giá độ phù hợp của hình hồi qui tuyến tính bội. 4. Kiểm định độ phù hợp của hình. 5. Ý nghĩa các hệ số hồi qui riêng phần trong hình. 6. Lựa chọn biến cho hình. KẾT LUẬN .  Trang 1 Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 LỜI NÓI ĐẦU Phân tích định lượng là một môn khoa học về đo lường các mối quan hệ kinh tế xã hội diễn ra trong thực tế. N gày nay, nó là sự kết hợp giữa các lý thuyết kinh tế hiện đại, thống kê toán học và máy vi tính, nhằm định lượng các mối quan hệ kinh tế xã hội, dự báo khả năng phát triển hay diễn biến của các hiện tượng kinh tế xã hội và phân tích chính sách. Một khía cạnh quan trọng trong nghiên cứu kinh tế xã hội là nghiên cứu để tìm hiểu, đưa ra các quyết định thay đổi cho tương lai. Phán đoán tốt, trực giác và quan tâm đến thực trạng của nền kinh tế, môi trường kinh doanh và môi trường xã hộithể cho người nghiên cứu một ý tưởng sơ bộ hay “cảm giác” về những gì có thể xảy ra trong tương lai. Tuy nhiên, chuyển từ cảm giác thành con số để có thể sử dụng một cách hiệu quả thì khá khó khăn. Phân tích dữ liệu thống kê giúp các nhà nghiên cứu và quản lý dự đoán thực tế phức tạp của kinh tế và xã hội trong tương lai ít rủi ro hơn. N hững người ra quyết định và người quản lý thành công nhất chính là những người có thể hiểu thông tin và sử dụng thông tin hiệu quả. Một trong những nội dung chính của môn phân tích định lượng là phân tích hồi qui – nghiên cứu sự phụ thuộc của một biến (biến phụ thuộc) vào một hay nhiều biến khác (các biến độc lập), với ý tưởng là ước lượng (hay dự đoán) giá trị trung bình của biến phụ thuộc trên cơ sở các giá trị biết trước của các biến độc lập. Đây là nội dung chính của tiểu luận mà nhóm chúng em sẽ trình bày. N hân đây, chúng em muốn tỏ lòng biết ơn sâu sắc đến thầy Hoàng Trọng, người đã hết lòng tận tụy truyền đạt những kiến thức quý báu và chia sẻ những kinh nghiệm thực tế của bản thân cho khóa học MBA8 và chúng em cũng xin kính chúc Thầy được dồi dào sức khỏe và luôn luôn thành công trong con đường sự nghiệp. Tp.HCM, ngày 20 tháng 02 năm 2009 Các thành viên nhóm 7 Trang 2 Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 I. HÌNH HỒI QUI ĐƠN TUYẾN TÍNH: Một đồ thị phân tán là công cụ hữu ích có thể cho chúng ta thấy nhiều loại liên hệ giữa hai biến ta đang khảo sát. Một số dạng liên hệ thường gặp giữa hai biến định lượng: Không có tương quan Tương quan nghịch Tương quan thuận N gười ta dùng một số thống kê có tên là hệ số tương quan Pearson (ký hiệu là r) để lượng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa hai biến định lượng. Trong đó: -1 ≤ r ≤ 1 9 r có thể âm hoặc dương, trị tuyệt đối của r tiến gần đến 1 khi hai biến có mối tương quan tuyến tính chặt chẽ. 9 Trị tuyệt đối của r = 1 : Khi tất cả các điểm phân tán xếp thành một đường thẳng. 9 Giá trị r = 0 : Khi hai biến không có mối liên hệ tuyến tính Phân tích hồi qui trước hết là đo mức độ tuyến tính giữa hai biến, nhằm ước lượng hay dự báo một biến trên cơ sở giá trị đã cho của một biến khác. Về mặt kỹ thuật, trong phân tích hồi qui, các biến không có tính chất đối xứng. Biến phụ thuộc là đại lượng ngẫu nhiên, biến giải thích là phi ngẫu nhiên, giá trị của chúng đã được xác định. 1. Xây dưng phương trình của hình hồi đơn tuyến tính từ dữ liệu mẫu: Xét mối liên hệ tuyến tính giữa một biến phụ thuộc và một biến độc lập. hình được xây dựng từ dữ liệu mẫu có dạng đường thẳng như sau: Ŷ i = B 0 + B 1 *X Trong đó: 9 X i : là trị quan sát thứ i của biến độc lập 9 Ŷ i : là giá trị dự đoán (hay giá trị lý thuyết) thứ i của biến phụ thuộc, dấu mũ đại diện cho giá trị dự đoán. Trang 3 Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 9 B0 và B1 : là hệ số hồi qui. Phương pháp dùng để xác định B 0 (tung độ của vị trí tại đó đường thẳng cắt trục tung) và B 1 (độ dốc) là phương pháp bình phương nhỏ nhất thông thường (OLS – Ordinary Least Square), nghĩa là ta phải tìm ra Ŷ i sao cho nó càng gần với giá trị thực (Y i ) càng tốt. Đường thẳng được tìm ra dựa trên nguyên tắc nó cực tiểu hóa tổng các độ lệch bình phương giữa tung độ của các điểm dữ liệu quan sát và đường thẳng. Khi chỉ có một biến độc lập thì hình hồi qui tuyến tính tổng thểthể được tả như sau: Y i = β 0 + β 1 * X + e i 9 β 1 , β 0 : là các hệ số độ dốc và hằng số của tổng thể 9 e i : sai số thực, là chênh lệch giữa giá trị thực Y i quan sát được và giá trị dự báo (do ảnh hưởng của các yếu tố khác chưa nghiên cứu tới), tức là: e i = (Y - Ŷ i ) = Y i – (β 0 + β 1 * X) 2. Đánh giá độ phù hợp của hình: Một công việc quan trọng của bất kỳ thủ tục thống kê xây dựng hình từ dữ liệu mẫu nào cũng đều là chứng minh phù hợp của hình. Để biết hình hồi qui tuyến tính đã xây dựng phù hợp đến mức độ nào, ta dùng một thước đo là hệ số xác định R 2 (Coefficient of Determination). SST SSR R = 2 0 ≤ R 2 ≤ 1 Trong đó: 9 SST (Total Sum of Squares) : là tổng bình phương của tất cả các sai lệch giữa các giá trị quan sát Yi với giá trị trung bình của chúng. 9 SSR (Sum of Squares explained by Regression) : là tổng bình phương của tất cả các sai lệch giữa giá trị của biến Y tính theo hàm hồi qui mẫu với giá trị trung bình. Phần này đo độ chính xác của hàm hồi qui. 9 Mặt khác: SST = SSR + SSE ¾ Nếu R 2 = 1 : thì đường hồi qui phù hợp “hoàn hảo”, tất cả sai lệch của Y (so với giá trị trung bình) đều giải thích được bởi hình hồi qui. ¾ Nếu R 2 = 0 : chứng tỏ các biến X và Y không có quan hệ. Nếu hàm hồi qui mẫu phù hợp tốt với các số liệu quan sát thì SSR sẽ càng lớn hơn SSE. Nếu tất cả các giá trị quan sát của Yi đều nằm trên đường hồi qui (Ŷ) thì SSR sẽ bằng SST và do đó SSE=0. N gược lại, nếu hàm hồi qui mẫu kém phù hợp với các giá trị quan sát thì SSE sẽ càng lớn hơn SSR. (xem hình) Trang 4 Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 Trang 5 3. Kiểm định các giả thiết: Ta tiến hành qua hai bước sau: a. Kiểm định giả thiết về độ phù hợp của hình (phân tích phương sai): Xây dựng xong hình hồi qui tuyến tính, ta phải xem xét độ phù hợp của hình đối với tập dữ liệu qua giá trị R 2 . Để kiểm định độ phù hợp của hình hồi qui tổng thể, ta đặt giả thiết R 2 =0. Nếu sau khi kiểm định ta có đủ bằng chứng bác bỏ giả thiết H 0 : R 2 pop =0 thì kết luận hình hồi qui tuyến tính xây dựng được phù hợp với tổng thể. Đại lượng F được sử dụng cho kiểm định này. Nếu xác suất F nhỏ thì giả thiết R 2 pop =0 bị bác bỏ. Tính F theo công thức sau: Trong SPSS, số liệu tính F được lấy từ bảng phân tích phương sai ANOVA(b): b. Kiểm định giả thiết về ý nghĩa của hệ số hồi qui: Mặc dù hình hồi qui tuyến tính mẫu ta xây dựng được có giá trị độ dốc B 1 ≠ 0, nhưng ta chưa thể chắc chắn độ dốc của hình tổng thể khác 0. Vì vậy, ta phải làm kiểm định để có kết luân về β 1 . Giả thiết dùng để kiểm định giả thiết này là H 0 : β 1 =0, ta kỳ vọng giả thiết này sẽ bị bác bỏ vì nếu β 1 =0, nghĩa là Y độc lập với X. Do đó, mối quan hệ tương quan tuyến tính ta nhận thấy ở mẫu xảy ra là do ngẫu nhiên, hình hồi qui tuyến tính ta đã xây dựng được dựa trên một mối quan hệ “giả” giữa hai biến. Trị thống kê dùng để kiểm định giả thiết là: Trong SPSS, ta xem số liệu ở hai cột cuối cùng (là t và Sig. - hệ số độ dốc) trong bảng Coefficients(a): 1 )( Y)-Y ^ ( 1 2 1 2 −− − = ∑ ∑ = = pN Y p F N i i N i Y i ^ sidualSquareMean gressionMeanSquare F Re Re = 1 1 B S B t = Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 4. Vận dụng để xây dựng một hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới: Trong hình này, với:  Tuổi thọ TB của phụ nữ là biến phụ thuộc  Lần lượt xét từng chỉ tiêu còn lại với vai trò là biến độc lập. Trong SPSS, ta thực hiện các thao tác sau:  Graphs / Scatter … : để vẽ đồ thị phân tán cho từng cặp biến (giữa biến phụ thuộc với một biến độc lập).  Analyze / Correlate / Bivariate … : để tính được r của mẫu và thực hiện kiểm định giả thiết về hệ số tương quan tuyến tính của tổng thể.  Analyze / Regression / Linear … : Xây dựng hình hồi qui đơn tuyến tính a. Vẽ đồ thị phân tán cho từng cặp biến: + Tuổi thọ trung bình của phụ nữ theo Số lượng dân: Sè l−ỵng d©n 1400000 1200000 1000000 800000 600000 400000 200000 0 -200000 Ti thä TB cđa phơ n÷ 90 80 70 60 50 40 Correlations Tuổi thọ TB phụ nữ Số lượng dân Pearson Correlation 1 071 Sig. (2-tailed) . .461 Tuổi thọ TB phụ nữ N 109 109 Pearson Correlation 071 1 Sig. (2-tailed) .461 . Số lượng dân N 109 109 Trang 6 Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 + Tuổi thọ trung bình phụ nữ với Mật độ dân số (người/Km2): MËt ®é d©n sè (ng−êi/Km2) 6000500040003000200010000-1000 Ti thä TB phơ n÷ 90 80 70 60 50 40 Correlations Tuổi thọ TB phụ nữ Mật độ dân số (người/km2) Pearson Correlation 1 .128 Sig. (2-tailed) . .186 Tuổi thọ TB phụ nữ N 109 109 Pearson Correlation .128 1 Sig. (2-tailed) .186 . Mật độ dân số (người/km2) N 109 109 + Tuổi thọ trung bình phụ nữ với Tỉ lệ dân sống ở vùng đơ thị (%): TØ lƯ d©n sèng ë vïng ®« thÞ (%) 120100806040200 Ti thä TB phơ n÷ 90 80 70 60 50 40 Correlations Tuổi thọ TB phụ nữ Tỉ lệ dân sống ở vùng đô thò (%) Pearson Correlation 1 .743(**) Sig. (2-tailed) . .000 Tuổi thọ TB phụ nữ N 109 108 Pearson Correlation .743(**) 1 Sig. (2-tailed) .000 . Tỉ lệ dân sống ở vùng đô thò (%) N 108 108 ** Correlation is significant at the 0.01 level (2-tailed). + Tuổi thọ trung bình phụ nữ với Tỉ lệ dân biết chữ (%): TØ lƯ d©n biÕt ch÷ (%) 120100806040200 Ti thä TB phơ n÷ 90 80 70 60 50 40 Correlations Tuổi thọ TB phụ nữ Tỉ lệ dân biết chữ (%) Pearson Correlation 1 .865(**) Sig. (2-tailed) . .000 Tuổi thọ TB phụ nữ N 109 107 Pearson Correlation .865(**) 1 Sig. (2-tailed) .000 . Tỉ lệ dân biết chữ (%) N 107 107 ** Correlation is significant at the 0.01 level (2-tailed). Trang 7 [...]... biến cho mục đích này Trong tiểu luận này, ta xem xét Tuổi thọ trung bình phụ nữ giữa các quốc gia trên thế giới phụ thuộc như thế nào vào: Tỉ lệ dân sống ở vùng đơ thị (%) Calori nạp hàng ngày trung bình một người Số con trung bình của một phụ nữ Tỷ lệ nữ giới biết chữ Sử dụng SPSS, ta có ma trận sau: Correlations Tuổi thọ TB phụ nữ Tuổi thọ TB phụ nữ Tỉ lệ dân sống ở vùng đô thò (%) Calori nạp hàng... Số con TB của một phụ nữ Ý nghĩa của hàm hồi qui này: Với B1= -4.674 < 0 cho biết: xét tuổi thọ trung bình phụ nữ giữa các quốc gia trên thế giới nằm trong khoảng (43; 82), khi số con tăng lên 1 thì tuổi thọ trung bình phụ nữ giảm khoảng 4.674 tuổi d Đánh giá độ phù hợp của hình: Từ bảng Model Summary, ta có R Square = 0.702 (tiến gần đến 1) Vậy hình này là phù hợp e Kiểm định các giả thiết: Kiểm... Hệ số tương quan giữa Tuổi thọ trung bình phụ nữcác biến độc lập còn lại đều cao (thấp nhất là 0.743) Sơ bộ ta có thể kết luận các biến độc lập này có thể đưa vào hình để giải thích cho Tuổi thọ trung bình phụ nữ 2 Xây dựng hình: Sử dụng SPSS ta có các bảng số liệu sau: Regression Variables Entered/Removed(b) (Bảng 01) Model Variables Entered Variables Removed 1 Tỉ lệ nữ giới biết chữ (%),... 2 3 4 5 6 7 8 Sè con TB cđa mét phơ n÷ Trang 9 9 Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 + Tuổi thọ trung bình phụ nữ với Tỉ lệ nữ giới biết chữ (%): 90 Correlations Tuổi thọ TB phụ nữ Tỉ lệ nữ giới biết chữ (%) Pearson Correlation 1 819(**) Sig (2-tailed) 000 109 85 819(**) 1 000 85 85 80 70 Tuổi thọ TB phụ nữ Ti thä TB phơ n÷ N 60 Tỉ lệ nữ giới biết chữ (%) Pearson Correlation Sig (2-tailed)... TB của 1 phụ nữ d Dependent Variable: Tuổi thọ TB phụ nữ 626 571 273 con Nhận xét về hình: Qua các phân tích trên, ta thấy R2 của hình khá cao và kiểm định t lại cho thấy 4 biến độc lập ta đưa vào đều chấp nhận được vì chúng có ý nghĩa giải thích cho biến Tuổi thọ trung bình phụ nữ Điều này cho thấy khơng tồn tại hiện tượng đa cộng tuyến Cho nên, hình này là phù hợp Trang 22 Tiểu luận: Phân... tế, hình hồi qui đơn biến (có 2 biến) là khơng thỏa đáng, những lý thuyết kinh tế ít khi đơn giản như vậy Do đó, ta phải xem xét hình hồi qui có nhiều hơn hai biến Đó là hình hồi qui bội Các bước thực hiện cũng giống như hình hồi qui đơn tuyến tính hình hồi quy bội mở rộng hình hồi qui hai biến bằng cách thêm vào một số biến độc lập để giải thích tốt hơn cho biến phụ thuộc hình có... Trang 13 Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 1 Xem xét ma trận hệ số tương quan: Đầu tiên, khi tiến hành phân tích hồi qui tuyến tính bội là xem xét các mối tương quan tuyến tính giữa tất cả các biến, xem xét tổng qt mối quan hệ giữa từng biến độc lập với biến phụ thuộc và chính giữa các biến độc lập với nhau Ta xây dựng ma trận tương quan giữa tất cả các biến cho mục đích này Trong tiểu luận. .. 6.765 47.467 Số con TB của 1 phụ nữ t a Dependent Variable: Tuổi thọ TB phụ nữ Trong bảng 04, các hệ số hồi qui của từng biến độc lập trong hình hồi qui tuyến tính bội được gọi là hệ số hồi qui riêng phần Ý nghĩa của hệ số hồi qui riêng phần là : βk đo lường sự thay đổi trong giá trị trung bình Y khi Xk thay đổi 1 đơn vị, giữ các biến độc lập còn lại khơng đổi Các hệ số hồi qui riêng phần của tổng... 0 10 20 30 40 50 60 TØ st sinh o/oo + Tuổi thọ trung bình phụ nữ với Số con trung bình của một phụ nữ: 90 Correlations 80 Tuổi thọ TB phụ nữ 70 Ti thä TB phơ n÷ Tuổi thọ TB phụ nữ Pearson Correlation Sig (2-tailed) N 60 Pearson Correlation Số con TB của 1 phụ nữ 1 -.838(**) 000 109 107 -.838(**) 1 Sig (2-tailed) 000 N Số con TB của 1 phụ nữ 50 107 107 ** Correlation is significant at the 0.01 level... phân tích hồi quy Phương pháp này quan trọng đối với kinh tế lượng bởi vì các nhà kinh tế khơng có cơ hội tiến hành các thử nghiệm có kiểm sốt Vấn đề các dữ liệu quan sát chệch do thiếu biến và các vấn đề khác cũng cần phải được giải quy t về mặt thống kê nhờ các hình kinh tế lượng Các nhà kinh tế lượng thường tìm cách làm sáng tỏ các thực nghiệm tự nhiên trong khi thiếu bằng chứng từ các thực nghiệm . một mô hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới. II. MÔ HÌN H HỒI QUI TUYẾN TÍN H BỘI: 1. Xem xét ma trận hệ số tương quan. 2. Xây dựng mô hình. . hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới. Bạn được tự do lựa chọn các biến giải thích để đưa vào mô hình cũng như tự quy t định dạng thức của các. 1 )( Y)-Y ^ ( 1 2 1 2 −− − = ∑ ∑ = = pN Y p F N i i N i Y i ^ sidualSquareMean gressionMeanSquare F Re Re = 1 1 B S B t = Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 4. Vận dụng để xây dựng một mơ hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới: Trong mơ hình

Ngày đăng: 20/05/2014, 15:07

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan