ỨNG DỤNG ƯỚC LƯỢNG BAYESIAN PHÂN TÍCH VỀ TỶ LỆ NGHÈO CỦA CÁC TỈNH Ở VIỆT NAM

11 9 0
ỨNG DỤNG ƯỚC LƯỢNG BAYESIAN PHÂN TÍCH VỀ TỶ LỆ NGHÈO CỦA CÁC TỈNH Ở VIỆT NAM

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Vấn đề ước lượng tham số nhị thức (binomial parameter) đã thu hút sự quan tâm của các nhà thống kê và những người khác trong lĩnh vực ước lượng tỷ trọng. Mọi người đều biết rằng khi ước lượng các số tỷ trọng thường cần một cỡ mẫu lớn để đạt được độ chính xác chấp nhận được của ước lượng. Các ước lượng cỡ mẫu thường dựa vào cách tính toán cổ điển về khoảng tin cậy, đôi khi được điều chỉnh theo các thiết kế mẫu đặc biệt. Công trình nghiên cứu gần đây của Brown (2001) đã tập trung sự chú ý vào những khiếm khuyết của những khoảng tin cậy này, đặc biệt vào thực tế là trong nhiều trường hợp “khoảng tin cậy 95%” có độ bao phủ ít hơn 95%.

ỨNG DỤNG ƯỚC LƯỢNG BAYESIAN PHÂN TÍCH VỀ TỶ LỆ NGHÈO CỦA CÁC TỈNH Ở VIỆT NAM Dominique Haughton(*) Nguyễn Phong(**) Vấn đề ước lượng tham số nhị thức (binomial parameter) thu hút quan tâm nhà thống kê người khác lĩnh vực ước lượng tỷ trọng Mọi người biết ước lượng số tỷ trọng thường cần cỡ mẫu lớn để đạt độ xác chấp nhận ước lượng Các ước lượng cỡ mẫu thường dựa vào cách tính tốn cổ điển khoảng tin cậy, điều chỉnh theo thiết kế mẫu đặc biệt Cơng trình nghiên cứu gần Brown (2001) tập trung ý vào khiếm khuyết khoảng tin cậy này, đặc biệt vào thực tế nhiều trường hợp “khoảng tin cậy 95%” có độ bao phủ 95% Ước lượng tỷ lệ nghèo ước lượng tham số nhị thức tỷ lệ nghèo nói chung xác định tỷ trọng hộ có mức chi tiêu dùng bình qn đầu người hàng năm thấp chuẩn nghèo cho trước Trong phần lớn nội dung viết này, giả sử chuẩn nghèo không ngẫu nhiên việc xác định hộ nghèo hay không nghèo thực xác Chúng ta thảo luận hàm ý việc xác định khơng xác chuẩn nghèo phần sau viết Ước lượng tỷ lệ nghèo cho tỉnh Việt Nam phù hợp với phân tích Bayesian: thơng tin tiên nghiệm (ví dụ ý kiến chuyên gia tỷ lệ nghèo) thường có sẵn cỡ mẫu cấp tỉnh có xu hướng nhỏ điều tra lớn thường tốn bị ảnh hưởng sai số phi chọn mẫu Những nhà thống kê chọn mẫu người khác có liên quan đến thiết kế phân tích điều tra (ở Việt Nam nơi khác) không sử dụng phân tích Bayesian với tỷ lệ nghèo (xem Glewwe Yansaneh phân tích đặc thù lĩnh vực này) Trong mức độ xác ước lượng cao sử dụng thông tin tiên nghiệm hợp lý chuẩn nghèo biết Chúng minh hoạ kết mẫu thành thị giàu (*) Đại học Bentley, Hoa Kỳ, (**) Tổng cục Thống kê - Việt Nam (thành phố Hồ Chí Minh) mẫu nông thôn nghèo (Nghệ An) Tuy nhiên, để đảm bảo có kết này, điều cần lưu ý xác định nghèo/không nghèo sai xảy ra, mà thực tế xảy ra, độ bao phủ trung bình khoảng xác suất rộng điểm % không đạt tới 0,95, với cỡ mẫu lớn, đạt tới 0,95 khoảng xác suất rộng điểm % Ước lượng Bayesian tỷ lệ nghèo chuẩn nghèo biết Ở khu vực thành thị thành phố Hồ Chí Minh, mẫu Khảo sát Mức sống Dân cư Việt Nam năm 1998 có 433 hộ, có hộ nghèo Các tính tốn có quyền số thơng thường (frequentist) (theo quyền số chọn mẫu) cho tỷ lệ nghèo 0,00462, với độ lệch chuẩn 0,00334 (hệ số biến thiên khoảng 0,7) Để thực phân tích Bayesian, chúng tơi sử dụng hỗn hợp phân phối bêta làm tiên nghiệm cho tỷ lệ nghèo chưa biết, gợi ý kỹ thuật Nandram Sedransk Điều chứng minh cơng trình nghiên cứu Dalal Hall (1983), tiên nghiệm xấp xỉ hỗn hợp Sau chúng tơi áp dụng cơng thức dạng đóng Nandram Sedransk giá trị trung bình hậu nghiệm độ lệch chuẩn hậu nghiệm tỷ lệ nghèo thiết kế mẫu chùm hai bước Trong trường hợp nước ta, giả sử xã/phường chọn ngẫu nhiên, sau hộ chọn ngẫu nhiên từ xã/phường Trong thực tế có thêm bước thiết kế mẫu: thôn/cụm chọn ngẫu nhiên từ xã/phường, sau hộ chọn ngẫu nhiên từ thôn/cụm Chúng dự kiến đề cập đến vấn đề chọn mẫu chùm ba bước tương lai, khơng có sẵn cơng thức dạng đóng giá trị trung bình độ lệch chuẩn hậu nghiệm tỷ lệ nghèo Mặc dù vậy, không nghĩ việc thêm bước chọn mẫu tạo khác biệt lớn phân tích xấp xỉ với thực tế Tiếp theo, sử dụng WINBUGS để mô phân phối hậu nghiệm, với lệnh (code) công bố Congdon (2001; ví dụ 5.18 trang 196) Ngồi số liệu hộ nghèo/không nghèo từ xã/phường điều tra, phân tích cịn sử dụng số liệu số hộ xã/phường tương ứng khu vực thành thị thành phố Hồ Chí Minh khu vực nơng thơn Nghệ An Mơ hình phân tích tính tỷ lệ nghèo riêng xã/phường sau kết hợp tỷ lệ nghèo vào tỷ lệ nghèo chung tỉnh Trong Bảng Hình 1, chúng tơi trình bày kết từ bốn tiên nghiệm khác cho khu vực thành thị thành phố Hồ Chí Minh Trong Bảng Hình 2, chúng tơi trình bày kết từ hai tiên nghiệm khác cho khu vực nông thôn Nghệ An Các giá trị trung bình độ lệch chuẩn hậu nghiệm tỷ lệ nghèo chung toàn khu vực (khu vực thành thị thành phố Hồ Chí Minh khu vực nông thôn Nghệ An) Hỗn hợp phân phối bêta sử dụng làm tiên nghiệm cho véc tơ  N tỷ lệ nghèo N xã/phường Nandram Sedransk đưa sau: R −N  ( |  ) =   r B(a r , − a r ) r =1 N   (1 −  ) ar −1 k k − ar −1 , k =1 Trong k tỷ lệ nghèo tỉnh thứ k, B ký hiệu hàm Bêta Giá trị wr, ar  phải lựa chọn suy tiên nghiệm Lưu ý giá trị trung bình phân phối bêta hỗn hợp ar/, giá trị  điều khiển độ lệch chuẩn phân phối bêta:  cao, độ lệch chuẩn nhỏ Hai tiên nghiệm cho khu vực thành thị thành phố Hồ Chí Minh cách lỏng lẻo vào tỷ lệ nghèo độ lệch chuẩn chúng tỉnh Việt Nam Baulch đồng ước lượng, sử dụng số liệu từ Tổng điều tra Dân số Nhà năm 1999 phương trình hồi quy dựa số liệu Khảo sát mức sống dân cư Những ước lượng sử dụng để định nghĩa beans tập trung vào giá trị trình bày cột “Giá trị trung bình” Bảng cho riêng cấu thành xác suất tiên nghiệm bin tương ứng 0,07; 0,43; 0,43; 0,07 Lưu ý giá trị R chọn phần mang tính áp đặt nhằm tiện lợi linh hoạt tính tốn Tiên nghiệm khác giá trị , độ lệch chuẩn Các cấu thành tiên nghiệm tách rời nhau, Hình Kết từ hai tiên nghiệm gần nhau, tỷ lệ nghèo hậu nghiệm khoảng 0,01 với độ lệch chuẩn khoảng 0,005, cải thiện (hệ số biến thiên khoảng 0,5) so với ước lượng thơng thường Hình cho thấy hai mật độ hậu nghiệm từ tiên nghiệm gần nhau, cho phần lớn xác suất hậu nghiệm thành hai phận tương ứng với xã giàu xã nghèo Tiên nghiệm tương ứng với tiên nghiệm từ ý kiến chuyên gia (của số tác giả) “chúng chắn đến 95% tỷ lệ nghèo khu vực thành thị thành phố Hồ Chí Minh nằm khoảng 0,01 đến 0,03” Giống với tiên nghiệm 2, bin tạo cho tiên nghiệm 3, tập trung vào giá trị đưa Bảng với độ rộng phù hợp với tiên nghiệm theo ý kiến chuyên gia Những thống kê tóm tắt tỷ lệ nghèo hậu nghiệm gần với kết theo tiên nghiệm Tiên nghiệm tiên nghiệm tản mạn, trường hợp này, tỷ lệ nghèo hậu nghiệm khơng xác (độ lệch chuẩn 0,008) dự kiến Trong trường hợp này, chúng tơi có biểu thức dạng đóng giá trị trung bình độ lệch chuẩn hậu nghiệm, lẫn khả sử dụng WINBUGS để tạo mẫu từ hậu nghiệm Kết từ hai phân tích dự kiến gần nhau, thực tế Chúng lưu ý phát cấu thành bêta tách rời cấu thành gần chuỗi MCMC WINBUGS bị “tắc” cấu thành cho giá trị trung bình hậu nghiệm khơng Vấn đề thực tế không gây ngạc nhiên cho tác giả WINBUGS (N Best, personal communication), khắc phục cách kiểm tra kết WINBUGS dựa vào cơng thức dạng đóng dùng cho thiết kế mẫu chùm hai bước tiên nghiệm cho, sau chuyển sang thiết kế điều tra phức tạp cần thiết Đối với khu vực nơng thơn tỉnh Nghệ An có 225 hộ mẫu, có 110 hộ nghèo Các ước lượng có quyền số thơng thường cho tỷ lệ nghèo 0,489 với độ lệch chuẩn 0,104 Tiên nghiệm lại cách lỏng lẻo vào ước lượng Baulch đồng sự; đưa giá trị trung bình hậu nghiệm tỷ lệ nghèo 0,5 với độ lệch chuẩn 0,05, cải thiện độ xác so với phân tích thơng thường Tiên nghiệm vào tỷ lệ nghèo 0,2 theo ước tính Bộ Lao động Thương binh Xã hội để tạo bin với độ rộng tiên nghiệm Tỷ lệ nghèo tiên nghiệm 0,2 thấp, thật thú vị xem phân tích Bayesian sử dụng số liệu để sửa thông tin tiên nghiệm này: chuỗi MCMC tập trung gần riêng vào phận cao để đưa giá trị trung bình hậu nghiệm tỷ lệ nghèo 0,42 với độ lệch chuẩn khoảng 0,01 BẢNG 1: GIÁ TRỊ TRUNG BÌNH VÀ ĐỘ LỆCH CHUẨN TIÊN NGHIỆM VÀ HẬU NGHIỆM CỦA KHU VỰC THÀNH THỊ CỦA THÀNH PHỐ HỒ CHÍ MINH W Wi Tiên nghiệm Tiên nghiệm =200 =80 Giá trị TB Độ lệch chuẩ n 0,0 Cấu thành 0,005 0,4 Cấu thành Tiên nghiệm Tiên nghiệm =80 =40 Giá trị TB Độ lệch chuẩ n Giá trị TB 0,005 0,005 0,008 0,009 0,010 0,005 0,011 0,015 0,009 0,015 0,014 0,016 0,014 0,025 0,024 0,4 Cấu thành 0,045 0,015 0,045 0,023 0,024 0,017 0,080 0,042 0,0 Cấu thành 0,075 0,019 0,075 0,029 0,031 0,019 0,140 0,054 0,031 0,023 0,031 0,027 0,020 0,017 0,055 0,051 Tổng Độ Độ Giá trị lệch lệch TB chuẩn chuẩn Độ Độ Độ Độ Giá Giá Giá Giá trị lệch lệch lệch lệch trị TB trị TB trị TB TB chuẩ chuẩ chuẩ chuẩn hậu hậu hậu hậu n hậu n hậu n hậu hậu nghiệ nghiệ nghiệ nghiệ nghiệ nghiệ nghiệ nghiệ m m m m m m m m Dạng đóng 0,009 872 0,004 982 0,010 765 0,004 0,0136 911 84 0,004 561 0,008 0,0078 841 01 Winbug s 0,009 664 0,004 964 0,010 611 0,004 0,0135 910 30 0,004 508 0,010 0,0086 130 32 BẢNG 2: GIÁ TRỊ TRUNG BÌNH VÀ ĐỘ LỆCH CHUẨN TIÊN NGHIỆM VÀ HẬU NGHIỆM CỦA KHU VỰC NÔNG THÔN TỈNH NGHỆ AN wi Tiên nghiệm Tiên nghiệm =40 =30 Giá trị trung bình Độ lệch chuẩn Giá trị trung bình Độ lệch chuẩn 0,07 Cấu thành 0,225 0,065 0,050 0,039 0,43 Cấu thành 0,375 0,076 0,125 0,059 0,43 Cấu thành 0,525 0,078 0,275 0,080 0,07 Cấu thành 0,675 0,073 0,425 0,089 Tổng 0,450 0,133 0,205 0,122 Giá trị trung bình hậu nghiệm Độ lệch chuẩn hậu nghiệm Giá trị trung bình hậu nghiệm Độ lệch chuẩn hậu nghiệm Dạng đóng 0,499810 0,055138 0,424697 0,008203 Winbugs 0,503400 0,051560 0,424500 0,009934 HÌNH 1: MẬT ĐỘ KERNEL TIỀN NGHIỆM VÀ HẬU NGHIỆM; KHU VỰC THÀNH THỊ TP HỒ CHÍ MINH Tiền nghiệm Hậu nghiệm 300 35 30 200 Density 25 20 15 100 10 -5 0 0.05 0.1 0.15 0.2 01 02 P Kernel Density Estimate 03 04 Tiền nghiệm Hậu nghiệm 300 35 30 200 Density 25 20 15 100 10 0 -5 0 0.05 0.1 0.15 01 0.2 02 P 03 04 Kernel Density Estimate Tiền nghiệm Hậu nghiệm 300 35 30 200 Density 25 20 15 100 10 -5 0 0.05 0.1 0.15 0.2 01 02 P 03 04 Kernel Density Estimate Tiền nghiệm Hậu nghiệm 300 35 30 25 Density 200 20 15 100 10 -5 0,05 0,1 0,15 0,2 0 01 02 P Kernel Density Estimate 03 04 HÌNH 2: MẬT ĐỘ KERNEL TIỀN NGHIỆM VÀ HẬU NGHIỆM; KHU VỰC NÔNG THÔN NGHỆ AN Tiền nghiệm Hậu nghiệm 100 3,5 Density 2,5 50 1,5 0,5 0 -0,5 0,2 0,4 0,6 0,8 P Kernel Density Estimate Tiền nghiệm Hậu nghiệm 100 3,5 Density 2,5 50 1,5 0,5 -0,5 0 0,2 0,4 0,6 0,8 P Kernel Density Estimate Ước lượng Bayesian với trường hợp có phân loại sai Chúng ta xét tình có sai số việc xác định hộ nghèo hộ khơng nghèo (có phân loại sai) Ngun nhân thực tế khó tính xác chuẩn nghèo mà phần lớn khó thu thập xác số liệu giá hàng hố Vấn đề xác định hộ nghèo tương tự chẩn đoán bệnh dựa xét nghiệm khơng hồn hảo Ở chúng tơi sử dụng cơng trình nghiên cứu Rahme đồng ứng dụng vào lĩnh vực y tế thực xác định cỡ mẫu Bayesian cho tham số nhị thức với giả thiết có phân loại sai Trong phạm vi vấn đề này, việc kiểm tra tình trạng nghèo có độ nhạy (xác suất hộ nghèo phân loại nghèo) đặc trưng (xác suất hộ không nghèo phân loại không nghèo), với phân phối tiên nghiệm bêta dựa theo Rahme đồng sự, tỷ lệ nghèo cho phân phối tiên nghiệm bêta Minh hoạ cách tiếp cận với khu vực nông thôn Nghệ An, với định nghĩa phân phối tiên nghiệm bêta cho tỷ lệ nghèo có tham số =70,32 =77,1 dựa sở ước lượng cho tỷ lệ nghèo độ lệch chuẩn cơng trình nghiên cứu Baulch đồng Lấy phân phối bêta làm tiên nghiệm cho độ nhạy đặc trưng phân loại nghèo/không nghèo từ ý kiến cho độ nhạy trung bình đặc trưng khoảng 0,95 chắn 95% độ nhạy đặc trưng nằm khoảng 0,9 đến Ý kiến cho tham số bêta giá trị nêu bảng Bảng trình bày độ bao phủ trung bình khoảng xác suất hai độ rộng khoảng khác ba cỡ mẫu khác nhau, tính tốn từ chương trình S-plus Rahme đồng cơng bố Rõ ràng độ bao phủ không đạt đến 0,95 độ rộng điểm %, với cỡ mẫu lớn Độ bao phủ khả thi với khoảng có độ rộng 0,08 với cỡ mẫu lớn Tuy nhiên, lưu ý kỹ thuật Rahme đồng giả thiết mẫu độc lập tạo từ phân phối (independent identically distributed sample - mẫu iid), tình hình xấu sử dụng thiết kế điều tra phức tạp BẢNG 3: ĐỘ BAO PHỦ TRUNG BÌNH CỦA KHOẢNG XÁC SUẤT ĐỐI VỚI TỶ LỆ NGHÈO CỦA KHU VỰC NÔNG THÔN NGHỆ AN VỚI GIẢ THIẾT MẪU IID sens=spec=71,25; sens=spec=3,75; =70,32; =77,1 Độ rộng khoảng Cỡ mẫu Độ bao phủ xác suất 0,04 1000 0,6439 0,04 2000 0,6924 0,04 3000 0,6995 0,08 1000 0,9261 0,08 2000 0,9471 0,08 3000 0,9587 Tài liệu tham khảo Baulch, B & N Minot (2002) The Spatial Distribution of Poverty in Vietnam and the Potential for Targeting World Bank working paper 2829 Brown, L D., T Tony Cai & A DasGupta (2001) Interval Estimation for a Binomial Proportion Statistical Science, 16(2), 101-133 Congdon, P (2001) Bayesian Statistical Modelling Wiley ... 35 30 20 0 Density 25 20 15 100 10 0 -5 0 0.05 0.1 0.15 01 0 .2 02 P 03 04 Kernel Density Estimate Tiền nghiệm Hậu nghiệm 300 35 30 20 0 Density 25 20 15 100 10 -5 0 0.05 0.1 0.15 0 .2 01 02 P 03... 0,016 0,014 0, 025 0, 024 0,4 Cấu thành 0,045 0,015 0,045 0, 023 0, 024 0,017 0,080 0,0 42 0,0 Cấu thành 0,075 0,019 0,075 0, 029 0,031 0,019 0,140 0,054 0,031 0, 023 0,031 0, 027 0, 020 0,017 0,055 0,051... 0, 425 0,089 Tổng 0,450 0,133 0 ,20 5 0, 122 Giá trị trung bình hậu nghiệm Độ lệch chuẩn hậu nghiệm Giá trị trung bình hậu nghiệm Độ lệch chuẩn hậu nghiệm Dạng đóng 0,499810 0,055138 0, 424 697 0,00 820 3

Ngày đăng: 09/04/2021, 10:22

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan