Bài giảng Thống kê y học Bài 14 So sánh nhiều trung bình Phân tích phương sai

13 341 1
Bài giảng Thống kê y học  Bài 14 So sánh nhiều trung bình  Phân tích phương sai

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Mục tiêu của bài giảng là cung cấp các kiến thức giúp người học có thể nhận thức được ý nghĩa của phương pháp phân tích phương sai trong so sánh nhiều số trung bình, xây dựng bảng phân tích phương sai từ số liệu định lượng của 3 hay nhiều hơn các nhóm,... Mời các bạn cùng tham khảo.

SO SÁNH NHIỀU TRUNG BÌNH - PHÂN TÍCH PHƯƠNG SAI Mục tiêu Sau nghiên cứu chủ đề học viên có khả năng: - Nhận thức ý nghĩa phương pháp phân tích phương sai so sánh nhiều số trung bình - Xây dựng bảng phân tích phương sai từ số liệu định lượng hay nhiều nhóm - Trình bày khái niệm: phân tích phương sai chiều, với hai chiều, ba chiều; quy hoạch có lập lặp, quy hoặch cân đối không cân đối - So sánh yếu tố tác động ngẫu nhiên yếu tố tác động cố định Giới thiệu Thường có tập hợp số liệu phức tạp chứa hai nhóm phân tích thường phải so sánh trung bình nhóm thành phần Thí dụ, người ta muốn phân tích số đo hemoglobin thu thập điều tra cộng đồng để xem có khác theo tuổi giới tính hay không xem có phải khác biệt nhóm tuổi dù nam hay nữ Thoạt đầu, dường làm điều cách dùng loạt kiểm định t, so sánh nhóm Ðiều không rắc rối mặt thực tiễn mà vô lí mặt lí thuyết, tiến hành số lớn kiểm định ý nghĩa dẫn tới kết có ý nghĩa sai lạc Thí dụ trông đợi 20 (5%) kiểm định tiến hành có ý nghĩa mức 5% khác biệt Một phương pháp khác gọi phân tích phương sai (analysis of variance) Ý nghĩa tên trình bày sau Phương pháp phức tạp Việc tính toán nhiều thời gian thường tiến hành nhờ gói phần mềm máy tính chuẩn Vì lí này, chương nhấn mạnh đến nguyên lí với mục đích giúp người đọc có đủ kiến thức để định dạng phân tích cần thiết lí giải kết Dù chương trình bày chi tiết việc tính toán trường hợp đơn giản nhất, phân tích phương sai chiều, giúp ích cho việc nắm vững phương pháp quan hệ với kiểm định t Phân tích phương sai chiều thích hợp nhóm so sánh xác yếu tố (factor), thí dụ so sánh trung bình giai cấp khác hay dân tộc khác Phân tích phương sai hai chiều mô tả thích hợp việc chia nhóm dựa yếu tố, thí dụ tuổi giới tính Phương pháp dễ dàng mở rộng để so sánh nhóm đươc phân loại chéo nhiều hai yếu tố Một yếu tố phân tích phương sai người ta muốn so sánh mức khác hay gây cho biến thiên cần loại trừ Xem thí dụ sau Sau khám phá tỉ suất bệnh mạch vành thay đổi đáng kể nhóm dân tộc khác nhau, người ta tiến hành điều tra để xem điều có phải nồng độ lipid trung bình khác nhóm dân tộc khác Bởi nồng độ lipid thay đổi theo giới tính tuổi, cần phân tích phương sai nhóm tuổi giới tính nhóm dân tộc, tuổi giới tính mối quan tâm nghiên cứu Việc đưa vào phân tích chúng có hai lợi ích Thứ nhất, kiểm định ý nghĩa khác biệt nhóm chủng tộc trở nên mạnh mẽ (powerful) hơn, nghĩa dễ khiến cho khác biệt thực trở thành có ý nghĩa Thứ nhì, đảm bảo so sánh nhóm chủng tộc không bị sai lệch cấu nhóm tuổi giới tính Cũng phân tích số liệu phân thành nhiều yếu tố cách dùng kĩ thuật tương tự tổng quát gọi hồi quy bội (multiple regression) Cả hai phương pháp cho kết giống hệt hồi quy bội tổng quát nên cần tính toán phức tạp Vì không hiệu trường hợp đơn giản Dù vậy, lựa chọn phụ thuộc vào chương trình máy tính có chúng sử dụng hay không Phân tích phương sai chiều Phân tích phương sai chiều (one-way analysis of variance) dùng để so sánh trung bình số nhóm, thí dụ nồng độ hemoglobin trung bình bệnh nhân loại bệnh hồng cầu liềm khác (bảng 8.1a) Phương pháp phân tích gọi chiều số liệu phân tích theo biến số, trường hợp loại bệnh hồng cầu liềm 2.1 Kí hiệu sử dụng cho phân tích phương sai chiều Giả sử muốn so sánh trung bình k nhóm Hãy kí hiệu số đối tượng nhóm N1, N2, …, Nk Số đối tượng nhóm j kí hiệu N j Tổng số đối tượng tất nhóm N1+ N2+ …+ Nk = N Số liệu trình bày sau Nhóm Nhóm Nhóm Nhóm k Số liệu X11 X21 XN11 X11 X21 XN22 X1k X2k XNkk N1 N2 Nk N1 N2 Nk Số đối tượng Trung bình Phương sai X1 = ∑ X i1 i =1 N1 N1 s12 = ∑(X i =1 X2 = i1 − X1) N1 − ∑ X i2 i =1 N2 N2 s 22 = ∑(X i =1 Xk = i2 − X2) N2 −1 ∑X i =1 Nk Nk s k2 = ∑(X i =1 ik ik − X k )2 Nk −1 Trong kí hiệu sử dụng cước số Số đầu xác định đối tượng nhóm số thứ hai xác định nhóm Do X 21 giá trị đối tượng thứ nhóm Một cách tổng quát Xij giá trị đối tượng thứ i nhóm j Chúng ta sử dụng kí hiệuX1, X2,…,Xk, làm trung bình nhóm 1, 2, , k X trung bình chung Biến thiên toàn số liệu thể tổng bình phương toàn độ lệch quan sát so với trung bình chung gọi tắt tổng bình phương toàn (total sum of square – total SS) Độ tự tổng bình phương toàn chúng tổng số đối tường -1 2.2 Phân tích thành phần tổng bình phương toàn Có thể sử dụng đại số để chứng minh tổng bình phương toàn chia thành phần độc lập với nhau: tổng bình phương nội nhóm (within-group SS) tổng bình phương nhóm (between-group SS) k Nj ∑∑ ( X j =1 i =1 k ij Nj k Nj k Nj − X ) =∑∑ ( X ij − X j ) + ∑∑ ( X j − X ) = j =1 i =1 k j =1 i =1 Nj k ∑∑ ( X ij − X ) =∑∑ ( X ij − X j ) + ∑ N j ( X j − X ) j =1 i =1 j =1 i =1 j =1 Số hạng vế trái tổng bình phương toàn Ở vế phải, số hạng tổng bình phương nội nhóm số hạng thứ nhì tổng bình phương nhóm Có thể nhận xét tổng bình phương nội nhóm tính từ phương sai nhóm Nj N1 N2 Nk j =1 i =1 i =1 i =1 i =1 k ∑∑ ( X ij − X j ) = ∑ ( X i1 − X ) + ∑ ( X i − X ) + + ∑ ( X ik − X k ) k Nj ∑∑ ( X j =1 i =1 ij − X j ) = s12 ( N − 1) + s k2 ( N k − 1) + + s k2 ( N k − 1) 2.3 Phân tích độ tự Chúng ta biết độ tự tổng bình phương toàn chúng tổng số đối tường -1 (N-1) Độ tự chia thành thành phần độc lập cộng tính, độ tự tổng bình phương nhóm số nhóm trừ (k-1) độ tự tổng bình phương nội nhóm (N-k) 2.4 Trung bình bình phương Khi chia tổng bình phương nội nhóm cho độ tự nội nhóm có trung bình bình phương nội nhóm (within group mean squares -MS w) Khi chia tổng bình phương nhóm cho độ tự nhóm có trung bình bình phương nhóm (between group mean squares - MS b) Khác với tổng bình phương độ tự do, trung bình bình phương tính chất cộng tính Có thể chứng minh trung bình bình phưong nội nhóm (MS w) ước lượng không chệch phương sai dân số σ2 Với giả thuyết Ho : µ1 = µ1 =…= µk, trung bình bình phưong nhóm (MSb) ước lượng không chệch phương sai dân số σ2 Vì giả thuyết Ho MS b với MSw có chung giá trị kì vọng có phân phối F Tuy nhiên giả thuyết Ho sai, có nghĩa trung bình nhóm không nhau, giá trị kì vọng MSb lớn kì vọng MSw Vì để kiểm định giả thuyết Ho người ta tính xem tỉ sốphân phối F hay không 2.5 Thí dụ Phân tích phương sai chiều (one-way analysis of variance) dùng để so sánh trung bình số nhóm, thí dụ nồng độ hemoglobin trung bình bệnh nhân loại bệnh hồng cầu liềm khác (bảng 8.1a) Phương pháp phân tích gọi chiều số liệu phân tích theo chiều, trường hợp loại bệnh hồng cầu liềm Việc tính toán số liệu hồng cầu liềm trình bày Bảng 7(b) kết trình bày bảng phân tích phương sai Bảng 7(c) Cột thứ tư bảng trình bày lượng biến thiên cho độ tự gọi trung bình bình phương (mean square - MS) Kiểm định ý nghĩa cho khác biệt nhóm dựa trung bình bình phương nhóm (between groups) nội nhóm (within groups) Nếu khác biệt quan sát nồng độ hemoglobin loại bệnh hồng cầu liềm khác tình cờ, biến thiên nhóm tương đương với biến thiên đối tượng loại bệnh Ngược lại chúng khác biệt thực biến thiên nhóm lớn Trung bình bình phương so sánh kiểm định F, gọi kiểm định tỉ số phương sai (variance-ratio) Trong N tổng số quan sát k số nhóm F phải xấp xỉ khác biệt thực nhóm lớn có khác biệt Theo giả thuyết trung tính cho khác biệt tình cờ, tỉ số tuân theo phân phối F mà không giống với phân phối khác, có cặp độ tự do: (k-1) độ tự tử số (N-k) độ tự mẫu số Ðiểm phần trăm phân phối F lập bảng theo cặp độ tự Bảng A4 Cột bảng độ tự tử số khối gồm nhiều hàng độ tự mẫu số khối có hàng khác cho mức phần trăm khác Ðiểm phần trăm đuôi kiểm định dựa phân phối F lớn Trong Bảng 7(c), F=50,26/0,95=52,9 với độ tự (2,38) Bảng điểm phần trăm có hàng cho 30 40 độ tự hàng cho 38 độ tự Dù nói điểm 0,1% F(2,38) 8,77 8,25 (là điểm 0,1% F(2,30) F(2,40)) Rõ ràng 52,9 lớn hai Do nồng độ hemoglobin khác cách có ý nghĩa bệnh nhân mắc loại bệnh hồng cầu liềm khác (P0,1 Tương tác Chủng x Giới 1,65 0,83 1,2,>0,1 Phần dư 16,86 24 0,70 Tổng cộng 22,30 29 Tác động Quy hoạch cân đối không lặp Năm phương pháp để xác định tuổi thai so sánh 10 phụ nữ bảng 8.3 Không có tổng bình phương phầnphân tích phương sai có quan sát cho phương pháp áp dụng phụ nữ Trong trường hợp vậy, tương tác giả thiết biến thiên tình cờ trung bình bình phương dùng làm ước lượng trung bình bình phương phần dư để tính giá trị F tác động Tác động tuổi thai khác 10 phụ nữ hiển nhiên có ý nghĩa Bản thân điều không quan tâm nguồn biến thiên quan trọng cần phải tính đến so sánh phương pháp Tác động khác biệt phương pháp có ý nghĩa mức 5% (F=757,85/202,81= 3,74, d.f.=[4,36]) Phân chia tổng bình phương Cần xem xét chi tiết hiệu số tạo nên tác động có ý nghĩa Thí dụ, phương pháp dựa ngày thai máy cho số trung bình cao đáng kể so với phương pháp khác Có thể phân chia tổng bình phương tác động phương pháp Bảng 9(c) thành: (i) Tổng bình phương hiệu số phương pháp dựa ngày thai máy phương pháp khác Tổng có độ tự Bảng Tuổi thai tính theo ngày 10 phụ nữ ước tính phương pháp - kě kinh cuối (last mentrual period - LMP), khám âm đạo (Vaginal examination - VE), ngày thai máy (date of quickening - DOQ), siêu âm (Ultra sound - US) oxydase diamine máu (Diamine oxidase - DAO) (a) số liệu Ðối tượng LMP VE DOQ US DAO 275 273 288 273 244 270,6 292 283 284 285 329 294,6 281 274 298 270 252 275,0 284 275 271 272 258 272,0 285 294 307 278 275 287,8 283 279 301 276 279 283,6 290 265 298 291 295 287,8 294 277 295 290 271 285,4 300 304 293 279 271 289,4 10 284 297 352 292 284 301,8 Trung bình 286,4 282,1 298,7 280,6 275,8 (b) Phân tích phương sai hai chiều: quy hoạch cân đối lặp (trung bình bình phương tương tác dùng làm ước lượng trung bình bình phương phần dư kiểm định F) Nguồn biến thiên SS d.f MS = F= Ðối tượng 4437,6 493,07 2,43, P

Ngày đăng: 22/05/2017, 15:37

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan