Một số thuật toán thống kê thường được sử dụng trong dịch tễ học

10 1.6K 1
Một số thuật toán thống kê thường được sử dụng trong dịch tễ học

Đang tải... (xem toàn văn)

Thông tin tài liệu

MỘT SỐ THUẬT TOÁN THỐNG KÊ THƯỜNG ĐƯỢC SỬ DỤNG TRONG DỊCH TỂ HỌC Giới thiệu: Chúng thực định hướng thực hành số phương pháp thuật toán mà ứng dụng phân tích liệu ban đầu Khoảng tin cậy cho tỷ lệ mô tả, test t giới thiệu Test x2 trình bày dài hơn, test fisher nhận ý Cuối cùng, số quan niệm nhầm lẫn phổ biến test ý nghĩa bàn luận Đây sách thống kê, có số lượng lớn sách thống kê y học Tuy nhiên, có lượng lớn cách tính toán thống kê đơn giản mà thường dùng dịch tể học, hầu hết thực máy tính bỏ túi Nó cho cảm giác tự tin tính khoảng tin cậy cho liệu thực hiện, hay kiểm tra cách tính toán số báo xuất Chương chứa số thuật toán thống kê mà thường thực tay Hai thuật toán giới thiệu chương trước, chủ yếu làm để tính 95% khoảng tin cậy cho nguy tương đối gần (odd ratios) nguy tương đối (relative risks) Điều thực nhanh chóng cho kết khoảng giới hạn có giá trị ORs RRs, số nghiên cứu thực tiễn việc đòi hỏi tất giá trị ô bảng 2x2 phải có giá trị 10 hay lớn lúc chấp thuận Vấn đề khác không phổ biến dịch tể học ước tính khoảng tin cậy cho tỷ lệ Khoảng tin cậy cho tỷ lệ Thông thường người ta muốn ước tính tỷ lệ quần thể có số đặc trưng, tỷ lệ người có kháng thể với bệnh A, hay tỷ lệ quần thể người thực test với bệnh B.Rất để thực test hay hỏi người, người ta thực điều cách thu thập mẫu ngẫu nhiên Giả dụ mẫu ngẫu nhiên thực sự, sai số chọn lựa, người ta muốn biết làm tỷ lệ đo lường mẫu liên quan đến tỷ lệ mắc thực quần thể Đây lý tương tự xác theo sau chương đề cập đến khoảng tin cậy cho ORs: Nếu người ta muốn thực trình bày mẫu nghiên cứu không cần thiết khoảng tin cậy Nếu 31 đối tượng 100 thử nghiệm có kháng thể bệnh A, tỷ lệ huyết học nhóm 31% Tuy nhiên, tình , người ta muốn kết áp dụng đến số quần thể lớn Người ta có cảm giác trực quan kích thước mẫu quan trọng Nếu người mẫu 10 người có kháng thể viêm gan A ngẫu nhiên(chance) giữ vai trò quan trọng.Tỷ lệ huyết thực quần thể dễ dàng gần với 20 hay 40%, người ta chần chừ để chứng tỏ 30% Tuy nhiên, thực mẫu 100 đối tượng quần thể lớn thấy 31 huyết dương tính cảm giác bảo đảm ước tính khoảng 30% 308 số 1000 mẫu thấy có kháng thể Mẫu lớn có ảnh hưởng đưa vào cỡ mẫu nghiên cứu ngẫu nhiên cặp “quá nhiều” hay “quá ít” huyết dương tính Khoảng tin cậy cho quần thể tính toán theo cách sau: Viết số tỷ lệ thay phần trăm Đối với mẫu cuối đoạn văn tỷ lệ 0.308 ( 308 người 1000 thử test) Gọi tỷ lệ p Gọi tổng số đối tượng nghiên cứu N Tính số p x (1-p)/N Trong ví dụ : 0,308 x 0,692/1000 Tính bình phương số ngay: p(1  p) N hay ví dụ 0.308 X 0.692 1000  0.015 Số gọi sai số chuẩn tỷ lệ Ngay nhận yếu tố sai số chương trước, nhân sai số chuẩn với 2, lần cách thống kê để tạo khoảng tin cậy 95% x 0,015 = 0,030 Tuy nhiên, lúc không chia nhân với số cuối mà thay vào trừ cộng với tỷ lệ gốc (0,308 ví dụ) Cận : 0,308-0,030 = 0,278 Cận : 0,308 +0,030 = 0,338 Diễn giải: Chúng ta giả dụ thực mẫu ngẫu nhiên thực ( không sai số) 1000 người quần thể lớn nhiều Trong ví dụ thấy 308 đối tượng có dương tính với kháng thể viêm gan A Chúng ta chứng tỏ với xác suất 95% tỷ lệ huyết học dương tính quần thể phải từ 27,8% 33,8% Quan sát mang tính dự báo sai số: Nếu mẫu bị sai theo cách thức tỷ lệ tính toán bị sai khoảng tin cậy ý nghĩa Nếu hỏi 1000 người họ xét nghiệm chẩn đoán HIV, số xét nghiệm HIV trả lời họ chưa xét nghiệm tỷ lệ tính toán tổng số quần thể nghiên cứu thấp thực tế tình cờ điều chỉnh cách thêm vào khoảng tin cậy số Khoảng tin cậy cho biết ảnh hưởng có ngẫu nhiên ( hay sai số chọn mẫu)- mong đợi để hiểu ý tưởng người Test có ý nghĩa Ngày có nhiều ghi nhận nhà nghiên cứu y học thống kê cách thông tin tốt để chứng tỏ ý nghĩa thống kê giá trị cho cách trình bày khoảng tin cậy Trong ví dụ ORs RRs chương trước , hai điều hiển nhiên từ khoảng tin cậy Nếu 95% khoảng tin cậy không bao gồm ( toàn khoảng 1), biết có xác suất tốt mà yếu tố nguy nghiên cứu thực liên quan đến bệnh, không phát ngẫu nhiên Độ lớn khoảng tin cậy cho biết OR hay RR đo lường xác nghiên cứu Nếu 95% khoảng tin cậy cho RR từ 1,3 đến 15, không thực biết yếu tố nguy quan trọng với bệnh (RR cao) hay yếu tố nguy tương đối nhẹ Tuy nhiên, nhiều báo y khoa sử dụng test ý nghĩa thống kê cho mục đích này, có nhiều ví dụ thực khoảng tin cậy khó khăn để tính toán giá trị ý nghĩa đạt dễ dàng Câu hỏi phổ biến đằng sau tất test ý nghĩa khả theo sau: Người ta quan sát khác nhóm bệnh (một nhóm có, ví dụ giá trị haemoglobin cao hơn, số phụ nữ cao hơn, tỷ lệ công thấp hơn, thời gian ủ bệnh dài hơn, v.v) Có điều xảy ngẫu nhiên, hay khác biệt thực nhóm? Lý thuyết thống kê trình bày cố gắng để trả lời câu hỏi phần mang tính phức tạp, thông thường test ý nghĩa tình đời sống thực điều không giả dụ lý thuyết cần thiết đáp ứng test đảm bảo Hơn nữa, tồn triết lý liên quan đến giá trị xác suất thực có ý nghĩa tình Chúng ta cố gắng từ bàn luận chỉ với biến số đo nhóm người, có vài loại thay đổi ngẫu nhiên đối tượng Câu hỏi trở nên: có khác quan sát nhóm biến thiên này, mà người có giá trị cao xảy kết thúc nhóm người có giá trị thấp nhóm khác? Hay điều không tính ngẫu nhiên chia nhóm đồng thành nhóm phân tách bên ngoài? Có tình khác có thể: Chúng ta đo lường giá trị biến liên tục cho tất thành viên nhóm Đây chiếu cao họ, giá trị haemoglobin họ, tuổi họ, nhiệt độ họ… Tất biến số có chung họ giả dụ, nguyên lý, giá trị đường liên tục Điều không hoàn toàn thực có khả ghi nhận toàn chiều cao theo centimetre , hay nhiệt độ cách 0,1oC mặt lý thuyết chúng biến liên tục Với nhóm tính toán giá trí trung bình so sánh chúng Người phân nhóm chia thành loại, phơi nhiễm/không phơi nhiễm; ốm/khỏe, nam/nữ, già hơn/ trẻ hơn… Sau nhìn vào nhóm bệnh nhân để thấy có khác tỷ lệ phơi nhiễm/không phơi nhiễm, ốm/khỏe, nam/nữ… chúng Test t Trong tình với liệu liên tục, người ta sử dụng test t (Student’s) để định khác biệt có ý nghĩa thống kê nhóm Các chương trình thống kê cho máy tính cá nhân thực điều đơn giản:người ta nhập vào giá trị cho nhóm bệnh vào cột , giá trị cho nhóm khác vào cột kế tiếp, chương trình đưa xác suất ( giá trị p) mà tính ngẫu nhiên riêng lẽ gây khác biệt lớn lớn giá trị quan sát thực Giá trị p nhỏ có khả ngẫu nhiên, giá trị p lớn nhiều khả có khác thực nhóm Cách để thực test t 1.Gọi nhóm Số lượng đối tượng nhóm n1 n2 Giá trị trung bình cho nhóm thứ ( ví dụ giá trị haemoglobin) gọi m1, m2 cho nhóm thứ 3 Tính độ lệch chuẩn giá trị nhóm riêng lẽ: với nhóm thứ nhất, trừ m1 từ giá trị, bình phương khác này, cộng tất bình phương Rồi chia số cho (n-1) thực bậc hai số Kết cuối độ lệch chuẩn giá trị nhóm 1, gọi S1 Công thức toán học ( xi  m1 ) 1 (n  1) n S1 = Trong xi tất cá thể đo lường nhóm Rồi tính S2 theo cách Độ lệch chuẩn cách mô tả giá trị phân bố chụm nhóm xung quanh giá trị trung bình Độ lệch chuẩn thấp nghĩa tất giá trị phân bố chụm lại gần giá trị trung bình Độ lệch chuẩn cao cho biết giá trị đo phân tán xa giá trị trung bình Người ta cần kết hợp độ lệch chuẩn cho nhóm Đây gọi Sp, tính sau (n1-1)S12 + (n2 – 1)s22 Sp2= n1 + n2 - Bài toán cuối muốn gọi t, xác định sau : m1-m2 t= sp 1/ n1  1/ n2 Giá trị t thực theo bảng làm sẵn ts, hầu hết tìm thấy phần cuối hầu hết sách thống kê Mức ý nghĩa thực khác với kích thước nhóm quy luật chung ngón tay cái, giá trị t nghĩa có 5% ngẫu nhiên hay khác biệt giá trị trung bình nảy sinh ngẫu nhiên Người ta thấy tiến hành test t trở nên khó khăn với mẫu tương đối nhỏ Người ta phải sử dụng máy vi tính để làm, dẫn bao gồm để chứng minh làm thực thực Tuy nhiên, có điều hiển nhiên xảy Giá trị t cao xác suất mà khác biệt quan sát giá trị trung bình hai nhóm kết ngẫu nhiên nhỏ Từ công thức cuối thấy khác trị trung bình lớn giá trị t cao.Thêm nữa, đo lường kết hợp lan tỏa xung quanh giá trị trung bình nhỏ (Sp) giá trị t cao Một khác nhỏ nhóm ý nghĩa độ lệch chuẩn thấp, trái lại khác lớn nhóm với độ lệch chuẩn cao phát ngẫu nhiên Có giới hạn sử dụng test t : độ lệch chuẩn nhóm khác (một lớn hai lần khác) test t phải không thực mô tả Tuy nhiên chương trình thống kê mà anh yêu thích có test giá trị đôi khi, hay tư vấn nhà thống kê học, lan tỏa khác nhóm có nghĩa anh phải quan tâm so sánh hai trị trung bình Test Chi Ở phần ví dụ trên, đo lường số biến liên tục nhóm mà thay thành viên người thuộc loại khác Điều trở nên lạ để nói “ giới tính trung bình” nhóm bệnh nhân Tình bảng 2x2 quen thuộc, mà ví dụ: Tiêm chủng Ốm Khoẻ Không tiêm chủng 10 80 90 40 20 60 50 100 150 Tuy nhiên bảng 2x2 dễ dàng mở rộng tới bảng có nhiều cột hay nhiều hàng có nhiều loại phơi nhiễm hay kết hay hai Trong tình này, đối tượng thuộc hai loại: tiêm chủng hay không tiêm chủng, hai loại ốm khỏe Cách ý nghĩa cho giá trị sức khỏe trung bình nhóm tiêm chủng, hay tình trạng tiêm chủng trung bình nhóm khỏe mạnh Loại liệu khác với test t trên, thường gọi biến phân hạng ngược với biến liên tục Trong chương 4, thấy cách tính OR bảng thế, khoảng tin cậy với giá trị Nếu muốn thực test có ý nghĩa thống kê thay vì, câu hỏi để hỏi là: loại xác suất mà 150 đối tượng nghiên cứu phân chia cách thành ốm khỏe mạnh tính ngẫu nhiên?Một xác suất thấp ngẫu nhiên làm gia tăng trọng lượng đến giả thiết vaccin có hiệu Cách giải thích sau: có 50 người bị ốm 100 người khỏe mạnh Nếu vaccin hiệu toàn bộ, giả định chẳng vấn đề dù đối tượng tiêm chủng hay không Bởi 1/3 tổng số bị ốm, tỷ lệ mong muốn nhóm cá thể Trong nhóm 90 người chủng vaccin, mong muốn 30 người bị ốm, nhóm không chủng vaccin 60, 20 Bảng kỳ vọng 2x2 vaccin tác dụng chút Bảng kỳ vọng Ốm Khoẻ Tiêm chủng 30 60 90 không tiêm chủng 20 40 60 50 100 150 Cách chung để tính giá trị mong muốn cho ô bảng 2x2 ( hay 3x3, hay 5x3…) nhân tổng cột đáy cột tương ứng với tổng số hàng bên phải, chia số với tổng góc bên phải thấp Đối với ô ví dụ 90x50/150 =30, trên( tính toán này, người ta thường nhận phân số người ô bảng kỳ vọng mà không ảnh hưởng chút đến kết phân tích) Bây so sánh số bảng kỳ vọng với số thực để thấy chúng thực khác Một cách để thực khác số ô tương ứng (10-30 ô thứ nhất, 40-20 ô thứ hai, vân vân ).Nếu vaccin hiệu quả, mong muốn khác nhỏ, khác lớn kết nghiên cứu dẫn đến từ mong muốn phân bổ ngẫu nhiên ca bệnh xa Test x2 bao gồm bình phương tất khác bình phương cho giá trị mong muốn (từ bảng trên) cộng chúng lại Số cao phân bổ đối tượng ốm khỏe mạnh theo tình trạng vaccin xảy ngẫu nhiên Với bảng 2x2 này, giá trị x2 lớn 3,84 chứng tỏ có 5% xác suất kết xảy ngẫu nhiên Trong ví dụ trên, cách tính x2 = (10-30)2/30 + (40-20)2/20+ (8060)2/60 + (20-40)2/40= 50 Chúng ta thấy thực tế có xác suất nhỏ cho giá trị X2 cao xuất cách tình cờ, đưa nhận định thuật toán thống kê hỗ trợ kết luận vaccin có hiệu bảo vệ Trong thực tế, xác suất mang tính ngẫu nhiên/ tình cờ giá trị tính toán p ... Tính bình phương số ngay: p(1  p) N hay ví dụ 0.308 X 0.692 1000  0.015 Số gọi sai số chuẩn tỷ lệ Ngay nhận yếu tố sai số chương trước, nhân sai số chuẩn với 2, lần cách thống kê để tạo khoảng... ốm/khỏe, nam/nữ… chúng Test t Trong tình với liệu liên tục, người ta sử dụng test t (Student’s) để định khác biệt có ý nghĩa thống kê nhóm Các chương trình thống kê cho máy tính cá nhân thực điều... ngẫu nhiên Ngay với số nhỏ bảng 2x2, test fisher tốn nhiều thời gian để thực hiện, việc sử dụng số chương trình thống kê chuẩn máy tính khuyến cáo mạnh mẽ Test phía test phía Một vấn đề khác cần

Ngày đăng: 24/02/2016, 16:47

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan