Nguyên lí kiểm định thống kê

47 0 0
Nguyên lí kiểm định thống kê

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Biến số: Đặc tính hay đại lượng có thể thay đổi của các đối tượng: Có hút thuốc lá hay không hút thuốc lá Chiều cao của một người Tham số: Đặc trưng của đặc tính hay đại lượng của dân số Tỉ lệ hút thuốc lá ở nam thanh niên Việt Nam Chiều cao trung bình của nam thanh niên Việt Nam Thống kê: đặc trưng của đặc tính hay đại lượng của mẫu Tỉ lệ hút thuốc lá ở trong mẫu nghiên cứu gồm 100 thanh niên Chiều cao trung bình 100 thanh niên trong mẫu nghiên cứu

Trang 1

Nguyên lí kiểm định thống kê

TS Đỗ Văn Dũng

Trang 2

Biến số, thống kê, tham số

Biến số: Đặc tính hay đại lượng có thể thay đổi của các đối tượng:

Có hút thuốc lá hay không hút thuốc lá

Chiều cao của một người

Tham số: Đặc trưng của đặc tính hay đại lượng của dân số

Tỉ lệ hút thuốc lá ở nam thanh niên Việt Nam

Chiều cao trung bình của nam thanh niên Việt Nam

Thống kê: đặc trưng của đặc tính hay đại lượng của mẫu

Tỉ lệ hút thuốc lá ở trong mẫu nghiên cứu gồm 100 thanh niên

Chiều cao trung bình 100 thanh niên trong mẫu nghiên cứu

Trang 4

Kiến thức tiền nghiệm

lượng protein cao

Chặt chẽ nhưng phụ thuộc vào giá trị của đại mệnh đề

Nếu tiểu mệnh đề đúng chưa chắc đại mệnh đề đã đúng

Trang 5

Kiến thức hậu nghiệm

đại mệnh đề

suy ra tiểu mệnh đề

Nếu tiểu mệnh đề đúng => không kết luận được

Nếu tiểu mệnh đề sai => bác bỏ đại mệnh đề

Trang 7

Kiểm định ý nghĩa

bởi R A Fisher

ở bệnh nhân thiếu máu

Một nhóm gồm 50 bệnh nhân điều trị với thuốc A

Sau khi điều trị Hemoglobin trung bình cải thiện 2,5 (g/lít)

Xác suất xảy ra sự khác biệt là 2 nếu thực sự thuốc A không có tác dụng cải thiện tình trạng thiếu máu

Trang 8

Nguyên tắc kiểm định ý nghĩa theo Fisher Đường phân phối màu xanh dương thể hiện phân phối khi thuốc A không có tác dụng (giả thuyết Ho), Vùng diện tích màu

Trang 9

 Nếu thuốc A không có hiệu quả lên hemoglobin (giả thuyết Ho)

và hemoglobin thay đổi giá trị s

giá trị s > 0,05

Trang 10

 Nếu thuốc A không có hiệu quả lên hemoglobin (giả thuyết Ho)

bệnh nhân này tăng không quá 2g/l

Trang 11

Cơ sở lý luận của kiểm định

P(A)P(B|A) = P(B)P(A|B) = P(A và B)

P(A|B)= thấp  P(B|A)= thấp

Nếu P (cĩ cải thiện hemoglobin 2,5 nếu thuốc A vơ dụng) thấp => P (thuốc A vơ dụng khi cĩ sự

hemoglobin cải thiện) thấp

Trong thống kê

(A  B )  {P(B ) thấp P(B ) thấp  P(A) thấp)

Ho  Tkê S  P(Tkê S | H0 ) < ngưỡng  bác bỏ Ho

Trang 12

Cơ sở lý luận của kiểm định

 Trong logic học

P(A|B)=0  P(B|A)=0

Nếu khơng cĩ trung tiện ở bệnh nhân tắc ruột => khơng xảy ra tắc ruột ở BN cĩ trung

(A  B )  (B  A)

Trang 13

 Giá trị p (p-value)

P (có cải thiện hemoglobin trung bình tăng trên 2,5 nếu thuốc A không có hiệu quả)

Giá trị p=P(Xảy ra thống kê cực đoan hơn kết quả |Giả thuyết Ho)

Chỉ số đo lường sức mạnh chống lại giả thuyết Ho: Xác định nguy cơ bác bỏ nhầm giả thuyết Ho

P <0,05: bằng chứng chống lại Ho 0,05 là ngưỡng để bác bỏ Ho

Ngưỡng 0,05 là tùy tiện (arbitrary) - Việc lí giải giá trị p dành cho nhà nghiên cứu

Được kí hiệu là sig (significant level) trong phần mềm SPSS

Trang 14

 Nếu sử dụng ANOVA để so sánh trung bình giữa các nhóm nhưng test Barlet cho thấy phương sai giữa các nhóm là khác nhau, có thể sử dụng 1 trong 2 giải pháp

Sử dụng kiểm định phi tham số Kruskal-Wallis

Sử dụng phép biến đổi log: tạo biến mới bằng logarithm của biến phụ thuộc và thực hiện lệnh oneway trên biến số này

Trang 15

Giả thuyết thống kê

hành suy luận thống kê

cứu muốn chứng minh (do việc chứng minh được thực hiện bằng phản chứng)

sự khác biệt

Trang 16

Giả thuyết thống kê: Các thí dụ

 Chiều cao trung bình nam = chiều cao trung bình ở nữ

 Tỉ lệ bị nhồi máu cơ tim ở nhóm tăng

cholesterol = tỉ lệ nhồi máu cơ tim ở nhóm có cholesterol thấp

 Thuốc A có hiệu quả điều trị bằng thuốc B

Trang 17

 Kiểm định 1 bên và kiểm định 2 bên

Trang 18

 Vì không thể tính được xác suất thuốc A không có hiệu quả khi có thay đổi

hemoglobin

hemoglobin khi thuốc A không có hiệu quả

Trang 19

Giả thuyết Ho

không khác biệt, không có liên quan

được giả thuyết H

Trang 20

 Nguyên lí của kiểm định là gì?

 Giá trị p là gì?

có phải là giả thuyết Ho hay không?

không có tác dụng phòng bệnh cúm” Nếu giá trị p là 0,01, có thể rút ra kết luận gì?

Trang 21

Kiểm định giả thuyết

Do Neyman và Pearson đề xuất

Đưa ra cách tiếp cận khách quan, dựa vào quyết định để thay thế quan điểm chủ quan của sức mạnh bằng chứng chống lại giả thuyết Ho

Quan tâm đến cả nguy cơ bác bỏ nhầm giả thuyết Ho lẫn nguy cơ chấp nhận nhầm giả thuyết Ho

“Không có kiểm định nào cho bằng chứng có giá trị về chân lí hay sai lầm của giả thuyết Nhưng chúng ta có thể nhìn nhận mục đích của kiểm định theo quan điểm khác …

Chúng ta tìm quy tắc quy định hành vi của chúng ta đối với các giả thuyết để nhìn chung, chúng ta ít mắc phải các sai

Trang 23

Xác suất sailầm loại 1

Nhỏ<0,05

Bác bỏ giả thuyết

Xác suất sai

Trang 24

Kiểm định giả thuyết

Để sử dụng cách tiếp cận của Neyman-Pearson, chúng ta phải xác định giả thuyết thay thế một cách chính xác

Nói cách khác, nói rằng thuốc A có hiệu quả là không đủ mà phải xác định thuốc A có hiệu quả bao nhiêu

Quy tắc kiểm định có thể xác định bằng xác định nguy cơ sai lầm loại I, nguy cơ sai lầm loại II và xác định giả thuyết thay thế

Không thể lí giải giá trị p để đánh giá sức mạnh của bằng chứng chống lại giả thuyết không trong một nghiên cứu riêng lẻ

Ít nhà nghiên cứu thông suốt được các điều lí tưởng này

Trang 25

Phân biệt 2 cách tiếp cận

thuyết không (Ho) và giả thuyết thay thế (Ha) một cách chính xác

Trang 26

Mối liên quan giữa sai lầm loại 1, sai lầm loai 2, cỡ mẫu và khoảng cách giữa Ho - Ha (khoảng 3 lần se) Đường phân phối màu xanh dương thể hiện giả thuyết Ho,

đường màu đỏ thể hiện giả thuyết Ha Vùng diện tích màu đỏ là xác suất sai lầm loại

Trang 28

Khi khoảng cách Ho-Ha tăng lên, vùng diện tích màu xanh thể hiện xác suất sai lầm loại 2 (2%) sẽ giảm đi Nếu đã xác định Ha và cỡ mẫu để có  =20%, thì   20%

Trang 29

Khi khoảng cách Ho-Ha giảm đi, vùng diện tích màu xanh thể hiện xác suất sai lầm loại 2 (70%) sẽ tăng lên

Trang 30

Khi khoảng cách Ho-Ha giảm đi, cần phải tăng cỡ mẫu để đường cong phân phối của giả thuyết Ho và Ho hẹp lạI để vùng diện tích màu xanh thể hiện xác suất sai lầm

Trang 31

Bài tập

Dựa vào đề cương nghiên cứu của nhóm hãy

 Nêu sai lầm loại II

Trang 35

Chọn lựa kiểm định phù hợp

Biến phụ thuộc

(hậu quả) Biến độc lập (nguyên nhân)

Nhị giáDanh địnhThứ tự -Định lượng

tổng quát Wilcoxon tổng quát Hồi quy Cox

Phi tham số - Phân tích đa biến – Biến sống còn

Trang 36

Kết luận

tổng quát cho toàn bộ dân số mục tiêu

nghiên cứu và phải thể hiện bằng một đẳng thức

càng nhỏ chúng ta càng mạnh dạn bác bỏ giả thuyết Ho

Trang 37

 Có kiểm định 2 bên và kiểm định 1 bên Kiểm định 2 bên tốt hơn vì không đòi hỏi các giả định

lầm loại 2 là sai lầm khi chấp nhận

độc lập và biến phụ thuộc

lượng không phân phối bình thường (hay biến thứ tự) được gọi là kiểm định phi tham số

Trang 38

 Cho 2 nhóm trẻ em, một nhóm có tiêm ngừa và một nhóm không tiêm ngừa

Sau đó theo dõi nhóm nào có tỉ lệ bệnh ho gà cao hơn.

Trang 39

Phân biệt

 Biến số - variables(chiều cao, giới tính, cân nặng) đặc tính của một người

 Thống kê - Statistics (trung bình, tỉ lệ) đặc tính của một mẫu

số, tỉ lệ trong dân số) đặc tính của toàn bộ dân số

Trang 40

 Cho 2 nhóm bệnh nhân, một nhóm suy dinh dưỡng và nhóm dinh dưỡng tốt

Đánh giá hiệu giá kháng thể sau tiêm vaccine ở 2 nhóm này

Trang 41

Loại thiết kế nghiên cứu

Trang 42

 Thảo luận:

Trang 43

Tóm tắt

xác dưới dạng một đẳng thức

càng nhỏ việc bác bỏ giả thuyết Ho càng mạnh

và sai lầm khi chấp nhận (loại 2)

đo của biến phụ thuộc và thiết kế

Trang 46

Kiểm định phi tham số

Không đòi hỏi biến số phân phối bình thường

Không đòi hỏi phương sai đồng nhất

Dễ tính toán

Nhưng: không ước lượng được tham số

Khuynh hướng cũ: sử dụng phi tham số khi biến không phân phối bình thường

Khuynh hướng mới: dùng kiểm định tham số (và dùng phép biến đổi biến số (transformation) để có phân phối bình thường hay dùng kiểm định t-test với phương sai không bằng nhau)

Ngày đăng: 02/04/2024, 08:44

Tài liệu cùng người dùng

Tài liệu liên quan