phương pháp thống kê toán học đậu xuân thoan

33 495 2
phương pháp thống kê toán học đậu xuân thoan

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học PHƯƠNG PHÁP THỐNG KÊ TOÁN HỌC 1. MẪU NGẪU NHIÊN 1.1 Khái niệm về mẫu ngẫu nhiên: Giả sử ta cần xem xét một đặc điểm hay một tính chất T, trên tất cả các phần tử của một tập hợp X. Có hai khả năng ta giải quyết: Một là, số lượng phần tử N của X là hữu hạn và khá bé, ta có thể thực hiện phép thử để nghiên cứu trên toàn bộ N phần tử, việc nghiên cứu diễn ra bình thường. Hai là, số lượng phần tử N của X hữu hạn nhưng rất lớn, hoặc số lượng phần tử của X là vô hạn, ta không thể thực hiện phép thử trên tất cả các phần tử của X. Trong trường hợp này, ta phải chọn ra một bộ phận để nghiên cứu ta gọi la tập hợp mẫu, từ việc nghiên cứu trên nhiều tập hợp mẫu ta khái quát và quy nạp cho tất cả các phần tử của X. - Tập hợp tổng quát: Tập hợp X bao gồm các đối tượng (hay gọi là phần tử) có bản chất nào đó, mà ta đang cần nghiên cứu một tính chất T trên tất cả các phần tử của X. Ta gọi X là tập hợp tổng quát. - Tập hợp mẫu: Tập hợp các đối tượng (phần tử) được chọn ra từ tập tổng quát X, để nghiên cứu theo một tính chất T đã xác định trước, gọi là tập hợp mẫu. Trong việc chọn mẫu, tính chất khách quan của các phần tử được chọn ra phụ thuộc vào năng lực của người nghiên cứu. Mỗi lần chọn một phần tử hoặc chọn cùng lúc nhiều phần tử, ta có thể sắp xếp lần chọn thứ i ta có phần tử X i , i= 1, 2, 3, … , n. Sau n lần chọn ta có bộ (X 1 , X 2 , X 3 , … , X n ), số n gọi là cỡ mẫu. Mỗi lần chọn X i / i=1, 2, 3, …, n một cách ngẫu nhiên thì ta coi X i như là một biến ngẫu nhiên, khi đó bộ (X 1 , X 2 , X 3 , … , X n ) được gọi là mẫu ngẫu nhiên cỡ n. Mẫu ngẫu nhiên cỡ n là một dãy n biến ngẫu nhiên độc lập (X 1 , X 2 , X 3 , … , X n ) có cùng phân phối xác suất. Trong quá trình nghiên cứu, chỉ lấy một mẫu ra nghiên cứu có kết quả, mà đem kết quả đó kết luận phủ lên tất cả các phần tử của tập tổng quát thì nhiều khi không đảm bảo độ chính xác khoa học. Vì vậy người ta thường dùng nhiều mẫu để xem xét nghiên cứu, hy vọng ta có khái niệm về không gian mẫu sau đây. - Không gian mẫu: Tập hợp tất cả các mẫu ngẫu nhiên rút ra từ tập hợp tổng quát để nghiên cứu gọi là không gian mẫu. Ta dùng ký hiệu Ω M để chỉ không gian mẫu. 1.2. Phương pháp chọn mẫu: Việc chọn mẫu phải đảm bảo tính “tiêu biểu”, tính “đại diện”, bộc lộ được “đặc trưng” của tất cả các phần tử của tập tổng quát X cần nghiên cứu. Thông thường người ta dùng các phương pháp chọn mẫu sau đây. a/ Chon mẫu ngẫu nhiên đơn giản hoàn lại: Giả sử tập X có N phần tử, ta làm N cái thăm ghi chỉ số của mỗi phần tử, bỏ vào hộp kín và bốc ngẫu nhiên một cách vô tư lần thứ nhất ra một thăm, gọi phần tử ứng với thăm đó là X 1 . Sau đó bỏ thăm trở lại hộp và bốc lần thứ hai được phần tử X 2 . Tiếp tục như vậy đến lần thứ n ta có phần tử X n . Sau n lần chọn ta có mẫu (X 1 , X 2 , X 3 , … , X n ) cỡ n. Chú ý rằng nếu N phần tử của X đồng khả năng thì xác suất lấy được mỗi phần tử bằng N 1 . 1 ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học b/ Chọn ngẫu nhiên đơn giản không hoàn lại: Cách chọn bằng hộp thăm như trường hợp trên, chỉ khác một điều là khi bốc được thăm nào ta bỏ ra ngoài luôn chứ không trả lại hộp nữa. Chú ý rằng nếu N phần tử của X đồng khả năng thì xác suất lấy được mỗi phần tử khác nhau, phần tử thứ nhất có xác suất bằng N 1 [tức là P (X 1 ) = N 1 ], phần tử thứ hai có xác suất bằng 1 1 −N [tức là P(X 2 ) = 1 1 −N ], … , xác suất phần tử thứ n là nN − 1 [tức là P (X n ) = nN − 1 ]. Mẫu chọn được (X 1 , X 2 , X 3 , … , X n ) cỡ n là mẫu không hoàn lại. c/ Chọn mẫu theo phương pháp cơ học: Tập tổng quát X có vô hạn phần tử, việc chọn như trên là rất khó khăn, bằng phương pháp cơ học ta chia ngẫu nhiên tập X ra thành m tập con phân biệt (có thể dùng máy phân tán tập X không phụ thuộc chủ quan người nghiên cứu), gọi các tập con là A 1 , A 2 , A 3 , … , A m Trong mỗi tập A i , i=1, 2, 3, … , m ta chọn mầu ngầu nhiên đơn giản (X i1 , X i2 , … , X in ), i=1,2,3, … , m cỡ mẫu n. Tổ hợp các mẫu bộ phận ta có mẫu               mnm3m2m1 2n232221 1n131211 X X X X X X X X X X X X là một ma trận cấp m.n d/ Chọn mẫu theo một đặc trưng ( hay điển hình ): Ta phân chia tập tổng quát X dựa vào một đặc trưng nào đó, thành m tập con phân biệt A 1 , A 2 , A 3 , … , A m Trong mỗi tập A i , i=1,2,3, … , m ta chọn mầu ngầu nhiên đơn giản (X i1 , X i2 , … , X in ), i=1,2,3, … , m cỡ mẫu n. Tổ hợp các mẫu bộ phận ta có mẫu               mnm3m2m1 2n232221 1n131211 X X X X X X X X X X X X là một ma trận cấp m.n e/ Chọn mẫu theo tính chất dãy (sê ry): Ta phân chia tập tổng quát X dựa vào tính chất phân dãy nào đó, thành m dãy phân biệt {A 1 }, {A 2 }, {A 3 }, … , {A m } Trong mỗi dãy {A i } , i=1,2,3, … , m ta chọn mầu ngầu nhiên đơn giản (X i1 , X i2 , … , X in ) , i=1,2,3, … , m cỡ mẫu n. Tổ hợp các mẫu bộ phận ta có mẫu               mnm3m2m1 2n232221 1n131211 X X X X X X X X X X X X là một ma trận cấp m.n 1.3. Mã hóa bằng số cho mẫu và ghi số liệu mẫu: - Khi đã chọn được mẫu ngẫu nhiên (X 1 , X 2 , X 3 , … , X n ), hay mẫu ngẫu nhiên (X i1 , X i2 , … , X in ) , i=1,2,3, … , m . Ta xem các X i hay các X i j , i=1,2,3, … , m, j=1,2,3, … , n như là những biến ngẫu nhiên, mã hóa bằng những giá trị bằng số thực mà nó nhận, ta ký hiệu giá trị của X i = x i và X i j = x i j . Từ nay về sau nói cho mẫu ngẫu nhiên kể như cho giá trị mẫu bằng các số thực. - Việc ghi chép số liệu mẫu có thể trình bày theo nhiều cách khác nhau, tùy theo đặc điểm công việc nghiên cứu, có một số cách ghi chép sau đây. 2 ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học a/ Ghi số liệu thành một dãy số, ma trận số: + Đối với mẫu (X 1 , X 2 , X 3 , … , X n ), ta ghi số liệu thành dãy số (x 1 , x 2 , x 3 , … , x n ). Khi cần thiết phân biệt, ta sắp theo thứ tự từ nhỏ đến lớn hoặc từ lớn đến nhỏ. Chẳng hạn x k1 < x k2 < … < x kn là việc sắp từ nhỏ đến lớn. + Đối với mẫu mẫu               mnm3m2m1 2n232221 1n131211 X X X X X X X X X X X X , ta ghi số liệu thành bảng số dạng một ma trận số gồm m hàng n cột               mnm3m2m1 2n232221 1n131211 x x xx x x xx x x xx , biến ngẫu nhiên X ij nhận giá trị x ij . Nhiều khi người ta không thể hiện rõ ma trận, nhưng số liệu được ghi thành bảng theo hàng - cột, ta đọc hiểu được và xem như một ma trận vậy. b/ Ghi số liệu theo dạng bảng tần số, tần suất: - Ta lập bảng số liệu ở dạng bảng tần số, với x 1 < x 2 < … < x n , tần số tương ứng là t 1 , t 2 , t 3 , … , t n thì ghi chép theo bảng tần số như sau Giá trị x i x 1 x 2 x 3 ……………… x n Tần số t i t 1 t 2 t 3 ……………… t n - Từ bảng tần số ta lập bảng số liệu ghi kết hợp biểu thị tần suất như sau Giá trị khác nhau của các x i Tần số t i Tần suất W i = n t i Tổng dồn tần suất ∑ i W x 1 x 2 x 3 . . . x n t 1 t 2 t 3 . . . t n W 1 = n t 1 W 2 = n t 2 W 3 = n t 3 …………… W n = n t n W 1 W 1 + W 2 W 1 + W 2 + W 3 …………… ∑ = n i i W 1 = 1 Tổng n = ∑ = n i i t 1 1 Ví dụ 1: Cho mẫu ngẫu nhiên nhận các giá trị là dãy số 3 3 2 1 1 5 5 6 6 6 8 9 4 6 6 7 5 7 3 3 Sắp xếp các giá trị từ nhỏ đến lớn: Có hai lần nhận giá trị 1, Có một lần nhận giá trị 2, Có bốn lần nhận giá trị 3 Có một lần nhận giá trị 4, Có ba lần nhận giá trị 5, Có năm lần nhận giá trị 6 Có hai lần nhận giá trị 7, Có một lần nhận giá trị 8, Có một lần nhận giá trị 9 3 ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học Bảng tần số là Các giá trị x i 1 2 3 4 5 6 7 8 9 Tần số n i 2 1 4 1 3 5 2 1 1 Bảng tần suất là Giá trị khác nhau Tần số Tần suất Tổng dồn tần suất 1 2 3 4 5 6 7 8 9 2 1 4 1 3 . 5 2 1 1 20 2 = 0,1000 20 1 = 0, 0500 20 4 = 0,2000 20 1 = 0, 0500 20 3 = 0,1500 20 5 = 0,2500 20 2 = 0,1000 20 1 = 0, 0500 20 1 = 0, 0500 0,1000 0,1500 0,3500 0,4000 0,5500 0,8000 0,9000 0,9500 1,000 Tổng n = 20 1 c/ Ghi số liệu ở dạng bảng số phân lớp (hay gọi là sự phân tổ thống kê) Khi mẫu nhận giá trị khá đều với biên độ từ giá trị này đến giá trị khác khá hẹp, ta chia tập giá trị ra từng khoảng (x a , x b ) độ dài khoảng bằng h = (b – a). Thông thường người ta chia theo công thức Sturges, tức là chia tập giá trị mẫu thành những khoảng có độ dài h bằng nhau, số khoảng chia tối ưu là 1+3,322.lg n và khoảng h = n lg322,31+ − MinMax xx trong đó n là kích thước mẫu. Lập bảng thể hiện như sau Khoảng l i = x i+1 -x i i = 1,2,3,… , n Tần số n i (số giá trị trong khoảng) Tần suất W i = n i / n Tổng dồn tần suất ∑ i W x Min - x 1 x 1 - x 2 x 2 - x 3 …………. x n-1 - x n n 1 n 2 n 3 ………… n n W 1 W 2 W 3 ………… W n W 1 W 1 + W 2 W 1 + W 2 + W 3 …………… ∑ = n i i W 1 = 1 Tổng n = ∑ = n i i t 1 1 4 ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học d/ Ghi số liệu dưới dạng biểu đồ, đồ thị: Người ta dùng biểu đồ quạt, biểu đồ cột hình chữ nhật, biểu đồ ven để ghi lại số liệu của mẫu. Ngoài ra còn dùng đồ thị biểu diễn số liệu mẫu, mô tả đồ thị thực nghiệm của biến ngẫu nhiên đang xét. 2. HÀM PHÂN PHỐI VÀ CÁC ĐẶC TRƯNG 2.1 Hàm phân phối mẫu: - Cho biến ngẫu nhiên X có phân phối F (x), thông thường khó xác định chính xác hàm F nên người ta thường xét hàm F với một tham số θ ta viết F (x, θ ), ta cũng nói luôn là X có phân phối F (x, θ ). Bây giờ cho mẫu ngẫu nhiên (x 1 , x 2 , x 3 ,… , x n ) cỡ mẫu n, từ phân phối F (x, θ ). Ta gọi hàm phân phối mẫu (hay hàm phân phối thực nghiệm) là tỉ số F n (x) = n m , x ∈ R, trong đó m là số các số x i < x và n là kích thước mẫu. - Tính chất của hàm phân phối mẫu: T/c 1: 0 ≤ F n (x) ≤ 1, với mọi giá trị x ∈ R. T/c 2: F n (x) là hàm tăng theo x. T/c 3: F n (x) = 0 với x ≤ Min (x 1 , x 2 , x 3 , … , x n ) F n (x) = 1 với x > Max(x 1 , x 2 , x 3 , … , x n ) T/c 4: Nếu gọi hàm phân phối lý thuyết là F (x) thì khi cỡ mẫu tăng vô hạn hàm phân phối mẫu tiến tới hàm phân phối lý thuyêt, theo nghĩa hầu chắc chắn hay còn nói theo nghĩa xác suất. Tức là P [ )()( xFxF n n Lim = ∞→ ] = 1. T/c 5: Hàm phân phối mẫu F n (x) là hàm liên tục bên trái. Ví dụ 2: Cho mẫu quan sát của một biến ngẫu nhiên X như sau Giá trị x i 2 5 7 8 Tần số n i 10 3 2 4 Hãy lập hàm phân phối mẫu, vẽ đồ thị của hàm phân phối mẫu. Giải: Cỡ mẫu n = 10 + 3 + 2 + 4 = 19, biến ngẫu nhiên X nhận 4 giá trị là 2, 5, 7, 8. Hàm phân phối mẫu F n (x) =                >= +++ ≤<= ++ ≤<= + ≤< ≤ 8 1 19 42310 87 19 15 19 2310 7x5 khi 19 13 19 310 5x2 khi 19 10 2 xkhi 0 khix xkhi Đồ thị của hàm F (x) dạng bậc thang: 2.2. Các số đặc trưng của mẫu: a/ Số trung bình mẫu. Cho mẫù (x 1 , x 2 , x 3 ,…, x n ) cỡ n của biến ngẫu nhiên X có phân phối F (x, θ ). - Ta gọi số X = n 1 (x 1 + x 2 + x 3 + … + x n ) là trung bình mẫu.Viết gọn là X = n 1 ∑ = n k k x 1 . 5 ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học Nếu mẫu cho ở bảng tần số với các số x k 1 < x k 2 < … < x k m , chỉ số (km ) ≤ n Giá trị x k i x k 1 x k 2 x k 3 …………………… x k m Tần số t k i t k 1 t k 2 t k 3 ……………………… t k m thì X = n 1 (x k 1 t k 1 + x k 2 t k 2 + x k 3 t k 3 + … + x k m t k m ) = n 1 i m 1i i kk tx ∑ = ở đây tổng các tần số t k 1 + t k 2 + t k 3 + … + t k m = n - Số trung bình bình phương theo mẫu (x 1 , x 2 , x 3 ,…, x n ), là số 2 X được xác định bằng 2 X = n 1 (x 1 2 + x 2 2 + x 3 2 + … + x n 2 ) = n 1 ∑ = n k k x 1 2 Nếu mẫu cho ở bảng tần số với các số x k 1 < x k 2 < … < x k m , chỉ số (km ) ≤ n Giá trị x k i x k 1 x k 2 x k 3 ………………… x k m Tần số t k i t k 1 t k 2 t k 3 ………………… t k m Thì 2 X = n 1 [(x k 1 ) 2 t k 1 + (x k 2 ) 2 t k 2 + (x k 3 ) 2 t k 3 + … + (x k m ) 2 t k m )] = n 1 i 2 m 1i i )( kk tx ∑ = ở đây tổng các tần số t k 1 + t k 2 + t k 3 + … + t k m = n b/ Phương sai của mẫu. Cho mẫu (x 1 , x 2 , x 3 …, x n ) cỡ n của biến ngẫu nhiên X có phân phối F (x, θ ). Ta gọi số S 2 X = n 1 2 1 ) ( ∑ = − n k k Xx là phương sai của mẫu. Chú ý đẳng thức n 1 2 1 ) ( ∑ = − n k k Xx = 2 X - ( X ) 2 nên S 2 X = 2 X - ( X ) 2 Ta gọi số S* 2 X = 1 1 −n 2 1 ) ( ∑ = − n k k Xx là phương sai hiệu chỉnh của mẫu ngẫu nhiên. Ta có phương sai hiệu chỉnh S* 2 X = 1−n n . S 2 X , như vậy S* 2 X > S 2 X . c/ Mô men gốc bậc v, mô men trung tâm bậc v. Cho mẫu (x 1 , x 2 , x 3 ,…, x n ) cỡ n của biến ngẫu nhiên X có phân phối F (x, θ ). Ta gọi số m V = n 1 V n k k x )( 1 ∑ = là mô men gốc bậc v theo mẫu đã chọn. Ta gọi số a V = n 1 V n k k Xx ) ( 1 ∑ = − là mô men trung tâm bậc v theo mẫu đã chọn. d/ Trung vị mẫu. Cho mẫu (x 1 , x 2 , x 3 ,…, x n ) cỡ n của biến ngẫu nhiên X có phân phối F (x, θ ). Ta sắp xếp các giá trị của mẫu theo thứ tự tăng dần x k 1 < x k 2 < … < x k m , chỉ số (km) ≤ n , có hai khả năng xét: - Nếu chỉ số n là lẻ tức là n = 2q – 1, khi đó các giá trị x q-1 , x q , x q+1 chen vào trong dãy số x k 1 < x k 2 < … < x k m , tức là có x k 1 < x k 2 < … < x q-1 < x q < x q+1 < … < x k m . Từ đây giá trị trung vị x Me = x q . 6 ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học - Nếu chỉ số n là chẵn tức là n = 2q , khi đó các giá trị x q-1 , x q , x q+1 chen vào trong dãy số x k 1 < x k 2 < … < x k m , tức là có x k 1 < x k 2 < < x q-1 < x q < x q+1 < … < x k m .Từ đây giá trị trung vị x Me = 2 x 1q+ + q x . e/ Mod (đọc là Mốt) Cho mẫu (x 1 , x 2 , x 3 ,…, x n ) cỡ n của biến ngẫu nhiên X có phân phối F (x, θ ). Ta biểu thị mẫu theobảng tần số với các số x k 1 < x k 2 < … < x k m , chỉ số (km ) ≤ n Giá trị x k i x k 1 x k 2 x k 3 ……… x k m Tần số t k i t k 1 t k 2 t k 3 ………… t k m Giả sử giá trị (Max n ik t ) / i= 1, 2, 3, … , m, đạt tại điểm x k v thì giá trị x Mod = x k v . Ví dụ 3: Cho mẫu quan sát của một biến ngẫu nhiên X như sau Giá trị x i 2 5 7 8 Tầnsố n i 10 3 2 4 Tính trung bình mẫu X , phương sai mẫu S 2 X , độ lệch chuẩn S X , trung vị, mod. Giải: Cỡ mẫu n = 10 + 3 + 2 + 4 = 19 X = 19 1 (2.10 + 5.3 + 7.2 + 8.4) = 19 81 = 4,263157… ≈ 4,2632 2 X = 19 1 (2 2 .10 + 5 2 .3 + 7 2 .2 + 8 2 .4) = 19 1 (4.10 + 25.3 + 49.2 + 64.4) = 19 1 . 469 ≈ 24,6842 S 2 X = 2 X - ( X ) 2 = 24,6842 – (4,2632) 2 = 24,6842 – 18,1749 = 6,5093 S* 2 X = 1−n n . S 2 X = 18 19 . 6,5093 = 6,8709. Độ lệch chuẩn S X = 2 X S = 5093,6 = 2,5513 Số trung vị mẫu ứng với giá trị thứ 10 trong mẫu, theo thứ tự đó (đếm theo hàng tần số từ 1 đến 10) là x = 2 nên x Me = 2 Mốt của mẫu đạt tại giá trị có tần suất lớn nhất đó là x = 2, nên x Mod = 2 Ví dụ 4: Chọn ngẫu nhiên 30 chi tiết máy của cùng một loại sản phẩm, đo độ dài của chúng thu được số liệu sau: 39, 43, 41, 41, 40, 41, 43, 42, 41, 39, 40, 42, 44, 42, 42, 41, 41, 42, 43, 40, 41, 41, 42, 43, 39, 40, 41, 39, 40, 42. a/ Tìm các số đặc trưng của mẫu. b/ Lập bảng phân phối thực nghiệm c/ Lập hàm phân phối xác suất Giải: Viết số liệu ban đầu theo bảng tần số là: Giá trị x i 39 40 41 42 43 44 Tần số n i 4 5 9 7 4 1 Cỡ mẫu n = 30 a/ các số đặc trưng: X = 30 1 (39.4+40.5+41.9+42.7+43.4+44.1) = 30 1 (156+200+369+294+172+44) = = 30 1 .1235 = 41,1666… ≈ 41,17 2 X = 30 1 (39 2 .4+40 2 .5+41 2 .9+42 2 .7+43 2 .4+44 2 .1) = 7 ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học = 30 1 (6084+8000+15129+12348+7396+1936) = 30 1 .50893 = 1696,4333333…. S 2 X = 2 X - ( X ) 2 = 1696,3333 – (41,17) 2 = 1696,3333 – 1694,9689 = 1,3644 Độ lệch chuẩn là S X = 3644,1 = 1,1680753… ≈ 1,1681 Trung vị mẫu: x Me = 2 1 (x 15 + x 16 ) = 2 1 (41 + 41) = 41 (giá trị thứ 15 và thứ 16 trên bảng tần số đều bằng 41) Mốt của mẫu: x Mod = 41 (vì tại giá trị 41 tần số cao nhất, nên tần suất lớn nhất) b/ Bảng phân phối thực nghiệm: x i 39 40 41 42 43 44 P (X=x i ) 30 4 30 5 30 9 30 7 30 4 30 1 c/ Hàm phân phối mẫu: Từ câu b/ ta rút ngay hàm phân phối mẫu như sau F 30 (x) =                      >==+++++ ≤<=++++ ≤<==+++ ≤<==++ ≤<==+ ≤< ≤ 44 1 30 30 30 1 30 4 30 7 30 9 30 5 30 4 4443 30 29 30 4 30 7 30 9 30 5 30 4 4342 6 5 30 25 30 7 30 9 30 5 30 4 4241 15 9 30 18 30 9 30 5 30 4 4140 10 3 30 9 30 5 30 4 4039 30 4 39 0 xkhi xkhi xkhi xkhi xkhi xkhi xkhi Ví dụ 5: Kiểm tra độ dài các chi tiết máy có số liệu cho ở bảng sau Độ dài mm 20-30, >30-40, >40-50, >50-60, >60-70, >70-80, >80-90, >90-100,>100 Số chi tiết 3 8 30 45 20 25 17 9 3 a/ Tính các đặc trưng X , S 2 X , S X . b/ Lập bảng phân phối thực nghiệm. Giải: Số liệu cho ở khoảng, ta chuyển về bảng số liệu thu gọn bằng cách lấy giá trị trung bình của mỗi khoảng như sau Độ dài m m 25 35 45 55 65 75 85 95 105 Số chi tiết 3 8 30 45 20 25 17 9 3 a/ Cỡ mẫu n = 3+8+30+45+20+25+17+9+3 = 160 X = 160 1 (25.3+35.8+45.30+55.45+65.20+75.25+85.17+95.9+105.3) = 62,31 8 ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học 2 X = 160 1 (25 2 .3+35 2 .8+45 2 .30+55 2 .45+65 2 .20+75 2 .25+85 2 .17+95 2 .9+105 2 .3)= = 160 1 .670600 = 4191,25 S 2 X = 2 X - ( X ) 2 = 4191,25 – (62,31) 2 = 4191,25 – 3882,54 = 308,71 S* 2 X = 1−n n . S 2 X = 159 160 . 308,7 = 310,65. Độ lệch chuẩn là S X = 71,308 = 17,5701 b/ Bảng phân phối thực nghiệm: Giá trị x i 25 35 45 55 65 75 85 95 105 P(X=x i ) 3/160 8/160 30/160 45/160 20/160 25/160 17/160 9/160 3/160 2.3 Hệ số tương quan của hai mẫu Trong thực tế nhiều khi ta nghiên cứu cùng một lúc hai hoặc nhiều biến ngẫu nhiên, mà các biến ngẫu nhiên ấy được xét trên cùng một đối tượng, có thể giữa chúng có một sự tương quan nhau. Đối với hai biến ngẫu nhiên X và Y, có các số trung bình mẫu X , Y và các phương sai mẫu S 2 X , S 2 Y thì hệ số tương quan là số r XY = YX SS . 1 ( XY - X . Y ). Ví dụ 6: Cho mẫu của cặp biến ngẫu nhiên (X,Y) theo số liệu là X 0 1 1 3 3 4 Y 3 3 4 4 5 5 Tìm hệ số tương quan r XY ? Giải: Cỡ mẫu n = 6, để tính các đặc trưng của mẫu ta lập bảng sau X 0 1 1 3 3 4 Y 3 3 4 4 5 5 X.Y 0 3 4 12 15 20 X 2 0 1 1 9 9 16 Y 2 9 9 16 16 25 25 X = 6 1 (0+1+1+3+3+4) = 6 1 . 12 = 2, Y = 6 1 (3+3+4+4+5+5) = 6 1 .24 = 4 2 X = 6 1 (0 2 +1 2 +1 2 +3 2 +3 2 +4 2 ) = 6 1 (0+1+1+9+9+16) = 6 1 .36 = 6 2 Y = 6 1 (3 2 +3 2 +4 2 +4 2 +5 2 +5 2 ) = 6 1 (9+9+16+16+25+25) = 6 1 .100 = 16,666666… XY = 6 1 (0+3+4+12+15+20) = 6 1 . 54 = 9 S 2 X = 2 X - ( X ) 2 = 6 – 2 2 = 6 – 4 = 2 ⇒ S X = 2 S 2 Y = 2 Y - ( Y ) 2 = 6 1 .100 - 4 2 = 6 4 = 3 2 ⇒ S Y = 3 2 = 3 2 ⇒ YX SS . 1 = 2 3 Cuối cùng r XY = 2 3 ( 9 – 2 . 4 ) = 2 3 = 2 1 . 1,73205080756… = 0,86602540378… Ví dụ 7: Cho mẫu của cặp (X,Y) như sau, tính hệ số tương quan r XY . X 1 2 3 9 ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học Y 2 3 4 8 2 3 7 2 8 Giải: Theo mẫu ta tách các biến X, Y, X.Y bằng bảng phụ được các số liệu: Giá trị của X 1 2 3 Tần số n i (X) 8+3=11 2+7+2=11 8 Giá trị của Y 2 3 4 Tần số n i (Y) 8+2=10 3+7=10 2+8=10 Giá trị của X Tần số n i (X) n i (X) . X Giá trị của X 2 n i (X) . X 2 1 2 3 11 11 8 11 22 24 1 4 9 11 44 72 Tổng theo cột 30 57 127 Giá trị của Y Tần số n i (Y) n i (Y) . Y Giá trị của Y 2 n i (Y) . Y 2 2 3 4 10 10 10 20 30 40 4 9 16 40 90 160 Tổng theo cột 30 90 290 Giá trị từng cặp (X,Y) Tần số n i của cặp giá trị Tích số n i .X.Y (1, 2) (1, 3) (1, 4) (2, 2) (2, 3) (2, 4) (3, 2) (3, 3) (3, 4) 8 3 0 2 7 2 0 0 8 1.2.8 = 16 1.3.3 = 9 1.4.0 = 0 2.2.2 = 8 2.3.7 = 42 2.4.2 = 16 3.2.0 = 0 3.3.0 = 0 3.4.8 = 96 Tổng theo cột 30 187 Bây giờ chỉ việc tính các giá trị X = 30 1 . 57 = 1,9 , 2 X = 30 1 . 127 = 4,2333333… , S 2 X = 2 X - ( X ) 2 = 30 1 . 127 - ( 30 1 . 57) 2 = ( 30 1 ) 2 (30.127 – 57.57) = 900 561 = 0,623333… Y = 30 1 . 90 = 3 , 2 Y = 30 1 . 290 = 9,6666666… 10 [...]... 10 5 X 2 3 4 3 2 5 8 10 c/ Giá tri của Y 100 120 5 2 3 10 15 1 4 Giá trị của X 20 25 3 21 30 35 40 ĐẬU XUÂN THOAN – ĐT.0915.638.272 140 160 180 5 10 Phương pháp thống kê toán học 8 6 1 4 “MỖI NGƯỜI CẦN PHẢI HỌC TẬP THƯỜNG XUYÊN SUỐT ĐỜI” 22 1 1 ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học CÁC BẢNG SỐ TRA CỨU Bảng 1 Giá trị hàm phân phối F(x) = 1 2π x ∫e − 1 2 u 2 du trong phân phối...ĐẬU XUÂN THOAN – ĐT.0915.638.272 1 1 Phương pháp thống kê toán học 1 600 2 = S2Y = Y 2 - ( Y )2 = 290 – ( 90 )2 = ( )2 ( 290.30 – 90.90) = = 30 30 30 900 3 0,66666… XY = rXY = 1 187 30 1 Cuối cùng: 187 57 ( − 3) 561 2 30 30 = 900 3 900.3 16 16 16 = = = 0,82734370 ≈ 0,83 561.2 30 187.2 374 3 ƯỚC LƯỢNG KHOẢNG TRONG THỐNG KÊ 3.1 Định nghĩa: Trong thực tế độ chính... 12 245 14 ĐẬU XUÂN THOAN – ĐT.0915.638.272 1 S* X = n −1 2 n ∑ (x k =1 k − X ) 2 = 152,8 Phương pháp thống kê toán học ⇒ S*X = 12,36 α = 0,975, tra bảng có F(1,96) = 0,975 nên ta 2 12,36 24,2256 ≈ 1,7130 Khoảng ước lượng là lấy tα = xα = 1,96 Tính riêng 1,96 = 14,1421 200 (221 – 1,713; 221 + 1,713) hay là (219,287; 222,713) Độ tin cậy (1 - α ) = 95% = 0,95 ⇒ 1 − 3.3 Khoảng ước lượng của phương sai... ngẫu nhiên X gọi là đối thiết đơn, ngược lại xác định nhiều phân phối gọi là đối thiết hợp Người ta thường ký hiệu giả thiết bằng chữ H, đối thiết bằng chữ K 14 ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học - Nội dung của bài toán kiểm định giả thiết là: Căn cứ vào mẫu để lựa chọn một trong hai quyết định, chấp nhận giả thiết H hoặc bác bỏ giả thiết H Khi quyết định có hai sai lầm thường... mẫu X ta lập bài toán tương ứng, cụ thể là: Xu hướng X < a0 , kiểm định H : a = a0 với K : a < a0 mức α n , có kết luận: Zα > xα thì H bị bác bỏ, Zα < xα thì H được chấp σ nhận Số xα tra trong bảng phân phối chuẩn N(0,1) sao cho F ( xα ) = 1 - α Xu hướng X > a0 , kiểm định H: a = a0 với K: a > a0 mức α Tính Zα = (a0 - X ) 15 ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học n , có kết... khoảng ước lượng kỳ vọng a - Nếu chưa biết phương sai S* S* α ) là ( X - tα X < a < X + tα X ) hay ghi khoảng ước với độ tin cậy (1 n n * * S X S X lượng là ( X - tα ; X + tα ) n n Với cỡ mẫu n >30 thì tα tra giống như xα ở trên Giá trị xα tra trong bảng phân phối chuẩn N (0, 1) sao cho F ( xα ) = 1 - 11 ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học Với cỡ mẫu n tα ) = α hay viết t(α ,n −1) = tα tra từ dưới lên, dóng hàng k = n-1 bậc tự do và cột mức ý nghĩa α Ví dụ t(0,5%; 27) = 2,771 ; t(5%; 16) = 1,746 30 ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học Bảng 3 Phân phối khi bình phương với k = n – 1 bậc tự do Số bậc tự α =0,01 do k (1%) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 6,635 9,210 11,345... SX = 2,58199535243… ≈ 2,58 1 1 Y = (30+32+35+40+48+52+58+62+68) = 425 = 47,22222… ≈ 47,2 9 9 1 2 2 2 2 2 2 2 2 2 Y 2 = (30 +32 +35 +40 +48 +52 +58 +62 +69 ) = 9 X = 19 8 68 ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học 1 1 (900+1024+1225+1600+2304+2704+3364+3844+4624) = 21589 = 9 9 = 2398,7777777… ≈ 2398,78 2 S Y = Y 2 - ( Y )2 = 2398,78 – (47,2)2 = 170,94 ⇒ SY = 13,074402472… ≈ 13,07... (0 , 1) sao cho α F ( xα ) = 1 2 Chú ý rằng χ 2(n-1, Ví dụ 11: Đo độ chịu lực của 200 mẫu bê tông người ta thu được số liệu sau 13 ĐẬU XUÂN THOAN – ĐT.0915.638.272 Độ chịu lực X (kG/cm2) 190 - 200 200 - 210 210 - 220 220 - 230 230 - 240 240 - 250 Phương pháp thống kê toán học Số mẫu bê tông ni 10 26 56 64 30 14 Bê tông có độ chịu lực lớn hơn 220 kG/cm 2 được xếp loại 1, hãy ước lượng xác suất p của bê... 0,9429 1,90 1,91 1,92 1,93 0,9713 0,9719 0,9726 0,9732 ĐẬU XUÂN THOAN – ĐT.0915.638.272 0,8 7 0,8 8 0,89 0,90 0,91 0,92 0,93 0,94 0,95 0,96 0,97 0,98 0,99 1,00 1,01 1,0 2 1,03 1,04 0,807 8 0,810 6 0,813 3 0,815 9 0,818 6 0,821 2 0,823 8 0,826 4 0,828 9 0,831 5 0,834 0 0,836 5 0,838 9 0,841 3 0,843 8 0,846 1 0,848 5 0,850 Phương pháp thống kê toán học 1,2 2 1,2 3 1,2 4 1,2 5 1,2 6 1,2 7 1,2 8 1,29 0,888 . ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học PHƯƠNG PHÁP THỐNG KÊ TOÁN HỌC 1. MẪU NGẪU NHIÊN 1.1 Khái niệm về mẫu ngẫu nhiên: Giả. ký hiệu giả thiết bằng chữ H, đối thiết bằng chữ K. 14 ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học - Nội dung của bài toán kiểm định giả thiết là: Căn cứ vào mẫu để lựa chọn. cho trước, có hai trường hợp. - Bài toán kiểm định 2 phía H: p = p 0 với K: p ≠ p 0 mức α . 16 ĐẬU XUÂN THOAN – ĐT.0915.638.272 Phương pháp thống kê toán học Tính giá trị α Z = 0 .pnk

Ngày đăng: 17/06/2015, 19:56

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan