bài tập lớn xác suất thống kê thầy Nguyễn Đình Huy

34 1.3K 4
bài tập lớn xác suất thống kê thầy Nguyễn Đình Huy

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

1.ĐỀ BÀI TẬP – ĐỀ SỐ 5 ............................................................................. 3 2.PHÂN TÍCH BÀI TOÁN – GIẢI TOÁN TRÊN EXCEL ....................... 6 2.1 Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK 2015 (N.Đ.HUY). ................................................................................................6 2.1.1 Ví dụ 10 trang 172 ................................................................................. 6 2.1.2 Ví dụ 12 trang 181 ................................................................................. 9 2.2 Bài tập 2 ........................................................................................................15 2.3 Bài tập 3 ........................................................................................................19 2.4 Bài tập 4 ........................................................................................................25 2.5 Bài tập 5 ........................................................................................................28 1.ĐỀ BÀI TẬP – ĐỀ SỐ 51.1. Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK 2015 (N.Đ.HUY). 1.1.1. Ví dụ 10172: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:

MỤC LỤC ĐỀ BÀI TẬP – ĐỀ SỐ PHÂN TÍCH BÀI TỐN – GIẢI TỐN TRÊN EXCEL 2.1 Trình bày lại ví dụ 10 trang 172 ví dụ 12 trang 181 Sách GT XSTK 2015 (N.Đ.HUY) 2.1.1 Ví dụ 10 trang 172 2.1.2 Ví dụ 12 trang 181 2.2 Bài tập 15 2.3 Bài tập 19 2.4 Bài tập 25 2.5 Bài tập 28 ĐỀ BÀI TẬP – ĐỀ SỐ 1.1 Trình bày lại ví dụ 10 trang 172 ví dụ 12 trang 181 Sách GT XSTK 2015 (N.Đ.HUY) 1.1.1 Ví dụ 10/172: Hiệu suất phần trăm (%) phản ứng hóa học nghiên cứu theo yếu tố: pH (A), nhiệt độ (B) chất xúc tác (C) trình bày bảng sau: Yếu tố B Yếu tố A A1 A2 A3 A4 B1 C1 C2 C3 C4 B2 12 13 10 C2 C3 C4 C1 B3 14 15 14 11 C3 C4 C1 C2 B4 16 12 11 13 C4 C1 C2 C3 12 10 14 13 Hãy đánh giá ảnh hưởng yếu tố hiệu suất phản ứng? 1.1.2 Ví dụ 12/181: Người ta dùng ba mức nhiệt độ gồm 105, 120 135C kết hợp với ba khoảng thời gian 12, 30 60 phút, để thực mộ phản ứng tổng hợp Các hiệu suất phản ứng (%) trình bày bảng sau đây: Thời gian (phút) X1 15 20 60 15 30 Thời gian ( C) X2 105 105 105 120 120 Hiệu suất (%) Y 1.87 2.02 3.28 3.05 4.07 60 15 30 60 120 135 135 135 5.54 5.03 6.45 7.26 Hãy cho yếu tố nhiệt độ thời gian/ yếu tố thời gian có liên quan tuyến tính với hiệu suất phản ứng tổng hợp? Nếu có điều kiện nhiệt độ 115C vòng 50 phút hiệu suất phản ứng bao nhiêu? 1.2 Một nông trường nuôi bò nuôi ba giống bò sữa A, B, C Lượng sữa bò thống bảng sau đây: Lượng sữa Loại bò A B C Ít Trung bình Nhiều 92 53 75 37 15 19 46 19 12 Với mức ý nghóa = 0,05, nhận đònh xem có phải ba giống bò phương diện sản lượng sữa hay không? 1.3 Hãy phân tích tình hình kinh doanh số ngành nghề quận quận nội thành sở số liệu doanh thu số cửa hàng sau: Ngành nghề kinh doanh Điện lạnh Vật liệu xây dựng Dòch vụ tin học Khu vực kinh doanh Q1 Q2 Q3 2.5:2.7:2.0:3.0 3.1:3.5:2.7 2.0:2.4 9.5:9.3:9.1 0.6:10.4 15.0 1.2:1.0:9.8:1.8 2.0:2.2:1.8 1.2:1.3:1.2 Q4 5.0:5.4 19.5:17.5 5.0:4.8:5.2 1.4 Một nhóm gồm 105 nhà doanh nghiệp Mỹ phân loại theo thu nhập hàng năm tuổi họ Kết thu sau: Tuổi Thu nhập Từ 100 000 $ - 399 599 $ Treân 400 000 $ 18 19 11 12 17 Dưới 100 000 $ Dưới 40 Từ 40 đến 54 Trên 54 Với mức ý nghóa 1%, kiểm đònh giả thiết cho tuổi mức thu nhập có quan hệ với hay không ? 1.5 Sau số liệu số lượng loại báo ngày bán quận nội thành: Quận nội thành Ngày khảo sát Thứ hai Thứ ba Thứ tư Thứ năm Thứ sáu Thứ bảy Q1 Q2 Q3 Q4 Q5 22 21 25 24 28 30 18 18 25 24 19 22 22 22 25 18 15 28 18 18 19 20 22 25 18 19 20 22 25 25 Lượng báo bán quận có khác thực không? Chọn  = 1% Lượng báo bán có chòu tác động yếu tố ngày tuần không? 5.1 Trình bày lại ví dụ 10 trang 172 ví dụ 12 trang 181 Sách GT XSTK 2015 (N.Đ.HUY) 5.1.1 Vd 10, trang 172: Hiệu suất phần trăm (%) phản ứng hóa học nghiên cứu theo ba yếu tố: pH (A), nhiệt độ (B) chất xúc tác (C) trình bày bảng sau: Hãy đánh giá ảnh hưởng yếu tố hiệu suất phản ứng 5.1.1.1.Phương pháp: Khi nghiên cứu ảnh hưởng hai yếu tố, yếu tố có n mức, người ta dùng mơ hình hình vng la tinh n x n Thí dụ mơ hình x 4: Mơ hình hình vng la tinh ba yếu tố trình bày sau: BẢNG ANOVA : Trắc nghiệm: Giả thiết: H0 : μ1= μ2= =μk “Các giá trị trung bình nhau” H1 : μi ≠ μj “Có hai giá trị trung bình khác nhau” Giá trị thống kê: Fr Fc Biện luận:    Nếu Fr < Fα => Chấp nhận H0 (Yếu tố A) Nếu Fc< Fα=> Chấp nhận H0 (Yếu tố A) Nếu F < Fα => Chấp nhận H0 (Yếu tố C) 5.1.1.2.Áp dụng MS-EXCEL Nhập liệu vào máy tính : Tính giá trị Ti (Tổng hàng) Chọn ô B7 nhập biểu thức =SUM(B2:E2) Chọn ô C7 nhập biểu thức =SUM(B3:E3) Chọn ô D7 nhập biểu thức =SUM(B4:E4) Chọn ô E7 nhập biểu thức =SUM(B5:E5) Các giá trị T.j Chọn ô B8 nhập biểu thức =SUM(B2:B5) Dùng trỏ kéo kí hiệu tự điền từ B8 đến ô E8 Các giá trị T.j Chọn ô B9 nhập biểu thức =SUM(B2,C5,D4,E3) Chọn ô C9 nhập biểu thức =SUM(B3,C2,D5,E3) Chọn ô D9 nhập biểu thức =SUM(B4,C3,D2,E5) Chọn ô E9 nhập biểu thức =SUM(B5,C4,D3,E2) Giá trị T Chọn ô B10 nhập biểu thức =SUM(B2:E5) Các giá trị SUMSQTi , SUMSQT.J SUMSQT k Chọn ô G7 nhập biểu thức =SUMSQ(B7:E7) Dùng trỏ kéo ký hiệu tự điền từ ô G7 đến ô G9 Giá trị SQT Chọn ô G10 nhập biểu thức =POWER(B10.2) Giá trị SUMSO Yijk Chọn ô G11 nhập biểu thức = SUMSQ(B2:E5) Tính giá trị SSR, SSC, SSF, SST SSE Các giá trị SSR, SSC SSF Chọn ô I7 nhập biểu thức =G7/4-39601/POWER(4.2) Dùng trỏ kéo ký hiệu tự điền từ ô I7 đến ôn I9 Giá trị SST Chọn ô I11 nhập biểu thức =G11-G10/16 Giá trị SSE Chọn I10 nhập biểu thức =I11-SUM(I7:I9) Tính giá trị MSR, MSC, MSF MSE Các giá trị MSR, MSC MSF Chọn ô K7 nhâp biểu thức =I7/(4-1) Dùng trỏ kéo kí hiệu điền từ ô K7 đến ô K9 Giá trị MSE: Chọn ô K10 nhâp biểu thức =I10/((4-1)*(4-2)) Tình giá trị FR , FC F: Chọn ô M7 nhâp biểu thức =K7/0.3958 Dùng trỏ kéo kí hiệu điền từ M7 đến M9 Ta có kết sau: Kết biện luận     FR=3.1 < F0.05(3.6)=4.76 → Chấp nhận Ho (pH) FC=11.95 > F0.05(3.6)=4.76→ Bác bỏ Ho (nhiệt độ) F=30.05 > F0.05(3.6)=4.76 → Bác bỏ Ho (chất xúc tác) Vậy có nhiệt độ chất xuc tác gây ảnh hưởng đến hiệu suất 5.1.2 Ví dụ 12/181: Người ta dùng ba mức nhiệt độ gồm 105, 120 135C kết hợp với ba khoảng thời gian 12, 30 60 phút, để thực mộ phản ứng tổng hợp Các hiệu suất phản ứng (%) trình bày bảng sau đây: Hãy cho yếu tố nhiệt độ thời gian/ yếu tố thời gian có liên quan tuyến tính với hiệu suất phản ứng tổng hợp? Nếu có điều kiện nhiệt độ 115°C vòng 50 phút hiệu suất phản ứng bao nhiêu? 5.1.2.1.Phương pháp: Hồi quy tuyền tính đa tham số Trong phương tình hồi quy tuyền tính đa tham số, biến số phụ thuộc Y có liên quan đến k biến số độc lập Xi (i=1,2,…,k) thay có quy hồi quy tuyến tính đơn giản Phương trình tổng quát: Ŷ X0,X1,…,Xk= B0 +B1X1+…+BkXk Bảng Anova: Giá trị thống kê: - Giá trị R-bình phương: Độ lệch chuẩn: Trắc nghiệm thông o Giá trị thông kê: F o Trắc nghiệm t: H0 βi = ↔ Các hệ số hồi quy khơng có ý nghĩa H1 βi ≠ ↔ Có vài hệ số hồi quy có ý nghĩa o Trác nghiệm F: H0 βi = ↔ Phuơng trình hồi quy khơng thích hợp H1 βi ≠ ↔ Phương trình hồi quy thích hợp với vài hệ số Bi Bậc tự giá trị F : v1 =1, v2= N-k-1 5.1.2.2.ÁP DỤNG MS EXCEL: Nhập liệu vào bảng: Sử dụng “Regresstion” : o Vào Data nhấn Data Analysis, Regression nhấn nut Ok Trong hộp Regression, ấn định chi tiết : o Phạm vị biến X (Input X Range): $A$1:$A$10 o Phạm vị biến Y (Input Y Range): $C$1:$C$10 o Nhãn liệu (Labels) o Mức tin cậy (Confidence Level) o Đường hồi quy (Line Fit Plots), biểu thức sai số (Residuals) Nhấn OK ta có bảng sau: Phương trình hồi quy: ŶX1=f(X1) ŶX1=2.73 + 0.04X1 (R2=0.21;S=1.81) T0=2.129< t0.05=2.365 Ta có quy tắc định sau: + Nếu FA > f (r – 1, n – cr) ta bác bỏ giả thiết H 0A : “Các mức A1, Ar có hiệu trung bình nhau” + Nếu FB > f (c – 1, n – cr) ta bác bỏ giả thiết: H 0B : “Các mức B1, B2, Bc có hiệu trung bình nhau” Nếu FAB > f ((r – 1)(c – 1), n – rc) ta bác bỏ giả thiết: H 0AB : “Có tương tác A B” Trên thực hành tính tốn thực sau Giả sử Tjk tổng giá trị mẫu (j, k) Ký hiệu: c r  T  T ,  T  T jk  ok  jo  jk k 1 j 1    c r n  n ,n  n  jk ok jk  jo  k 1 j 1 T   T jo   Tok   xijk  n   no   nok    xijk2 (3) Ta có đẳng thức sau: T2 (4) n r T2 T2 SSFA   jo  (5) n j 1 n jo SST  A  Tok2 T  (6) n k 1 nok c SSFB   c r SSE  A   k 1 j 1 T jk2 n jk  SSI  SST  SSFA  SSFB  SSE Đặc biệt tất mẫu njk = m với j, k thì: n jo  cm,nok  rm r T đó:o SSFA  jo j 1 cm  T2 ' ) n r ok T T2 (6' ) rm n T jk2  k j SSE  A  (7 ' ) m SSFB  k 1  Trước hết ta cần tính đại lượng Tjk Tiếp theo tính giá trị Tjo, njo, nok, Tok, n, T A theo công thức (1), (2), (3) Từ tính SST, SSFA, SSFB, SSE SSI theo công thức (4), (5), (6), (7) (hoặc (5’), (6’), (7’) njk = m) Giảthuyết: -HA (yếu tố ngành nghề): doanh thu không phụ thuộc vào ngành nghề -HB (yếu tố quận): doanh thu không phụ thuộc vào quận -HAB (sự tương tác yếu tố): doanh thu giữ ngành nghề quận khơng có liên quan tới Nhập liệu vào bảng tính: Áp dụng: “Anova: Two-Factor With Replication” Vào Data -> Data Analysis Chọn mục Anova: Two-Factor With Replication Chọn OK Trong hộp thoại Anova: Two-Factor With Replication ấn định chi tiết Phạm vi đầu vào (Input Range): $A$9:$E$21 Số hàng mẫu (Rows per sample): Ngưỡng tin cậy (Alpha): 0.01 (mức ý nghĩa = 1%) Phạm vi đầu (Output Range): $A$23 Nhấn OK Ta bảng sau: Kết biện luận: Thực toán MS-EXCEL: FR = 2.8929 < F0.01 = 5.247894 Chấp nhận giả thuyết Ho (ngành nghề kinh doanh) FC= 0.8089 < F0.01 = 4.3771 Chấp nhận giả thuyết Ho (ngành nghề địa điểm kinh doanh) KẾT LUẬN: Vì doanh thu cửa hàng khơng phụ thuộc vào ngành nghề địa điểm kinh doanh, ngành nghề kinh doanh địa điểm kinh doanh tương tác lẫn Bài 4: Một nhóm gồm 105 nhà doanh nghiệp Mỹ phân loại theo thu nhập năm tuổi thọ họ Kết thu hình sau: Thu nhập Tuổi Dưới 100 000 $ Từ 100 000 $ đến 399 599 $ Trên 400 000 $ Dưới 40 Từ 40 đến 54 18 19 Trên 54 11 12 17 Với mức ý nghĩa 1%, kiểm định giả thiết cho tuổi mức thu nhập có quan hệ với hay khơng? Dạng bài: Kiểm định tính độc lập Phương pháp giải : Kiểm tra tính độc lập  Cơ sở lí thuyết: Giả sử ta quan tâm tới dấu hiệu cá thể tập hợp C Dấu hiệu nói chung thay đổi từ cá thể sang cá thể khác Nếu dấu hiệu biểu thị số, hay nói cách khác gán số đo cho dấu hiệu lên cá thể, ta nói dấu hiệu biến lượng dấu hiệu định lượng Chẳng hạn cad thể người biến lượng chiều cao, lượng, tuổi nhiên thực tế có dấu hiệu đo đạc để biểu diễn số Chẳng hạn màu tóc, màu mắt người, cảm giác hạnh phúc, yêu thích phim Đó dấu hiệu khơng đo đạc Ta gọi dấu hiệu định tính Trong mục ta xét tốn kiểm tra tính độc lập hai dấu hiệu Trước hết, xét tốn kiểm định tính độc lập dấu hiệu định tính A B Ta chia dấu hiệu A làm r mức độ A1, A2, , Ar, chia đặc tính B làm k mức độ B1, B2, , Bk Xét mẫu ngẫu nhiên gồm n cá thể Mỗi cá thể mang dấu hiệu A mức Ai mang dấu hiệu B mức Bj Giả sử nij số cá thể có dấu hiệu Ai Bj Các số liệu nij ghi bảng sau gọi bảng liên hợp dấu hiệu (Contingency Table) A B1 B2 Bk Tổng A1 n11 n12 … n1k n10 A2 n21 n22 … n2k n20 … … … … … … Ar nr1 nr2 … nrk nr0 Tổng n01 n02 n0k N B Trong ký hiệu pij xác suất để cá thể chọn ngẫu nhiên mang dấu hiệu Ai Bj ; pjo poj tương ứng xác suất để cá thể mang dấu hiệu Ai Bj Nếu giả thiết Ho “Hai dấu hiệu A B độc lập” có hệ thức sau: pij = pio.poj Các xác suất pio poj ước lượng n ˆ p io  io , n n oj ˆ poj  n Do Ho n io noj ˆ ˆ ˆ , p ij  p io poj  n2 số cá thể có đồng thời dấu hiệu Ai Bj xấp xỉ n io n oj ˆ n ij  np ij  n ˆ Các số n ij gọi tần số lý thuyết (TSLT), số nij gọi tần số quan sát (TSQS) Khoảng cách TSLT TSQS đo đại lượng sau: ˆ (n ij  n ij )2 T ˆ n ij j 1 i 1 k r  Người ta chứng minh n lớn TSLT khơng nhỏ T có phân bố xấp xỉ phân bố 2 với bậc tự (k–1).(r–1) Thành thử Ho bị bác bỏ mức ý nghĩa  T > c, c phân vị mức  phân bố 2 với (k–1).(r–1) bậc tự Chú ý Ta có thức sau thuận lợi tính tốn thực hành:  T  n  n 2ij   nionoj  1  Trong trường hợp k = r = (bảng liên hợp có hai dòng, hai cột) n T n11 n12 n21 n22 n01n02n10n20 n11 n12 n 21 n 22  n11n 22  n 21 n 22  n11 n12   n   21 n22  định thức ma trận  Công cụ giải: Phần mềm Micsrosoft Excel 2010 Sử dụng hàm CHITEST Excel: CHITEST (nij,γij), với lưu ý số lượng giá trị nij γij phải Nếu  02   2 → Chấp nhận giả thiết H0 Hoặc kết hàm CHITEST > α =0.01 → Chấp nhận giả thiết H0 Bài làm: a) Kết tính tay Giả thiết H0: Tuổi thu nhập không phụ thuộc ˆ (nij  n ij )2 => Tqs = 6.854861 ˆ n ij j1 i 1 k Áp dụng cơng thức T  r  Ta có bậc tự do: (3-1)(3-1) = mức ý nghĩa 1% tra bảng ta c = 13.28 Tqs < c chấp nhận giả thiết H0 Kết luận tuổi thu nhập khơng phụ thuộc b) Tính excel  Bước 1: Lập giả thiết H0: Tuổi thu nhập không phụ thuộc Nhập bảng số liệu: Tuổi Dưới 40 Từ 40 đến 50 Trên 50 Dưới 100000$ Thu Nhập Từ 1000000$-399599$ 18 11 19 12 Trên 400000$ 17 Bước 2: Tính tổng hàng tổng cột Đặt trỏ ô B5 giữ chuột kéo đến E8 Sau nhấn nút Ta tổng hàng tổng cột:  Bước 3: Tính tần số lý thuyết Tần số = (tổng hàng * tổng cột) / tổng cộng Ô B9 nhập lệnh = =B$6*$E3/$E$6 enter Sau ta kéo chọn từ B9:D11 , sau ta ấn tổ hợp phím F2+ctrl+enter Tab Home Ta có bảng tần số lý thuyết:  Bước 4: Dùng hàm CHITEST để tính Nhấn vào Tab Fomulas chọn Insert Function chọn CHITEST nhấn OK Lúc xuất hộp thoại Function Arguments Nhập giá trị tần số quan sát vào mục Actual_range: Rồi nhập giá trị tần số quan sát vào mục Expected_range Nhấn OK c) Kết quả: Ta P = 0.14376 Vì giá trị P > α = 1% => Chấp nhận giả thuyết H0, tuổi thu nhập không phụ thuộc Kết luận: Tuổi thu nhập không phụ thuộc Bài Sau số liệu số lượng loại báo ngày bán quận nội thành: Ngày khảo sát Thứ hai Thứ ba Thứ tư Thứ năm Thứ sáu Thứ bảy Quận nội nh Q1 22 21 25 24 28 30 Q2 18 18 25 24 19 22 Q3 22 22 25 18 15 28 Q4 18 18 19 20 22 25 Q5 18 19 20 22 25 25 Lượng báo bán quận có khác thực không? Chọn  = 1% Lượng báo bán có chịu tác động yếu tố ngày tuần khơng? Bài giải: • Dạng tốn: phân tích phương sai yếu tố khơng lặp • Cơ sở lý thuyết: - Phân tích nhằm đánh giá ảnh hưởng yếu tố A B giá trị quan sát xij - Giả sử yếu tố A có n mức a1,a2,…,an ( yếu tố hàng) B có m mức b1,b2,…,bm (yếu tố cột) - Giả thiết H0: +Trung bình yếu tố cột + Trung bình yếu tố hàng + Khơng có tương tác yếu tố cột hàng - Bảng ANOVA - Kết luận: + Nếu FA >F [n-1; (n-1)(m-1); 1-] bác bỏ yếu tố A (hàng) + Nếu FB >F [m-1; (n-1)(m-1); -] bác bỏ yếu tố B (cột) Thực tính tốn Excel: Nhập liệu: Sử dụng bảng ANOVA: Two-factor without replication Đối với Excel 2010 cần thực bước sau để mở hộp thoại Data Analysis: + File > Options > Add-Ins > Analysis ToolPak > Go > Analysis ToolPak > Ok + Hộp thoại Data Analysis xuất Data Thao tác hộp thoại Data Analysis Khi xuât bảng giá trị sau : Anova: Two-Factor Without Replication SUMMARY Count Thứ Thứ Thứ Thứ 5 Thứ Thứ Q1 Q2 Q3 Q4 Q5 98 98 114 108 109 130 6 6 ANOVA Source of VariationSS Rows 141,5 Columns 78,53333 Error 158,6667 Total Sum 378,7 Average Variance 19,6 4,8 19,6 3,3 22,8 9,2 21,6 6,8 21,8 25,7 26 9,5 150 25 12 126 21 9,6 130 21,66667 21,86667 122 20,33333 7,466667 129 21,5 9,1 df MS F P-value F crit 28,3 3,567227 0,018135 4,102685 19,63333 2,47479 0,077317 4,43069 20 7,933333 29 Kết luận: - Rows: F =3,5672 Chấp nhận giả thiết H0 - Columns: F=2.47479 < F0.02 =4,4307=> Chấp nhận giả thiết H0 => Vậy yếu tố ngày không ảnh hưởng đến số lượng báo bán Lượng báo bán năm quận không khác

Ngày đăng: 02/06/2018, 00:45

Từ khóa liên quan

Mục lục

  • 2.1.1 Ví dụ 10 trang 172 ................................................................................. 6

  • 2.1.2 Ví dụ 12 trang 181 ................................................................................. 9

  • 1. ĐỀ BÀI TẬP – ĐỀ SỐ 5

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan