PHƯƠNG PHÁP THỐNG KÊ TRONG HẢI DƯƠNG HỌC Phạm Văn HuấnTừ khóa: Đại lượng docx

Từ khóa: Đại lượng ngẫu nhiên, luật phân bố, phân bố thống kê, tiêu chuẩn phù hợp, ước lượng tham số, xác suất tin cậy, khoảng tin cây, quá trình ngẫu nhiên, tương quan, phương pháp bình phương nhỏ nhất, khai triển phổ, phân tích điều hòa, là trơn, chu trình tuần hoàn, trung bình trượt. Tài liệu trong Thư viện điện tử Trường Đại học Khoa học Tự nhiên có thể được sử dụng cho mục đích học tập và nghiên cứu cá nhân. Nghiêm cấm mọi hình thức sao chép, in ấn phục vụ các mục đích khác nếu không được sự chấp thuận của nhà xuất bản và tác giả. PHƯƠNG PHÁP THỐNG KÊ TRONG HẢI DƯƠNG HỌC Phạm Văn Huấn ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN Phạm Văn Huấn PHƯƠNG PHÁP THỐNG KÊ TRONG HẢI DƯƠNG HỌC Nhà xuất bản Đại học Quốc gia Hà Nội - 2010 Lời nói đầu Giáo trình “Phương pháp thống kê trong hải dương học” phục vụ cho môn học cùng tên với thời lượng hai tín chỉ trong chương trình đào tạo cử nhân ngành hải dương học ở Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội. Sách chọn giới thiệu một cách tóm tắt những khái niệm, phương pháp cơ bản của lý thuyết thống kê toán học hay được sử dụng trong phân tích số liệu quan trắc hải dương học và được sắp xếp thành năm chương theo nhóm vấn đề. Đầu mỗi chương thường ôn lại những khái niệm và công thức cơ bản từ toán học thống kê, sau đó giới thiệu sự ứng dụng thông qua các thí dụ để rèn luyện thói quen hiểu ý nghĩa thực tế của khái niệm và kỹ năng thực hành tính toán cụ thể của sinh viên. Cuối mỗi chương có phụ lục gồm các đoạn mã chương trình máy tính chính là nhằm mục đích đó. Những thí dụ ứng dụng phương pháp thống kê trong hải dương học chưa bao quát hết những vấn đề hải dương học thống kê, mới chỉ giới thiệu ở mức độ giúp cho sinh viên bước đầu biết áp dụng các khái niệm và phương pháp, tính toán đúng theo các công thức liên quan, chưa giành chú ý nhiều đến cách đặ t vấn đề, lý giải kết quả phân tích và ý nghĩa thực tế của mỗi bài toán. Nội dung sách cũng chưa bao gồm những kết quả nghiên cứu biển và đại dương theo hướng thống kê trong hải dương học trên thế giới và ở Việt Nam. Sinh viên ngành hải dương học sẽ thấy những khía cạnh này trong các môn học cơ sở khác của ngành như hải dương học khu vực, thông tin và dự báo khí tượ ng thủy văn biển, thủy triều, sóng và các bài báo khoa học, sách chuyên khảo về biển. Tác giả 3 4 MỤC LỤC Chương 1. Khái niệm về đại lượng ngẫu nhiên 3 1.1. Những đại lượng ngẫu nhiên và luật phân bố 3 1.2. Quy luật phân bố chuẩn 7 Phụ lục chương 1 10 Chương 2. Những khái niệm cơ bản của lý thuyết xử lý số liệu quan trắc 13 2.1. Hàm phân bố thống kê 13 2.2. Sự phù hợp của phân bố lý thuyết và phân bố thống kê 15 2.2.1. Tiêu chuẩn 2 χ 15 2.2.2. Sơ đồ ứng dụng tiêu chuẩn 2 χ để đánh giá sự phù hợp 18 2.2.3. Tiêu chuẩn phù hợp của Kolmogorov 19 2.3. Khái niệm về ước lượng tham số của phân bố 20 2.4. Ước lượng của kỳ vọng toán học và phương sai 20 2.5. Khoảng tin cậy và xác suất tin cậy 20 2.5.1. Khoảng tin cậy đối với kỳ vọng toán học 22 2.5.2. Khoảng tin cậy đối với phương sai 23 2.5.3. Những phương pháp chính xác dựng khoảng tin cậy cho các tham số của đại lượng ngẫu nhiên phân bố chuẩn 25 2.6. Ước lượng xác suất theo tần suất 30 Phụ lục chương 2 34 Chương 3. Khái niệm về hệ các đại lượng ngẫu nhiên và ứng dụng 37 3.1. Hệ các đại lượng ngẫu nhiên 37 3.2. Các đặc trưng số của hệ hai đại lượng ngẫu nhiên. Mô men tương quan. Hệ số tương quan 39 3.3. Phép là trơn các mối phụ thuộc thực nghiệm bằng phương pháp bình phương nhỏ nhất 41 Phụ lục chương 3 49 Chương 4. Những khái niệm cơ bản của lý thuyết hàm ngẫu nhiên và ứng dụng 51 4.1. Các đặc trưng của hàm ngẫu nhiên 51 4.2. Khái niệm về hàm ngẫu nhiên dừng 52 4.3. Tính chất egođic của những hàm ngẫu nhiên dừng 53 4.4. Xác định các đặc trưng của hàm ngẫu nhiên dừng egođic theo một hiện 53 4.5. Khai triển phổ hàm ngẫu nhiên dừng trên khoảng thời gian hữu hạn 54 Phụ lục chương 4 61 Chương 5. Ứng dụng lý thuyết hàm ngẫu nhiên vào phân tích số liệu hải dương học 63 5.1. Phân tích chuỗi thời gian trong hải dương học 63 5.1.1. Phân tích các chu trình tuần hoàn 64 5.1.2. Xác định các chu trình tuần hoàn bằng phương pháp phân tích điều hòa 65 5.2. Phổ phương sai của chuỗi thời gian 68 5.3. Loại bỏ chu trình tuần hoàn khỏi chuỗi thời gian 69 5.3.1. Loại bỏ chu trình tuần hoàn bằng phân tích điều hòa 69 5.3.2. Loại bỏ biến trình năm từ chuỗi quan trắc năm 71 5.3.3. Loại bỏ chu trình tuần hoàn và phân tích các chu trình không tuần hoàn trong thực tế xử lý số liệu 71 5.4. Hàm tương quan và hàm phổ đối với chuỗi thời gian các yếu tố hải dương học 73 Phụ lục chương 5 75 Tài liệu tham khảo 77 5 6 Chương 1 KHÁI NIỆM VỀ ĐẠI LƯỢNG NGẪU NHIÊN 1.1. Những đại lượng ngẫu nhiên và luật phân bố Đại lượng ngẫu nhiên là đại lượng mà trong thử nghiệm có thể nhận một giá trị nào đó không biết trước cụ thể. Những giá trị có thể có của đại lượng ngẫu nhiên rời rạc có thể được kể ra từ trước. Những giá trị có thể có của đại lượng ngẫu nhiên liên tục không thể kể ra trước được và chúng phân bố liên tục trên một khoảng nào đó. Đối với đại lượng ngẫu nhiên rời rạc X , nếu ta biết xác suất P của từng giá trị có thể có của nó n xxx , , , 21 , tức biết () () ( ) ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ = = = == = = ∑ = n i i nn p pxXPpxXPpxXP 1 2211 1 ; ; ; ; thì ta nói rằng đại lượng ngẫu nhiên ấy hoàn toàn đã được xác định về phương diện xác suất. Mối liên hệ giữa các giá trị có thể có của đại lượng ngẫu nhiên và những xác suất tương ứng của chúng được gọi là luật phân bố của đại lượng ngẫu nhiên. Luật phân bố có thể được cho bởi bảng phân bố hoặc đa giác phân bố. Đối với đại l ượng ngẫu nhiên liên tục, chúng ta không thể kể ra hết tất cả các giá trị có thể có, hơn nữa từng giá trị riêng biệt của đại lượng ngẫu nhiên liên tục thường có xác suất bằng không, nên người ta cho phân bố bằng hàm phân bố )(xF : ( ) xXPxF < = )( (1.1) Người ta còn gọi )(xF là hàm phân bố tích phân hay luật phân bố tích phân. Hàm phân bố là đặc trưng vạn năng nhất của đại lượng ngẫu nhiên. Nó tồn tại cho cả các đại lượng ngẫu nhiên rời rạc lẫn liên tục. Hàm phân bố có tính chất là hàm không giảm, tức ( ) ( ) 12 xFxF ≥ nếu 12 xx > , bằng không ở âm vô cùng ( ) 0)( = − ∞F và bằng một ở dương vô cùng ( ) 1)( = +∞F . Hàm phân bố của đại lượng ngẫu nhiên rời rạc bất kỳ luôn luôn là một hàm bậc thang gián đoạn. Trong thực tế thông thường hàm phân bố của đại lượng ngẫu nhiên liên tục là hàm liên tục. Khi giải những bài toán thực tế nhiều khi đòi hỏi tính xác suất của sự kiện đại lượng ngẫu nhiên rơi vào khoảng giá trị từ x đến xx Δ+ : )( )( )( xFxxFxxXxP − Δ + = Δ + < < hoặc xác suất trung bình đối với một đơn vị độ dài trong khoảng giá trị đó x xFxxF Δ − Δ + )( )( . Nếu 0→Δx thì )()( )( )( lim 0 xfxF x xFxxF x = ′ = Δ − Δ + →Δ . (1.2) Hàm )(xf (đạo hàm của hàm phân bố) đặc trưng cho mật độ mà các giá trị của đại lượng ngẫu nhiên phân bố ở điểm đã cho. Hàm này được gọi là mật độ phân bố (hay “mật độ xác suất”) của đại lượng ngẫu 7 8 nhiên. Đôi khi người ta còn gọi hàm )(xf là hàm phân bố vi phân hoặc luật phân bố vi phân của đại lượng ngẫu nhiên liên tục X . Xác suất giá trị của đại lượng ngẫu nhiên X rơi vào khoảng từ α đến β sẽ bằng ∫ =<< β α βα dxxfXP )()( (1.3) Có thể biểu thị hàm mật độ phân bố qua hàm phân bố bằng công thức (1.2). Ngược lại, có thể biểu thị hàm phân bố qua hàm mật độ ∫ ∞− = x dxxfxF )()( . (1.4) Mật độ phân bố là hàm không âm )0)(( ≥xf , tích phân của hàm mật độ với các giới hạn vô cùng bằng một ( ∫ ∞ ∞− = 1)( dxxf ). Như vậy, đường cong phân bố luôn luôn nằm trên trục hoành, diện tích đầy đủ giới hạn bởi đường cong phân bố và trục hoành bằng một. Thứ nguyên của hàm phân bố )( xF giống như xác suất không có thứ nguyên, thứ nguyên của mật độ phân bố )(xf nghịch đảo với thứ nguyên của đại lượng ngẫu nhiên. Trong nhiều vấn đề thực tế, không nhất thiết phải đặc trưng đại lượng ngẫu nhiên một cách đầy đủ bằng hàm phân bố )(xF mà chỉ cần chỉ ra những tham số bằng số riêng biệt ở mức độ nào đó đặc trưng cho những nét chủ yếu của đại lượng ngẫu nhiên. Đó là những đặc trưng số của đại lượng ngẫu nhiên: 1) Kỳ vọng toán học (giá trị trung bình) của đại lượng ngẫu nhiên: Nếu đại lượng ngẫu nhiên rời rạc X có các giá trị có thể có n xxx , , , 21 với xác suất n ppp , , , 21 thì kỳ vọng toán học của đại lượng ngẫu nhiên sẽ bằng [] ∑ ∑ ∑ = = = == +++ +++ == n i ii n i i n i ii n nn x px p px ppp pxpxpx Xm 1 1 1 21 2211 M . (1.5) Như vậy, kỳ vọng toán học của đại lượng ngẫu nhiên là tổng của các tích của tất cả các giá trị có thể có của đại lượng ngẫu nhiên với những xác suất của các giá trị ấy. Kỳ vọng toán học có liên quan với trung bình số học. Giả sử chúng ta thực hiện N thí nghiệm độc lập, trong mỗi lần thí nghiệm đại lượng X nhận giá trị xác định: giả sử giá trị 1 x xuất hiện 1 m lần, giá trị 2 x xuất hiện 2 m lần, nói chung, giá trị i x xuất hiện i m lần. Công thức tính trung bình số học các giá trị quan trắc đại lượng X sẽ là N mxmxmx mmm mxmxmx XM nn n nn + + + = +++ + + + = ∗ ][ 2211 21 2211 11 * 2 2 1 1 ∑∑ == ==+++= n i n i ii i i n n px N m x N m x N m x N m x (1.6) trong đó N m p i i = ∗ là tần suất (hay xác suất thống kê). Như vậy, trung bình số học của các giá trị quan trắc của đại lượng ngẫu nhiên bằng tổng của các tích của tất cả các giá trị có thể có của đại lượng ngẫu nhiên với tần suất của những giá trị đó. Đối với đại lượng ngẫu nhiên liên tục X kỳ vọng toán học tính theo công thức 9 10 [] ∫ ∞ ∞− == dxxfxXm x )(M . (1.7) 2) Mốt của đại lượng ngẫu nhiên là giá trị hay xảy ra nhất của nó. Cụm từ “hay xảy ra nhất” chỉ hoàn toàn chính xác đối với các đại lượng ngẫu nhiên rời rạc, đối với đại lượng ngẫu nhiên liên tục thì mốt là giá trị mà tại đó mật độ xác suất cực đại. Người ta ký hiệu mốt bằng chữ M. Trên hình 1.1 biểu diễn mốt của các đạ i lượng ngẫu nhiên rời rạc và liên tục. x p i M 0 0 M x f(x) Hình 1.1. Biểu diễn mốt của các đại lương ngẫu nhiên rời rạc và liên tục Trong trường hợp tổng quát thì mốt và kỳ vọng toán học của đại lượng ngẫu nhiên không trùng nhau. Khi nào phân bố là đối xứng và có mốt (tức có một mốt) và tồn tại kỳ vọng toán học thì kỳ vọng toán học trùng với mốt và tâm đối xứng của phân bố. 3) Trung vị của đại lượng ngẫu nhiên (thường chỉ dùng cho đại lượng liên tục) là giá trị Me của nó sao cho )()( MeXPMeXP >=< . Trên đồ thị phân bố, trung vị là hoành độ của điểm mà diện tích giới hạn bởi đường cong phân bố bị chia làm đôi. Trong trường hợp phân bố đối xứng có mốt thì trung vị trùng với kỳ vọng toán học và mốt. 4) Các mô men: Mô men gốc bậc s của đại lượng ngẫu nhiên rời rạc X là tổng dạng [] ∑ = = n i i s is pxX 1 α . (1.8) Đối với đại lượng ngẫu nhiên liên tục X , mô men gốc bậc s là tích phân [] ∫ ∞ ∞− = dxxfxX s s )( α . (1.9) Từ các công thức (1.8) và (1.9) thấy rằng kỳ vọng toán học chính là mô men gốc bậc một. Các công thức (1.8) và (1.9) có thể thống nhất thành một công thức chung cho cả các đại lượng ngẫu nhiên rời rạc lẫn liên tục là [ ] [ ] s s XMX = α . (1.10) Như vậy, mô men gốc bậc s của đại lượng ngẫu nhiên X là kỳ vọng toán học của mũ bậc s của đại lượng ngẫu nhiên đó. 5) Đại lượng ngẫu nhiên o X nhận được bằng công thức x o mXX −= (1.11) gọi là đại lượng ngẫu nhiên quy tâm tương ứng của đại lượng X . Dễ dàng thấy rằng kỳ vọng toán học của đại lượng ngẫu nhiên quy tâm bằng không. Các mô men của đại lượng ngẫu nhiên quy tâm được gọi là các mô men tâm. Mô men tâm bậc s của đại lượng ngẫu nhiên X là kỳ vọng toán học của luỹ thừa bậc s của đại lượng ngẫu nhiên quy tâm tương ứng 11 12 [] () [ ] s x o s s mXMXMX −= ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ = μ . (1.12) Đối với đại lượng ngẫu nhiên rời rạc: () ∑ = −= n i i s xis pmx 1 μ , (1.13) còn đối với đại lượng ngẫu nhiên liên tục: () ∫ ∞ ∞− −= dxxfmx s xs )( μ . (1.14) Rõ ràng đối với đại lượng ngẫu nhiên bất kỳ mô men tâm bậc một bằng không. Tồn tại những công thức liên hệ giữa các mô men tâm và gốc như sau: ⎪ ⎪ ⎭ ⎪ ⎪ ⎬ ⎫ +−= −= = ,23 , ,0 3 233 2 22 1 xx x mm m ααμ αμ μ (1.15) 6) Mô men tâm bậc hai là đặc trưng đặc biệt quan trọng trong số các mô men khác, được ký hiệu là ][ D X (hoặc x D ) và thường gọi là phương sai: ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ = o XMX 2 2 =][D μ . (1.16) Như vậy, phương sai của đại lượng ngẫu nhiên X là kỳ vọng toán học của bình phương đại lượng ngẫu nhiên quy tâm tương ứng. Các công thức để tính trực tiếp phương sai của các đại lượng ngẫu nhiên rời rạc và liên tục tuần tự là: () ∑ = −= n i ixi pmxX 1 2 ][ D , (1.17) () ∫ ∞ ∞− −= dxxfmxX x )(][D 2 . (1.18) Phương sai của các đại lượng ngẫu nhiên là đặc trưng phân tán, tản mạn của những giá trị đại lượng ngẫu nhiên xung quanh kỳ vọng toán học của nó. 7) Phương sai có thứ nguyên bình phương của đại lượng ngẫu nhiên. Để đặc trưng rõ hơn độ tản mạn người ta dùng một đại lượng có thứ nguyên trùng với thứ nguyên của đại lượng ngẫu nhiên gọi là độ lệch bình ph ương trung bình [ ] X σ (hay ký hiệu bằng x σ ): ][][ XDX = σ . (1.19) Phương sai và độ lệch bình phương trung bình có thể tính theo mô men gốc bậc hai 2 α và kỳ vọng toán học bằng các công thức: ⎪ ⎭ ⎪ ⎬ ⎫ −== −= . , 2 2 2 2 xxx xx mD mD ασ α (1.20) 8) Mô men tâm bậc ba 3 μ dùng để đặc trưng tính bất đối xứng của phân bố. Nếu phân bố đối xứng đối với kỳ vọng toán học thì 3 μ (và tất cả các mô men bậc lẻ) bằng không (xét theo cấu trúc của các công thức (1.13) và (1.14)). Mô men tâm bậc ba có thứ nguyên lập phương đại lượng ngẫu nhiên. Người ta dùng đại lượng 13 14 3 3 σ μ = k S (1.21) không có thứ nguyên để đặc trưng cho tính bất đối xứng của phân bố gọi là hệ số bất đối xứng. Khi 0> k S ta có phân bố bất đối xứng dương (đường cong 1), khi −< 0 k S bất đối xứng âm (đường cong 2) trên hình 1.2. Hình 1.2. Các đường cong phân bố bất đối xứng 9) Mô men tâm bậc bốn dùng để đặc trưng “độ dốc”, tức mức độ đỉnh nhọn hay đỉnh dẹt của phân bố. Người ta dùng đại lượng gọi là độ nhọn x E của đại lượng ngẫu nhiên liên quan với mô men bậc bốn như sau: 3 4 4 −= σ μ x E . (1.22) Đối với luật phân bố chuẩn rất quan trọng và thường gặp trong tự nhiên thì tỷ số 3 4 4 = σ μ , nên độ nhọn 0 = x E . Những phân bố có đỉnh nhọn hơn so với phân bố chuẩn thì 0> x E , những phân bố có đỉnh dẹt hơn so với phân bố chuẩn sẽ có 0 < x E (xem hình 1.3). x 0 f (x) E x < 0 Ex = 0 Ex > 0 Hình 1.3. Các đường cong phân bố có độ nhọn khác nhau 10) Nhiều khi người ta sử dụng những mô men tuyệt đối (gốc và tâm) mà trong số đó thường dùng nhất là mô men tâm tuyệt đối bậc một: [] M M 1 x o mXX −= ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ = γ . (1.23) gọi là độ lệch trung bình số học, cũng đặc trưng cho độ tản mạn. 1.2. Quy luật phân bố chuẩn Trong lý thuyết xác suất người ta đặc biệt quan tâm tới một kiểu luật phân bố gọi là luật phân bố chuẩn (hay phân bố Gauss). Đây là kiểu phân bố thường gặp nhất trong thực tế. Người ta đã chứng minh được rằng tổng của một s ố lượng đủ lớn các đại lượng ngẫu nhiên độc lập (hoặc phụ thuộc ít) tuân theo những quy luật phân bố bất kỳ nào đó sẽ xấp xỉ tuân theo quy luật chuẩn và điều này được thể hiện càng chính xác nếu lấy tổng của càng nhiều các đại lượng ngẫu nhiên. Điều hạn chế chủ yếu là các đại lượng ngẫu nhiên được cộng lại phả i có vai trò đều nhau và tương 15 16 đối nhỏ trong tổng chung. Quy luật phân bố chuẩn được đặc trưng bởi mật độ xác suất dạng: () 2 2 2 2 1 )( σ πσ mx exf − − = , (1.24) trong đó − m kỳ vọng toán học của đại lượng ngẫu nhiên − σ ,X độ lệch bình phương trung bình của nó. Hình 1.4. Đồ thị hàm mật độ phân bố chuẩn Đường cong phân bố theo luật chuẩn có dạng hình đồi đối xứng (hình 1.4). Tung độ cực đại của đường cong bằng πσ 2 1 ứng với hoành độ m x = . Xa dần m mật độ phân bố giảm đi và khi ∞ ± → x đường cong tiệm cận dần tới trục hoành. Điểm m là tâm đối xứng của phân bố, gọi là tâm tản mạn; tham số σ là đặc trưng tản mạn. Khi σ tăng thì tung độ cực đại giảm và đường cong phân bố trở nên phẳng hơn, duỗi dài theo trục hoành, ngược lại, khi σ giảm đường cong phân bố nhô cao lên trên, đồng thời co hẹp hai bên lại. Tính toán các đặc trưng bằng số của phân bố chuẩn cho các kết quả sau: 0 ;1 10 = = μ μ (và tất cả các mô men bậc lẻ bằng không); ;15 ;3 ; 6 6 4 4 2 2 σμσμσμ === nói chung các mô men bậc s tính theo công thức truy hồi 2 2 )1( − −= ss s μσμ ; 0 ;0 = = xk ES . Để tính được xác suất mà đại lượng ngẫu nhiên X tuân theo quy luật chuẩn với các tham số m và σ rơi vào khoảng giá trị từ α tới β phải dùng công thức tổng quát )()()( α β β α FFXP − = < < , (1.25) trong đó − )(xF hàm phân bố của đại lượng ngẫu nhiên X tính theo công thức (1.4): ∫∫ ∞−∞− − − == xx mx dxedxxfxF 2 2 2 )( 2 1 )()( σ πσ . Nếu thay biến t mx = − σ có thể dẫn tích phân trên tới dạng ∫ − ∞− − = σ π mx dtexF t 2 2 2 1 )( . (1.26) Tích phân (1.26) không biểu thị được bằng các hàm cơ bản, nhưng có thể tính nó qua hàm đặc biệt biểu thị tích phân xác định của biểu thức 2 t e − hay 2 2 t e − (tích phân xác suất) đã lập thành bảng. Thí dụ, nếu ta dùng hàm ∫ ∞− − ∗ = x dtex t 2 2 2 1 )( π φ , (1.27) thì ta tính ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = ∗ σ φ mx xF )( . (1.28) Do đó 17 18 ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − − ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − =<< ∗∗ σ α σ β βα φφ mm XP )( . (1.29) Như vậy, chúng ta đã biểu thị xác suất của đại lượng ngẫu nhiên X phân bố theo luật chuẩn với các tham số bất kỳ rơi vào khoảng giá trị cho trước từ α đến β qua hàm phân bố tiêu chuẩn )(* x φ ứng với luật phân bố chuẩn đơn giản nhất có các tham số tuần tự là 0 = m và 1 = σ . Hàm )(* x φ đã được bảng hóa và các giá trị của nó có ở các sách giáo khoa về lý thuyết xác suất và toán thống kê bất kỳ, ở các tài liệu chuyên khảo và các cẩm nang toán học. Bảng 1.1 là một dạng thuộc loại các bảng đó. Độ lệch xác suất. Trong nhiều ứng dụng lý thuyết xác suất người ta thường dùng một đặc trưng tản mạn gọi là độ lệch xác suất, ký hiệu bằng E . Độ lệch xác suất của đại lượng ngẫu nhiên X phân bố theo luật chuẩn là nửa độ dài của một đoạn đối xứng qua tâm tản mạn mà xác suất rơi vào đó bằng 0,5 (xem hình 1.5). Có thể viết () 5,0 =<− EmXP hay 5,0)( = + <<− EmXEmP . Dùng công thức (1.29) ta có: ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ −− ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ =+<<− ∗∗ σσ φφ EE EmXEmP )( . Theo tính chất của hàm * φ )(1)( xx −−= ∗∗ φ φ , ta suy ra 5,012 =− ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ∗ σ φ E , do đó 75,0= ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ∗ σ φ E . x 0 m m − E m+E f ( x ) Hình 1.5. Biểu diễn độ lệch xác suất Theo bảng giá trị của hàm ∗ φ ta tìm ngược lại được σ σ 674,0 674,0 =→= E E . (1.30) Ý nghĩa của E là với số lượng lớn thí nghiệm về trung bình sẽ có một nửa số giá trị của đại lượng ngẫu nhiên X lệch khỏi m vượt quá E và một nửa - nhỏ hơn E . Vì vậy E còn được gọi là độ lệch trung tâm. [...]... thống kê đơn giản hay chuỗi thống kê đơn giản Thông thường, tập hợp thống kê đơn giản được trình bày dưới dạng bảng 2.1 Hàm phân bố thống kê Hàm phân bố thống kê của đại lượng ngẫu nhiên X là tần suất của sự kiện X < x trong chuỗi thống kê đó F ∗ (x ) = P ∗ ( X < x ) (2.1) Để tìm giá trị của hàm phân bố thống kê ứng với x cho trước chỉ cần đếm số quan trắc mà trong đó đại lượng X nhận giá trị nhỏ hơn... cứu đại lượng ngẫu nhiên X nào đó mà luật phân bố của nó chưa biết trước đích xác, phải xác định quy luật đó từ thí nghiệm hay kiểm tra bằng thực nghiệm giả thuyết về một quy luật nào đó Khi đó, người ta làm một loạt thí nghiệm với đại lượng ngẫu nhiên X và trong mỗi thí nghiệm (quan trắc), đại lượng X nhận một giá trị nhất định Tập hợp các số liệu quan trắc của đại lượng được gọi là tập hợp thống kê. .. 0,999032 0,999313 0,999517 0,999663 0,999767 0,999841 0,999892 0,999928 0,999952 1 Kỳ vọng toán học của hằng số bằng chính hằng số: M[c] = c 2 Phương sai của đại lượng không ngẫu nhiên: D[c] = 0 3 Đưa đại lượng không ngẫu nhiên ra ngoài dấu KVTH: M[cX ] = cM[ X ] 4 Đưa đại lượng không ngẫu nhiên ra ngoài dấu phương sai: D[cX ] = c 2 D[ X ] , σ [cX ] = c σ [ X ] 5 KVTH của tổng các ĐLNN: M[ X + Y ]... không xảy ra trong lần thí nghiệm i ( i = 1, 2, , n ), bằng 1 2 2 D[ XY ] = D[ X ]D[Y ] + m x D[Y ] + m y D[ X ] , && & & D[ XY ] = D[ X ]D[Y ] nếu A xảy ra Vậy X 1 , X 2 , , X n phân bố như nhau và độc lập, B Kỳ vọng toán học và phương sai của một số đại lượng ngẫu nhiên quyluật phân bố của từng ĐLNN trong chúng có dạng sau: giá trị xác suất Định lý 1: Nếu X 1 , X 2 , , X n − những đại lượng ngẫu nhiên... A trong n thí nghiệm độc lập, mà trong từng thí nghiệm sự kiện ấy có thể xuất hiện với xác suất không đổi p , bằng np , còn phương sai bằng npq , với q = 1 − p Nếu X và Y không tương quan: M[ XY ] = M[ X ] × M[Y ] , ⎡ n ⎤ n M ⎢∏ X i ⎥ = ∏ M[ X i ] ⎣ i =1 ⎦ i =1 Chứng minh: Xem ĐLNN trên là tổng của của các ĐLNN X 1 , X 2 , , X n biểu thị số lần xuất hiện sự kiện A tuần tự trong thí nghiệm thứ 10 Phương. .. ĐLNN không tương quan lẫn nhau: ⎡n ⎤ n D ⎢∑ X i ⎥ = ∑ D[X i ] ⎣ i =1 ⎦ i =1 Định lý 2: Nếu X 1 , X 2 , , X n − những ĐLNN phân bố như nhau, phương sai của từng ĐLNN bằng σ 2 , thì phương sai của tổng bằng nσ 2 , còn phương sai của trung bình số học bằng σ 2 / n : 8 Phương sai của hàm tuyến tính của một số ĐLNN: ⎡n ⎤ n D ⎢∑ a i X i + b⎥ = ∑ a i2 D[ X i ] ⎣ i =1 ⎦ i =1 D[ X 1 + X 2 + + X n ] = D[ X 1... s là kỳ vọng toán học và độ lệch chuẩn D[ X ] = D[ X 1 + X 2 + + X n ] = npq FUNCTION Gauss(m,s,x) PARAMETER (pi=3.141593) REAL x, m, s x = (x-m)/s x = -0.5*x*x Gauss = 1.0/(s*sqrt(2*pi))*exp(x) RETURN END Định lý 4: KVTH của tần suất của sự kiện A trong n thí nghiệm độc lập, mà trong từng thí nghiệm sự kiện A có thể xảy ra với xác suất không đổi p , bằng chính xác suất p , còn phương sai bằng pq... (2.1) Để tìm giá trị của hàm phân bố thống kê ứng với x cho trước chỉ cần đếm số quan trắc mà trong đó đại lượng X nhận giá trị nhỏ hơn x và chia cho tổng số quan trắc đã thực hiện n Hàm phân bố thống kê của đại lượng ngẫu nhiên bất kỳ - rời rạc hay liên tục - sẽ là một hàm bậc thang gián đoạn (hình 2.1) Khi tăng số quan 25 26 ... nghiệm độc lập, mà trong từng thí nghiệm sự kiện A có thể xảy ra với xác suất không đổi p , bằng chính xác suất p , còn phương sai bằng pq / n Chứng minh: Tần suất của sự kiện A trong n thí nghiệm có thể được xem như trung bình số học của các ĐLNN X 1 , X 2 , , X n phân bố như nhau, độc lập: p* = X 1 + X 2 + + X n , n D Mã Fortran của chương trình con tra giá trị hàm tích phân xác suất theo đối số ( x... của từng ĐLNN trong chúng có dạng sau: giá trị xác suất Định lý 1: Nếu X 1 , X 2 , , X n − những đại lượng ngẫu nhiên phân bố như nhau, KVTH của từng ĐLNN trong số chúng bằng a , thì KVTH của tổng các ĐLNN đó bằng na , còn KVTH của trung bình số học bằng a : 21 0 1 q p Ta tìm KVTH của từng X i theo công thức tính KVTH (công thức (1.5)): M[ X 1 ] = M[ X 2 ] = = M[ X n ] = 0 ⋅ q + 1 ⋅ p = p 22 D[ X . PHƯƠNG PHÁP THỐNG KÊ TRONG HẢI DƯƠNG HỌC Phạm Văn Huấn ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN Phạm Văn Huấn PHƯƠNG PHÁP THỐNG KÊ TRONG HẢI DƯƠNG HỌC . và đại dương theo hướng thống kê trong hải dương học trên thế giới và ở Việt Nam. Sinh viên ngành hải dương học sẽ thấy những khía cạnh này trong các môn học cơ sở khác của ngành như hải dương. dụng phương pháp thống kê trong hải dương học chưa bao quát hết những vấn đề hải dương học thống kê, mới chỉ giới thiệu ở mức độ giúp cho sinh viên bước đầu biết áp dụng các khái niệm và phương

PHƯƠNG PHÁP THỐNG KÊ TRONG HẢI DƯƠNG HỌC Phạm Văn HuấnTừ khóa: Đại lượng docx

Thông tin tài liệu

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan