Bài giảng Lý thuyết thống kê Đoàn Hồng Chương

85 1.6K 38
Bài giảng Lý thuyết thống kê  Đoàn Hồng Chương

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài giảng Lý thuyết thống kê gồm 7 chương. Nội dung bài giảng lần lượt trình bày các vấn đề về các khái niệm cơ bản về thống kê, tóm tắt và trình bày dữ liệu, thống kê mô tả, ước lượng tham số tổng thể, kiểm định giả thuyết về tham số tổng thể, phân tích phương sai một nhân tố, kiểm định phi tham số.

BÀI GIẢNG LÝ THUYẾT THỐNG KÊ Đoàn Hồng Chương 1 1 Bộ môn Toán - TKKT, Đại học Kinh Tế - Luật Lý t huyết t hống kê GIỚI THIỆU MÔN HỌC 1. Giới thiệu đề cương • Thống kê mô tả • Hướng dẫn sử dụng SPSS • Ước lượng • Kiểm định tham số • Kiểm định phi tham số 2. Kiểm tra đánh giá • Kiểm tra cuối kì: Trắc nghiệm (20 câu hỏi - 60 phút) - Tỉ lệ 100% • Đề mẫu sẽ gửi vào tuần học cuối. 3. Thông tin liên lạc • Email: chuongdh@uel.edu.vn • Blog: www.chuongdh.wordpress.com Trang 1 Lý t huyết t hống kê Chương 1 CÁC KHÁI NIỆM CƠ BẢN VỀ THỐNG KÊ 1.1 Thống kê là gì? Định nghĩa 1.1 (STATISTICS). Thống kê là khoa học về việc thu thập, tổ chức, trình bày, phân tích và diễn giải các dữ liệu nhằm đưa ra những quyết định hiệu quả. Về mặt lịch sử, khoa học t hống kê ra đời và phát triển nhờ: 1. Nhu cầu của nhà nước về việc thu thập, xử lý và giải thích các dữ liệu. 2. Sự phát triển của lý thuyết xác suất trong Toán học. Phân loại: 1. Thống kê mô tả (DESCRIPTION STATISTICS) là phương pháp tổ chức, tổng hợp và trình bày các dữ liệu dưới dạng thông tin. 2. Thống kê suy diễn (INFERENTIAL STATISTICS) là phương pháp dùng ước lượng các tính chất của một tổng thể dựa trên mẫu. Trang 2 Lý t huyết t hống kê 1.2 Tổng t hể và mẫu Định nghĩa 1.2 (POPULATION). Tổng thể là tập hợp toàn bộ các cá thể hoặc sự vật được nghiên cứu. Định nghĩa 1.3 (SAMPLE). Mẫu là một phần của tổng thể. Số lượng các phần tử được gọi là kích thước mẫu. Kí hiệu: n. 1.3 Các loại dữ liệu Định nghĩa 1.4 (QUALITATIVE DATA). Dữ liệu định tính là loại dữ liệu chỉ thể hiện tính chất của đối tượng được nghiên cứu. Định nghĩa 1.5 (QUANTITATIVE DATA). Dữ liệu định lượng là loại dữ liệu được thể hiện dưới dạng các con số. Ví dụ 1.1. Dữ liệu định tính & Dữ liệu định lượng • Giới tính (Nam, Nữ), xếp loại (Giỏi, Khá, Trung bình ), tỉ lệ khách hàng hài lòng, xếp hạng (Rating). • Số tiền trong tài khoản (Balance account), tuổi, khối lượng của một vật, khoảng cách, nhiệt độ. Trang 3 Lý t huyết t hống kê 1.4 Cấp bậc dữ liệu Định nghĩa 1.6 (NOMINAL LEVEL DATA). Dữ liệu định danh là loại dữ liệu có các đặc tính sau: • các giá trị được chia thành nhóm hoặc phạm trù. • giữa các nhóm hoặc phạm trù không có sự phân biệt thứ tự. Ví dụ 1.2. Lĩnh vực kinh doanh của công ty 1. Kinh doanh 2. Tài chính 3. Vận tải 4. Dịch vụ Định nghĩa 1.7 (ORDINAL LEVEL DATA). Dữ liệu thứ bậc là loại dữ liệu có các đặc tính sau: • các giá trị được chia thành nhóm hoặc phạm trù. • giữa các nhóm hoặc phạm trù có thể sắp thứ tự và do đó có thể xếp hạng các nhóm hoặc phạm trù. Ví dụ 1.3. Student rating of a Prof. Finance 1 . 1 Doughlas A. Lind, William G. Marchal, and Samuel A. Wathen., "Basic Statistics for Business & Economics", McGraw Hill, Singapore, 2008. Trang 4 Lý t huyết t hống kê Rating Superior Good Average Poor Inferior Frequency 6 28 25 12 3 Định nghĩa 1.8 (INTERVAL LEVEL DATA) . Dữ liệu khoảng là loại dữ liệu có các đặc tính sau: • các giá trị có thể so sánh và thực hiện được các phép tính số học. • điểm gốc 0 của loại dữ liệu này chỉ mang tính tương đối. Ví dụ 1.4. Nhiệt độ, cỡ giày, cỡ quần áo là các dữ liệu khoảng. Định nghĩa 1.9 (RATIO LEVEL DATA). Dữ liệu tỉ lệ là loại dữ liệu có các đặc tính sau: • các giá trị có thể so sánh và thực hiện được các phép tính số học • điểm gốc 0 và tỉ lệ giữa các giá trị của loại dữ liệu này thực sự có ý nghĩa. Ví dụ 1.5. Father-son income combinations 2 2 Doughlas A. Lind, William G. Marchal, and Samuel A. Wathen., "Basic Statistics for Business & Economics", McGraw Hill, Singapore, 2008. Trang 5 Lý t huyết t hống kê Name Father Son Lahey $80000 $40000 Nale $90000 $30000 Rho $60000 $120000 Steele $75000 $130000 1.5 Kỹ thuật chọn mẫu 1. Chọn mẫu ngẫu nhiên đơn giản (PROBABILITY SAMPLING): là cách chọn ngẫu nhiên n phần tử bất kì từ N phần tử của tổng thể. Các bước tiến hành • Lập danh sách sắp thứ tự các đơn vị của tổng thể. • Thực hiện lấy mẫu bằng cách bốc thăm, quay số hoặc sử dụng phần mềm máy tính chọn ngẫu nhiên. 2. Chọn mẫu ngẫu nhiên hệ thống (SYSTEMATIC SAMPLING): là cách chọn ngẫu nhiên n phần tử từ N phần từ của tổng thể theo các bước sau • Lập danh sách và đánh số thứ tự các phần tử của tổng thể. Trang 6 Lý t huyết t hống kê • Xác định cỡ mẫu n. • Xác định khoảng cách chọn mẫu k theo công thức k =   N n  , nếu  N n  < 0, 5;  N n  + 1, nếu  N n  ≥ 0, 5. • Trong k phần tử đầu tiên của tổng thể, chọn ngẫu nhiên 1 phần tử. Phần tử được chọn tiếp theo cách phần tử đầu tiên k vị trí và cứ thế tiếp tục chọn đến phần tử cuối cùng của mẫu. Ví dụ 1.6. Giả sử tổng thể bao gồm N=13, kích thước mẫu n=4. Vì N n = 3, 25 nên k = 3. Khi đó ta chọn mẫu theo tắc: • Chọn ngẫu nhiên một phần tử trong 3 phần tử đầu tiên. • Phần tử tiếp theo được chọn cách phần tử đầu tiên 3 vị trí. Công việc trên được mô tả qua sơ đồ sau (ô vuông màu đen thể hiện phần tử được chọn của mẫu)              Trang 7 Lý t huyết t hống kê Ví dụ 1.7. Giả sử tổng thể bao gồm N=10, kích thước mẫu n=6. Vì N n = 1, 67 nên k = 2. Khi đó ta chọn mẫu theo tắc: • Chọn ngẫu nhiên một phần tử trong 2 phần tử đầu tiên. • Phần tử tiếp theo được chọn cách phần tử đầu tiên 2 vị trí. Công việc trên được mô tả qua sơ đồ sau (ô vuông màu đen thể hiện phần tử được chọn của mẫu)           Lưu ý. Trong trường hợp này, chúng ta chỉ chọn được mẫu có kích thước n = 5. 3. Lấy mẫu phân tầng (STRATIFIED SAMPLING) được sử dụng khi có sự khác biệt lớn về tính chất giữa các phần tử của tổng thể. Khi chọn mẫu phân tầng, chúng ta cần lưu ý 2 vấn đề: • phân tầng theo đặc điểm gì? • phân bố số lượng mẫu trong các tầng. Trang 8 Lý t huyết t hống kê Chương 2 TÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU 2.1 Bảng phân phối tần số, tần suất, tần số tích lũy và tần suất tích lũy Định nghĩa 2.1. FREQUENCY-RELATIVE FREQUENCY • Tần số n i là số lần xuất hiện của giá trị quan sát X i . • Tần suất f i là tỉ lệ xuất hiện của giá trị quan sát X i . Ví dụ 2.1. Bảng tần số, tần suất về nhiệt độ trung bình của 18 ngày mùa đông (tính bằng độ 0 F ) tại một vùng: Nhiệt độ X i ( 0 F ) Tần số n i Tần suất f i 12 2 11,11% 15 3 16,67% 17 4 22,22% 18 4 22,22% 20 3 16,67% 21 2 11,11% Trang 9 [...]... trái, ít nhọn Trang 30 Lý thuyết thống kê 3.10 Quy tắc thực nghiệm Giả sử một mẫu số liệu có đồ thị dạng hình chuông (phân phối chuẩn) Khi đó ta có các tính chất sau • Có khoảng 68% quan sát dao động trong khoảng (µ − σ, µ + σ) • Có khoảng 95% quan sát dao động trong khoảng (µ − 2σ, µ + 2σ) • Có khoảng 99,7% quan sát dao động trong khoảng (µ − 3σ, µ + 3σ) Trang 31 Lý thuyết thống kê Chương 4 ƯỚC LƯỢNG... Lý thuyết thống kê Chương 3 THỐNG KÊ MÔ TẢ 3.1 Số trung bình Định nghĩa 3.1 (Trung bình tổng thể) Giả sử tổng thể Ω có N phần tử Khi đó giá trị N Xi µ= i=1 , N (3.1) được gọi là trung bình tổng thể Định nghĩa 3.2 (Trung bình mẫu) Giả sử mẫu có kích thước là n Khi đó giá trị n xi X= i=1 n , (3.2) được gọi là trung bình mẫu Ví dụ 3.1 Tính giá trị trung bình của mẫu số liệu được cho như sau Trang 16 Lý. .. lệch chuẩn Trang 24 Lý thuyết thống kê Định nghĩa 3.11 (Độ lệch bình phương trung bình) n MS = (xi − X)2 i=1 (3.10) n Định nghĩa 3.12 Phương sai mẫu là đại lượng đặc trưng cho mức độ phân tán của các dữ liệu Kí hiệu: s2 n s2 = (xi − X)2 i=1 n−1 (3.11) Tính chất 3.1 n MS s = n−1 Định nghĩa 3.13 Độ lệch chuẫn mẫu: 2 n s= (3.12) (xi − X)2 i=1 n−1 (3.13) Trang 25 Lý thuyết thống kê Ví dụ 3.11 Cho số... thì các dữ liệu của mẫu lệch trái Trang 28 Lý thuyết thống kê Ví dụ 3.13 Cho bảng số liệu Trọng lượng (g) 25 26 27 40 Số túi (ni) 4 6 4 2 Độ lệch (skewness) của bảng số liệu trên là γ1 = 2.395 > 0 Do đó histogram lệch phải 3.9 Độ nhọn - Kurtosis Định nghĩa 3.16 Độ nhọn được xác định bởi công thức n  (xi −X)4  i=1 β2 = n s4  (3.16) Trang 29 Lý thuyết thống kê • β < 3: đồ thị tù • β = 3: đồ thị bình... Trang 10 Lý thuyết thống kê Ví dụ 2.3 Năng suất lúa (tạ/ha) của 50 hộ dân tại một địa phương được cho như sau 35 41 32 44 33 41 38 44 43 42 30 35 35 43 48 46 48 49 39 49 46 42 41 51 36 42 44 34 46 34 36 47 42 41 37 47 49 38 41 39 40 44 48 42 46 52 43 41 52 43 Hãy lập bảng phân phối tần số, tần suất, tần số tích lũy, tần suất tích lũy của dữ liệu trên 2.2 Biểu đồ cột Trang 11 Lý thuyết thống kê 2.3 Histogram... n α Với độ tin cậy 1 − α = 95%, ta có = 2, 5% Khi đó giá trị z α = 1, 96 2 2 Vậy µ ∈ (19, 36; 19, 92) 3 Bảng 1, Hoàng Trọng, Chu Nguyễn Mộng Ngọc, "Thống kê ứng dụng - trong Kinh tế & Xã hội", Nhà xuất bản Lao Động - Xã Hội, 2010 Trang 33 Lý thuyết thống kê b Trường hợp chưa biết phương sai σ 2 • Độ chính xác s = z √ , nếu n ≥ 30 (4.4) n s = t α ,n−1 √ , nếu n < 30 (4.5) 2 n được tra từ bảng phân phối... một đoạn đường, người ta thu được kết quả sau Mức xăng 1,9-2,1 2,1-2,3 2,3-2,5 2,5-2,7 Số xe 5 9 8 3 4 Bảng 2, Hoàng Trọng, Chu Nguyễn Mộng Ngọc, "Thống kê ứng dụng - trong Kinh tế & Xã hội", Nhà xuất bản Lao Động - Xã Hội, 2010 Trang 34 Lý thuyết thống kê Hãy ước lượng mức hao phí xăng trung bình với độ tin cậy 95% Giải Từ bảng số liệu, ta có X = 2, 272, s = 0, 19 Do chưa biết phương sai σ 2 và kích... 13 Lý thuyết thống kê Ví dụ 2.5 Xét dữ liệu về độ tuổi của một nhóm nhân viên trong công ty A như sau 28 23 30 24 19 21 39 22 22 Biểu đồ thân và lá của dữ liệu trên là 1 9 2 122348 3 09 2.6 Phân tổ/nhóm dữ liệu Định nghĩa 2.5 Công thức phân tổ dữ liệu • Cho một mẫu có kích thước là n Số tổ/nhóm dữ liệu được xác định bởi công thức sau: √ 3 k 2n (2.3) • Độ rộng mỗi tổ h Xmax − Xmin k (2.4) Trang 14 Lý. .. = 15, 5 2 Định nghĩa 3.6 Giả sử mẫu số liệu gồm n phần tử được cho dưới dạng phân tổ đều nhau Khi đó trung vị MedX được xác định gần đúng như sau Khi đó MedX = 1 Tính tần số tích lũy Trang 20 Lý thuyết thống kê n+1 2 Xác định nhóm chứa trung vị Med, là nhóm có tần số tích lũy ≥ 2 3 Áp dụng công thức n 2 − SM e−1 MedX = L + h , trong đó fM e (3.5) L là giới hạn dưới của nhóm chứa Med, h là khoảng cách... lượng (gram) 484-490 490-496 496-502 502-508 508-514 Tần số ni 5 10 15 13 7 Tần số tích lũy Si 5 15 30 43 50 Khi đó nhóm chứa Med là nhóm có trọng lượng nằm trong khoảng 496 − 502 gram Trang 21 Lý thuyết thống kê Áp dụng công thức (3.5), ta có 50 2 − 15 = 500 MedX = 496 + 6 15 Điều này có nghĩa là sẽ có khoảng 50% giá trị của dãy dữ liệu nhỏ hơn MedX 3.4 Phân vị Định nghĩa 3.7 (Tứ phân vị) Giả sử dãy . BÀI GIẢNG LÝ THUYẾT THỐNG KÊ Đoàn Hồng Chương 1 1 Bộ môn Toán - TKKT, Đại học Kinh Tế - Luật Lý t huyết t hống kê GIỚI THIỆU MÔN HỌC 1. Giới thiệu đề cương • Thống kê mô tả • Hướng. Blog: www.chuongdh.wordpress.com Trang 1 Lý t huyết t hống kê Chương 1 CÁC KHÁI NIỆM CƠ BẢN VỀ THỐNG KÊ 1.1 Thống kê là gì? Định nghĩa 1.1 (STATISTICS). Thống kê là khoa học về việc thu thập, tổ chức, trình. hống kê ra đời và phát triển nhờ: 1. Nhu cầu của nhà nước về việc thu thập, xử lý và giải thích các dữ liệu. 2. Sự phát triển của lý thuyết xác suất trong Toán học. Phân loại: 1. Thống kê mô

Ngày đăng: 25/07/2014, 09:01

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan