Bài giảng Thống kê ứng dụng và xây dựng: Chương 2 - Đặng Thế Gia

11 133 0
Bài giảng Thống kê ứng dụng và xây dựng: Chương 2 - Đặng Thế Gia

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Sau khi học xong chương này người học có thể hiểu về: Giới thiệu, Các kiểu dữ liệu (Types of data), Kỹ thuật đồ họa cho dữ liệu định lượng (Graphical Techniques for Quantitative Data), Các dạng biểu đồ (Pie Charts, Bar Charts, Line Charts), Sơ đồ phân tán (Scatter Diagrams). Mời các bạn cùng tham khảo!

10/4/2017 Chương 2: MÔN HỌC THỐNG KÊ ỨNG DỤNG (KC107) GIÁO VIÊN PHỤ TRÁCH KỸ THUẬT MÔ TẢ ĐỒ HỌA (Graphical Descriptive Techniques) ĐẶNG THẾ GIA Bộ môn Kỹ Thuật Xây Dựng Khoa Công Nghệ, Trường Đại Học Cần Thơ Nội dung chương Giới thiệu Các kiểu liệu (Types of data) Kỹ thuật đồ họa cho liệu định lượng (Graphical Techniques for Quantitative Data) Các dạng biểu đồ (Pie Charts, Bar Charts, Line Charts) GIỚI THIỆU INTRODUCTION Sơ đồ phân tán (Scatter Diagrams) Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ 10/4/2017 Giới thiệu • Thống kê mơ tả (Descriptive statistics) bao gồm việc xếp, tóm tắc trình bày liệu nhằm diễn giải cách có ý nghĩa hỗ trợ trình định CÁC KIỂU DỮ LIỆU • Các phương pháp thống kê mơ tả sử dụng: TYPES OF DATA • Các kỹ thuật đồ họa (Chương 2) • Các phép đo mơ tả số (Chương 3) • Những phương pháp áp dụng cho: • Tổng thể/quần thể (the entire population) • Mẫu (the population sample) Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Các kiểu liệu Dữ liệu định tính & Dữ liệu định lượng (Types of data) (Categorical/Qualitative & Quantitative Data) Dữ liệu định lượng • Biến (Variable) – đặc tính tổng thể mẫu mà quan tâm đến • Lựa chọn sản phẩm kệ hàng • Chi phí đầu tư • Thời gian chờ xe buýt • Dữ liệu (Data) – giá trị thực biến • Dữ liệu định lượng (Quantitative data) – quan sát dạng số (numerical observations) • Dữ liệu định lượng (Qualitative data) – quan sát thang đo Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Tuổi – Thu nhập 55 75000 42 68000 Tăng cân +10 +5 Dữ liệu định tính Người Đã lập gia đình Với liệu định tính, yes tất no làm là, tính tốn no tỷ lệ mà liệu rơi vào thang đo Giáo viên Hạng Giảng viên Giáo sư Giảng viên GS PhóGS Trợ giảng Tổng Phó giáo sư 15 15 60 25 25% 41.67% 8.33% 25% Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ 10/4/2017 Chọn kiểu liệu • Hiểu rõ kiểu liệu giúp chọn lựa kỹ thuật phù hợp để sử dụng • Đơi khi, đặc biệt thực kỹ thuật phi tham số, cần phải biết liệu liệu có thứ tự (rank) hay khơng • Kiểu phân tích cho phép kiểu liệu: • Dữ liệu định lượng – Các tính tốn số học • Dữ liệu định tính – đếm số lượt quan sát cấp thang đo • Dữ liệu có thứ tự – tính tốn dựa trình tự (ordering process) Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ KỸ THUẬT ĐỒ HỌA CHO DỮ LIỆU ĐỊNH LƯỢNG GRAPHICAL TECHNIQUES FOR QUANTITATIVE DATA Dữ liệu thời điểm & Dữ liệu chuỗi thời gian (Cross-Sectional & Time-Series Data) • Dữ liệu cắt ngang/thời điểm (Cross-sectional Data) thu thập thời điểm định: Khảo sát thị trường (quan sát sở thích theo giới tính, tuổi,…), Điểm kiểm tra khóa học mơn TKUD, Lương khởi điểm sinh tốt nghiệp ngành XD,… • Dữ liệu chuỗi thời gian (Time-series data) thu thập qua thời điểm liên tiếp: Giá vàng lúc đóng cửa hàng tuần, Lượng dầu thơ nhập hàng tháng,… • Dữ liệu cross-section ghi nhận kiện thời điểm, liệu time-series phải theo dõi đối tượng thời gian nhiều năm tháng Do đó, nghiên cứu theo thời gian thường tốn công phu nghiên cứu thời điểm Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ • Ví dụ: Cung cấp thơng tin liên quan đến hóa đơn hàng tháng thuê bao tháng sau ký kết hợp đồng với nhà mạng điện thoại • Các bước thực hiện: • Thu thập liệu • Lập bảng phân phối tần suất • Vẽ biểu đồ Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ 10/4/2017 Thu thập liệu Lập bảng phân bố tần suất Biểu đồ cho ta thơng tin gì? Giá sát Giátrịtrị qan sátlớn lớnnhất Giá trịquan quan sát lớn Giá trị quan sát lớnnhất 20 120 105 90 75 60 45 More 15 40 30 Chiều rộng lớp = [Khoảng giá trị] / [Số lớp/nhóm] Chỉ vài hóa đơn Khá nhiều hóa khoảng trung bình đơn có giá trị cao 13+9+10=32 18+28+14=60 60 15 71 Số37 lớp 13 5-7 7-99 10 9-10 18 10-11 28 14 Frequency 120 15 Số quan sát 30 < 50 45 60 50 - 200 75 200 – 500 90 500 - 1,000 105 120 More [119.63 - 0] / [8] = 14.95 (Có 200 điểm liệu) Khoảng ½ số hóa đơn có giá trị nhỏ 80 71+37=108 BinthànhFrequency Cần phần lớp/nhóm? More 90 105 15 75 20 60 40 45 60 30 Frequency 80 Bills 42.19Vẽ biểu đồ 38.45 29.23 89.35 118.04 110.46 0.00 72.88 83.05 Bills Bills Giá trịtrịquan sátsát nhỏ Giá quan nhỏ trị quan sát nhỏ Giá trị quan sát nhỏ Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Tần suất tương đối Chiều rộng nhóm (Relative frequency) (Class width) • Đơi tần suất tương đối (tỉ lệ) thích hợp tần suất để biểu diễn số quan sát rơi vào nhóm Tần suất tương đối nhóm = Tần suất nhóm Tổng số quan sát • Tần suất tương đối thường dùng khi: • Nghiên cứu tần suất tương đối tổng thể • So sánh nhiều biểu đồ • Số lượng quan sát khác mẫu nghiên cứu Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ • Thơng thường chiều rộng nhóm/lớp nhau, đơi cần sử dụng chiều rộng nhóm/lớp khơng đồng • Độ rộng nhóm/lớp khơng đồng sử dụng tần số liên quan đến nhóm/lớp học thấp Khi đó: • Vài nhóm kết hợp lại với để tạo thành nhóm rộng “đơng đúc” • Có thể tạo thành nhóm mở đầu (cao thấp nhất) biểu đồ Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ 10/4/2017 Hình dạng biểu đồ Hình dạng biểu đồ (Shapes of histogram) (Shapes of histogram) Nghiêng âm Nghiêng dương Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Biểu đồ nhóm thường gặp đơn Biểu đồ nhóm thường gặp đơi (Unimodal Histogram) (Bimodal Histogram) Nhóm thường gặp/Điển hình Nhóm thường gặp Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Nhóm thường gặp Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ 10/4/2017 Biểu đồ hình chng Biểu đồ hình cung/lũy tích (Bell shaped histogram) (Ogives) • Nhiều kỹ thuật thống kê đòi hỏi tổng thể phải có hình chng • Vẽ biểu đồ giúp xác minh hình dạng quần thể nghiên cứu • Hình cung (Ogives) biểu diễn phân phối tần suất tương đối lũy tích • Tiếp tục ví dụ trước Cumulative relative frequency Cumulative relative frequency for telephone bills Class 0-15 15-30 30-45 45-60 60-75 75-90 90-105 105-200 Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Cumulative Frequency frequency 71 71 37 108 13 121 130 10 140 18 158 28 186 14 200 }} Cum.Relative frquency 71/200=.355 108/200=.540 121/200=.605 130/200=.650 140/200=.700 158/200=.790 186/200=.930 200/200=1.000 700 540 605 650 790 930 1.000 355 15 30 45 Bills 60 75 90 105 120 Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Biểu diễn dạng Thân-Lá Biểu diễn dạng Thân-Lá (Stem-and-Leaf Display) (Stem-and-Leaf Display) • Là biểu diễn dạng khoảng, hữu ích phân tích sơ • Các sơ đồ Thân-Lá biễu diễn giá trị quan sát nguyên thủy, biểu đồ (histogram) thường bị “mất” chúng • Biểu diễn Thân-Lá cơng cụ trình bày liệu định lượng dạng đồ hoạ, tương tự biểu đồ, để giúp hình dung hình dạng phân bố • Các giá trị thường phải làm tròn: -23.678758, -12.45, -3.4, 4.43, 5.5, 5.678, 16.87, 24.7, 56.8 Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ 10/4/2017 Tạo sơ đồ Thân-Lá Tạo sơ đồ Thân-Lá (Creating Stem-and-Leaf Display) (Creating Stem-and-Leaf Display) Liệt kê “thân” vào cột theo thứ tự tăng dần Đặt “lá” hàng với “thân” Quan sát liệu bảng sau 19.1 19.6 22.2 19.9 19.8 18.5 19.1 18.7 18.0 18.1 21.1 22.1 19.2 19.7 19.3 17.2 19.5 18.4 20.8 18.4 17.3 17.6 21.2 21.4 20.0 21.2 21.0 20.3 20.6 18.7 Xác định Lá & Thân (Có nhiều cách) Ví dụ: • Chũ số bên trái dấu thập phân Thân • Chữ số bên phải đấu thập phân Lá 19 Thân Lá Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ 19.1 19.8 18 18 19 19 19 1717 19 19.1 18 1719 17 19 Thân Lá 19 từ17Sơ đồ 17 Thân-Lá: Kết luận 18 19 gặp • Giá19trị17thường 1919.19 18 19 • Các giá trị quan nằm khoảng sát 19 18 190 19 17.219- 22.2 19 19 19.1 • Hầu hết khoảng 1919các giá trị nằm 18.0 20.0 • Hình dạng phân bố khơng i xng ẵ s giỏ tr quan sỏt nm 19.5 ½ nằm giá trị Biểu diễn hồn chình Stem 17 18 19 20 21 22 Leaf 623 4705147 1983627571 038 12204 12 Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Đồ thị chấm Đồ thị chấm (Dot Plot/Chart) (Dot Plot/Chart) Đây dạng đồ thị tương tự biểu đồ histogram, đó: • Trục ngang chia thành nhiều nhóm/lớp • Các giá trị quan sát biểu diễn dấu chấm • Đồ thị hộp Ví dụ phía biểu (Box Plots ) diễn dạng đồ thị chấm Trình bày slides phía sau : : : : : : : : : : : : : : : : : : : : : : : : : : :: : :: : :: : :: Có 10 khoảng trống cho $25 Mỗi khoảng trống “trị giá” $2.5 : : : : : : : :: : : : : :: 25 Có dấu chấm vị trí $25 đại diện cho quan sát rơi vào khoảng [25-1.25, 25+1.25] $ Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ 10/4/2017 Biểu đồ bánh Biểu đồ CÁC DẠNG BIỂU ĐỒ Biểu đồ đường thẳng PIE CHART, BAR CHART & LINE CHART • Sử dụng chủ yếu cho liệu định tính • Những cơng cụ đồ hoạ thích hợp liệu thơ phân loại tự nhiên cách có ý nghĩa Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Biểu đồ bánh/tròn (Pie/Circle Chart) • Biểu đồ hình tròn cơng cụ phổ biến dùng để biểu thị tỷ lệ xuất cho liệu danh nghĩa • Ví dụ 2.3 • Phòng Cơng Tác Sinh Viên CTU muốn xác định tổng thể lĩnh vực việc làm năm • Dữ liệu đếm thu thập, số lần xuất ghi lại cho lĩnh vực • Những dự liệu đếm chuyển thành tỷ lệ kết trình bày biểu đồ tròn Khác 11.1% Kế tốn 28.9% (28.9 /100)(3600) = 1040 Quản lý 14.2% Tài 20.6% Tiếp thị 25.3% • Biểu đồ hình tròn vòng tròn, chia nhỏ thành số miếng tương ứng với lĩnh vực việc làm • Kích thước miếng tỷ lệ với tỷ lệ phần trăm tương ứng với số đếm lĩnh vực mà đại diện Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ 10/4/2017 Biểu đồ Thanh (Bar Chart) • Biểu đồ cung cấp giải pháp khác cho biểu đồ bánh • Tần suất (tần suất tương đối) nhóm biểu diễn bang đứng • Ví dụ biểu diễn dạng biểu đồ Histogram 80 73 64 Frequency 70 52 60 50 36 40 30 Frequency 28 20 10 M ore Area Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Biểu đồ Thanh Biểu đồ đường thẳng (Bar Chart) (Line Chart) Dùng biểu đồ trật tự liệu định lượng trình bày có ý nghĩa • Chấm giá trị phía vạch trục ngang • Nối dấu chấm đọan thẳng theo thứ tự Vốn ODA giải ngân từ năm 1989 đến 1994 Vốn ODA giải ngân từ năm 1989 đến 1994 20,000 20,000 15,000 15,000 10,000 10,000 5,000 Biểu đồ đường thẳng đặc biệt hữu ích liệu theo thứ tự thời gian cần nhấn mạnh 5,000 ‘89 ‘90 ‘91 ‘92 ‘93 ‘94 Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ ‘89 ‘90 ‘91 ‘92 ‘93Đặng Thế Gia,‘94 BM Kỹ thuật xây dựng ĐH Cần Thơ 10/4/2017 Biểu đồ radar Biểu đồ ống khói (Radar Chart) (Funnel Chart) Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Biểu đồ hộp (Box Chart) SƠ ĐỒ PHÂN TÁN SCATTER DIAGRAM Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ 10/4/2017 Sơ đồ phân tán (Scatter Diagram) Advert 5 Sales 30 40 40 50 35 50 35 25 Sales • Thơng thường quan tâm đến mối quan hệ hai biến định lượng Advert Sales • Ví dụ 2.4 30 giá hiệu quảng • Một doanh nghiệp nhỏ muốn đánh cáo mức bán hàng 40 40 • Dữ liệu quan sát thu thập Mỗi cặp bao gồm chi 50 tiêu quảng cáo hàng tháng mức doanh thu hàng 35 tháng 50 35 25 Sơ đồ phân tán biễu diễn mối Doanh thu quan hệ chi phí quảng cáo doanh thu 60 50 40 30 20 10 0 Quảng cáo Advertising Expenditure Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Các quan hệ điển hình Quan hệ tuyến tính dương Khơng có mối quan hệ Quan hệ tuyến tính âm Thank you! Quan hệ phi tuyến âm Quan hệ phi tuyến (lõm) Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ ... bills Class 0-1 5 1 5-3 0 3 0-4 5 4 5-6 0 6 0-7 5 7 5-9 0 9 0-1 05 105 -2 0 0 Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Cumulative Frequency frequency 71 71 37 108 13 121 130 10 140 18 158 28 186 14 20 0 }} Cum.Relative... frquency 71 /20 0=.355 108 /20 0=.540 121 /20 0=.605 130 /20 0=.650 140 /20 0=.700 158 /20 0=.790 186 /20 0=.930 20 0 /20 0=1.000 700 540 605 650 790 930 1.000 355 15 30 45 Bills 60 75 90 105 120 Đặng Thế Gia, BM... 5.678, 16.87, 24 .7, 56.8 Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ Đặng Thế Gia, BM Kỹ thuật xây dựng ĐH Cần Thơ 10/4 /20 17 Tạo sơ đồ Thân-Lá Tạo sơ đồ Thân-Lá (Creating Stem-and-Leaf Display)

Ngày đăng: 12/01/2020, 21:51

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan