ứng dụng phương pháp hồi quy bayes vào việc dự báo thời tiết

33 595 0
ứng dụng phương pháp hồi quy bayes vào việc dự báo thời tiết

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC LẠC HỒNG KHOA CÔNG NGHỆ THÔNG TIN  - - ỨNG DỤNG PHƯƠNG PHÁP HỒI QUY BAYES VÀO VIỆC DỰ BÁO THỜI TIẾT GVHD: TS Hồng Thị Lan Giao HVTH: Nguyễn Thị Thu Hịa NỘI DUNG CHÍNH Phần I: Tổng quan khai phá liệu Phần II: Giới thiệu chung dự báo thời tiết Phần III: Giới thiệu phương pháp học Bayes phân lớp Naive Bayes Phần IV: Chương trình thực nghiệm hướng phát triển TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU Khái niệm khai phá liệu Là trình khai thác thơng tin tiềm ẩn có tính dự đốn, thơng tin có nhiều ý nghĩa, hữu ích từ sở liệu lớn Kiến trúc hệ thống khai phá liệu Quy trình thực khai phá liệu Xác định liệu liên quan Thống kê, báo cáo Chuẩn bị liệu Dữ liệu trực tiếp Tri thức Giải thuật Data Mining Một số phương pháp khai phá liệu a) Phân lớp định Cây định cấu trúc biễu diễn dạng Trong đó, nút (internal node) biễu diễn thuộc tính, nhánh (branch) biễu diễn giá trị có thuộc tính, (leaf node) biểu diễn lớp định đỉnh gọi gốc (root) Cây định dùng để phân lớp cách xuất phát từ gốc di chuyển theo nhánh gặp nút Trên sở phân lớp chuyển đổi luật định Xây dựng định dựa thuật toán ID3 Thuật toán ID3 biểu diễn khái niệm (concept) dạng định (decision tree) Biểu diễn cho phép xác định phân loại đối tượng cách kiểm tra giá trị số thuộc tính Ý tưởng thuật toán ID3: ID3(D, target, Atts) Trong đó: D: tập liệu huấn luyện đầu vào Target: thuộc tính mà giá trị dự đốn định Atts: tập thuộc tính cần kiểm thử trình xây dựng Kết trả về: định xây dựng theo giá trị đầu vào Ưu điểm ID3 - Sử dụng thuật tốn tìm kiếm leo đồi (hill climbing) dựa giá trị Gain để tìm kiếm thuộc tính toàn định - Đầu (Output) giả thuyết đơn (1 kết nhất) - Không gặp tượng quay lui – tính hội tụ cao - Khuyết điểm ID3 - Chỉ thích hợp với mơ hình có lượng liệu ít, rời rạc - Khơng thích ứng với tập liệu tạp (dễ phát sinh lỗi) - Không hiệu xuất liệu không mong muốn - Cây định dựng cịn lớn, rườm rà, chưa tối ưu mức tối đa Thuật tốn phân lớp Naive Bayes - Mỗi mẫu biểu diễn X=(x1, x2, …, xn) với thuộc tính a1, a2 ,…, an - Các lớp C1, C2, …, Cm Cho trước mẫu chưa biết X X phân loại vào Ci nếu: P( X | Ci )  P( X | C j ) Với  j  m, j  i (theo định lý Bayes) - Phân lớp Naive Bayes giả định độc lập thuộc tính: n P( X | Ci )   P( X k | Ci ) k 1 - Để phân lớp mẫu chưa biết X, ta tính P(X|Ci)P(Ci) cho Ci NBC gán X vào lớp Ci cho P(X|Ci)P(Ci) lớn N g y 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Ví dụ: xét bảng 1: bảng liệu thời tiết Nhiệt độ (t) Độ ẩm (t) Lượng mây (t) Lượng mưa (t) Nhiệt độ (s) Độ ẩm (s) Lượng mây (s) Lượng mưa (s) 26.2 25.4 25.4 24.6 24.9 25.5 25.0 24.1 24.3 23.8 24.5 25.3 25.4 25.9 26.3 25.7 25.6 25.7 27.1 26.9 26.0 24.7 25.9 25.7 25.3 25.3 25.3 25.0 27.2 26.2 77 76 73 79 76 78 75 73 68 76 76 75 76 75 77 82 81 81 75 73 69 71 73 74 81 75 72 77 72 77 27 30 30 30 20 35 35 34 33 33 25 36 17 32 24 30 10 22 20 20 36 17 30 32 30 39 30 14 0 0 0 0 0 0 0 16 0 0 0 0 71 0 0 25.4 25.4 24.6 24.9 25.5 25.0 24.1 24.3 23.8 24.5 25.3 25.4 25.9 26.3 25.7 25.6 25.7 27.1 26.9 26.0 24.7 25.9 25.7 25.3 25.3 25.3 25.0 27.2 26.2 25.4 76 73 79 76 78 75 73 68 76 76 75 76 75 77 82 81 81 75 73 69 71 73 74 81 75 72 77 72 77 78 30 30 30 20 35 35 34 33 33 25 36 17 32 24 30 10 22 20 20 36 17 30 32 30 39 30 14 30 0 0 0 0 0 0 16 0 0 0 0 71 0 0 0 -Biến nhiệt độ (kí hiệu ND), có khoảng giá trị sau: + Thấp ND nằm khoảng (0 – 25.5) + Trung bình ND nằm khoảng (25.5 – 27.0) + Cao ND (27.0 - + ) Tương tự ta có: -Biến độ ẩm (kí hiệu ĐA): + Thấp ĐA nằm khoảng (0 – 80) + Cao ĐA nằm khoảng (80 - +  ) -Biến lượng mây (kí hiệu MA): + Ít MA nằm khoảng (0 – 20) + Nhiều MA nằm khoảng (20 – 30) + Rất nhiều MA nằm khoảng (30 - +  ) -Biến lượng mưa (kí hiệu M): + Rải rác M nằm khoảng (0 – 2) + Nhỏ M nằm khoảng (2 – 50) + Lớn M nằm khoảng (50 - +  ) Sau phân lớp ta có bảng liệu sau: Ngày Nhiệt độ (t) Độ ẩm (t) Lượng mây (t) Lượng mưa (t) Nhiệt độ (s) Độ ẩm (s) Lượng mây (s) Lượng mưa (s) 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 TB Thấp Thấp Thấp Thấp TB Thấp Thấp Thấp Thấp Thấp Thấp Thấp TB TB TB TB TB Cao TB TB Thấp TB TB Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Cao Cao Cao Thấp Thấp Thấp Thấp Thấp Thấp Cao Thấp Nhiều Ít Rất nhiều Rất nhiều Rất nhiều Nhiều Rất nhiều Rất nhiều Rất nhiều Rất nhiều Rất nhiều Nhiều Rất nhiều Ít Rất nhiều Nhiều Rất nhiều Ít Nhiều Ít Nhiều Nhiều Rất nhiều Ít Rất nhiều Rất nhiều Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Nhỏ Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Lớn Rải rác Thấp Thấp Thấp Thấp TB Thấp Thấp Thấp Thấp Thấp Thấp Thấp TB TB TB TB TB Cao TB TB Thấp TB TB Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Thấp Cao Cao Cao Thấp Thấp Thấp Thấp Thấp Thấp Cao Thấp Thấp Ít Rất nhiều Rất nhiều Rất nhiều Nhiều Rất nhiều Rất nhiều Rất nhiều Rất nhiều Rất nhiều Nhiều Rất nhiều Ít Rất nhiều Nhiều Rất nhiều Ít Nhiều Ít Nhiều Nhiều Rất nhiều Ít Rất nhiều Rất nhiều Rất nhiều Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Nhỏ Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Rải rác Lớn Rải rác Rải rác 27 28 29 30 31 Thấp Thấp Cao TB Thấp Thấp Thấp Thấp Thấp Thấp Rất nhiều Rất nhiều Rất nhiều Ít Rất nhiều Rải rác Rải rác Rải rác Rải rác Rải rác Thấp Cao TB Thấp TB Thấp Thấp Thấp Thấp Thấp Rất nhiều Rất nhiều Ít Rất nhiều Nhiều Rải rác Rải rác Rải rác Rải rác Rải rác Yêu cầu: Áp dụng thuật toán Naive Bayes để phân lớp cho thể sau đây: trời có mưa hay khơng? Thực hiện: Bước 1: ta có lớp C1 mưa rải rác (RR), C2 mưa nhỏ, C3 mưa lớn; tổng số mẫu 31 -Số mẫu phân lớp C1 29 xác suất mưa RR : P(C1)=29/31=0.935 -Số mẫu phân lớp C2 xác suất mưa nhỏ là: P(C2)=1/31=0.032 -Số mẫu phân lớp C3 xác suất mưa lớn là: P(C3)=1/31=0.032 Ta tính xác suất thuộc tính sau: Nhiệt độ Thấp|RR=17/29 Thấp|nhỏ=17 TB|RR=12/29 TB|nhỏ=12 Cao|RR=2/29 Cao|nhỏ=2 Độ ẩm Thấp|RR=27/29 Thấp|nhỏ=27 Cao|RR=4/29 Cao|nhỏ=4 Lượng mây Ít|RR=6/29 Ít|nhỏ=6 Nhiều|RR=7/29 Nhiều|mhỏ=7 Rất nhiều|RR=18/29 Rất nhiều|nhỏ=18 Lượng mưa RR|RR=29/29 RR|nhỏ=29 Nhỏ|RR=1/29 Nhỏ|nhỏ=1 Lớn|RR=1/29 Lớn|nhỏ=1 Thấp|lớn=17 TB|lớn=12 Cao|lớn=2 Thấp|lớn=27 Cao|lớn=4 Ít|lớn=6 Nhiều|lớn=7 Rất nhiều|lớn 18 RR|lớn=29 Nhỏ|lớn=1 Lớn|lớn=1 Bước 2: Phân lớp cho mẫu mới: X1= P(X1|RR)=2/29*4/29*6/29*1/29*29/31=0.00006 P(X1|Nhỏ)=2*4*6*7*1/31=10.839 P(X1|Lớn)=2*4*6*1*1/31=1.548 CNB=max(P(X1|RR), P(X1|Nhỏ), P(X1|Lớn))= P(X1|Nhỏ)  X1 thuộc lớp Nhỏ nghĩa với nhiệt độ cao, độ ẩm cao, trời mây, có mưa nhỏ thời tiết ngày có mưa mưa nhỏ CHƯƠNG TRÌNH THỰC NGHIỆM VÀ HƯỚNG PHÁT TRIỂN 1.Bài toán Bài toán dự báo thời tiết với liệu đầu vào gồm có nhiệt độ, độ ẩm, lượng mây lượng mưa Yêu cầu: Đưa dự báo thời tiết ngày tháng 2.Xây dựng chương trình dự báo Bước 1: Thu thập liệu từ thực tế để xây dựng tập liệu huấn luyện bao gồm yếu tố: nhiệt độ, độ ẩm, lượng mây lượng mưa Bước 2: Dự báo thời tiết Kiểm tra liệu đầu vào trùng với tập liệu huấn luyện đưa kết ngược lại sử dụng thuật toán Naive Bayes để dự đốn CHƯƠNG TRÌNH DEMO KẾT QUẢ ĐẠT ĐƯỢC - Phân lớp liệu, phát yếu tố liên quan đến thời tiết, từ tạo sở cho nhà chuyên môn sâu nghiên cứu, đánh giá tầm quan trọng yếu tố thực tế - Xây dựng chương trình dự báo thời tiết dựa yếu tố chính: nhiệt độ, độ ẩm, lượng mây, lượng mưa Tuy nhiên chương trình dự báo thời tiết địa phương yếu tố đầu vào hạn chế HƯỚNG PHÁT TRIỂN - Mở rộng số yếu tố liên quan đến dự báo thời tiết để đưa dự báo xác - Phát triển ứng dụng tự động, xây dựng hệ thống tự động cập nhật liệu trợ giúp hệ thống thiết bị chun dụng cung cấp thơng tin dự báo thới tiết cách xác, nhanh chóng đầy đủ Cảm ơn quý Thầy Cô, anh chị bạn lắng nghe ... Các phương pháp dự báo thời tiết - Phương pháp dự báo thời tiết truyền thống – Phương pháp Synốp - Phương pháp dự báo số trị - Phương pháp dự báo theo dấu hiệu địa phương PHƯƠNG PHÁP HỌC BAYES. .. VỀ DỰ BÁO THỜI TIẾT 1.Khái niệm thời tiết dự báo thời tiết - Thời tiết Là trạng thái khí biểu khu vực định khoảng thời gian định, đặc trưng số yếu tố khí tượng tượng khí tượng điển hình - Dự báo. .. quan đến dự báo thời tiết để đưa dự báo xác - Phát triển ứng dụng tự động, xây dựng hệ thống tự động cập nhật liệu trợ giúp hệ thống thiết bị chuyên dụng cung cấp thông tin dự báo thới tiết cách

Ngày đăng: 27/11/2014, 09:28

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan