Báo cáo tốt nghiệp các giải thuật khai phá dữ liệu trên SQL server 2005 và ứng dụng

51 882 0
Báo cáo tốt nghiệp các giải thuật khai phá dữ liệu trên SQL server 2005 và ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

DataMining Các giải thuật khai phá dữ liệu trên SQL Server 2005 ứng dụng GVHD : Nội dung (1/2) •    !"#$#%!# • #&'%()*)+%+%, /'!0%!1!234+56+1 /'!76869:; /'!/+)+%+1  Nội dung (2/2) • /<=#>?%%(" %@A#51+11+#++++!+ )!5) 5) /B!CD6"E • FG3#$# !<:!#H 9%!#;%@A#I#! I.Giới thiệu (1/5) J #  9%E%I K%!#L1M  N6OP  9%E81< %A%B%!# %I# Q8CQ8'R%SQI !9%E%869:; I. Giới thiệu (2/5) ,  !"#$#%!# 5 !711T!P7  !%!##U#V !B:W:@S X:;%@ 5 !<:!%+!PO :9CY<:!1Z<%("#:#O:[ :@%Y#%;1\V]<:!FQ$P< :!#H9 5 !/E'(9^11!!_+PE 9\(9#]`FQ$P 3Oa #@A#:@Sb 5 !7$1+%#PO:\ @S#OQD#\# !c#Y O II. Các giải thuật khai phá dữ liệu trên SQL Server 2005 0%!1!2)*)+%+%, ^611)+%+ ))^):W! '! @A#1`$#%!#Y!  dD1!)*)+%+%, ^) /%!#Y# !!"X%E  6e'!P 0%!1!20)34+56+1 0)+1!/%++ 0)+1+%+1  1. Thuật toán MS Naïve Bayes P /'!c#:[8 #Y:] !Y<:!C  #&1`%=#Y:Y'!#& 9 6('!O( 3+ 56+1 /'!X76<#"EL '!C$$7!B  <:! dR%SYQ%A%B  1. Thuật toán MS Naïve Bayes 3#6(fL&g#&' /'!QX1DO:g %B#gRY:] !R %B#gY<! h;#iX1DO:@ 1P j1Dg9\^:9\5 X&6%:@Sk^l5  )( )( BP ABP 1. Thuật toán MS Naïve Bayes 3#6(fL&g#&' FQ$P/%!#9@S8&#! mX+:BgU#0%+#Y "#6^+%+n!%16+CV869 :;c#A%Lh[#&QC V\d#`:9# #8 7:9a # 6 j76<#"E/03+56+1D %o@1P   1. Thuật toán MS Naïve Bayes FY:] !!+1+Cp@ %"#Jqeqe #g"#6O &#\#(1P  3@:WOM%(P/'!QX1DO: g%B#gRY:] !R %B#gY<!  [...]... cây quyết định là chia dữ liệu một cách đệ quy từ trên xuống theo cách thức chia để trị thành các tập hợp con - Ban đầu toàn bộ dữ liệu ở gốc, - Chọn thuộc tính phân loại tốt nhất( mục đích làm tối thiểu hóa, chẳng hạn tối thiểu chiều cao của cây), - Dữ liệu được phân chia theo các trạng thái của thuộc tính được chọn Lặp lại quá trình trên với tập dữ liệu ở mỗi nút vừa tạo ra 2 Thuật toán MS Decision... Decision Tree b Nguyên tắc của thuật toán Bằng cách sử dụng thuật toán MS Decision tree, phòng Marketing có thể xây dựng một mô hình khai phá có cấu trúc: 2 .Thuật toán MS Decision Tree b Nguyên tắc của thuật toán Từ dữ liệu của công ty ta có các bảng sau 2 .Thuật toán MS Decision Tree b Nguyên tắc của thuật toán 2 .Thuật toán MS Decision Tree b Nguyên tắc của thuật toán Dữ liệu của công ty gồm có 18484...1 .Thuật toán MS Naïve Bayes b Nguyên tắc cơ bản của giải thuật A :biến cố khách hàng có khoảng cách từ nhà đế chỗ làm việc từ 0-1 Miles B1: là biến cố người đó mua xe đạp B2: là biến cố người đó không mua xe đạp 1 .Thuật toán MS Naïve Bayes b Nguyên tắc cơ bản của giải thuật 1 .Thuật toán MS Naïve Bayes b Nguyên tắc cơ bản của giải thuật Xét với 1000 khách hàng mua xe 1000 khách hàng... 0.5 2 Thuật toán MS Decision Tree a Giới thiệu: Là kĩ thuật phổ biến nhất, hỗ trợ cả việc phân loại hồi quy Nhưng phổ biến nhất là tác vụ phân loại Thuật toán này có thể sử dụng cho cả thuộc tính rời rạc liên tục Cây quyết định cũng là một phương tiện có tính mô tả cho việc tính các xác suất có điều kiện 2 Thuật toán MS Decision Tree b Nguyên tắc của thuật toán Nguyên tắc cơ bản của giải thuật. .. bản của giải thuật Tree Điều kiện để dừng phân chia là: - Ở một nút tất cả phần tử của dữ liệu tại nút đó thuộc về cùng một lớp - Không còn thuộc tính nào để thực hiện phân chia tiếp - Số lượng phần tử của dữ liệu tại một nút bằng không, trong thực tế tập dữ liệu đầu vào rất lớn, với điều kiện dừng này cây quyết định thu được rất phức tạp, với những đường đi dài Để tránh hiện tượng này trong thuật toán... hay ta có lượng thông tin về tập đó là cao nhất Giả sử một tập dữ liệu S có hai lớp: lớp N lớpP với n phần tử thuộc lớp N p phần tử , thuộc lớp P Entropy đo độ hỗn loạn của tập S như sau 2 .Thuật toán MS Decision Tree b Nguyên tắc của thuật toán Một cách tổng quát hơn, nếu S có c lớp, p i là xác suất của một phần tử trong tập dữ liệu thuộc lớp thứ i, thì ta có công thức tính entropy tổng quát:... thái 0-1 Miles phân biệt giữa các khách hàng mua không mua xe rõ nhất, trạng thái 10+ Miles phân biệt giữa khách hàng không mua khách hàng mua xe tại công ty rõ ràng nhất 1 Thuật toán MS Naïve Bayes • • • • c Các tham số của thuật toán MAXIMUM_INPUT_ATTRIBUTES : xác định số thuộc tính đầu vào lớn nhất Thiết lập tham số này bằng 0 để thuật toán tính đên tất cả các thuộc tính Giá trị mặc định... Mục đích của thuật toán time series là tìm ra hàm f Nếu f là hàm tuyến tính thì ta có: Xt = a1 Xt-1 + a2 Xt-2 + a3Xt-3+…+ anXt-n + et Trong đó ai là các hệ số 3 .Thuật toán Time Series b Nguyên tắc của thuật toán Một trong những bước quan trọng của ART đổi dữ liệu 3 .Thuật toán Time Series b Nguyên tắc của thuật toán Cây tự hồi quy: tương tự như cây quyết định là một flow-chart, trong đó các nút biểu... trạng thái: trẻ, trung tuổi già - Thiết lập bằng 1 để chỉ ra cây có dạng nhị phân Tức thuật toán phải tách ra thành hai nút với lựa trọng trạng thái là: trẻ không trẻ - Thiết lập bằng 2 để không hạn chế số phân chia Tức là thuật toán phân tách thành 3 nút với các trạng thái: trẻ, trung tuổi già - Mặc định thiết lập bằng 3, để thuật toán chọn số phân chia tối ưu nhất 3 Thuật toán Time Series a... Thuật toán Time Series a Giới thiệu MS Time series là một thuật toán hồi quy được dùng để tạo mô hình dự đoán các cột có giá trị liên tục, chẳng hạn giá cổ phiếu của một công ty Một time series là một chuỗi dữ liệu được thống kê theo thời gian 3 .Thuật toán Time Series b Nguyên tắc của thuật toán Time Series là sự kết hợp giữa kỹ thuật cây quyết định tự hồi quy nên còn có tên ART (AutoRegression Tree) . DataMining Các giải thuật khai phá dữ liệu trên SQL Server 2005 và ứng dụng GVHD : Nội dung (1/2) •   . !7$1+%#PO: @S#OQD## !c#Y O II. Các giải thuật khai phá dữ liệu trên SQL Server 2005 0%!1!2)*)+%+%, ^611)+%+ ))^):W! '! @A#1`$#%!#Y!. 9#@A:OX+:B 5 , P 9#@A:O"#X+:B 1 .Thuật toán MS Naïve Bayes 3#6(fL&g#&' 1 .Thuật toán MS Naïve Bayes 3#6(fL&g#&' jrJ

Ngày đăng: 19/06/2014, 20:44

Từ khóa liên quan

Mục lục

  • DataMining Các giải thuật khai phá dữ liệu trên SQL Server 2005 và ứng dụng

  • Nội dung (1/2)

  • Nội dung (2/2)

  • I.Giới thiệu (1/5)

  • I. Giới thiệu (2/5)

  • II. Các giải thuật khai phá dữ liệu trên SQL Server 2005

  • Thuật toán MS Naïve Bayes

  • Slide 8

  • Slide 9

  • Slide 10

  • 1.Thuật toán MS Naïve Bayes

  • Slide 12

  • Slide 13

  • Slide 14

  • Thuật toán MS Decision Tree

  • Slide 16

  • Slide 17

  • 2.Thuật toán MS Decision Tree

  • Slide 19

  • Slide 20

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan