Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu meta data

9 1.4K 16
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu meta data

Đang tải... (xem toàn văn)

Thông tin tài liệu

1.Mô tả bài toán Meta Data được sử dụng để đưa ra lời khuyên về phương pháp phân loại thích hợp cho một số liệu cụ thể (lấy từ các kết quả của Statlog dự án) 2.Xây dựng cơ sở dữ liệu -Dataset sửdụng: Meta Data -Thông tin dataset -Các thuộc tính: DS_Name{Aust_Credit,BT,Belgian,CUT,Chromosone,Credit,DNA,Diabetes,Digits,Faults,German_Credit,Head,Heart,KlDigits,Letters,NewBelgian,SatImage,Segment,Shuttle,Technical,TseTse,Vehicle} T real N real p real k real Bin real Cost real SDratio real correl real cancor1 real cancor2 real fract1 real fract2 real skewness real kurtosis real Hc real Hx real MCx real EnAtr real NSRatio real Alg_Name {Ac2,Alloc80,BackProp,Bayes,BayesTree,C4.5,CART,Cal5,Cascade,Castle,Cn2,Default,Dipol92,Discrim,ITrule,IndCART,KNN,Kohonen,LVQ,LogDisc,NewId,QuaDisc,RBF,Smart} Norm_error real -Training data 3.TIến hành trong Weka -Đưa dữ liệu vào Weka

Meta Data 2011 BTL KHAI PHÁ DỮ LIỆU Đề bài :Meta Data Sinh viên thực hiện: Vũ Lê Hoàng Lớp : HTTT6 GVHD :Hồ Nhật Quang 1.Mô tả bài toán Meta Data được sử dụng để đưa ra lời khuyên về phương pháp phân loại thích hợp cho một số liệu cụ thể (lấy từ các kết quả của Statlog dự án) 2.Xây dựng cơ sở dữ liệu 1 Meta Data 2011 -Dataset sửdụng: Meta Data -Thông tin dataset -Các thuộc tính: DS_Name{Aust_Credit,BT,Belgian,CUT,Chromosone,Credit,DNA,Diabetes,Digits,Faults,German_Cr edit,Head,Heart,KlDigits,Letters,NewBelgian,SatImage,Segment,Shuttle,Technical,TseTse,Veh icle} T real N real p real k real Bin real Cost real SDratio real correl real cancor1 real cancor2 real fract1 real fract2 real skewness real kurtosis real Hc real Hx real MCx real EnAtr real NSRatio real Alg_Name {Ac2,Alloc80,BackProp,Bayes,BayesTree,C4.5,CART,Cal5,Cascade,Castle,Cn2,Default,Dipol92,D iscrim,ITrule,IndCART,KNN,Kohonen,LVQ,LogDisc,NewId,QuaDisc,RBF,Smart} Norm_error real -Training data 3.TIến hành trong Weka -Đưa dữ liệu vào Weka 2 Meta Data 2011 -Sử dụng toàn bộ dữ liệu để training 3 Meta Data 2011 -Nội dung kếtquả === Classifier model (full training set) === ZeroR predicts class value: 99.55247727272732 Time taken to build model: 0seconds === Cross-validation === === Summary === 4 Meta Data 2011 Correlation coefficient -0.1108 Mean absolute error 151.5401 Root mean squared error 764.994 Relative absolute error 100 % Root relative squared error 100 % Total Number of Instances 528 -Cây quyết định -95% dữ liệu để xây dựng, 5% dữ liệu test 5 Meta Data 2011 -90% dữliệuđểxâydựng, 10% dữliệu test -85% dữliệuđểxâydựng, 15% dữ liệu test 6 Meta Data 2011 -70% dữliệuđểxâydựng, 30% dữliệu test 7 Meta Data 2011 -50% dữliệuđểxâydựng, 50% dữliệu test 8 Meta Data 2011 9 . Norm_error real -Training data 3.TIến hành trong Weka - ưa dữ liệu vào Weka 2 Meta Data 2011 -Sử dụng toàn bộ dữ liệu để training 3 Meta Data 2011 -Nội dung. Number of Instances 528 -Cây quyết định -9 5% dữ liệu để xây dựng, 5% dữ liệu test 5 Meta Data 2011 -9 0% dữliệuđểxâydựng, 10% dữliệu test -8 5% dữliệuđểxâydựng,

Ngày đăng: 03/12/2013, 16:08

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan