Tài liệu về " tiểu luận khai phá dữu liệu " 7 kết quả

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Adult  với thuật toán phân lớp

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Adult với thuật toán phân lớp

Phần I: Mô tả bài toán Cho cơ sử dữ liệu Adult là tập hợp bản ghi thực hiện bởi Barry Becker từ cuộc tổng điều tra dân số năm 1994. Tập hợp các bản ghi sạch được chiết xuất dựa trên các điều kiện sau đây (AGI>100) && (AFNLWGT>1)&& (HRSWK>0). Mục đích là dự đoán nhiệm vụ để xác định xem một người làm hơn 50.000 một năm. Bài toán dựa trên số liệu thống kê của 32561 người lớn và 15 thuộc tính. Em...
Ngày tải lên : 13/12/2013, 11:08
  • 18
  • 3.3K
  • 14
Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho dataset AutoUniv

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho dataset AutoUniv

I. ĐẶT VẤN ĐỀ AutoUniv (AU) là một công cụ để tạo ra các mô hình phân loại mà sau đó có thể được được sử dụng để tạo ra các ví dụ được phân loại đánh giá học tập phân loại thuật toán. Động lực cho AU là để cung cấp một thay thế cho dữ liệu bộ có sẵn từ kho chẳng hạn như [1]. Kho cung cấp dữ liệu tập hợp nhiều nhất 'thực tế' một phần đã được hiến tặng của các doanh nghiệp hoặc các nhà nghiên cứu kh...
Ngày tải lên : 13/12/2013, 11:20
  • 19
  • 537
  • 2
Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho bộ dữ liệu  golf dataset bằng cây quyết định C4.5

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho bộ dữ liệu golf dataset bằng cây quyết định C4.5

Tiểu luận về khai phá dữ liệu THUẬT TOÁN PHÂN LỚP HỌC CÂY QUYẾT ĐỊNH C4.5 1. Giới thiệu: - Cây quyết định là phương pháp xấp xỉ hóa bằng hàm mục tiêu những giá trị rời rạc trong đó những hàm được học được thể hiện bằng cây quyết định . Học cây quyết định là một trong những phương pháp thực dụng và được sử dụng rộng rãi nhất cho phương pháp suy diễn qui nạp. - Giải thuật học cây quyết định được...
Ngày tải lên : 13/12/2013, 11:27
  • 11
  • 1.1K
  • 7
Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka cho bộ dữ liệu  forset fires dataset

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka cho bộ dữ liệu forset fires dataset

I – Giới thiệu bài toánTheo Hiệp hội bảo tồn thế giới (IUCN) các vụ cháy rừng đang đặt ra mối đe dọa cho các khu vực phong phú về đa dạng sinh học, và một trong các nguyên nhân chính của mối đe dọa này là khí hậu thay đổi, nó hủy hoại môi trường sinh thái, gây thiệt hại nặng nề về kinh tế, ảnh hưởng trực tiếp tới môi trường sống của con người. Có nhiều nguyên nhân dẫn tới cháy rừng là do điều kiện...
Ngày tải lên : 13/12/2013, 11:33
  • 4
  • 674
  • 15
Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho dataset Titanic

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho dataset Titanic

I. ĐẶT VẤN ĐỀ Khai phá dữ liệu là một ngành khoa học thực nghiệm. Nó được thiết kế sao cho bạn có thể nhanh chống thử nghiệm những cách thức hiện tại trên cơ sở dữ liệu mới một cách linh hoạt. Nó cung cấp nhiều sự hỗ trợ cho toàn bộ quá trình xử lý số liệu thực nghiệm, bao gồm chuẩn bị dữ liệu đầu vào, việc ước lượng học những sơ đồ thống kê, và hình dung dữ liệu ra và kết quả của việc học. Weka đ...
Ngày tải lên : 13/12/2013, 11:56
  • 20
  • 578
  • 4
Tiêu luận khai phá dữ liệu : Sử dụng Weka với bài toán phân cụm  Dataset Optical Recognition of Handwritten Digits

Tiêu luận khai phá dữ liệu : Sử dụng Weka với bài toán phân cụm Dataset Optical Recognition of Handwritten Digits

MỤC LỤC I. Thông tin về bộ dữ liệu 3 II. Mô tả bài toán 4 1. Phân cụm là gì ? 4 2. Thuật toán K-means : 5 III. Thực hiện 11 1. Preprocess 11 2. Cluster 11 3. So sánh với các thuật toán khác : 14 I. Thông tin về bộ dữ liệu Những người tạo ra bộ dữ liệu dùng một chương trình tiền xử lí có sẵn bởi NIST để trích xuất ra các ảnh bitmap tiêu chuẩn của các chữ viết tay từ một mẫu in sẵn. Có tổng cộng...
Ngày tải lên : 13/12/2013, 12:20
  • 14
  • 1K
  • 4
Tiểu luận khai phá dữ liệu : Sử dụng Weka với bộ dữ liệu Semeion Handwritten Digit DataSet

Tiểu luận khai phá dữ liệu : Sử dụng Weka với bộ dữ liệu Semeion Handwritten Digit DataSet

1. Mô tả Dataset Someion Handwritten Digit Data set là cơ sở dữ liệu về chữ số viết tay gồm 1593 bản ghi (1593 mẫu) được thu thập từ 80 người. Dữ liệu sau khi quét được đưa về định dạng ảnh xám 256 mức và kéo về kích thước 16*16. Ảnh này được chuyển đổi thành ảnh nhị phân với ngưỡng 127. Các pixel có giá trị mức xám nhỏ hơn và bằng 127 được đưa về 0, các pixel trên 127 được đưa về 1. Như vậy mỗi b...
Ngày tải lên : 13/12/2013, 12:34
  • 13
  • 642
  • 5