Nghiên cứu một số thuật toán khai phá luật kết hợp và thử nghiệm ứng dụng vào khai phá cơ sở dữ liệu bảo hiểm y tế tại bảo hiểm xã hội Bắc Giang

90 848 0
Nghiên cứu một số thuật toán khai phá luật kết hợp và thử nghiệm ứng dụng vào khai phá cơ sở dữ liệu bảo hiểm y tế tại bảo hiểm xã hội Bắc Giang

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

[...]... kết hợp, khai phá dữ liệu dựa vào luật kết hợp, đồng thời trình b y một số thuật toán liên quan đến luật kết hợp 2.1 Luật kết hợp Từ khi đƣợc giới thiệu vào năm 1993, bài toán khai thác luật kết hợp nhận đƣợc rất nhiều sự quan tâm của các nhà khoa học Ng y nay việc khai thác luật kết hợp vẫn là một trong những phƣơng pháp khai thác mẫu phổ biến nhất trong việc khám phá tri thức và khai thác dữ liệu Một. .. của m y tính và thƣơng mại điện tử, ng y nay có rất nhiều cơ sở dữ liệu giao tác Khai phá dữ liệu trên cơ sở dữ liệu giao tác tập trung vào khai phá luật kết hợp, tìm mối tƣơng quan giữa những mục dữ liệu của bản ghi giao dịch Nghiên cứu sâu về cơ sở dữ liệu giao tác đƣợc mô tả chi tiết ở phần sau 1.4.1.4 Cơ sở dữ liệu không gian Cơ sở dữ liệu không gian bao gồm hai phần: Phần thứ nhất là dữ liệu quan... tâm Học liệu http://www.lrc-tnu.edu.vn/ 21 1.4.1 Các loại dữ liệu đƣợc khai phá Dựa vào những kiểu dữ liệu mà kỹ thuật khai phá áp dụng, có thể chia dữ liệu thành các loại khác nhau 1.4.1.1 Cơ sở dữ liệu quan hệ Đến nay, hầu hết dữ liệu đƣợc lƣu giữ dƣới dạng cơ sở dữ liệu quan hệ Cơ sở dữ liệu quan hệ là một nguồn tài nguyên lớn nhất chứa những đối tƣợng mà chúng ta cần khai phá Cơ sở dữ liệu quan... đòi hỏi khai phá dữ liệu phải có các giải pháp, các kỹ thuật để có thể áp dụng đƣợc, nhận ra đƣợc các mối quan hệ n y trong quá trình khai phá dữ liệu OLAM (Online Analytical Mining): là sự tích hợp giữa cơ sở dữ liệu, kho dữ liệu và khai thác dữ liệu một số hệ cơ sở dữ liệu nhƣ Oracle, MS SQL Server đã tích hợp tính năng x y dựng kho dữ liệu và phân tích trực tuyến (OLAP) Những tính năng n y đƣợc hỗ... không phụ thuộc vào phần cứng Bên cạnh những nghiên cứu về những biến thể của luật kết hợp, các nhà nghiên cứu còn chú trọng đề xuất những thuật toán nhằm tăng tốc quá trình tìm kiếm tập phổ biến từ cơ sở dữ liệu Ngoài ra, còn có một số hƣớng nghiên cứu khác về khai thác luật kết hợp nhƣ: Khai thác luật kết hợp trực tuyến, khai thác luật kết hợp đƣợc kết nối trực tuyến đến các kho dữ liệu đa chiều (Multidimensional... phá luật kết hợp: Có thể diễn đạt một bài toán khai phá luật kết hợp nhƣ sau: Cho một tập các item I, một cơ sở dữ liệu giao dịch D, ngƣỡng support tối thiểu minsup, ngƣỡng confidence tối thiểu minconf, tìm tất cả các luật kết hợp X Y trên D sao cho: support(X Y) minsup và confidence(X Y) minconf Ý nghĩa luật kết hợp: Luật kết hợp là một lĩnh vực quan trọng trong khai thác dữ liệu Luật kết hợp giúp... Học liệu http://www.lrc-tnu.edu.vn/ 22 1.4.1.5 Cơ sở dữ liệu có y u tố thời gian Giống nhƣ cơ sở dữ liệu không gian, cơ sở dữ liệu có y u tố thời gian bao gồm hai phần: Phần thứ nhất là dữ liệu quan hệ hay giao tác, phần thứ hai là thông tin về thời gian xuất hiện dữ liệu ở phần thứ nhất Những luật kết hợp có y u tố thời gian có nhiều thông tin hơn những luật kết hợp cơ bản Ví dụ, từ luật kết hợp cơ. .. chung để tìm ra các tập hay các nhóm, loại mô tả dữ liệu Các nhóm có thể tách nhau hoặc phân cấp - Luật kết hợp: Luật kết hợp là dạng luật biểu diễn tri thức ở dạng khá đơn giản Mục tiêu của phƣơng pháp n y là phát hiện và đƣa ra các mối liên hệ giữa các giá trị dữ liệu trong cơ sở dữ liệu Mẫu đầu của giải thuật khai phá dữ liệu là tập luật kết hợp tìm đƣợc Ví dụ về luật kết hợp: Một cửa hàng bán văn phòng... kèm và ngƣời sử dụng phải mua nếu cần sử dụng Các nhà nghiên cứu trong lĩnh vực cơ sở dữ liệu còn muốn thêm sự tích hợp giữa cơ sở dữ liệu, kho dữ liệu, và khai thác dữ liệu Khám phá đƣợc nhiều tri thức khác nhau từ các kiểu dữ liệu khác nhau Tính chính xác và hiệu quả, khả năng mở rộng và tích hợp, xử lý dữ liệu bị nhiễu không đ y đủ và tính có ích của tri thức đƣợc khám phá Vấn đề song song hóa và. .. lớn dữ liệu cần đƣợc xử lý Các tổ chức doanh nghiệp quy mô vừa có thể có từ hàng hàng trăm Megabyte đến vài Gigabyte dữ liệu thu thập đƣợc Các ứng dụng khai phá dữ liệu thƣờng thực hiện phân tích dữ liệu khá phức tạp, mất nhiều thời gian trong toàn bộ CSDL Vì v y, tìm một thuật toán nhanh và hiệu quả để xử lý khối lƣợng dữ liệu lớn là một thách thức lớn Chƣơng n y trình b y cơ sở lý thuyết của luật kết .

Ngày đăng: 19/07/2014, 22:33

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan