Phân cụm dữ liệu ứng dụng trong phân tích dữ liệu công thức dược phẩm

34 239 0
Phân cụm dữ liệu ứng dụng trong phân tích dữ liệu công thức dược phẩm

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

HỘI NGHỊ KHOA HỌC – KỸ THUẬT LẦN THỨ 34 Đề tài PHÂN CỤM DỮ LIỆU ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU CÔNG THỨC DƯỢC PHẨM Báo cáo viên Hà Siu NỘI DUNG CHÍNH Giới thiệu đề tài Cơ sở lý thuyết Chương trình minh họa Kết thực nghiệm Kết luận hướng phát triển Giới thiệu đề tài Công thức dược phẩm Thành phần Mới Công thức dược phẩm Kinh nghiệm Liều lượng Tỉ trọng Nhiệm vụ nhà bào chế Mâu thuẫn tiềm tàng Kiểm tra lại Phân tích lại Các phương pháp nghiên cứu Phương Mâupháp thuẫn thống kê cổ điển -Tuyến tính - Chậm - Đơn giản - Hiệu tốt (95%) tiềm tàng vs Các kỹ thuật khai phá liệu - Phi tuyến - Nhanh - Phức tạp - Hiệu tốt (98%) Cơ sở lý thuyết Phân cụm liệuPhân cụm liệu kỹ thuật quan trọng khai phá liệu • Có nhiều định nghĩa khác kỹ thuật • Về chất hiểu phân cụm quy trình tìm cách nhóm đối tượng cho vào cụm (clusters), cho đối tượng thuẫn tiềm tàng cụmMâu tương tự đối tượng khác cụm không tương tự • Mục đích phân cụm tìm chất bên nhóm liệu • Tuy nhiên, tiêu chí xem tốt để đánh giá hiệu phân tích phân cụm, điều phụ thuộc vào mục đích phân cụm như: giảm liệu (data reduction), “cụm tự nhiên” (“natural clusters”), cụm “có ích” (“useful” clusters), phát phần tử ngoại lai (outlier detection) Công thức dược phẩmDược phẩm hay thuốc chất dạng đơn chất hỗn hợp có nguồn gốc rõ ràng, dùng cho người sinh vật để chẩn đoán, phòng chữa bệnh, hạn chế thay đổi điều kiện bệnh lý hay sinh lý Mâu thuẫn tiềm tàng • Thiết lập công thức dược phẩm thiết lập dạng công thứcliều lượng khác Thiết lập công thức dược phẩm định nghĩa tập hợp hoạt động với mục tiêu tạo thuốc có thông số kỹ thuật định đảm bảo việc trì đặc điểm hiệu an toàn thuốc Mục tiêu thiết lập công thức dược phẩm làm cho thuốc vận chuyển dễ dàng thể tương thích với bệnh nhân Hiện mục tiêu quan tâm thiết lập công thức dược phẩm sinh khả dụng thuốc Thuật toán k-means • K-means thuật toán quan trọng sử dụng phổ biến kỹ thuật phân cụm liệu • Ý tưởng thuật toán k-means tìm cách phân nhóm đối tượng Mâu thuẫn(objects) tiềm tàngđã cho vào k cụm (k số cụm xác định trước, k số nguyên dương) cho tổng bình phương khoảng cách đối tượng đến tâm nhóm (centroid) nhỏ • Thuật toán k-means áp dụng cho đối tượng biểu diễn điểm không gian vectơ d chiều U = {xi | i = 1, … , N}, với xi ∈ ℜ biểu thị đối tượng (hay điểm liệu) thứ i 10 Dữ liệu cụ thể Bảng 2: Dữ liệu thực nghiệm viên nén matrix x1 x2 x3 y1 y2 y3 0,34 0,66 0,152 0,683 0,992 0,2 0,46 0,34 0,104 0,545 0,902 0,2 0,14 0,66 0,112 0,612 0,986 0,66 0,34 0,122 0,448 0,712 0,446 0,553 0,148 0,585 0,866 0,506 0,153 0,34 0,074 0,388 0,68 0,2 0,353 0,446 0,098 0,576 0,925 0,35 0,15 0,5 0,084 0,512 0,856 0,35 0,15 0,5 0,087 0,518 0,862 10 0,35 0,15 0,5 0,084 0,507 0,851 11 0,35 0,15 0,5 0,089 0,525 0,87 12 0,353 0,306 0,34 0,052 0,352 0,672 13 0,553 0,446 0,143 0,518 0,792 20 Giao diện chương trình – Module 1: Dữ liệu Hình 3: Giao diện module – Dữ liệu 21 Giao diện chương trình – Module 2: Phân cụm liệu Hình 4: Giao diện module – Phân cụm liệu với thuật toán k-means 22 Kết thực nghiệm 23 Thống kê x1 x2 x3 y1 y2 y3 0,2 0,34 0,052 0,352 0,672 0,66 0,46 0,66 0,152 0,683 0,992 0,373692 0,154769 0,471154 0,103769 0,520692 0,843538 0,0177825 0,0193429 0,011648 0,133351 0,139079 0,107926 Giá trị nhỏ Giá trị lớn Trung bình Độ 0,000854024 0,00723929 0,0100212 xác Độ lệch chuẩn 0,0292237 0,085084 24 0,100106 Phân cụm liệu Weka Thuộc tính Dữ liệu ban đầu Cụm Cụm Cụm x1 0.3737 0.2 0.393 0.3872 x2 0.1548 0.14 0.1872 x3 0.4712 0.66 0.6065 0.4252 y1 0.1038 0.112 0.15 0.0937 y2 0.5207 0.612 0.634 0.4889 y3 0.8435 0.986 0.929 0.8122 Tổng số thực thể 13 10 Tỉ lệ 100% 8% 15% 77% 25 Nhận xét phân cụm liệu Weka • Thực tế không cần thiết phân tích mối quan hệ nhân-quả biến phụ thuộc yi với • Không phù hợp 26 Phân cụm liệu biến phụ thuộc y1 phần mềm Cụm trọng tâm Cụm Cụm Cụm Record x1 x2 x3 y1 y2 y3 0,34 0,66 0,152 0,683 0,992 0,446 0,553 0,148 0,585 0,866 13 0,553 0,446 0,143 0,518 0,792 0,2 0,46 0,34 0,104 0,545 0,902 0,2 0,14 0,66 0,112 0,612 0,986 0,66 0,34 0,122 0,448 0,712 0,2 0,353 0,446 0,098 0,576 0,925 0,506 0,153 0,34 0,074 0,388 0,68 0,35 0,15 0,5 0,084 0,512 0,856 0,35 0,15 0,5 0,087 0,518 0,862 10 0,35 0,15 0,5 0,084 0,507 0,851 11 0,35 0,15 0,5 0,089 0,525 0,87 12 0,353 0,306 0,34 0,052 0,352 0,672 27 Phân cụm liệu biến phụ thuộc y2 phần mềm Cụm trọng tâm Cụm Cụm Cụm Record x1 x2 x3 y1 y2 y3 0,34 0,66 0,152 0,683 0,992 0,2 0,46 0,34 0,104 0,545 0,902 0,2 0,14 0,66 0,112 0,612 0,986 0,446 0,553 0,148 0,585 0,866 0,2 0,353 0,446 0,098 0,576 0,925 0,66 0,34 0,122 0,448 0,712 0,506 0,153 0,34 0,074 0,388 0,68 0,35 0,15 0,5 0,084 0,512 0,856 0,35 0,15 0,5 0,087 0,518 0,862 10 0,35 0,15 0,5 0,084 0,507 0,851 11 0,35 0,15 0,5 0,089 0,525 0,87 12 0,353 0,306 0,34 0,052 0,352 0,672 13 0,553 0,446 0,143 0,518 0,792 28 Phân cụm liệu biến phụ thuộc y3 phần mềm Cụm trọng tâm Cụm Cụm Cụm Record x1 x2 x3 y1 y2 y3 0,34 0,66 0,152 0,683 0,992 0,2 0,46 0,34 0,104 0,545 0,902 0,2 0,14 0,66 0,112 0,612 0,986 0,2 0,353 0,446 0,098 0,576 0,925 0,66 0,34 0,122 0,448 0,712 0,446 0,553 0,148 0,585 0,866 0,35 0,15 0,5 0,084 0,512 0,856 0,35 0,15 0,5 0,087 0,518 0,862 10 0,35 0,15 0,5 0,084 0,507 0,851 12 0,353 0,306 0,34 0,052 0,352 0,672 13 0,553 0,446 0,143 0,518 0,792 0,506 0,153 0,34 0,074 0,388 0,68 11 0,35 0,15 0,5 0,089 0,525 0,87 29 Phân cụm liệu phần mềm • Phần mềm ứng dụng tiến hành phân cụm liệu theo biến phụ thuộc y, điều cần thiết phù hợp toán ngành Dược 30 Kết luận hướng phát triển 31 Nhận xét • • Loại trừ trường hợp học mức dự đoán sai Phù hợp với yêu cầu ngành Dược 32 Hướng phát triển đề tài • • • Ứng dụng thực tế Bộ môn Bào chế Ứng dụng thêm nguồn liệu từ thực phẩm Mở rộng đề tài nhiều kỹ thuật khai phá liệu khác rút luật kết hợp định (đây đề tài mà tác giả đăng ký nghiên cứu báo cáo Hội nghị Khoa học – Kỹ thuật lần thứ 35, năm 2018) 33 XIN CHÂN THÀNH CẢM ƠN 34 ... liệu U thành k cụm C = {C1, C2,…, Ck} cho điểm liệu xi nằm cụm Để biết điểm liệu thuộc cụm người ta gán cho mã cụm Các điểm có mã cụm cụm, tiềmcụm tàngthì cụm khác Mâu điểmthuẫn khác mã Một cụm. .. Nhận xét phân cụm liệu Weka • Thực tế không cần thiết phân tích mối quan hệ nhân-quả biến phụ thuộc yi với • Không phù hợp 26 Phân cụm liệu biến phụ thuộc y1 phần mềm Cụm trọng tâm Cụm Cụm Cụm Record... • C# 2013 • module chính: • Dữ liệu • Phân cụm liệu với thuật toán k-means 17 Bộ liệu • • • • • Công thức viên nén matrix Công trình Bodea Leucuta, năm 1997 13 công thức thực nghiệm biến độc lập

Ngày đăng: 19/04/2017, 23:08

Tài liệu cùng người dùng

Tài liệu liên quan