Một cách tiếp cận trong khai phá dữ liệu để chuẩn đoán bệnh tim cho bệnh nhân ngoại trú

13 523 0
Một cách tiếp cận trong khai phá dữ liệu để chuẩn đoán bệnh tim cho bệnh nhân ngoại trú

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ BÙI XUÂN TRỌNG MỘT CÁCH TIẾP CẬN TRONG KHAI PHÁ DỮ LIỆU ĐỂ CHẨN ĐOÁN BỆNH TIM CHO BỆNH NHÂN NGOẠI TRÚ LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN HÀ NỘI, NĂM 2015 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ BÙI XUÂN TRỌNG MỘT CÁCH TIẾP CẬN TRONG KHAI PHÁ DỮ LIỆU ĐỂ CHẨN ĐOÁN BỆNH TIM CHO BỆNH NHÂN NGOẠI TRÚ Ngành: Công Nghệ Thông Tin Chuyên ngành: Hệ Thống Thông Tin Mã số: 60480104 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: TIẾN SĨ VŨ THỊ HỒNG NHẠN HÀ NỘI, NĂM 2015 LỜI CAM ĐOAN Tôi xin cam đoan luận văn công trình nghiên cứu tôi, hướng dẫn Tiến sĩ Vũ Thị Hồng Nhạn Luận văn không chép từ hay từ luận văn khác Nếu sai xin hoàn toàn chịu trách nhiệm trước nhà trường pháp luật BÙI XUÂN TRỌNG LỜI CẢM ƠN Tôi xin bày tỏ lòng biết ơn sâu sắc tới TS Vũ Thị Hồng Nhạn, cô hướng dẫn, dạy tận tình để hoàn thành luận văn Tôi xin chân thành cảm ơn thầy, cô giáo khoa Công nghệ thông tin Trường Đại học công nghệ - Đại học Quốc gia Hà nội truyền thụ kiến thức cho suốt trình học tập Tôi muốn bày tỏ lòng biết ơn tới gia đình, người thân đồng nghiệp động viên, khích lệ, giúp đỡ, tạo điều kiện để hoàn thành khóa học luận văn TÓM TẮT Bệnh tim mạch nguyên nhân gây tử vong cao Với phát triển Công nghệ, người ta sử dụng thiết bị không dây, thiết bị cảm ứng tích hợp người để thu thập liên tục liệu tình trạng sức khỏe bệnh nhân nội trú ngoại trú Trong luận văn này, nghiên cứu cách tiếp cận khai phá liệu để chẩn đoán bệnh tim cho bệnh nhân ngoại trú Quá trình chẩn đoán thực qua hai bước Trong bước thứ nhất, bệnh nhân chẩn đoán nguy mắc bệnh dựa vào luật kết hợp Luật kết hợp tìm dựa vào liệu lâm sàng Dữ liệu lâm sàng bệnh nhân tiền xử lý sau khai phá để tìm luật kết hợp dựa thuật toán Apriori Sau bước này, dựa kết chẩn đoán, bác sĩ định bệnh nhân có nguy bị bệnh tim mạch cao tiếp tục chẩn đoán thêm bước sau Ở bước chẩn đoán thứ hai áp dụng thuật toán GNG tập liệu thay đổi nhịp tim Dữ liệu điện tâm đồ biểu diễn thay đổi nhịp tim bệnh nhân thu hoạt động ngày Tín hiệu điện tâm đồ tiền xử lý dựa kỹ thuật Poincaré để chuyển sang định dạng véc tơ đầu vào Thuật toán GNG áp dụng để khai phá liệu tiền xử lý Thuật toán đáp ứng yêu cầu việc học liên tục GNG có khả huấn luyện với liệu không quên mẫu huấn luyện từ trước Một số thực nghiệm thực để đánh giá độ xác phương pháp chẩn đoán Từ kết thu được, ta thấy rằng, phương pháp áp dụng hệ hệ thống y tế để hỗ trợ việc chẩn đoán sớm trường hợp tim mạch bất bình thường, phòng tránh hậu nghiêm trọng, đặc biệt theo dõi bệnh nhân ngoại trú ứng cứu kịp thời trường hợp cần thiết Mục lục Mục lục iii Danh sách hình vẽ v Danh sách bảng vii Giới thiệu 1.1 Động nghiên cứu 1.2 Đóng góp luận văn Cơ sở lý thuyết 2.1 Giới thiệu bệnh tim mạch 2.2 Các hệ thống chuẩn đoán bệnh Tim 2.2.1 Các Hệ thống chẩn đoán dựa vào số nguy mắc bệnh tim 2.2.2 Hệ thống hỗ trợ chuẩn đoán bệnh Tim mạch sử dụng kỹ thuật khai phá liệu 2.3 Một số thuật toán khai phá liệu 10 2.3.1 K-means 10 2.3.2 Cây định 12 2.3.3 Thuật toán Mạng Perceptron nhiều lớp 14 2.3.4 2.3.3.1 Mạng Perceptron lớp 14 2.3.3.2 Mạng Perceptron lan truyền thẳng nhiều lớp 16 SOM 19 Quá trình chẩn đoán bệnh tim dựa kỹ thuật khai phá liệu 24 3.1 Tổng quan trình chẩn đoán 24 3.2 Chẩn đoán bệnh Tim mạch dựa thông tin lâm sàng 25 3.2.1 Tiền xử lý Dữ liệu 26 iii 3.3 3.2.2 Các khái niệm định nghĩa 26 3.2.3 Thuật toán Apriori 30 Chẩn đoán bệnh tim dựa vào thay đổi nhịp tim 31 3.3.1 Tiền xử lý liệu 32 3.3.2 Thuật toán GNG 35 3.3.2.1 Nguyên lý mô hình mạng 35 3.3.2.2 Thuật toán GNG 36 Thực nghiệm Đánh giá 4.1 44 Môi trường thực nghiệm liệu 44 4.1.1 Môi trường thực nghiệm cho bước chẩn đoán dựa vào thông tin lâm sàng 44 4.1.2 Môi trường thực nghiệm cho bước chẩn đoán dựa vào thay đổi nhịp tim 45 4.2 Kết thực nghiệm 49 4.2.1 Kết đánh giá hiệu thuật toán Apriori 49 4.2.1.1 Đánh giá thay đổi số lượng tập mục phổ biến theo thay đổi độ hỗ trợ minsup 49 4.2.1.2 Đánh giá số lượng luật sinh theo thay đổi độ hỗ trợ minsup 50 4.2.1.3 Đánh giá số lượng luật tạo độ tin cậy minconf thay đổi 51 4.2.2 Kết đánh giá hiệu thuật toán GNG 53 4.2.2.1 Đánh giá lỗi phân lớp tập liệu D(O) 53 4.2.2.2 Đánh giá số lượng nút cạnh thuật toán GNG tập liệu D(O) 54 4.2.2.3 Đánh giá lỗi bình phương trung bình MSE D(O) 55 4.2.2.4 So sánh GNG với SOM 56 Kết luận 58 Tài liệu tham khảo 60 iv Danh sách hình vẽ 2.1 Bệnh Tim mạch vành 2.2 Đặc điểm hệ thống ước tính nguy bệnh Tim mạch 2.3 Cụm liệu khai phá K-mean 11 2.4 Bảng liệu 12 2.5 Cây định 12 2.6 Mạng Perceptron lớp 15 2.7 Lan truyền tín hiệu trình huấn luyện theo phương pháp lan truyền ngược sai số 18 2.8 Mô hình SOM 19 2.9 Ma trận trọng số 20 2.10 Các lân cận 20 2.11 Nút khớp 22 2.12 Hàm lân cận 23 3.1 Tổng quan hệ thống trình chẩn đoán bệnh tim 25 3.2 Chẩn đoán bệnh tim dựa vào thông tin lâm sàng bệnh nhân 26 3.3 Kỹ thuật Poincaré 34 3.4 Đồ thị RR 34 4.1 Tập liệu đầu vào thuật toán Apriori 45 4.2 Sự thay đổi itemset theo minsup 50 4.3 Số lượng luật theo minsup 51 4.4 Số lượng luật theo minconf 52 4.5 Tập luật sinh với minsup=0.1 minconf=0.97 52 4.6 Giá trị lỗi phân lớp GNG tập liệu D(O) 53 4.7 Số nút cạnh GNG tập liệu với O=0% 54 4.8 Số nút cạnh GNG tập liệu với O=1% 55 v 4.9 Số nút cạnh GNG tập liệu với O=2% 55 4.10 MSE Mức độ giao lớp 56 4.11 GNG SOM tập liệu D(0%) 56 4.12 GNG SOM tập liệu D(1%) 57 4.13 GNG SOM tập liệu D(2%) 57 vi Danh sách bảng 3.1 Bảng thuộc tính mẫu liệu cho bệnh tim 27 3.2 Quy tắc chuyển đổi liệu 43 4.1 Tổng hợp tham số sử dụng để sinh tín hiệu điện tâm đồ 46 4.2 Tham số sử dụng để sinh tập liệu (BT-Bình thường, BBT- Bất bình thường) 47 4.3 Tổng hợp tham số sử dụng GNG 48 4.4 Sự thay đổi số lượng tập mục phổ biến theo độ hỗ trợ 50 4.5 Sự thay đổi số lượng luật sinh theo độ hỗ trợ 51 4.6 Sự thay đổi số lượng luật sinh theo độ tin 51 vii Tài liệu tham khảo [1] Anderson KM, Wilson PWF, Odell PM, Kannel WB An updated coronary risk profile A statement for health professionals Journal of the American Heart Association, Circulation 1991 , 356-361 24 [2] Azuaje F, W Dubitzky, X Wu, P Lopes, N.D Black, K Adamson, and J.A White A Neural Network Approach to Coronary Heart Disease Risk Assessment based on Short-Term Measurement of RR Intervals In:Processing of Computers in Cardiology, (1997) 33 [3] Chan HL, Fang SC, Ko YL, Lin MA, Huang HH, and Lin CH Heart rate variability characterization in daily physical activities using wavelet analysis and multilayer Fuzzy Activity Clustering IEEE Transactions on Biomedical Engineering (2006) [4] E.AbuKhousa and P.Campbell, Predictive data mining to support clinical decisions: An overview of heart disease prediction systems, presented at the International Conference on Innovations in Information Technology, 2012 [5] Fritzke B A growing neural gas network learns topologies.Advances in Neural Information Processing Systems 7, Cambridge, MA: MIT Press (1995) 36 [6] J Han and M Kamber (2001), Data Mining - Concepts and Techniques, Chapter 8: Cluster Analysis Morgan Kaufmann 19, 30 [7] J.A Hartigan, Sons Clustering algorithms(1975) 10 [8] Hiroyuki F, Takashi U, Koichi O Estimation of Breathing Frequency by R Wave Fluctuation of ECG Japanese Journal of Medical Electronics and Biological Engineering (1998) 45 [9] Ingo A, Jorg B, Gerald S On-line learning with dynamic cell structures Int Conf on Artificial Neural Networks, V ol.2, (1995) [10] Ishtake S.H, Prof Sanap S.A Intelligent Heart Disease Prediction System Using Data Mining Techniques, International J of Healthcare & Biomedical Research (2013) [11] Kamen PW, Krum H, Tonkin AM, Poincare plot of heart rate variability allows quantitative display of parasympathetic nervous activity in humans Clinical Science (1996) 60 [12] Karayiannis NB, Mi GW Growing radial basis neural networks: merging supervised and unsupervised learning with network growth techniques IEEE Transactions on Neural Networks (1997) [13] Kohonen T Self-Organizing Maps, 3rd ed Berlin: SpringerVerlag (2001) [14] Laerhoven KV, Lowette S Real-time analysis of data from many sensors with neural networks In Proceedings of the fourth International Symposium on Wearable Computers (2001) [15] Lee HG, Noh KY, Park HK, Ryu KH Predicting coronary artery disease from heart rate variability using classification and statistical analysis 7th IEEE International Conference on Computer and Information Technology, (2007) [16] Chin-Teng Lin, C.S.George Lee, Neural fuzzy systems: a neurofuzzy synergism to intelligent systems, Prentice-Hall Inc (1996) 14 [17] M.Ambarasi etc al.:, Enhanced Prediction of Heart Disease with Feature subset selection using Genetic Algorithm, IJESI, Vol 2(10) (2010) [18] MA.Jabbar, B.L.Deekshatulu and Priti Chandra.: Knowledge Discovery using Associative Classification for Heart Disease Prediction In: International symposium on Intelligent Informatics (ISI 2012) [19] MA.Jabbar, Priti Chandra, B.L.Deekshatulu :Cluster based association rule mining for heart attack prediction,JATIT,vol 32,no 2(Oct 2011) [20] MA.Jabbar, B.L.Deekshatulu and Priti Chandra.: An evolutionary algorithm for heart disease prediction, ICIP, CCIS 292 PP 378-389, Springer-Verlag (2012) [21] Martinetz TM Competitive hebbian learning rule forms perfectly topology preserving maps Int Conference on Artificial Neural Networks, Springer, (1993) 35 [22] Mayrhofer R, Radi H Extending the Growing Neural Gas Classifier for Context Recognition EUROCAST, (2007) [23] Mirkin B Clustering for data mining: A data recovery approach, Chapman & Hall/CRC,UK (2005) [24] Mozaffarian D, Stein PK, Prineas RJ, Siscovick DS Dietary fish and w − fatty acid consumption and heart rate variability in US adults Circulation, American heart association, 2008 [25] Nakagawa M, Iwao T, Ishida S, Yonemochi H, Fujino T, Saikawa T, Ito M Circadian rhythm of the signal averaged electrocardiogram and its relation to heart rate variability in healthy subjects 45 61 [26] P Raphiphan, A Zaslavsky, P Prathombutr, and P Meesad.Context aware traffic congestion estimation to compensate intermittently available mobile sensors In Mobile Data Management: Systems, Services and Middleware,2009 MDM ’09 Tenth International Conference on (2009) [27] D.E Rumelhart; G.E Hinton and R.J Williams Learning internal representations by error propagation Parallel distributed processing: Explorations in the microstructure of cognition, (Cambridge MA MIT Press), 318-362 (1986) 17 [28] S.Oyyathevan and A.Askarunisa, An expert system for heart disease prediction using data mining technique: Neural network, International Journal of Engineering Research and Sports Science, vol 1, pp 1-6, (2014) [29] Sellappan Palaniappan, Rafiah Awang Intelligent Heart Disease Prediction System Using Data Mining Techniques(2008) 10 [30] S.Ranganatha, H R P Raj, C Anusha, and S K Vinay, Medical data mining and analysis for heart disease dataset using classification techniques, presented at the National Conference on Challenges in Research & Technology in the Coming Decades, 2013 [31] S.P Syed Ibrahim et al.: An Evolutionary approach for rule set selection in a class based associative classifier Europian journal of scientific research (2011) [32] Juha Vesanto (2000),Using SOM in Data Mining, Licentiate’s thesis, Helsinki University of Technology 19 [33] www.cs.waikato.ac.nz/ml/weka/ 44 [34] www.archive.ics.uci.edu 44 [35] www.physionet.org/physiobank/ecgsyn/ 45 [36] www.vnha.org.vn/ 1, [37] www.wpro.who.int/vietnam/vi/ 62 [...]...Tài liệu tham khảo [1] Anderson KM, Wilson PWF, Odell PM, Kannel WB An updated coronary risk profile A statement for health professionals Journal of the American Heart Association, Circulation 1991 , 356-361... and M Kamber (2001), Data Mining - Concepts and Techniques, Chapter 8: Cluster Analysis Morgan Kaufmann 19, 30 [7] J.A Hartigan, Sons Clustering algorithms(1975) 10 [8] Hiroyuki F, Takashi U, Koichi O Estimation of Breathing Frequency by R Wave Fluctuation of ECG Japanese Journal of Medical Electronics and Biological Engineering (1998) 45 [9] Ingo A, Jorg B, Gerald S On-line learning with dynamic cell... unsupervised learning with network growth techniques IEEE Transactions on Neural Networks (1997) [13] Kohonen T Self-Organizing Maps, 3rd ed Berlin: SpringerVerlag (2001) [14] Laerhoven KV, Lowette S Real-time analysis of data from many sensors with neural networks In Proceedings of the fourth International Symposium on Wearable Computers (2001) [15] Lee HG, Noh KY, Park HK, Ryu KH Predicting coronary artery... the signal averaged electrocardiogram and its relation to heart rate variability in healthy subjects 45 61 [26] P Raphiphan, A Zaslavsky, P Prathombutr, and P Meesad.Context aware traffic congestion estimation to compensate intermittently available mobile sensors In Mobile Data Management: Systems, Services and Middleware,2009 MDM ’09 Tenth International Conference on (2009) [27] D.E Rumelhart; G.E

Ngày đăng: 26/08/2016, 16:44

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan