Nhận dạng hành vi người dùng từ dữ liệu của cảm biến của điện thoại thông minh

52 147 0
Nhận dạng hành vi người dùng từ dữ liệu của cảm biến của điện thoại thông minh

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ - ĐỖ VĂN THÌN NHẬN DẠNG HÀNH VI NGƯỜI DÙNG TỪ DỮ LIỆU CỦA CẢM BIẾN CỦA ĐIỆN THOẠI THÔNG MINH LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Hà Nội – 2016 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ - ĐỖ VĂN THÌN NHẬN DẠNG HÀNH VI NGƯỜI DÙNG TỪ DỮ LIỆU CỦA CẢM BIẾN CỦA ĐIỆN THOẠI THÔNG MINH Ngành : Hệ thống thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60.48.01.04 LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN HẢI CHÂU XÁC NHẬN CỦA XÁC NHẬN CỦA CÁN BỘ HƯỚNG DẪN CHỦ TỊCH HỘI ĐỒNG Hà Nội – 2016 LỜI CAM ĐOAN Tôi xin cam đoan nội dung kết luận văn tốt nghiệp tự nghiên cứu hướng dẫn PGS.TS Nguyễn Hải Châu Trong toàn nội dung luận văn, nội dung trình bày cá nhân tơi tổng hợp từ nhiều nguồn tài liệu khác Tất tài liệu tham khảo trích dẫn rõ ràng phần cuối luận văn Tôi xin cam đoan lời thật Nếu sai tơi xin hồn tồn chịu trách nhiệm Hà Nội, ngày tháng năm Học viên Đỗ Văn Thìn LỜI CẢM ƠN Tôi xin gửi lời cảm ơn sâu sắc tới PGS.TS Nguyễn Hải Châu, người tận tình bảo kiến thức chuyên môn, phương pháp nghiên cứu khoa học đồng thời gương mặt sống để học tập noi theo Tôi xin chân thành cảm ơn thầy, cô giáo trường Đại học Công Nghệ cung cấp cho tơi kiến thức bổ ích thời gian tơi học tập trường Cuối xin gửi lời cảm ơn tới gia đình tơi ln ủng hộ đường học tập nghiên cứu với nhiều khó khăn, vất vả Mặc dù tơi cố gắng trình làm luận văn khơng thể tránh khỏi thiếu sót, mong nhận góp ý thầy bạn Hà Nội, ngày tháng năm Học viên Đỗ Văn Thìn MỤC LỤC Mục lục Danh mục chữ viết tắt Danh mục hình Danh mục bảng Giới thiệu Chương 1: Tổng quan 1.1 Tổng quan giám sát hoạt động 1.2 Cảm biến 1.3 Điện thoại thông minh 11 1.4 Phân lớp 13 1.4.1 Khái niệm phân lớp 13 1.4.2 Phân lớp liệu 13 Chương 2: Phương pháp, công cụ hỗ trợ nhận dạng hành vi 18 2.1 Kỹ thuật phân lớp nhận dạng hành vi 18 2.2 Tiền xử lý 20 2.3 Trích chọn tính 21 2.4 Phân lớp liệu 23 2.4.1 Thuật toán SVM 24 2.4.2 Thuận toán k-NN 27 2.4.3 Phân lớp dựa thuật toán định 28 2.5 Đánh giá thuật toán 30 Chương 3: Cài đặt thực nghiệm 32 3.1 Bộ liệu nhận dạng hành vi 32 3.2 Tiền xử lý liệu 35 3.3 Xây dựng thực nghiệm ứng dụng nhận dạng hành vi 37 3.4 Kết thực nghiệm 39 Kết luận 42 Tài liệu tham khảo 43 DANH MỤC CHỮ VIẾT TẮT K ýAA DA cti A RAt cti A RD tri D T Fat Fa F Hst H M Kid k-N NS ea S VW up W eai kka Tiếng HV oạ N hậ Đị nh T ập Bi ến M ơM hì DANH MỤC HÌNH Hình 1.1: Lợi ích giám sát hoạt động người Hình 1.2: Cảm biến gia tốc tuyến tính Hình 1.3: Hệ trục điện thoại thông minh Hình 1.4: Tóm tắt nghiên cứu trước nhận dạng hành vi sử dụng cảm biến gia tốc 10 Hình 1.5: Phân lớp liệu – (a) Xây dựng mơ hình phân lớp 15 Hình 1.6: Phân lớp liệu – (b1) ước lượng độ xác mơ hình 16 Hình 1.7: Phân lớp liệu – (b2) phân lớp liệu 16 Hình 2.1: Sơ đồ biểu diễn quy trình học máy 19 Hình 2.2: mơ hình nhận dạng hành vi từ liệu cảm biến điện thoại thơng minh 20 Hình 2.3: Siêu phẳng h chia liệu huấn luyện thành tập + – với khoảng cách biên lớn 25 Hình 2.4: Ví dụ định 29 Hình 2.5: Mã giải thuật toán phân lớp liệu dựa định 30 Hình 2.6: Ma trận nhầm lẫn 31 Hình 3.1: Thu thập liệu từ cảm biến điện thoại thông minh 32 Hình 3.2: Ví dụ liệu cảm biến gia tốc 33 Hình 3.3: Chương trình ứng dụng demo 39 Hình 3.4: Kết phân lớp liệu với thuật toán J48 41 DANH MỤC BẢNG Bảng 1.1: Các cảm biến trang bị điện thoại thông minh 12 Bảng 2.1: Tính miền thời gian 22 Bảng 2.2: Miền tần số 22 Bảng 2.3: Tính miền chuỗi biểu tượng 23 Bảng 2.4: Công thức đánh giá toán hiệu thuật toán phân lớp 31 Bảng 3.1: Số lượng trường hợp cho lớp 34 Bảng 3.2: Tính trích xuất mơ tả 34 Bảng 3.3: Tín hiệu chuyển hóa từ liệu gia tốc, sử dụng miền thời gian tần số 35 Bảng 3.4: Trích chọn tính từ tập liệu ban đầu 36 Bảng 3.5: Loại bỏ tính đánh dấu tập liệu 36 Bảng 3.6: Phân lớp J48 với tập liệu 39 Bảng 3.7: Thử nghiệm với tập liệu DT2 40 Bảng 3.8: Kết thực nghiệm với thuật toán J48 40 GIỚI THIỆU Tính cấp thiết đề tài Nhận dạng hành vi người sử dụng cảm biến cá nhân trở thành lĩnh vực nghiên cứu quan trọng nhằm tạo hay cải thiện ứng dụng giám sát hoạt động người Khả ghi lại nhận dạng hoạt động cá nhân hàng ngày điều cần thiết để xác định mức độ thực hoạt động người Những hệ thống có ứng dụng thực tế việc chăm sóc sức khỏe theo dõi luyện tập sức khỏe Hoạt động thể chất có tác dụng tích cực lên tất chức thể nghiên cứu chứng minh nguy tim mạch giảm tới 50% người có hoạt động thể chất tích cực [5].Với già hóa dân số kinh phí hạn chế cho việc chăm sóc sức khỏe cộng đồng, quan tâm nhiều trả để giám sát hoạt động người, nâng cao khả hỗ trợ bệnh nhân giúp họ tự chăm sóc thân, giảm chăm sóc y tế thơng thường chuyển qua chăm sóc từ xa Trong lĩnh vực y tế, việc theo dõi hoạt động người dùng thời gian dài hữu ích việc phát sớm bệnh khuyến khích người dùng cải thiện mức độ hoạt động họ Một phương pháp sử dụng để giám sát hoạt động người dựa hệ thống video ghi chuyển động liên kết với cảm nhận áp lực Những phương pháp gây khó chịu, đòi hỏi thiết bị lớn sử dụng bên phòng thí nghiệm đòi hỏi thiết lập cao, thời gian xử lý không gian nhớ để ghi lại Phân tích hành vi sử dụng cảm biến điện thoại thông minh trở thành lựa chọn thú vị cho hệ thống kích thước nhỏ, chi phí thấp khả ghi lại tín hiệu chuyển động cách kín đáo Hơn ngày hầu hết điện thoại thơng minh tích hợp cảm biến phù hợp cho việc phân tích hành vi người dùng Cảm biến gia tốc quay hồi chuyển sử dụng để nghiên cứu hoạt động hàng ngày người Phân loại thông tin chuyển động, thu thập từ liệu từ cảm biến điện thoại thông minh, nhãn hoạt động thường thực với kỹ thuật học máy Bảng 2.4: Công thức đánh giá toán hiệu thuật toán phân lớp Hình 2.6: Ma trận nhầm lẫn CHƯƠNG 3: CÀI ĐẶT VÀ THỰC NGHIỆM Chương mô tả phương pháp sử dụng để đánh giá liệu cảm biến gia tốc, tìm kiếm mơ hình hoạt động huấn luyện phân lớp để dự đoán cho liệu với hành vi tương ứng 3.1 Bộ liệu nhận dạng hành vi Giả thuyết luận văn kiểm tra khả thực thuật toán phân loại điện thoại thông minh để nhận dạng hành vi người, có tính đến đánh giá pin hạn chế nhớ Với mục đích này, chúng cần nghiên cứu kỹ thuật cần thiết cho tiền xử lý phân loại liệu gia tốc, sử dụng liệu cạnh tranh Trong luận văn này, liệu nhận dạng hành vi cung cấp sẵn [6] với đặc tính liệu: Các thí nghiệm tiến hành với nhóm 30 tình nguyện viên phạm vi độ tuổi từ 19 tuổi đến 48 tuổi Mỗi người thực hành vi đeo điện thoại thông minh (Galaxy S II) vào thắt lưng, đặt theo chiều dọc Sử dụng cảm biến gia tốc, quay hồi chuyển họ lấy liệu gia tốc tuyến tính trục vận tốc góc trục tốc độ khơng thay đổi 50Hz Các thí nghiệm ghi hình lại để gán nhãn liệu tay Hình 3.1: Thu thập liệu từ cảm biến điện thoại thông minh Bộ liệu cung cấp tín hiệu gia tốc quay hồi chuyển cho liệu (huấn luyện kiểm thử) nhãn hành vi cho trường hợp “Các tín hiệu cảm biến (gia tốc quay hồi chuyển) tiền xử lý cách áp dụng lọc nhiễu sau lấy mẫu với cửa sổ trượt 2,56 giây 50% chồng chéo Tín hiệu cảm biến gia tốc, thành phần hấp dẫn chuyển động thể phân tách lọc thông thấp Butterworth Lực hấp dẫn giả định thành phần có tần số thấp, lọc với tần số cắt 0.3Hz sử dụng Với cửa sổ, vector tính thu lại cách tính tốn từ biến thời gian miền tần số.” [6] Hình 3.2: Ví dụ liệu cảm biến gia tốc Các tính chuẩn hóa giới hạn khoảng [-1, 1] Việc chuẩn hóa thực theo hàm số: ����� = �− ×2−1 ��� ��� − ��� Trường xNorm tính chuẩn hóa, x tính Min Max giá trị tối thiểu tối đa tương ứng với tính x Để phân loại xác hơn, liệu nên cân tất lớp nên có số trường hợp Sự phân lớp từ liệu cạnh tranh giới thiệu bảng 3.1 Bảng 3.1: Số lượng trường hợp cho lớp N hã W al ki n g W a T l ot T ập 2 7 T ập 49 47 42 49 129 47 Các tác giả trích xuất 561 tính tương ứng với 17 tính bảng 3.2, liệu rút theo tín hiệu từ bảng 3.3 Bảng 3.2: Tính trích xuất mơ tả Tí n m ea n( ) s t d ( ) M Gi trị tr un g bì nh Đ ộ lệ m ch a ch d uẩ ( n ) Đ ộ m a l x ệ bandsEnergy() angle() Năng lượng khoảng tần số 64 ngăn FFT cửa sổ Góc hai vectơ Bảng 3.3: Tín hiệu chuyển hóa từ liệu gia tốc, sử dụng miền thời gian tần số tB o d y A cc X Y Z t G fB od y A cc X Y Z f B o 3.2 Tiền xử lý liệu Liên quan đến kỹ thuật tiền xử lý, có cách thức để lựa chọn thuộc tính: Filters Wrapper Sau ta tạo tập từ vector đặc trưng phân loại để sử dụng tập con, mục tiêu tạo tập mà phân lớp thực tốt Để tìm tập con, người ta sử dụng phương thức tìm kiếm như: phương pháp linear forward phương pháp best first Các lọc sử dụng thẩm định thuộc tính (attribute evaluator) hàng để xếp hạng tính Với phương pháp này, tính có cấp bậc thấp loại bỏ thời gian để xem độ xác việc phân loại Với luận văn này, sử dụng weka để thực tiền xử lý liệu Trong Weka sử dụng phương pháp đánh giá CfsSubSetEval phương thức tìm kiếm Best First Từ liệu với 562 thuộc tính (561 thuộc tính thuộc tính lớp phân loại), thực trích chọn thuộc tính để có vector 37 tính cho huấn luyện mơ hình phân lớp Bảng 3.4: Trích chọn tính từ tập liệu ban đầu Atta ribt 56 C f 56 C f 37( C DT f S Sel e ect Bes49 tFir(D L 37( i DT L 32( i DT Bảng 3.5: Loại bỏ tính đánh dấu tập liệu Tậ Tậ T M pM pM ậ iề tB iề tiề tB o o B d d o y y d A A y cc cc A - - c m st c ax d( () )- m - X a X t x t B ( B o ) o d d y X y A t A c B c c o c - d - m y c a A o x c r ( c r ) e - a l X r C a t t o i B e o o f n d f M fiề B o d y A cc st d( )X f B o d y A c c s k e w n e M fiề B o d y A cc st d( )X f B o d y A c c J e r k m a 3.3 M iề fB od y A cc st d( )X f B o d y A c c J e r k m a x I Xây dựng thực nghiệm ứng dụng nhận dạng hành vi Do phạm vi nghiên cứu đề tài luận văn thời gian ngắn, nên tơi xây dựng chương trình mang tính chất demo tơi nghiên cứu Ứng dụng xây dựng tảng Android, sử dụng liệu tiền xử lý với công cụ Weka Ứng dụng sử dụng thư viện Weka cho việc xử lý tiền liệu thư viện Weka mobile cho việc kiểm thử liệu mobile Luận văn xin cung cấp số thông tin Weka sau:  Weka phần mềm nguồn mở khai phá liệu phát triển đại học University of Waikato nước New Zealand “Weka” từ viết tắt cho cụm từ Waikato Environment for Knowledge Analysis Weka sử dụng nhiều cấp độ khác Cấp độ đơn giản ta áp dụng thuật tốn Weka để xử lý liệu từ dòng lệnh Nó bao gồm nhiều công cụ dùng cho việc biến đổi liệu, thuật toán dùng để rời rạc hóa liệu  Weka cung cấp tất chức khai phá liệu bao gồm thuật toán phân lớp (classifier), thuật toán tiền xử lý liệu (filter), thuật toán phân cụm (cluster), thuật toán kết tập luật (association rule) Phương pháp phân lớp Trong chương trước luận văn trình bày số thuật toán phân lớp Với thử nghiệm, luận văn sử dụng định thuật toán SVM để xây dựng mơ hình học máy Mơi trường phát triển: - Hệ điều hành Windows 10 x64 - Android Studio version 2.2.2 - Android SDK - Công cụ Weka Windows thư viện Weka cho android Chức ứng dụng Với liệu tiền xử lý, hệ thống thực nhiệm vụ: xây dựng mô hình học máy điện thoại thơng minh để đốn định liệu sau kiểm thử với liệu test, sử dụng mơ hình xây dựng công cụ Weka thực kiểm thử liệu test với mơ hình điện thoại thơng minh, đánh giá mơ hình học máy Hình 3.3: Chương trình ứng dụng demo 3.4 Kết thực nghiệm Trong luận văn tiến hành số thí nghiệm tập liệu HAR để dự đoán kết người dùng tương lai Xét liệu thu với trích chọn thuộc tính từ Weka, thuật tốn J48 sử dụng phân lớp quan tâm giai đoạn phát tập liệu tối giản tốt Dựa số hiệu suất phân lớp trình bày bảng 3.6, tập liệu DT2 chọn liệu tối giản tốt hơn, số hiệu suất tốt Bảng 3.6: Phân lớp J48 với tập liệu D T D T D T TP FPP r 0 0 0 0 RF e 0 0 0 Dựa vào bảng 3.7 tập liệu DT2, thuật toán IB1 (thể thuật toán kNN) SMO (thuật toán SVM) cho hiệu tốt so với J48 giá trị FP F- Mesure Tuy nhiên, J48 phù hợp cho điện thoại thông minh, J48 cần thời gian để dự đoán liệu Bảng 3.7: Thử nghiệm với tập liệu DT2 IB S M N 395.412.407 m FM T 0,23 r Pr 0,2490.30,35 ed Xét tập DT2 mơ hình phân lớp J48, bảng 3.8 hình 3.4 cho thấy số liệu hiệu suất phân lớp cho tập liệu mơ hình phân lớp chọn Độ xác thu 87.38 % lỗi 12.62% cho tập liệu kiểm thử với 2947 liệu kiểm thử tập liệu 7532 liệu cho mơ hình huấn luyện Kết đánh bảng ta thấy liệu theo đường chéo có giá trị cao thể cho phần lớn phân lớp Với nhãn Laying liệu phân lớp 100% Bảng 3.8: Kết thực nghiệm với thuật toán J48 S ố S ố T ổ T T he he 12 37 62 87 2575 2947 Hình 3.4: Kết phân lớp liệu với thuật toán J48 Trong kết phân tích hành vi hội nghị ESANN 2013, kết tốt 96% [6] Độ xác luận văn 87.4% với thuật toán định – J48, thấp gần 10% so với kết tốt Tuy nhiên, khơng có thơng tin quy trình xử lý đánh giá kết quả, việc so sánh kết nghiên cứu khó khăn KẾT LUẬN Phân tích hoạt động người nhận quan tâm ngày nhiều người chăm sóc người cao tuổi, vận động viên, bác sỹ, chuyên gia dinh dưỡng, nhà vật lý trị liệu, người muốn kiểm tra mức độ hoạt động hàng ngày Với tài liệu tham khảo nghiên cứu trước lĩnh vực này, điện thoại thông minh với cảm biến gia tốc sử dụng để thu thập liệu chuyển động người dùng chúng nhỏ gọn, vướng víu cảm biến đeo được, đặc biệt người dùng thường xuyên mang theo người Các liệu thu thập từ gia tốc tuyến tính cung cấp thơng tin gia tốc chuyển động thể người trọng lực Các tín hiệu trích xuất cường độ, góc, độ lệch chuẩn biến đổi FFT dùng để huấn luyện mơ hình học máy Mục tiêu luận văn thực xây dựng phương pháp để xác định hoạt động hàng ngày người ngồi, nằm, đứng, leo cầu thang thiết bị điện thoại thông minh; sử dụng liệu cảm biến cung cấp sẵn Với phán xây dựng, tỷ lệ xác khoảng 86% lỗi phân loại khoảng 14% Hướng nghiên cứu phát triển từ kết đạt luận văn vào toán xây dựng ứng dụng giám sát nhiều cho hoạt động thể chất người mà người dùng cung cấp thông tin phản hồi tiền sử thể chất người dùng, tương tác với thiết bị đeo để tăng cường tính xác cho hoạt động phân tích ứng dụng TÀI LIỆU THAM KHẢO Tiếng Anh Symposium of the Brazilian Institute for Web Science Research (WebScience) Wilde, A (2010) An overview of human activity detection technologies for pervasive systems Seminar paper Pervasive and Artificial Intelligence Group of University of Southampton Bao, L (2003) Physical Activity Recognition from Acceleration Data under SemiNaturalistic Conditions M.Eng Thesis, Massachusetts Institute of Technology Bao, L., & Intille, S (2004) Activity recognition from user-annotated acceleration data Pervasive Computing, 1-17 Czabke, A., Marsch, S., & Lueth, T C (2011, 23-26 May 2011) Accelerometer based real-time activity analysis on a microcontroller The Morgan Kaufmann Series in Data Management Systems, Jim Gray Datamining- Concepts and Techniques, Chapter 7-Classification and Prediction Series Editor Morgan Kaufmann Publishers, August 2000 Anguita, Davide, Ghio, Alessandro, Oneto, Luca, Parra, Xavier, & Reyes-Ortiz, Jorge L (2013).A Public Domain Dataset for Human Activity Recognition Using Smartphones 21th European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning, ESANN 2013 Website http://weka.sourceforge.net/doc.stable/ https://archive.ics.uci.edu/ml/datasets/Human+Activity+Recognition+Using+Smar tphone ... THÌN NHẬN DẠNG HÀNH VI NGƯỜI DÙNG TỪ DỮ LIỆU CỦA CẢM BIẾN CỦA ĐIỆN THOẠI THƠNG MINH Ngành : Hệ thống thơng tin Chun ngành: Hệ thống thông tin Mã số: 60.48.01.04 LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG... đặt cảm biến gia tốc để phát ADL Dữ liệu cảm biến thu từ cổ tay thuận tốt cho hoạt động phân biệt hành vi liên quan đến chuyển động thể liệu từ gia tốc đùi hữu ích cho vi c nhận dạng hành vi thực... thường, cảm biến đặt bên cạnh thể nên đem lại thoải mái cho người sử dụng Các hệ điện thoại thông minh trang bị với loạt cảm biến bên trong: cảm biến gia tốc, cảm biến quay hồi chuyển, cảm biến

Ngày đăng: 05/04/2019, 12:25

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan