Ứng dụng phân tích mẫu chuỗi tuần tự vào việc phát hiện thói quen sử dụng các ứng dụng trên thiết bị di động

73 633 0
Ứng dụng phân tích mẫu chuỗi tuần tự vào việc phát hiện thói quen sử dụng các ứng dụng trên thiết bị di động

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NHỆ ĐÀO THẾ MẪN ỨNG DỤNG PHÂN TÍCH MẪU CHUỖI TUẦN TỰ VÀO VIỆC PHÁT HIỆN THÓI QUEN SỬ DỤNG CÁC ỨNG DỤNG TRÊN THIẾT BỊ DI ĐỘNG Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60 48 05 LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS NGUYỄN HÀ NAM HÀ NỘI - 2013 MỤC LỤC LỜI CAM ĐOAN Error! Bookmark not defined LỜI CẢM ƠN Error! Bookmark not defined MỤC LỤC DANH MỤC CÁC HÌNH VẼ DANH MỤC CÁC KÍ HIỆU VÀ CHỮ VIẾT TẮT DANH MỤC CÁC BẢNG Chương - GIỚI THIỆU Chương - TỔNG QUAN KHAI PHÁ MẪU CHUỖI TUẦN TỰ 11 2.1 Đặc điểm liệu 11 2.2 Khai phá liệu mẫu chuỗi 13 2.2.1 Giới thiệu chung 13 2.2.2 Bài toán Khai phá mẫu chuỗi 15 2.2.3 Một số thuật toán khai phá mẫu 18 Chương - MƠ HÌNH ĐỀ XUẤT 20 3.1 Mô hình đề xuất tổng thể 20 3.2 Các phương án tách chuỗi 22 3.3 Tách Itemset chuỗi 23 3.4 Tính thời gian cho phương án tách chuỗi 25 Chương - THỰC NGHIỆM 30 4.1 Bộ liệu thứ 31 4.2 Bộ liệu thứ 35 KẾT LUẬN 39 Phụ lục A – TÍNH KHOẢNG THỜI GIAN PHÂN TÁCH 40 Phụ lục B – MỘT SỐ KẾT QUẢ THỰC NGHIỆM CỤ THỂ 54 B1 Kết thực nghiệm liệu thứ 54 B2 Kết thực nghiệm Bộ liệu thứ 61 TÀI LIỆU THAM KHẢO 71 DANH MỤC CÁC HÌNH VẼ Hình 2.1 Dữ liệu thu từ TBDĐ sử dụng Hệ điều hành Android 12 Hình 2.2 Dữ liệu ứng dụng gốc lấy từ Hình 2.1 13 Hình 2.3 Giải thuật DFS với Kỹ thuật cắt tỉa 19 Hình 3.1 Mơ hình tổng qt khai phá liệu 20 Hình 3.2 Mơ hình đề xuất tổng thể khai phá thói quen sử dụng phần mềm TBDĐ 20 Hình 3.3 Phân tách liệu theo buổi ngày 22 Hình 3.4 Phân tách liệu theo n ngày 22 Hình 3.5 Phân tách liệu theo khoảng thời gian sử dụng 23 Hình 3.6 Phân tách liệu theo thời gian Itemset 24 Hình 3.7 Trường hợp 1, ứng dụng Itemset 24 Hình 3.8 Trường hợp 2, ứng dụng Itemset 25 Hình 4.1 Giao diện chương trình 30 Hình 4.2 Đồ thị so sánh giải pháp phân tách liệu với minSup ={45% - 65%} 33 Hình 4.3 Đồ thị so sánh giải pháp phân tách liệu với minSup ={35% - 65%} 34 Hình 4.4 Đồ thị so sánh giải pháp phân tách liệu 37 Hình 4.5 Đồ thị so sánh giải pháp phân tách liệu 38 DANH MỤC CÁC KÍ HIỆU VÀ CHỮ VIẾT TẮT Ký hiệu Diễn giải CSDL Cơ sở liệu TBDĐ Thiết bị di động ID Định danh thiết bị di động sử dụng nhà cung cấp mạng viễn thông DANH MỤC CÁC BẢNG Bảng 2.1 Danh sách khách mua hàng 16 Bảng 2.2 Biểu diễn liệu dạng chuỗi 16 Bảng 2.3 Danh mục thỏa mãn điều kiện minsup = 40% 17 Bảng 3.1 Khoảng cách thời gian kiện 26 Bảng 3.2 chuỗi chứa khoảng thời gian phân tách 27 Bảng 3.3 chuỗi chứa khoảng thời gian phân tách 28 Bảng 4.1 Một số mẫu Hình B.1 ý nghĩa phân tách 32 Bảng 4.2 Kết thử nghiệm liệu phân tách theo hành vi 32 Bảng 4.3 Kết thử nghiệm liệu phân tách theo ngày 32 Bảng 4.3 Kết thử nghiệm liệu phân tách theo hành vi 36 Bảng 4.4 Kết thử nghiệm liệu phân tách theo ngày 36 MỞ ĐẦU Hiện nay, xu hướng công nghệ phục vụ người tiêu dùng giới chuyển sang công nghệ di động thể qua việc nhiều hãng tên tuổi giới chuyển sang nghiên cứu, sản xuất đưa thị thiết bị di động (TBDĐ) thông minh Sony, Philips, Panasonic, HP, Microsoft, Lenovo, LG,… Mỗi TBDĐ tích hợp nhiều tính như: điện thoại, máy ảnh, máy quay phim, thiết bị multi media, máy tính, điều khiển từ xa, để phục vụ ngày nhiều nhu cầu người dùng liên lạc, giải trí, khai thác thơng tin, xử lý công việc, kinh doanh trực tuyến, điều khiển thiết bị từ xa,… khách hàng Nhu cầu sử dụng TBDĐ thông minh xu hướng không biên giới quốc gia, tầng lớp dân chúng Chính vậy, hãng sản xuất liên tục tung dòng sản phẩm nhằm chiếm lĩnh thị trường cạnh tranh với đối thủ Từ đó, nhu cầu nghiên cứu hành vi, thói quen, xu hướng sử dụng người dùng TBDĐ đặt cách cấp thiết cho tất hãng sản xuất Nghiên cứu hành vi, thói quen, mạng xã hội người dùng TBDĐ đề tài nóng bỏng giới nay, phục vụ cho nhiều ngành khác tâm lý, xã hội, chiến lược kinh doanh hãng sản xuất,… Do đó, chúng tơi lựa chọn đề tài nghiên cứu thói quen sử dụng phần mềm TBDĐ để làm đề tài khóa luận tốt nghiệp Nghiên cứu hành vi, thói quen sử dụng phần mềm TBDĐ bước cho việc nghiên cứu ngành khác TBDĐ tâm lý, mạng xã hội, phần mềm thuộc vào lớp ứng dụng thiết bị (như lớp nhạc, lớp phim, lớp game, lớp tài chính, lớp liên lạc, …) Nghiên cứu thói quen người sử dụng, thông thường việc nghiên cứu để đưa hành vi mang tính phổ biến, hành vi mang tính quy luật, hành vi mang tính phổ biến tuần tự, … khoảng thời gian không gian định Ứng với đề tài này, việc nghiên cứu để đưa hành vi mang tính phổ biến khoảng thời gian định khơng gian TBDĐ Tuy nhiên, để giới hạn khoảng thời gian để đưa hành vi mang tính phổ biến đối theo trình tự với tập liệu dạng chuỗi dài vấn đề cần quan tâm giải trước đưa giải thuật vào áp dụng Đó mục tiêu nghiên cứu Luận văn Phạm vi nghiên cứu: Nghiên cứu tập liệu ứng dụng kích hoạt TBDĐ sử dụng hệ điều hành Android chuẩn hóa, tức tên ứng dụng quy tên ứng dụng gốc ban đầu (nếu tên ứng dụng người dùng thay đổi), thời gian bắt đầu chạy ứng dụng, thời gian kết thúc thực thi ứng dụng quy chuẩn định dạng giống nhau,… để đưa hành vi mang tính phổ biến có trình tự theo thời gian Chương - GIỚI THIỆU Ngày nay, điện thoại di động thiết bị phổ biến gần phương tiện thiếu người Điện thoại giá thành rẻ, đa dạng lại tích hợp nhiều thiết bị quay phim, chụp ảnh, nghe nhạc, Bluetooth, thiết bị định vị, trình chiếu, máy tính, … phục vụ nhiều nhu cầu người dùng liên lạc, giải trí, kinh doanh (chứng khốn, vàng, kim loại quý khác, dầu mỏ, …), điều khiển từ xa,… Thời gian gần đây, hãng liên tục nghiên cứu, tung thị trường nhiều TBDĐ với mục tiêu chiếm lĩnh thị trường nhiều tốt Bên cạnh đó, có cơng ty phần mềm chuyển hướng sang nghiên cứu phát triển ứng dụng TBDĐ Việc nắm bắt thói quen, hành vi người dùng vấn đề cấp thiết đặt cho doanh nghiệp sản xuất kinh doanh phần mềm TBDĐ Nếu kết nghiên cứu mang tính khả quan từ người ta đưa chiến lược kinh doanh chiến lược phát triển phần mềm tiềm phần mềm tích hợp, phần mềm cần nâng cấp, cải tiến, … Dữ liệu log file TBDĐ lưu trữ hoạt động mà người dùng sử dụng TBDĐ liệu gọi, liệu tin nhắn, liệu ứng dụng, liệu vị trí, liệu thiết bị, mail, game, kinh doanh, liệu Bluetooth,… Từ liệu trên, có số xu hướng nghiên cứu sau: Một số nghiên cứu tìm hành vi, thói quen dựa liệu vị trí liệu Bluetooth Trong [1-4], tác giả dựa vào thơng tin vị trí TBDĐ cung cấp nhà mạng để nghiên cứu, phân loại hành vi, thói quen Nhóm tác giả phân tích, xây dựng mơ hình mối quan hệ xã hội thói quen hàng ngày cá nhân cách sử dụng liệu điện di động cá nhân dựa việc phân loại liệu ID điện thoại di động vào địa điểm khác từ phân tích thói quen hành vi người sử dụng Các nghiên cứu sử dụng liệu thu thông qua Bluetooth để phân biệt ngày tuần cuối tuần Hạn chế nghiên cứu thông tin ID di động cung cấp thơng tin vị trí Nó khơng thể biết hoạt động mức thấp.Ví dụ, liệu ID di động cho biết người sử dụng nhà văn phịng / trường, cho biết hoạt động bên tham dự giảng ngồi quán ăn tự phục vụ mà người dùng tham gia Khắc phục điểm có loạt báo nghiên cứu hành vi cá nhân thông quan kết hợp hai loại liệu liệu từ nhà cung cấp dịch vụ TBDĐ liệu thu từ thiết bị Bluetooth gắn TBDĐ Đặc điểm liệu thu từ thiết bị Bluetooth cho phép lưu lại thông tin kết nối phạm vi nhỏ định danh cá nhân, thiết bị cảm biến Việc áp dụng loại liệu dùng để nghiên cứu để tìm hành vi bất thường cá nhân nhằm phục vụ việc theo dõi người già người có dấu hiệu bệnh trí nhớ báo [6, 7] Trong [6], tác giả trình bày quy trình cho việc phát hành vi khác thường người bên nhà thông minh Tác giả sử dụng cảm biến chuyển động để phát hoạt động mẫu hành vi bất thường người dựa chuỗi Markov Giới hạn công việc họ xem xét hoạt động xảy bên nhà Để phân tích hành vi hoạt động người, số nhà nghiên cứu sử dụng thiết bị khác như, gia tốc, máy ảnh kỹ thuật số micro Một số kỹ thuật trình bày cho phân tích hành vi nhiều cá nhân thay cá nhân đơn lẻ Ví dụ, [8] tác giả đề xuất quy trình xác định hành vi không gian hạn chế Công việc tập trung vào chuyển động bên tòa nhà Tương tự phát hành vi nhiều cá nhân gom nhóm hành động họp trình bày [9] Tuy nhiên, đa số nghiên cứu tập trung vào môi trường nhà, dựa thiết bị cảm biến Do vậy, có vài hạn chế phạm vi ngắn thiết bị phát sóng, pin nguồn kém, khả lưu trữ khơng nhiều, khơng khả thi mơi trường ngồi trời Mạng Nơ ron [10, 11] sử dụng để phát dự đoán chuyển động người dùng dựa ID điện thoại di động xác suất người sử dụng địa điểm khác Trong [5] việc sử dụng xác suất người dùng khác địa điểm khác nhau, họ sử dụng liệu theo thời gian thực ID di động liệu Bluetooth Các tác giả xây dựng lên quy trình để phân tích liệu cho việc xác định hành vi Để đạt mục tiêu đó, nhóm tác giả xây dựng quy trình để thực công đoạn sau: Phân lớp liệu theo vị trí để xác định di chuyển người dùng, xây dựng ma trận xác suất liệu di chuyển dùng để huẩn luyện, sử dụng mạng Nơ ron định (DT) để xác định hành vi bất thường người già người giai đoạn đầu bệnh trí nhớ Một cách tiếp cận khác, nhà nghiên cứu [7] phát kiện bất thường sống người già cô đơn cách khai thác liệu liên quan thu thiết bị cảm biến Họ sử dụng thuật tốn tìm luật kết hợp với cụm thời gian để phân tích hoạt động người cao tuổi Đầu tiên, họ gom cụm hoạt động người cao tuổi với thời gian sau đó, dựa vào kỹ thuật luật kết hợp để tìm tất tập hành động thường xuyên Cao cộng [23] đề xuất cách tiếp cận hiệu cho khai thác thói quen điện thoại di động Họ khai thác mối liên hệ tương tác người dùng với bối cảnh sử dụng, liệu từ file log điện thoại di động sử dụng để khám phá thói quen người dùng Các tác giả đưa thuật toán hiệu để giải toán Các tác giả sử dụng độ hỗ trợ khác nhau, độ tin cậy khác để giải thành cơng tốn khơng cân liệu liệu ngữ cảnh liệu tương tác người dùng với TBDĐ mà phương pháp tiếp cận truyền thống tìm luật kết hợp khơng giải Chúng tơi chọn đề tài tìm hiểu thói quen nhiều người dùng sử dụng phần mềm điện thoại di động hệ điều hành Android Trong đề tài này, tập trung tìm hiểu phân tích thơng tin phần mềm sử dụng TBDĐ Qua việc tìm hiểu liệu này, chúng tơi mong muốn phát thói quen sử dụng phần mềm, loại phần mềm hệ điều hành Android Từ ta xây dựng chiến lược để phát triển phần mềm tiền năng, chiến lược khác kinh tế quảng cáo, tiếp thị,… Cấu trúc luận văn gồm: Chương Cung cấp thơng tin tốn phân tích hành vi người sử dụng TBDĐ Trong chương này, trình bày hướng nghiên cứu hành vi người dùng khác từ liệu thu liên quan TBDĐ Đồng thời, ... điện di động cá nhân dựa việc phân loại liệu ID điện thoại di động vào địa điểm khác từ phân tích thói quen hành vi người sử dụng Các nghiên cứu sử dụng liệu thu thông qua Bluetooth để phân biệt... phân tách liệu 38 DANH MỤC CÁC KÍ HIỆU VÀ CHỮ VIẾT TẮT Ký hiệu Di? ??n giải CSDL Cơ sở liệu TBDĐ Thiết bị di động ID Định danh thiết bị di động sử dụng nhà cung cấp mạng viễn thông DANH MỤC CÁC... mẫu kiện theo trình tự Chúng ta tìm thấy mẫu sự kiê ̣n cụ thể, tìm thấy mẫu qua sự kiê ̣n khác Việc phát mẫu 14 sử dụng rộng rãi việc phân tích trình tự DNA Một ví dụ mẫu chứng khoán Microsoft

Ngày đăng: 25/03/2015, 10:18

Từ khóa liên quan

Mục lục

  • MỤC LỤC

  • DANH MỤC CÁC HÌNH VẼ

  • DANH MỤC CÁC KÍ HIỆU VÀ CHỮ VIẾT TẮT

  • DANH MỤC CÁC BẢNG

  • MỞ ĐẦU

  • Chương 1 - GIỚI THIỆU

  • Chương 2 - TỔNG QUAN KHAI PHÁ MẪU CHUỖI TUẦN TỰ

  • 2.1. Đặc điểm của dữ liệu

  • 2.2. Khai phá dữ liệu mẫu chuỗi tuần tự

  • 2.2.1. Giới thiệu chung

  • 2.2.2. Bài toán Khai phá mẫu chuỗi tuần tự

  • 2.2.3. Một số thuật toán khai phá mẫu tuần tự

  • Chương 3 - MÔ HÌNH ĐỀ XUẤT

  • 3.1. Mô hình đề xuất tổng thể

  • 3.2. Các phương án tách chuỗi

  • 3.3. Tách Itemset trong chuỗi.

  • 3.4. Tính thời gian cho phương án tách chuỗi

  • Chương 4 - THỰC NGHIỆM

  • 4.1 Bộ dữ liệu thứ nhất

  • 4.2. Bộ dữ liệu thứ 2

Tài liệu cùng người dùng

Tài liệu liên quan