(Luận văn thạc sĩ) Áp dụng kỹ thuật khai phá dữ liệu dự báo thuê bao rời mạng trong mạng di động

62 35 0
(Luận văn thạc sĩ) Áp dụng kỹ thuật khai phá dữ liệu dự báo thuê bao rời mạng trong mạng di động

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

(Luận văn thạc sĩ) Áp dụng kỹ thuật khai phá dữ liệu dự báo thuê bao rời mạng trong mạng di động(Luận văn thạc sĩ) Áp dụng kỹ thuật khai phá dữ liệu dự báo thuê bao rời mạng trong mạng di động(Luận văn thạc sĩ) Áp dụng kỹ thuật khai phá dữ liệu dự báo thuê bao rời mạng trong mạng di động(Luận văn thạc sĩ) Áp dụng kỹ thuật khai phá dữ liệu dự báo thuê bao rời mạng trong mạng di động(Luận văn thạc sĩ) Áp dụng kỹ thuật khai phá dữ liệu dự báo thuê bao rời mạng trong mạng di động(Luận văn thạc sĩ) Áp dụng kỹ thuật khai phá dữ liệu dự báo thuê bao rời mạng trong mạng di động(Luận văn thạc sĩ) Áp dụng kỹ thuật khai phá dữ liệu dự báo thuê bao rời mạng trong mạng di động(Luận văn thạc sĩ) Áp dụng kỹ thuật khai phá dữ liệu dự báo thuê bao rời mạng trong mạng di động(Luận văn thạc sĩ) Áp dụng kỹ thuật khai phá dữ liệu dự báo thuê bao rời mạng trong mạng di động(Luận văn thạc sĩ) Áp dụng kỹ thuật khai phá dữ liệu dự báo thuê bao rời mạng trong mạng di động(Luận văn thạc sĩ) Áp dụng kỹ thuật khai phá dữ liệu dự báo thuê bao rời mạng trong mạng di động(Luận văn thạc sĩ) Áp dụng kỹ thuật khai phá dữ liệu dự báo thuê bao rời mạng trong mạng di động(Luận văn thạc sĩ) Áp dụng kỹ thuật khai phá dữ liệu dự báo thuê bao rời mạng trong mạng di động

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN NGỌC TUÂN ÁP DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU DỰ BÁO THUÊ BAO RỜI MẠNG TRONG MẠNG DI ĐỘNG LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội - 2016 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN NGỌC TUÂN ÁP DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU DỰ BÁO THUÊ BAO RỜI MẠNG TRONG MẠNG DI ĐỘNG Ngành: Công nghệ Thông tin Chuyên ngành: Hệ thống Thông tin Mã số: 60480104 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN HÀ NAM Hà Nội - 2016 LỜI CẢM ƠN Tôi xin gửi lời cảm ơn sâu sắc tới PGS.TS.Nguyễn Hà Nam, Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội, người thầy dành nhiều thời gian tận tình bảo, hướng dẫn, giúp đỡ tơi suốt q trình tìm hiểu, nghiên u Thầy người đ nh hướng đưa nhiều góp ý q báu q trình th c luận văn Tôi xin chân thành cảm ơn thầy, cô khoa Công nghệ thông tin – Trường Đại học Công nghệ - ĐHQGHN cung cấp cho kiến thức tạo cho tơi điều kiện thuận lợi suốt q trình tơi học tập trường Tơi bày tỏ lịng biết ơn s giúp đỡ lãnh đạo quan, đồng nghiệp cung cấp liệu, tài liệu cho lời khuyên quý báu Tôi xin cảm ơn gia đình, người thân, bạn bè thành viên nhóm nghiên cứu ln động viên tạo điều kiện tốt cho Tôi xin chân thành cảm ơn! Hà Nội, tháng năm 2016 Họ tên Nguyễn Ngọc Tuân LỜI CAM ĐOAN Tôi xin cam đoan đề tài nghiên cứu riêng tôi, th c s hướng dẫn PGS.TS Nguyễn Hà Nam Các kết nêu luận văn trung th c chưa cơng bố cơng trình khác Hà Nội, tháng năm 2016 Họ tên Nguyễn Ngọc Tuân MỤC LỤC LỜI CẢM ƠN LỜI CAM ĐOAN DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT .5 DANH MỤC CÁC BẢNG DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ LỜI MỞ ĐẦU Chương Giới thiệu tổng quan mạng di động kiến thức sở liên quan 1.1 Giới thiệu mạng di động 1.2 Sơ lược tình hình nghiên cứu giới 1.3 Phát biểu toán .11 1.3.1 Chu trình thuê bao di động 11 1.3.2 Phát biểu toán 13 1.4 Kết luận chương 13 Chương 2.1 Khai phá liệu kỹ thuật phân tích d báo 14 Khai phá liệu .14 2.1.1 Khái niệm KPDL .14 2.1.2 Những nhóm tốn KPDL 15 2.1.3 Các bước xây d ng giải pháp KPDL 16 2.1.4 Ứng dụng KPDL viễn thông 17 2.2 Một số kỹ thuật KPDL phân lớp, d báo .18 2.2.1 Cây đ nh 18 2.2.2 Phân lớp Naïve Bayes .22 2.2.3 Mạng nơ ron nhân tạo .23 2.2.4 Luật kết hợp 24 2.2.5 Đánh giá độ xác thuật tốn 27 2.3 Giới thiệu công cụ weka 28 2.4 Kết luận chương 28 Chương Giải pháp phát thuê bao di động có khả rời mạng 29 3.1 Giải pháp chung: 29 3.2 Giải pháp mạng MobiFone 29 3.3 Giải pháp đề xuất .30 3.3.1 Giải pháp đề xuất dùng kỹ thuật khai phá liệu 30 3.3.2 Giải pháp đề xuất sau cải tiến .30 3.4 Mô hình đề xuất áp dụng th c tế .31 Chương Th c nghiệm đánh giá kết .33 4.1 Chuẩn b liệu .33 4.2 Mô tả liệu th c nghiệm .34 4.3 Kết th c nghiệm theo phương pháp .35 4.4 Kết th c nghiệm d a khai phá liệu .37 4.4.1 Kết th c nghiệm d a giải pháp khai phá liệu 37 4.4.2 Kết th c nghiệm d a khai phá liệu cải tiến .41 4.5 So sánh đánh giá kết 47 4.6 Kết luận chương 49 KẾT LUẬN 50 Phụ lục THÔNG TIN BỘ DỮ LIỆU 52 PHỤ LỤC PHÂN TÍCH ĐĂC TRƯNG BỘ DỮ LIỆU THỰC NGHIỆM .55 Nhóm 55 Nhóm 55 Nhóm 56 Nhóm 57 Nhóm 58 Phụ lục Đặc trưng phân lớp giải pháp MobiFone áp dụng 59 Nhóm 59 Nhóm 2: 59 Nhóm 3: 59 Nhóm 4: 59 Nhóm 5: 60 DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Chữ viết tắt Ý nghĩa KPDL Khai phá liệu CSDL Cơ sở liệu OLAP Online analytical processing MobiFone Tổng công ty Viễn thông MobiFone VLR Visitor Location Register Tổng đài ghi nhận đăng nhập mạng thuê bao di động 3K3D_VLR Chỉ tiêu xác đ nh thuê bao tháng có > ngày nhập mạng VLR phát sinh doanh thu >3000 GSM Global System for Mobile Communications Mạng thông tin di động CDR Call Data Record CLV Giá tr vòng đời khách hàng (custommer lifecycle value) DANH MỤC CÁC BẢNG Bảng 2-1 Các độ đo xác .27 Bảng 4-1 Nhóm thuê bao theo đặc trưng .34 Bảng 4-2 Các nhóm liệu mẫu 35 Bảng 4-3 Tổng hợp kết phương pháp 37 Bảng 4-4 Bảng tổng hợp kết theo giải pháp khai phá liệu 41 Bảng 4-5 Tổng hợp độ xác giải pháp đề xuất .47 DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ Biểu đồ 4-1 So sánh độ đo Accuracy ba giải pháp 48 Biểu đồ 4-2 So sánh thời gian xây d ng mơ hình giải pháp đề xuất đề xuất cải tiến 48 Biểu đồ 4-3 So sánh thời gian d báo 49 Hình 1-1 Th phần thuê bao di động tính đến 2013 [2] .9 Hình 1-2 Vịng đời th bao 12 Hình 2-1 Các bước xây d ng hệ thống KPDL [1] 14 Hình 2-2 Biểu diễn đ nh 18 Hình 2-3 Cây đ nh cho việc chơi Tennis .19 Hình 2-4 Mơ hình mạng nơron nhiều lớp 23 Hình 2-5 Tiến trình học 24 Hình 3-1 Giải pháp chung cho tốn d báo thuê bao rời mạng .29 Hình 3-2 Giải pháp MobiFone áp dụng 30 Hình 3-3 Giải pháp đề xuất dùng kỹ thuật khai phá liệu 30 Hình 3-4 Giải pháp đề xuất cải tiến .30 Hình 3-5 Mơ hình đề xuất áp dụng th c tế 31 Hình 4-1 Kết nhóm giải pháp đề xuất 38 Hình 4-2 Kết nhóm giải pháp đề xuất 39 Hình 4-3 Kết nhóm giải pháp đề xuất 39 Hình 4-4 Kết nhóm giải pháp đề xuất 40 Hình 4-5 Kết nhóm giải pháp đề xuất 40 Hình 4-6 Kết nhóm giải pháp đề xuất cải tiến thử nghiệm 42 Hình 4-7 Kết nhóm giải pháp đề xuất cải tiến sau tối ưu 43 Hình 4-8 Kết nhóm giải pháp đề xuất cải tiến 44 Hình 4-9 Kết nhóm giải pháp đề xuất cải tiến 45 Hình 4-10 Kết nhóm giải pháp đề xuất sau cải tiến 46 Hình 4-11 Kết nhóm giải pháp đề xuất cải tiến 47 LỜI MỞ ĐẦU Thuê bao rời mạng vấn đề “đau đầu” nhà mạng nước giới lẽ khách hàng (thuê bao) người mang lại doanh thu trì hoạt động nhà mạng Để trì phát triển hoạt động kinh doanh mình, nhà mạng phải tìm cách để phát triển thuê bao đồng thời phải tìm cách để trì hoạt động thuê bao hữu Theo nghiên cứu th c tế triển khai nhà mạng cho thấy, tổng chi phí để phát triển thuê bao cao nhiều so với việc trì thuê bao hữu Trong đó, doanh thu từ thuê bao hữu (đặc biệt thuê năm) cao nhiều so với doanh thu thuê bao (theo thống kê MobiFone thuê năm có doanh thu trung bình cao 48% so th bao mới) Chính lý trên, nhà mạng giới khơng ngừng tìm kiếm giải pháp nghiên cứu phát triển ứng dụng để xác đ nh, d đốn sớm th bao có khả rời mạng để có biện pháp k p thời tác động nhằm trì th bao hoạt động Xuất phát từ yêu cầu đặt đơn v mình, tơi th c đề tài luận văn “ÁP DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU DỰ BÁO THUÊ BAO RỜI MẠNG TRONG MẠNG DI ĐỘNG” Luận văn sâu vào việc áp dụng kỹ thuật khai phá liệu từ hành vi sử dụng thuê bao di động từ d báo thuê bao có khả rời mạng Luận văn gồm có phần mở đầu, kết luận 04 chương, cụ thể sau: Chương 1: Giới thiệu tổng quan mạng di động vấn đề liên quan Chương trình bày tổng quan mạng di động, thuê bao rời mạng Phát biểu toán nghiên cứu liên quan Chương 2: Khai phá liệu kỹ thuật phân tích dự báo Nghiên cứu sở lý thuyết KPDL, vấn đề liên quan đến KPDL toán d báo thuê bao rời mạng Tìm hiểu kỹ thuật khai phá liệu sử dụng toán phân lớp, d báo (chuẩn b liệu, l a chọn thuộc tính, phân tích đặc trưng, đ nh, …) áp dụng kỹ thuật KPDL ứng dụng WEKA Chương 3: Giải pháp phát thuê bao di động có khả rời mạng Các phương pháp để phát thuê bao di động có khả rời mạng bao gồm kỹ thuật d a vào đặc trưng thuê bao, phương pháp ứng dụng kỹ thuật khai phá liệu Chương 4: Thực nghiệm đánh giá kết Nội dung chủ yếu áp dụng mơ hình tìm hiểu vào việc d báo thuê bao rời mạng Trước tiên áp dụng kỹ thuật toàn liệu chuẩn b với mơ hình phân tích đặc trưng, đ nh đánh giá Tiếp theo sử dụng kỹ thuật l a chọn thuộc tính để cải tiến tốc độ xử lý đánh giá độ xác mơ hình d báo Cuối tiến hành đánh giá kết d báo mơ hình đưa mơ hình d báo khuyến ngh để áp dụng vào tốn th c tế Hình 4-10 Kết nhóm giải pháp đề xuất sau cải tiến 4.4.2.5 Nhóm 5: Tập liệu: 156.000 TB, đó: 20.000 TB rời mạng, 136.000 TB không rời mạng Kết với trích chọn thuộc tính 46 Hình 4-11 Kết nhóm giải pháp đề xuất cải tiến 4.4.2.6 Đánh giá mơ hình Từ kết kiểm nghiệm mục 3.3, ta tính tốn độ xác d đốn nhóm th bao d a vào công thức đưa sau: Tên độ đo Accuracy Error_Rate Recall Precision Thời gian xây d ng mơ hình (giây) Thời gian d báo (giây) Nhóm 99.2% 0.8% 96.5% 97.1% Nhóm 98.8% 1.2% 98.8% 94.1% Nhóm 98.8% 1.2% 99.3% 99.4% Nhóm 99.3% 0.7% 99.4% 99.8% Nhóm 98.9% 1.1% 96.6% 95.3% 16 7 0.13 0.07 0.05 0.24 0.05 Bảng 4-5 Tổng hợp độ xác giải pháp đề xuất cải tiến 4.5 So sánh đánh giá kết Để đánh giá kết th c nghiệm ta so sánh độ xác (độ đo Accuracy) giải pháp th c sau: 47 So sánh độ xác 100% 080% 060% 040% 020% 000% nhóm nhóm Phương pháp Nhóm Giải pháp đề xuất Nhóm Nhóm Giải pháp đề xuất cải tiến Biểu đồ 4-1 So sánh độ đo Accuracy ba giải pháp Nhận xét: giải pháp MobiFone sử dụng có độ xác thấp nhất, nhóm độ xác nhỏ gần tương đương với độ xác giải pháp dùng thuật tốn khai phá liệu, nhóm 1,2 độ xác thấp đáng kể so với giải pháp dùng khai phá liệu đặc biệt nhóm thấp nhiều (78,4% so với 98,8%) Qua việc so sánh độ xác giải pháp ta nhận thấy đặc trưng nhóm thuê bao nhóm 3,4 nhóm nhận đ nh thuê bao rời mạng, nhóm nhận đ nh nhóm mục tiêu để d báo kết giải pháp MobiFone chưa cao giải pháp đề xuất cho kết cao Độ xác giải pháp đề xuất giải pháp đề xuất sau cải tiến tương đương Để đánh giá tiếp giải pháp trước sau cải tiến ta tiếp tục đánh giá thời gian xây d ng mơ hình thời gian d báo hai giải pháp kết biểu đồ dưới: So sánh thời gian xây dựng mơ hình (giây) 120 100 96 86 80 68 60 44 40 20 16 16 7 nhóm nhóm Giải pháp đề xuất Nhóm Nhóm Nhóm Giải pháp đề xuất cải tiến Biểu đồ 4-2 So sánh thời gian xây d ng mơ hình giải pháp đề xuất đề xuất cải tiến 48 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 nhóm nhóm Giải pháp đề xuất Nhóm Nhóm Nhóm Giải pháp đề xuất cải tiến Biểu đồ 4-3 So sánh thời gian d báo Qua biểu đồ ta thấy rõ thời gian xây d ng mơ hình thời gian d báo giải pháp sau cải tiến nhiều so với giải pháp trước cải tiến Do giải pháp đề xuất cải tiến đạt mục tiêu đề ban đầu đưa giải pháp với độ gần tương đương (có thể giảm) nhiên thời gian xây d ng mơ hình thời gian d báo nhanh 4.6 Kết luận chương Chương trình bày kết th c nghiệm d a phương pháp th c chương Qua th c nghiệm ta có nhận xét sau: Kết dùng thuật toán khai phá liệu cao so với phương pháp th c 49 KẾT LUẬN Từ việc nghiên cứu yêu cầu cấp thiết đặt công tác trì phát triển thuê bao mạng di động, luận văn đạt số kết sau đây: - Xây d ng mơ hình d báo áp dụng kỹ thuật khai phá liệu để phát nhanh xác th bao di động có khả rời mạng từ áp dụng giải pháp để trì th bao - Triển khai mơ hình đề xuất, áp dụng liệu th c tế, so sánh với giải pháp sử dụng áp dụng Các kết đạt cho thấy tiềm áp dụng phương pháp đề xuất vào th c tiễn Trong thời gian tới nghiên cứu tích hợp kỹ thuật vào chương trình hỗ trợ kinh doanh MobiFone đồng thời cải tiến thời gian d báo kết d báo Trong thời gian tới tiếp tục cập nhật mơ hình với liệu củ a MobiFone để kết d đoán cải thiện 50 TÀI LIỆU THAM KHẢO Tiếng Việt [1] [2] [3] Phan Xuân Hiếu (2013),Bài giảng môn học KPDL kho liệu, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Bộ Thông tin Truyền thông (2014),Sách Trắng Công nghệ thông tin Truyền thông (CNTT-TT) Việt Nam 2014, Nhà xuất Thông tin Truyền thông, Hà nội Hà Quang Thụy (2010),Bài giảng môn học Kho liệu KPDL, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Tiếng Anh [4] [5] [6] [7] [8] [9] [10] [11] Leo Breiman, Jerome Friedmen, and Charles J Stone (1984),Classification and Regression Trees, Wadsworth International Group M Chandar, Laha, A., & Krishna, P (2006),Modeling churn behavior of bank customers using predictive data mining techniques, National conference on soft computing techniques for engineering applications Jiawei Han and Micheline Kamber (2012),Data Mining Concepts and Techniques, Third Edition ed Elsevier Inc John Ross Quinlan (1993),C4.5: Programs for Machine Learning, Morgan Kaufmann Publishers John Ross Quinlan, Induction of decision trees, in Machine Learning 1986 p 81-106 J Burez, & Van den Poel, D (2009), Handling class imbalance in customer churn prediction, Expert System with Applications,36, 4626-4636 S Olafsson, Li, X., & Wu, S (2008), Operations research and data mining, European Journal of Operational Research,187, 2592-1448 Weka - Data Mining with Open Source Machine Learning Software in Java Available from: http://www.cs.waikato.ac.nz/ml/weka/ 51 Phụ lục THÔNG TIN BỘ DỮ LIỆU Thông tin trường liệu STT 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 Tên trường GRAND_PACKAGE_ID STA_DATETIME CUS_TYPE STATUS_ID IS_MEMBER RANK_ID AREA_SK_PSC_N AREA_SK_PSC_N1 AREA_SK_PSC_N2 Ý nghĩa Mã gói cước thuê bao sử dụng Ngày bắt đầu sử dụng thuê bao Loại khách hàng (cá nhân /doanh nghiêp) Trạng thái thuê bao Mã thể có tham gia chương trình kết nối dài lâu Hạng thuê bao chương trình kết nối dài lâu Khu vực phát sinh cước tháng n-1 Khu vực phát sinh cước tháng n-2 Khu vực phát sinh cước tháng n-3 Doanh thu tài khoản dịch vụ thoại nội DTKC_THOAI_NOI_N mạng tháng n-1 Doanh thu tài khoản khuyến mại dịch vụ thoại TKKM_THOAI_NOI_N nội mạng tháng n-1 Doanh thu tài khoản dịch vụ thoại liên DTTKC_THOAI_LIEN_MANG_N mạng tháng n-1 Doanh thu tài khoản khuyến mại dịch vụ thoại DTTKM_THOAI_LIEN_MANG_N liên mạng tháng n-1 Doanh thu tài khoản dịch vụ sms nội mạng DTTKC_SMS_NOI_N tháng n-1 Doanh thu tài khoản khuyến mại dịch vụ sms nội DTTKM_SMS_NOI_N mạng tháng n-1 Doanh thu tài khoản dịch vụ sms liên DTTKC_SMS_LIEN_MANG_N mạng tháng n-1 Doanh thu tài khoản khuyến mại dịch vụ sms DTTKM_SMS_LIEN_MANG_N liên mạng tháng n-1 Doanh thu tài khoản dịch vụ data tháng nDTTKC_DATA_N Doanh thu tài khoản khuyến mại dịch vụ data DTTKM_DATA_N tháng n-1 Doanh thu tài khoản dịch vụ khác tháng nDTTKC_KHAC_N Doanh thu tài khoản khuyến mại dịch vụ khác DTTKM_KHAC_N tháng n-1 Doanh thu tài khoản dịch vụ thoại nội DTKC_THOAI_NOI_N1 mạng tháng n-2 Doanh thu tài khoản khuyến mại dịch vụ thoại TKKM_THOAI_NOI_N1 nội mạng tháng n-2 Doanh thu tài khoản dịch vụ thoại liên DTTKC_THOAI_LIEN_MANG_N1 mạng tháng n-2 Doanh thu tài khoản khuyến mại dịch vụ thoại DTTKM_THOAI_LIEN_MANG_N1 liên mạng tháng n-2 Doanh thu tài khoản dịch vụ sms nội mạng DTTKC_SMS_NOI_N1 tháng n-2 Doanh thu tài khoản khuyến mại dịch vụ sms nội DTTKM_SMS_NOI_N1 mạng tháng n-2 DTTKC_SMS_LIEN_MANG_N1 Doanh thu tài khoản dịch vụ sms liên 52 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 mạng tháng n-2 Doanh thu tài khoản khuyến mại dịch vụ sms DTTKM_SMS_LIEN_MANG_N1 liên mạng tháng n-2 Doanh thu tài khoản dịch vụ data tháng nDTTKC_DATA_N1 Doanh thu tài khoản khuyến mại dịch vụ data DTTKM_DATA_N1 tháng n-2 Doanh thu tài khoản dịch vụ khác tháng nDTTKC_KHAC_N1 Doanh thu tài khoản khuyến mại dịch vụ khác DTTKM_KHAC_N1 tháng n-2 Doanh thu tài khoản dịch vụ thoại nội DTKC_THOAI_NOI_N2 mạng tháng n-3 Doanh thu tài khoản khuyến mại dịch vụ thoại TKKM_THOAI_NOI_N2 nội mạng tháng n-3 Doanh thu tài khoản dịch vụ thoại liên DTTKC_THOAI_LIEN_MANG_N2 mạng tháng n-3 Doanh thu tài khoản khuyến mại dịch vụ thoại DTTKM_THOAI_LIEN_MANG_N2 liên mạng tháng n-3 Doanh thu tài khoản dịch vụ sms nội mạng DTTKC_SMS_NOI_N2 tháng n-3 Doanh thu tài khoản khuyến mại dịch vụ sms nội DTTKM_SMS_NOI_N2 mạng tháng n-3 Doanh thu tài khoản dịch vụ sms liên DTTKC_SMS_LIEN_MANG_N2 mạng tháng n-3 Doanh thu tài khoản khuyến mại dịch vụ sms DTTKM_SMS_LIEN_MANG_N2 liên mạng tháng n-3 Doanh thu tài khoản dịch vụ data tháng nDTTKC_DATA_N2 Doanh thu tài khoản khuyến mại dịch vụ data DTTKM_DATA_N2 tháng n-3 Doanh thu tài khoản dịch vụ khác tháng nDTTKC_KHAC_N2 Doanh thu tài khoản khuyến mại dịch vụ khác DTTKM_KHAC_N2 tháng n-3 REMAIN_CREDIT Số tiền cịn lại tài khoản tháng trước REMAIN_BONUS Số tiền lại tài khoản thưởng tháng trước MONTH_3K3D_NEAREST Tháng đạt tiêu 3k3d gần NUM_OG_CALLS Số lượng gọi thoại chiều tháng n-1 SUM_DURATION_OG Số lượng lưu lượng thoại chiều tháng n-1 SUM_DURATION_IC số lượng lưu lượng thoại đến tháng n-1 NUM_SMO Số lượng sms chiều tháng n-1 NUM_SMT Số lượng sms chiều đến tháng n-1 NUM_OG_CALLS_N1 Số lượng gọi thoại chiều tháng n-2 SUM_DURATION_OG_N1 Số lượng lưu lượng thoại chiều tháng n-2 SUM_DURATION_IC_N1 số lượng lưu lượng thoại đến tháng n-2 NUM_SMO_N1 Số lượng sms chiều tháng n-2 NUM_SMT_N1 Số lượng sms chiều đến tháng n-2 NUM_OG_CALLS_N2 Số lượng gọi thoại chiều tháng n-3 SUM_DURATION_OG_N2 Số lượng lưu lượng thoại chiều tháng n-3 53 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 SUM_DURATION_IC_N2 NUM_SMO_N2 NUM_SMT_N2 SCR_AMOUNT_N SCR_COUNT_N SCR_AMOUNT_N1 SCR_COUNT_N1 SCR_AMOUNT_N2 SCR_COUNT_N2 DEBIT_N MONTH_DEBIT_N DEBIT_N1 MONTH_DEBIT_N1 DEBIT_N2 MONTH_DEBIT_N2 NUM_VLR_N NUM_VLR_N1 NUM_VLR_N2 NUM_PSC_N NUM_PSC_N1 NUM_PSC_N2 PHONE_MODEL PROM_CODE_N PROM_CODE_N1 PROM_CODE_N2 RM số lượng lưu lượng thoại đến tháng n-3 Số lượng sms chiều tháng n-3 Số lượng sms chiều đến tháng n-3 Số tiền nạp thẻ tháng n-1 Số lượng thẻ nạp tháng n-1 Số tiền nạp thẻ tháng n-2 Số lượng thẻ nạp tháng n-2 Số tiền nạp thẻ tháng n-3 Số lượng thẻ nạp tháng n-3 Nợ tiền nợ cước tháng n-1 Số tháng nợ cước tính đến tháng n-1 Nợ tiền nợ cước tháng n-2 Số tháng nợ cước tính đến tháng n-2 Nợ tiền nợ cước tháng n-3 Số tháng nợ cước tính đến tháng n-3 Số ngày cập nhật VLR tháng n-1 Số ngày cập nhật VLR tháng n-2 Số ngày cập nhật VLR tháng n-3 Số ngày phát sinh cước tháng n-1 Số ngày phát sinh cước tháng n-2 Số ngày phát sinh cước tháng n-3 Nhãn hiệu máy khách hàng dùng Số chương trình khuyến mại tham gia tháng n-1 Số chương trình khuyến mại tham gia tháng n-2 Số chương trình khuyến mại tham gia tháng n-3 Trường đánh dấu rời mạng 54 PHỤ LỤC PHÂN TÍCH ĐĂC TRƯNG BỘ DỮ LIỆU THỰC NGHIỆM Nhóm MobiFone đưa tiêu chí thuê bao 3k3d_vlr để nhằm thống kê thuê bao sử dụng thật thuê bao ảo (thuê bao nằm kênh phân phối, thuê bao khách hàng mua dùng để nhắn tin rác, …) Theo đó, thuê bao đạt chuẩn 3k3d_vlr thuê bao thỏa mãn đồng thời tiêu chí sau: (1) tiêu dùng tối thiểu 3.000đ từ tài khoản (2) cập nhật vlr (mở máy) tối thiểu ngày Do vậy, mốc tiêu dùng 3.000đ từ tài khoản mốc cập nhật vlr ngày mốc quan trọng để đánh giá thuê bao Trong phần này, nhóm chun gia th c phân tích nhóm th bao khơng phát sinh cước tháng 8/2015 có tiêu dùng tài khoản khơng đạt 3k3d_vlr tháng trước (tháng 7/2015) Nhóm gồm thuê bao thỏa mãn điều kiện sau: - Tiêu dùng tài khoản 3.000đ tháng 7/2015 Hoặc: - Tiêu dùng tài khoản từ 3.000đ trở lên cập nhật VLR ngày tháng 7/2015 Sau phân tích nhóm rút đặc điểm đặc trưng tập thuê bao trước rời mạng (không phát sinh cước) sau: - Tiêu dùng tài khoản 3.000đ tháng trước - Chỉ đạt 3k3d_vlr đến lần tháng liên tục - Không phát sinh giao dịch phát sinh đến giao dịch thoại chiều tháng trước - Không phát sinh giao dịch thoại chiều đến tháng trước - Có xu hướng giảm dần số lượng giao dịch thoại chiều đến tháng liên tục giảm sản lượng thoại chiều đến tháng liên tục - Hầu không phát sinh giao dịch nạp thẻ tháng liền trước - Có xu hướng giảm tần suất nạp thẻ tháng liên tiếp Nhóm Nhóm có 67.565 thuê bao, chiếm tỷ trọng cao MobiQ (51,07%), MobiCard (26,84%), Zone+ (9,55%) Trong cấu thuê bao MobiFone tại, MobiQ chiếm khoảng 49%, MobiCard chiếm khoảng 12%, Zone+ chiếm khoảng 12% 55 Như vậy, rõ ràng nhóm thuê bao MobiCard có tỉ lệ rời mạng cao nhóm khác Sau phân tích nhóm chun gia rút đặc điểm đặc trưng tập thuê bao trước rời mạng (không phát sinh cước) sau: - Tiêu dùng TKC ≥ 3.000đ tiêu dùng TKKM < 3.000đ tháng trước - Có mức tiêu dùng TKKM giảm dần tháng liên tục - Không phát sinh giao dịch phát sinh đến giao dịch thoại chiều tháng trước - Không phát sinh giao dịch phát sinh đến giao dịch sms chiều tháng trước - Không phát sinh giao dịch thoại chiều đến tháng trước - Có xu hướng giảm dần số lượng giao dịch thoại chiều tháng liên tục - Có xu hướng giảm dần số lượng giao dịch sms chiều tháng liên tục - Có xu hướng giảm dần số lượng giao dịch thoại chiều đến tháng liên tục - Hầu không phát sinh giao dịch nạp thẻ tháng liền trước có tần suất nạp thẻ giảm dần tháng liên tục - Có xu hướng giảm dần số ngày cập nhật VLR tháng liên tục Nhóm Nhóm gồm 219.993 thuê bao, MobiQ chiếm tỷ trọng cao với 82,16% MobiQ loại thuê bao có ngày sử dụng linh hoạt, dễ dàng cho khách hàng trì số th bao mà khơng cần tiêu dùng đến TKC Sau phân tích nhóm chuyên gia rút phần lớn thuê bao thuộc nhóm nằm kênh nằm ngăn kéo (KH mua không sử dụng nữa) Đặc điểm nhóm sau: - Chủ yếu loại hình th bao MobiQ - Hầu khơng đạt 3k3d_vlr nhiều tháng liên tục (chỉ có 7,5% th bao thuộc nhóm có đạt 3k3d_vlr lần tháng liên tiếp) - Hầu không tiêu dùng tài khoản tháng liên tục (tỉ lệ đạt 90%) 56 - Có mức tiêu dùng TKKM thấp < 3.000đ/tháng tháng liên tục (tỉ lệ đạt 90%) - Hầu không phát sinh giao dịch thoại chiều phát sinh giao dịch (chiếm 95% tháng liên tiếp) - Hầu không phát sinh giao dịch sms chiều phát sinh giao dịch (chiếm 94% tháng liên tiếp) - Hầu không phát sinh giao dịch thoại chiều đến (chiếm 96% tháng liên tiếp) - Hầu không phát sinh phát sinh sms chiều đến (chiếm 91% tháng liên tiếp) - Theo xu hướng giảm sản lượng thoại đến tháng liên tiếp (khoảng 97%) - Chỉ mở máy ngày (chiếm 91% tháng liên tiếp) - Hầu không nạp thẻ tháng trước rời mạng (chỉ có 0,44% nạp thẻ) - Theo xu hướng giảm tần suất nạp thẻ tháng liên tiếp (khoảng 98% thuê bao thể xu hướng này) Nhóm Bản chất nhóm rời mạng (khơng phát sinh cước) từ tháng 7/2015 Nhóm gồm có 1.067.414 thuê bao, chiếm tỉ trọng cao MobiCard (37,69%), MobiQ (27,30%) Mobi365 (21,02%) Trong đó, xét tỉ trọng thuê bao PSC tháng 8/2015 toàn mạng, MobiCard chiếm 12,23%, Mobi365 chiếm 2,64% MobiQ chiếm tới 48,81% Sau phân tích nhóm chun gia có nhận xét đặc điểm nhận dạng nhóm thuê bao sau: - Tiêu dùng TKC (dưới 3000đ) tháng liên tiếp - Tiêu dùng TKKM (dưới 3000đ) tháng liên tiếp - Có xu hướng tiêu dùng TKC TKKM giảm dần tháng liên tiếp (95% thuê bao thể rõ xu hướng này) - Không phát sinh phát sinh giao dịch thoại chiều tháng liên tiếp - Không phát sinh phát sinh giao dịch sms chiều tháng liên tiếp 57 - Có xu hướng giảm dần số lượng giao dịch thoại chiều tháng liên tiếp (93,26% thuê bao thể xu hướng này) - Có xu hướng giảm dần số lượng giao dịch sms chiều tháng liên tiếp (93,9% thể xu hướng này) - Có xu hướng giảm dần số lượng giao dịch sms chiều đến tháng liên tiếp (91,41% thuê bao thể xu hướng này) - Có xu hướng giảm dần số lượng giao dịch thoại chiều đến tháng liên tiếp (91,41% thuê bao thể xu hướng này) - Có xu hướng giảm dần số ngày cập nhật VLR tháng liên tiếp (88,94% thể xu hướng này) - Hầu không nạp thẻ vào tháng liền trước có xu hướng giảm tần suất nạp thẻ tháng liên tiếp Nhóm Nhóm gồm 105.703 thuê bao, chiếm tỷ trọng cao MobiQ (56,68%), MobiCard (15,32%) Zone+ (10,87%) Trong số này, 10,17% thuê bao hội viên chương trình Kết nối dài lâu Sau phân tích nhóm chun gia có nhận xét đặc điểm nhận dạng nhóm thuê bao sau: - Nhóm thuê bao hoạt động bình thường mạng: Vẫn nạp thẻ, phát sinh giao dịch thoại đi/đến với tỉ lệ cao, số ngày cập nhật VLR nhiều (≥3 ngày) - Số tiền cịn lại TKC thấp (trên 60% th bao có số tiền TKC 3.000đ) - Doanh thu TKC từ dịch vụ sms (nội mạng liên mạng) thấp (dưới 3.000đ/tháng) - Doanh thu TKKM từ dịch vụ sms (nội mạng liên mạng) thấp (dưới 3.000đ/tháng) 58 Phụ lục Đặc trưng phân lớp giải pháp MobiFone áp dụng Nhóm - Tiêu chí phân lớp: Thuê bao trả trước thỏa mãn đồng thời tiêu chí sau: o Tiêu dùng tài khoản 3.000đ tháng trước o Phát sinh giao d ch thoại chiều tháng trước o Giảm dần số lượng giao d ch thoại chiều đến tháng liên tục liền trước (số giao d ch tháng sau nhỏ số giao d ch tháng trước) o Giảm dần số lượng giao d ch thoại chiều đến tháng liên tục liền trước Nhóm 2: - Tiêu chí phân lớp: o Tiêu dùng TKC ≥ 3.000đ tháng trước o Cập nhật VLR < ngày tháng trước o Phát sinh giao d ch thoại chiều tháng trước o Không phát sinh giao d ch thoại chiều đến tháng trước Nhóm 3: - Tiêu chí phân lớp: o Khơng tiêu dùng TKC tháng trước (Tiêu dùng TKC= 0) o Tiêu dùng TKKM > tháng trước o Không nạp thẻ tháng trước o Có tần suất nạp thẻ giảm dần tháng liên tục liền trước (số lần nạp thẻ tháng sau nhỏ số lần nạp thẻ tháng trước) o Có xu hướng giảm dần số lượng giao d ch thoại chiều đến (hoặc giảm dần sản lượng gọi chiều đến) tháng liên tục liền trước Nhóm 4: - Tiêu chí phân lớp: o Không tiêu dùng TKC tháng trước (Tiêu dùng TKC= 0) 59 o Không tiêu dùng TKKM tháng trước (Tiêu dùng TKKM= 0) o Có số ngày cập nhật VLR giảm dần tháng liên tiếp liền trước (số ngày cập nhật VLR tháng sau nhỏ số ngày cập nhật tháng trước) o Khơng nạp thẻ tháng trước o Có tần suất nạp thẻ giảm dần tháng liên tục liền trước (số lần nạp thẻ tháng sau nhỏ số lần nạp thẻ tháng trước) Nhóm 5: - Tiêu chí phân lớp: o Tiêu dùng TKC ≥ 3.000đ tháng trước o Cập nhật VLR ≥ ngày tháng trước o Có số tiền lại TKC thời điểm cuối tháng trước < 5.000đ o Tiêu dùng TKC < 3.000đ cho d ch vụ sms (nội mạng liên mạng) tháng trước o Tiêu dùng TKKM < 3.000đ cho d ch vụ sms (nội mạng liên mạng) tháng trước 60 ... Giải pháp phát thuê bao di động có khả rời mạng Các phương pháp để phát thuê bao di động có khả rời mạng bao gồm kỹ thuật d a vào đặc trưng thuê bao, phương pháp ứng dụng kỹ thuật khai phá liệu Chương... th bao hoạt động Xuất phát từ u cầu đặt đơn v mình, tơi th c đề tài luận văn ? ?ÁP DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU DỰ BÁO THUÊ BAO RỜI MẠNG TRONG MẠNG DI ĐỘNG” Luận văn sâu vào việc áp dụng kỹ thuật. .. tế toán: dự báo thuê bao di động rời mạng, luận văn trình bày kết th c nghiệm đạt phương pháp nêu 4.1 Chuẩn bị liệu Yêu cầu thu thập liệu: Dữ liệu sử dụng luận văn liệu th c tế mạng di động MobiFone

Ngày đăng: 07/10/2020, 14:31

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan