Luận văn nghiên cứu một số phương pháp hồi quy dữ liệu và ứng dụng vào bài toán tính điểm rủi ro của doanh nghiệp phục vụ thanh tra thuế

82 283 0
Luận văn nghiên cứu một số phương pháp hồi quy dữ liệu và ứng dụng vào bài toán tính điểm rủi ro của doanh nghiệp phục vụ thanh tra thuế

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

B ộ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC s PHẠM HÀ NỘI PHẠM THỊ PHƯƠNG NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP HỒI QUY DỮ LIỆU VÀ ỨNG DỤNG VÀO BÀI TOÁN TÍNH ĐIỂM RỦI RO CỦA DOANH NGHIỆP PHỤC v ụ THANH TRA THUẾ LUẬN VĂN THẠC s ĩ MÁY TÍNH HÀ NỘI - 2016 B ộ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC s PHẠM HÀ NỘI PHẠM THỊ PHƯƠNG NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP HÒI QUY DỬ LIỆU VÀ ỨNG DỤNG VÀO BÀI TOÁN TÍNH ĐIỂM RỦI RO CỦA DOANH NGHIỆP PHỤC v ụ THANH TRA THUẾ Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 LUẬN VĂN THẠC s ĩ KHOA HỌC MÁY TÍNH Ngưòi hướng dẫn khoa học: TS Nguyễn Long Giang HÀ NỘI - 2016 LỜI CẢM ƠN Lời em xin gửi lời cảm ơn chân thành đến thầy cô giáo, Khoa công nghệ thông tin, Phòng sau đại học Trường Đại học Sư phạm Hà Nội tận tình giảng dạy, truyền đạt kiến thức, kỉnh nghiệm quý báu suốt thời gian em theo học trường Các kiến thức, kinh nghiệm quý báu thầy cô giáo không giúp cá nhân em hoàn thiện hệ thống kiến thức học tập mà giúp em ứng dụng kiến thức ừong công tác tại đơn vị Đặc biệt, em xin chân thành cảm ơn thầy hướng dẫn khoa học TS Nguyễn Long Giang, Viện Công nghệ thông tin - Viện Hàn lâm Khoa học Công nghệ Việt Nam nhiệt tình, tâm huyết việc định hướng giúp đỡ em hoàn thành luận văn Em xin bày tỏ tình cảm với gia đình, đồng nghiệp, bạn bè tạo điều kiện để cá nhân em dành thời gian cho khóa học Xin chân thành cảm ơn tập thể lớp cao học KI 8- KHMT, năm qua luôn động viên, khích lệ hỗ trợ em trinh học tập Trong trình thực Luận văn cố gắng hết mình, song chắn luận văn em thiếu sót Em mong nhận bảo vào đóng góp tận tình thầy cô để luận văn em hoàn thiện Hà Nội, ngày 10 tháng 07 năm 2016 Hoc viên Phạm Thị Phưomg LỜI CAM ĐOAN Tôi xin cam đoan: Đề tài: Nghiên cứu số phương pháp hồi quy liệu ứng dụng vào toán tính điểm rủi ro doanh nghiệp phục vụ tra thuế” công trình nghiên cứu thực cá nhân Học viên, thực hướng dẫn khoa học TS Nguyễn Long Giang Các kết quả, phân tích, kết luận ừong Luận văn thạc sĩ (ngoài phần trích dẫn) kết làm việc cá nhân tác giả chưa công bố hình thức Nếu sai xin chịu hoàn toàn trách nhiệm Hà Nội, ngày 10 tháng 07 năm 2016 Hoc viên Phạm Thị Phương MỤCLỤC NÔI DUNG CHƯƠNG TỔNG QUAN _ 1.1 Tổng quan tình hình nghiên cứu nước 1.2 Sự cần thiết phải triển khai vấn đề nghiên cứu 1.2.1 Hiện trạng hệ thống phân tích rủi ro ngưòi nộp thuế 1.2.2 Phân tích hạn chế hệ thống TPR 10 1.2.3 Sự cần thiết phải xây dựng hệ thống tính điểm rủi ro doanh nghiệp 10 r CHƯƠNG MỘT SỐ PHƯƠNG PHÁP HỒI QUY TUYẾN TÍNH 12 2.1 Pỉunmg pháp hồi quy đon biến 12 2.1.1 Vấn đề mô hình hồi quy .12 2.1.2 Ước lượng hệ số hồi quy 14 2.1.3 Tính chất ước lượng hệ số hồi quy 15 2.1.4 Kiểm định giả thiết 16 2.1.5 Khoảng tin cậy 19 2.1.6 Tính phù họp mô hình 23 22 Phương pháp hồi quỵ đa biến _28 2.2.1 Phương trình hồi q uy 28 2.2.2 Ước lượng hệ số hồi quy tính chất ước lượng 30 2.2.3 Kiểm định giả thuyết 31 2.2.4 Ước lượng dự đoán 33 2.2.5 Phân tích phàn dư 34 2.2.6 Sử dụng phần m ềm 34 Kấluận chương _ 38 CHUÔNG XÂY DỤNG v t h n g h iệ m c h u ô n g t r ìn h t ín h ĐIẺM *? X 3.1 Tữứi cấp thiết toán tính điểm rủi ro doanh nghiệp 39 32 Bài toán toán tính điểm rủi ro doanh nghiệp _ 40 33 Các buức xây dựng mô hình giải toán _ 43 3.3.1 Xây dựng mô hình hồi quy tuyến tính đa biến 43 3.3.2 Thực thi mô hình để tính điểm rủi ro cho doanh nghiệp 46 3A Thử nghiệm đánh giá kết 47 3.4.1 Mục tiêu thử nghiệm 47 3.4.2 Công cụ thử nghiệm môi trường thử nghiệm 47 3.4.3 Quy trình thử nghiệm đánh giá kết 47 Kấluận chương _53 X „ DANH MỤC CÁC TÀI LIỆU THAM KHẢO 55 DANH MỤC CÁC THUẬT NGỮ, TỪ VIẾT TẮT Từ viết tắt Mô tả NNT Người nộp thuế GTGT Giá trị gia tăng TNDN Thu nhập doanh nghiệp BCTC Báo cáo tài TPR Hệ thống phần mềm phân tích thông tin phục vụ công tác ứa thuế cấp QLT Quản lý thuế TPH Hệ thống tập trung liệu khai thác thông tin người nộp thuế ƯL Ước lượng BNN Biến ngẫu nhiên DANH MỤC CÁC HÌNH Hình Đồ thị rải điểm, đường hồi quy cho số liệu độ oxy 13 Hình 2 Độ lệch đường hồi quy lý thuyết, thực nghiệm 14 Hình Khoảng tin cậy (2 đường Hyperbol giữa) khoảng dự đoán (2 đường hyperbol ngoài) cho mức tiêu thụ nhiên liệu 21 Hình Dáng điệu phàn d 24 Hình Đồ thị phàn dư chuẩn hóa cho số liệu độ kéo 27 Hình Miền biến thiên biến hồi quy 34 Hình Đồ thị xác suất chuẩn phần dư chuẩn hóa số liệu lực kéo 37 Hình 3.1 Tập liệu huấn luyện 48 Hình Mô tả tập liệu huấn luyện 49 Hình 3 Kết xây dựng mô hình 50 Hình Kết tính điểm rủi ro doanh nghiệp tập liệu kiểm tra 51 DANH MỤC CÁC BẢNG Bảng Độ oxy ứng với tỷ lệ phần trăm hydrocarbon 12 Bảng 2 Phân tích phương sai để kiểm định tính hiệu hồi quy 18 Bảng Phân tích hệ số phân tích phương sai cho Ví dụ 1.2 27 Bảng Số liệu cho mô hình hồi quy bội 28 Bảng Kết xử lý với số liệu lực kéo dây dẫn 35 Bảng Tóm tắt, phân tích phương sai phân tích hệ số 36 Bảng Bảng liệu đầu vào hệ thống 43 MỞ ĐẦU Lý chọn đề tài Sự phát triển nhanh chóng ứng dụng công nghệ thông tin Internet vào nhiều lĩnh vực khác đời sống xã hội năm gần tạo nhiều sở liệu khổng lồ Để khai thác hiệu nguồn thông tin sở liệu khổng lồ nhằm mục đích dự báo, hỗ trợ định, bên cạnh phương pháp khai thác thông tin truyền thống, nhà nghiên cứu sử dụng công cụ máy tính điện tử để phát triển phương pháp, kỹ thuật hỗ trợ tiến trình khám phá, phân tích, tổng họp thông tin Lĩnh vực gọi khai phá liệu khám phá tri thức (Data Mining and Knowledge Discovery) Trong khai phá liệu, phân lớp (classification) hồi quy (regresstion) phương pháp quan ừọng có ứng dụng rộng rãi hiệu toán phân tích liệu dự báo lĩnh vực kinh tế, tài Hồi quy liệu việc xác định hàm ánh xạ từ mẫu liệu vào biến dự đoán có giá trị thực Các phương pháp hồi quy chia thành nhóm chính: hồi quy tương quan để xác định mối liên hệ nhiều biến ngẫu nhiên với nhau; hồi quy tuyến tính đơn biến để xác định mối liên hệ biến độc lập vào biến phụ thuộc; hồi quy tuyến tính đa biến xác định mối liên hệ nhiều biến độc lập vào biến phụ thuộc Trong lĩnh vực thuế, vấn đề gian lận trốn thuế diễn biến ngày trầm trọng ngày phổ biến giới Việt Nam [9] Nhiều quốc gia giới xây dựng phần mềm máy tính nhằm dự báo doanh nghiệp có khả gian lận, ừốn thuế dựa kỹ thuật khai phá liệu học máy [5, 6, 7, 8] Tại Việt Nam, Tổng cục thuế xây dựng kho liệu tập trung tình hình thu nộp thuế tra thuế cùa doanh nghiệp Bài toán đặt từ số liệu kết thu nộp thuế, 59 Tiêu chí phân loại doanh nghiệp theo loại hình kinh tế đánh giá ừên sở hình thức sở hữu vốn doanh nghiệp b Ỷ nghĩa tiêu chí Hình thức sở hữu phản ánh mức độ rủi ro thuế doanh nghiệp cao, trung bình hay thấp Các doanh nghịêp sở hữu tư nhân rủi ro doanh nghiệp cổ phần, doanh nghiệp nước ngoài, doanh nghiệp nhà nước c Phương pháp phân ngưỡng, tỉnh điểm rủi ro - Mức độ rủi phân thành mức: Cao, Vừa, Thấp Rất thấp, gán điểm số 4, 3, 2, - Phương pháp tính điểm sau: Căn vào loại hình kinh tế doanh nghiệp tờ khai Đăng ký thuế, phân loại doanh nghiệp tính điểm theo quy tắc: Mã loai • Tên loại hình kinh tế hình kỉnh tế Điểm 07 Tổ chức k.tế tổ chức trị 08 Đơn vị nghiệp, đơn vị vũ trang 01 Nhà nước 06 Công ty nuớc không theo luật đầu tư nước 02 Đầu tư nước 12 Doanh nghiệp liên doanh với nước 04 Cổ phần 11 Công ty họp danh 05 Doanh nghiệp tư nhân 03 Trách nhiệm hữu hạn (Mã loại hình kinh tể xác định theo hệ thống CSDL Đăng kỷ thuế lưu trữ) 1.2.3 Nhóm tiêu chí III: Nhóm tiêu chí đánh giá biến động kê khai năm Các tiêu chí nhóm tiêu chí đánh giá biến động kê khai 60 đánh giá vào biến động số thuế phát sinh so với doanh thu kê khai năm Phương pháp phân ngưỡng, tính điểm rủi ro cho tiêu chí: • Mức độ rủi phân thành mức: Cao, Vừa, Thấp Rất thấp, gán điểm số 4, 3, 2,1 • Phương pháp tính điểm sau: Bước 1: Tổng hợp đưa danh sách Kết phân tích NNT năm đánh giá năm trước đỏ (nếu có) Bước 2: Tính biển động Kết phân tích năm đánh giá với năm trước (nếu có) Bước 3: Tiến hành phân ngưỡng rủi ro từ cao đến thấp với miền giá trị: Tỷ lệ biến động STT năm N/năm Ý nghĩa Điểm N-l =1 Không biến động qua năm, rủi ro thấp 2 >1 Biến động tăng qua năm, rủi ro thấp Trường họp mẫu số —0 Kết phân tích năm trước năm đánh giá = NNT chưa hoạt động sản xuất kinh doanh, rủi ro thấp 0): Được giả trị "Trung bình thấp" Bước 2.5: Phân ngưỡng gán điểm rủi ro: M ax Tiêu chí So sánh Điểm Đối với tiêu Kết phân tích >= Trung bình cao chí Kết phân Trung bình cao > Kết phân tích > tích cao, rủi = Trung bình ngành ro cao Trung bình ngành > Kết phân tích >= Trung bình thấp Kết phân tích < Trung bình thấp Đối với tiêu Kết phân tích >= Trung bình cao chí Kết phân Trung bình cao > Kết phân tích > tích cao, rủi = Trung bình ngành 65 So sánh Điểm Trung bình ngành > Kết phân tích Tiều chí ro thấp >= Trung bình thấp Kết phân tích < Trung bình thấp Nhóm tiêu chíphản ánh hiệu sinh lời 1.2.4.1 Tiêu 5: Tỷ lệ lợi nhuận từ hoạt động kinh doanh/ doanh thu a Mô tả tiêu chí Phản ánh hiệu sản xuất kinh doanh doanh nghiệp kỳ Các doanh nghiệp ngành nghề có tỷ lệ cao hiệu sản xuất kinh doanh cao, rủi ro thấp b Ỷ nghĩa tiêu Doanh thu từ bán hàng cung cấp dịch vụ tạo đồng lợi nhuận Tỷ lệ lớn hiệu hoạt động sản xuất, kinh doanh doanh nghiệp tốt Chỉ tiêu dùng để so sánh doanh nghiệp ngành nghề Tuy nhiên tiêu chưa đánh giá xác khả sinh lời doanh nghiệp chưa loại trừ khác biệt doanh nghiệp có nguồn vốn hình thành khác 1.2.4.2 Tiêu 6: Tỷ lệ (lợi nhuận trước thuế + phỉ lãi vay)/ doanh thu a Mô tả tiêu Phản ánh hiệu sản xuất kinh doanh doanh nghiệp kỳ Các doanh nghiệp ngành nghề có tỷ lệ cao hiệu sản xuất kinh doanh cao, rủi ro thấp b Ý nghĩa tiêu Thể khả sinh lời doanh nghiệp, cho biết với đồng doanh thu từ bán hàng cung cấp dịch vụ tạo đồng lợi nhuận Tỷ lệ lớn hiệu hoạt động sản xuất, kinh doanh doanh nghiệp tốt 66 Chỉ tiêu dùng để so sánh doanh nghiệp ngành nghề Tuy nhiên tiêu chưa đánh giá xác khả sinh lời doanh nghiệp chưa loại trừ khác biệt doanh nghiệp có nguồn vốn hình thành khác 1.2.4.3 Tiêu chí 7: Tỷ lệ lợi nhuận sau thuế/doanh thu a Mô tả tiêu Phản ánh hiệu sản xuất kinh doanh doanh nghiệp ừong kỳ Trong thực tế tiêu chí bị ảnh hưởng sách miễn, giảm thuế Khi phân tích tỷ lệ thấp tỷ lệ lợi nhuận trước thuế/doanh thu cao thể doanh nghiệp kê khai miễn, giảm thuế khả rủi ro việc miễn, giảm thuế cao b Ý nghĩa tiêu chí Thể hiệu doanh nghiệp Đánh giá rủi ro miễn, giảm thuế TNDN Chỉ tiêu dùng để so sánh doanh nghiệp ngành nghề 1.2.4.4 Tiêu 8: Tỷ lệ lợi nhuận/ vốn chủ sở hữu a Mô tả tiêu chí Phản ánh hiệu sản xuất kinh doanh doanh nghiệp ừong kỳ Các doanh nghiệp ngành nghề có tỷ lệ cao hiệu sản xuất kinh doanh cao, rủi ro thấp b Ỷ nghĩa tiêu Phản ánh hiệu sử dụng vốn, ảnh hưởng đến rủi ro thuế Cho biết với đồng vốn chủ sở hữu doanh nghiệp sử dụng tạo đồng lợi nhuận Tỷ lệ cao phản ánh trình độ sử dụng vốn chủ sở hữu doanh nghiệp cao 1.2.4.5 Tiêu chi 9: Tỷ lệ giá vốn bán/ doanh thu a Mô tả tiêu Phản ánh trình độ kiểm soát chi phí doanh nghiệp Trình độ quản lý cao tức tỷ lệ thấp rủi ro thấp 67 b Ỷ nghĩa tiêu So sánh chi phí giá vốn doanh nghiệp ngành nghề Phản ánh trình độ quản lý giá vốn hàng bán doanh nghiệp Tỷ lệ cao trình độ quản lý doanh nghiệp tiềm ẩn rủi ro thuế, đặc biệt thuế TNDN 1.2.4.6 Tiêu chí 10: Tỷ lệ chi phỉ bán hàng/ doanh thu a Mô tả tiêu chí Phản ánh trình độ kiểm soát chi phí doanh nghiệp Trình độ quản lý cao tức tỷ lệ thấp rủi ro thấp b Ỷ nghĩa tiêu chí So sánh chi phí bán hàng doanh nghiệp ngành nghề Phản ánh trình độ quản lý chi phí bán hàng doanh nghiệp Tỷ lệ cao trình độ quản lý tiềm ẩn rủi ro thuế TNDN 1.2.4.7 Tiêu chí 11: Tỷ lệ chi phỉ quản lý/ doanh thu a Mô tả tiêu chi Phản ánh trình độ kiểm soát chi phí doanh nghiệp Trình độ quản lý cao tức tỷ lệ thấp rủi ro thấp b Ỷ nghĩa tiêu So sánh chi phí quản lý doanh nghiệp ngành nghề Phản ánh trình độ quản lý doanh nghiệp Tỷ lệ cao trình độ quản lý tiềm ẩn rủi ro thuế TNDN 1.2.4.8 Tiêu chí 12: Tỷ lệ Tổng dự phòng so với tổng chi phỉ sản xuất kinh doanh a Mô tả tiêu chí Phản ánh tỷ lệ khoản dự phòng trích lập đưa vào chi phí sản xuất kinh doanh kỳ Tỷ lệ cao rủi ro cao b Ý nghĩa tiêu Thể rủi ro ừong việc kê khai chi phí sản xuất kỉnh doanh từ nguồn trích lập dự phòng Tỷ lệ cao cho thấy việc sản xuất kinh doanh gặp khỏ khăn 68 c Phương pháp so sảnh tính điểm rủi ro: Mức độ rủi phân thành mức: Cao,Vừa,Thấp Rất thấp, gán điểm số 4, 3, 2, Phương pháp tính điểm sau: Gán điểm rủi ro theo quy tắc: STT So sánh Điểm Tỷ lệ Tổng dự phòng so với tổng chi phí sản xuất kinh doanh >10% 4 5% số thuế truy thu >= Trung bình thấp Số thuế truy thu < Trung bình thấp 1.2.6 Nhóm tiêu chí VI Tiêu chí 21: vốn chủ sở hữu nhỏ 20 tỷ đồng thời kinh doanh đa ngành nghề Mô tả tiêu chí Đánh giá dựa ưên vốn chủ sở hữu số ngành nghề kinh doanh doanh nghiệp Doanh nghiệp có vốn chủ sở hữu nhỏ đồng thời kinh doanh nhiều ngành nghề có mức độ rủi ro cao

Ngày đăng: 09/09/2016, 15:45

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan