Ứng dụng cây quyết định để phân loại khách hàng vay vốn của ngân hàng TMCP ngoại thương chi nhánh việt trì

60 621 3
Ứng dụng cây quyết định để phân loại khách hàng vay vốn của ngân hàng TMCP ngoại thương chi nhánh việt trì

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN  NGUYỄN VIỆT DŨNG ỨNG DỤNG CÂY QUYẾT ĐỊNH ĐỂ PHÂN LOẠI KHÁCH HÀNG VAY VỐN CỦA NGÂN HÀNG TMCP NGOẠI THƢƠNG CHI NHÁNH VIỆT TRÌ KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC Chuyên ngành: Khoa học máy tính TS LƯU THỊ BÍCH HƯƠNG HÀ NỘI – 2015 TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN  NGUYỄN VIỆT DŨNG ỨNG DỤNG CÂY QUYẾT ĐỊNH ĐỂ PHÂN LOẠI KHÁCH HÀNG VAY VỐN CỦA NGÂN HÀNG TMCP NGOẠI THƢƠNG CHI NHÁNH VIỆT TRÌ KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC Chuyên ngành: Khoa học máy tính TS LƯU THỊ BÍCH HƯƠNG Ngƣời hƣớng dẫn khoa học TS LƢU THỊ BÍCH HƢƠNG HÀ NỘI – 2015 HÀ NỘI – 201HÀ NỘI – 2015 HÀ NỘI – 2015 LỜI CẢM ƠN Để hồn thành đƣợc khóa luận này, trƣớc hết em xin gửi lời cảm ơn sâu sắc tới TS Lƣu Thị Bích Hƣơng tận tình hƣớng dẫn, bảo, định hƣớng, đóng góp ý kiến quý báu cho em suốt trình thực Em xin chân thành cảm ơn thầy, cô giáo khoa Công nghệ Thông tin, trƣờng Đại học Sƣ phạm Hà Nội quan tâm giảng dạy giúp đỡ em suốt bốn năm học vừa qua nhƣ thời gian em làm khóa luận Là sinh viên khoa Cơng nghệ Thơng tin, em tự hào khoa học, thầy giáo Em xin kính chúc thầy, cô mạnh khỏe, hạnh phúc thành công Chúc khoa Công nghệ Thông tin ngày khang trang, vững mạnh, góp phần to lớn nghiệp đào tạo chuyên nghiệp trƣờng Đại học Sƣ phạm Hà Nội Lần đầu nghiên cứu khoa học, chắn đề tài em không tránh khỏi thiếu sót, hạn chế Vì vậy, em mong đóng góp ý kiến thầy giáo bạn để đề tài em đƣợc hoàn thiện Hà Nội, tháng 05 năm 2015 Sinh viên Nguyễn Việt Dũng LỜI CAM ĐOAN Tên em là: Nguyễn Việt Dũng Sinh viên: K37A – CNTT, trƣờng Đại học Sƣ phạm Hà Nội Em xin cam đoan: Đề tài “Ứng dụng định để phân loại khách hàng vay vốn Ngân hàng thương mại cổ phần Ngoại thương, chi nhánh Việt Trì” kết tìm hiểu nghiên cứu riêng em, dƣới hƣớng dẫn TS Lƣu Thị Bích Hƣơng Khóa luận hồn tồn khơng chép từ tài liệu có sẵn đƣợc công bố khác Kết không trùng với tác giả khác Nếu sai em xin hoàn toàn chịu trách nhiệm Hà Nội, tháng 05 năm 2015 Ngƣời cam đoan Nguyễn Việt Dũng MỤC LỤC MỞ ĐẦU CHƢƠNG 1: CƠ SỞ LÝ THUYẾT 1.1 Giới thiệu 1.2 Các kiểu định 1.3 Ƣu điểm định 1.4 Ví dụ 1.5 Thuật toán định 12 1.5.1 Xử lý liệu 13 1.5.2 Tạo 13 1.5.3 Tiêu chuẩn tách 14 1.5.4 Tiêu chuẩn dừng 15 1.5.5 Tỉa 15 1.6 Phát biểu toán 16 CHƢƠNG 2: KHAI PHÁ DỮ LIỆU 19 2.1 Khám phá tri thức 19 2.1.1 Khai phá liệu 20 2.2 Một số phƣơng pháp khai phá liệu thông dụng 24 2.2.1 Phân lớp 24 2.2.2.Phân cụm 28 2.2.3 Luật kết hợp 32 2.3 Ứng dụng khai phá liệu lĩnh vực ngân hàng 35 2.3.1 Marketing 35 2.3.2 Quản lý rủi ro 35 2.3.3 Phát sai lệch 37 2.3.4 Quản trị quan hệ khách hàng 38 2.3.5 Phân tích liệu tài (Financial Data Analysis) 40 CHƢƠNG 3: ỨNG DỤNG KHAI PHÁ DỮ LIỆU ĐỂ PHÂN LOẠI KHÁCH HÀNG 42 3.1 Quy trình tín dụng 42 3.1.1 Khái niệm quy trình tín dụng 42 3.1.2 Ý nghĩa quy trình tín dụng 42 3.1.3 Quy trình tín dụng 42 3.1.4.Thử nghiệm dự đốn rủi ro tín dụng 43 3.2 Sử dụng định để phân loại khách hàng 45 3.2.1 Tiêu chí chọn thuộc tính phân lớp 45 3.2.2 Thuật toán ID3 46 3.3 Thiết kế chƣơng trình 48 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 50 TÀI LIỆU THAM KHẢO 52 MỤC LỤC HÌNH ẢNH Hình 1.1: Cây định phân lớp mức lƣơng Hình 1.2: Cây định có chơi golf hay khơng 12 Hình 1.3: Mơ tả định 13 Hình 2.1: Kiến trúc điển hình hệ thống khai phá liệu 20 Hình 2.2: Kiến trúc điển hình hệ thống khai phá liệu 23 Hình 2.3: Ví dụ phân cụm liệu 29 Hình 2.4: Ví dụ phân cụm nhà dựa khoảng cách 30 Hình 2.5: Ví dụ phân cụm ngơi nhà dựa kích cỡ 31 Hình 2.6: Quản trị quan hệ khách hàng 39 Hình 3.2: Form giao diện 48 Hình 3.3: Form nạp liệu 48 Hình 3.4: Form áp dụng thuật toán ID3 49 Hình 3.5: Form tạo định 49 MỞ ĐẦU Lý chọn đề tài Ứng dụng Công nghệ Thông tin vào lĩnh vực đời sống, kinh tế xã hội ngày phổ biến Điều đồng nghĩa với việc liệu đƣợc lƣu trữ quan, xí nghiệp, trƣờng học,… ngày khổng lồ Tuy nhiên theo thống kê có lƣợng nhỏ liệu (khoảng từ 5% đến 10%) ln đƣợc phân tích, số cịn lại họ khơng biết phải làm làm với liệu này, nhƣng họ tiếp tục thu thập lƣu trữ hy vọng liệu cung cấp cho họ thông tin quý giá cách nhanh chóng để đƣa định kịp thời vào lúc Chính vậy, phƣơng pháp quản trị khai thác sở liệu truyền thống ngày không đáp ứng đƣợc thực tế Từ làm phát triển khuynh hƣớng kỹ thuật kỹ thuật phát tri thức khai phá liệu (KDD - Knowledge Discovery and Data Mining) Cho đến nay, khai phá liệu ngày đƣợc nghiên cứu, phát triển đạt đƣợc thành tựu đáng kể lĩnh vực: kinh doanh, y tế, cơng nghệ sinh học, qn sự, bƣu viễn thông, xây dựng,… Rất nhiều tổ chức công ty lớn giới áp dụng kỹ thuật khai phá liệu vào hoạt động sản xuất kinh doanh thu đƣợc lợi ích to lớn Ngành công nghiệp ngân hàng bắt đầu nhận cần thiết kỹ thuật khai phá liệu, kỹ thuật giúp họ cạnh tranh thị trƣờng Các ngân hàng sử dụng công cụ khai phá liệu cho việc phân khúc khách hàng lợi nhuận, chấm điểm tín dụng, phê duyệt, quảng bá bán sản phẩm, phát giao dịch gian lận,…Việc sử dụng phƣơng pháp khai phá tri thức từ liệu để phân loại khách hàng vay vốn phƣơng pháp nhằm giảm nguy rủi ro tín dụng Với mong muốn nghiên cứu việc ứng dụng định để phân loại khách hàng ngân hàng thƣơng mại cổ phần Ngoại thƣơng, em chọn đề tài “Ứng dụng định để phân loại khách hàng vay vốn Ngân hàng thương mại cổ phần Ngoại thương, chi nhánh Việt Trì” làm khóa luận tốt nghiệp Mục đích, nhiệm vụ nghiên cứu  Tìm hiểu khai phá liệu, ứng dụng khai phá liệu lĩnh vực ngân hàng  Cây định, thuật toán ID3  Xây dựng ứng dụng định để phân loại khách hàng vay vốn ngân hàng thƣơng mại cổ phần Ngoại thƣơng, chi nhánh Việt Trì Đối tƣợngvà phạm vi nghiên cứu Đối tƣợng nghiên cứu khóa luận định, ứng dụng khai phá liệu lĩnh vực ngân hàng (Marketing, quản lý rủi ro, phát sai lệch, xâm nhập, ) Phạm vi nghiên cứu:  Thuật toán ID3  Khách hàng vay vốn ngân hàng thƣơng mại cổ phần Ngoại thƣơng, chi nhánh Việt Trì Ý nghĩa khoa học thực tiễn Đóng góp vào hệ thống thơng tin ứng dụng hỗ trợ việc định Đƣợc sử dụng để phân tích liệu, đƣa nhìn tổng quan cho ngƣời quản lý ƣớc lƣợng rủi ro dễ dàng Phân loại khách hàng vay vốn giúp cho việc lựa chọn áp dụng quy định pháp luật phù hợp để giải quyền lợi bên tín dụng đƣợc thuận lợi nhanh chóng hơn, tiết kiệm thời gian tiền bạc cho bên Phƣơng pháp nghiên cứu a Phương pháp nghiên cứu lý luận Nghiên cứu qua việc đọc sách, báo tài liệu liên quan nhằm xây dựng sở lý thuyết khóa luận biện pháp cần thiết để giải vấn đề khóa luận Phân tích tổng hợp tài liệu khai phá liệu sử dụng thuật toán Decision Tree có thuật tốn ID3, phân loại liệu, mơ hình dự báo b Phương pháp chuyên gia Tham khảo ý kiến chuyên gia để thiết kế chƣơng trình phù hợp với yêu cầu thực tiễn Nội dung xử lý nhanh đáp ứng đƣợc yêu cầu ngày cao ngƣời sử dụng c Phương pháp thực nghiệm Thông qua quan sát thực tế, yêu cầu sở, lý luận đƣợc nghiên cứu kết đạt đƣợc qua phƣơng pháp Ứng dụng kết hợp kỹ thuật phân loại mơ hình định để phân loại khách hàng vay vốn Ngân hàng thƣơng mại Cấu trúc khóa luận Ngoài lời cảm ơn, mở đầu, kết luận hƣớng phát triển, tài liệu tham khảo, khóa luận có nội dung sau: Chương 1: Cơ sở lý thuyết - Chƣơng nghiên cứu tổng quan thuật toán định Phát biểu toán xây dựng định việc phân loại khách hàng vay vốn ngân hàng Chương 2: Khai phá liệu - Tìm hiểu khám phá tri thức, khai phá liệu số phƣơng pháp khai phá liệu thông dụng Chƣơng đƣa ứng dụng cụ thể khai phá liệu ngân hàng chăm sóc khách hàng hợp lý Ngồi ra, doanh nghiệp cịn xử lý vấn đề vƣớng mắc khách hàng cách nhanh chóng hiệu Hình 2.6: Quản trị quan hệ khách hàng Trong thời đại cạnh tranh khốc liệt ngày nói chung, đặc biệt ngành ngân hàng nói riêng, khách hàng ln nhân tố quan trọng định tồn phát triển họ Khai phá liệu hữu ích tất ba giai đoạn chu kỳ mối quan hệ khách hàng: Tìm kiếm khách hàng, tăng giá trị khách hàng trì khách hàng Quản lý quan hệ khách hàng cung cấp hệ thống đáng tin cậy, giúp quản lý khách hàng nhân viên, cải thiện mối quan hệ nhân viên với 39 khách hàng Một sách quan hệ khách hàng hợp lý bao gồm chiến lƣợc đào tạo nhân viên, điều chỉnh phƣơng pháp kinh doanh áp dụng hệ thống công nghệ thông tin phù hợp Quan hệ khách hàng không đơn phần mềm hay công nghệ mà chiến lƣợc kinh doanh bao gồm chiến lƣợc tiếp thị, đào tạo dịch vụ mà doanh nghiệp cung ứng tới khách hàng Doanh nghiệp lựa chọn giải pháp quan hệ khách hàng hợp lý dựa tiêu chí đặt khách hàng vị trí trung tâm, quan tâm tới nhu cầu khách hàng nhằm đạt đƣợc mục đích trì mối quan hệ tốt với khách hàng đạt đƣợc lợi nhuận tối đa kinh doanh 2.3.5 Phân tích liệu tài (Financial Data Analysis) Dữ liệu tài ngân hàng ngành tài nói chung thƣờng đáng tin cậy có chất lƣợng cao, tạo điều kiện cho khai phá liệu Dƣới số ứng dụng điển hình khai phá liệu tài chính:  Dự đốn khả vay tốn khách hàng, phân tích sách tín dụng khách hàng  Phân tích hành vi khách hàng (vay, gửi tiền)  Phân loại phân nhóm khách hàng mục tiêu cho tiếp thị tàichính  Phát hoạt động rửa tiền tội phạm tài khác 2.3.6 Phát xâm nhập bất hợp pháp (Intrusion Detection) Xâm nhập bất hợp pháp hành động đe dọa tính tồn vẹn, bảo mật tính sẵn sàng tài nguyên mạng Trong giới kết nối, bảo mật trở thành vấn đề lớn tồn hệ thống Với phát triển internet sẵn có công cụ, thủ thuật trợ giúp cho xâm nhập cơng mạng, u cầu kiểm sốt truy cập bất hợp pháp yếu tố quan trọng đảm bảo cho ổn định hệ thống 40 Dƣới số ứng dụng khai phá liệu đƣợc áp dụng để phát xâm nhập:  Phát triển thuật toán khai phá liệu để phát xâm nhập  Phân tích kết hợp, tƣơng quan khác biệt để phát xâm nhập  Phân tích dịng liệu liệu (Analysis of Stream data) để phát bất thƣờng Theo kết thăm dò Kdnuggets (www.knuggets.com), khai phá liệu đƣợc ứng dụng thành công lĩnh vực ngân hàng 41 CHƢƠNG 3: ỨNG DỤNG KHAI PHÁ DỮ LIỆU ĐỂ PHÂN LOẠI KHÁCH HÀNG 3.1 Quy trình tín dụng 3.1.1 Khái niệm quy trình tín dụng Để chuẩn hố q trình tiếp xúc, phân tích, cho vay thu nợ khách hàng, ngân hàng thƣờng đặt quy trình phân tích tín dụng Đó bƣớc (hoặc nội dung cơng việc) mà cán tín dụng, phịng ban có liên quan ngân hàng phải thực làm việc cho khách hàng 3.1.2 Ý nghĩa quy trình tín dụng Việc thiết lập quy trình tín dụng khơng ngừng hồn thiện đặc biệt quan trọng ngân hàng thƣơng mại Về mặt hiệu quả, quy trình tín dụng hợp lý giúp cho ngân hàng nâng cao chất lƣợng tín dụng giảm thiểu rủi ro tín dụng Về mặt quản lý, quy trình tín dụng có tác dụng:  Làm sở cho việc phân định quyền, trách nhiệm cho phận hoạt động tín dụng  Làm sở để thiết lập hồ sơ, thủ tục vay vốn 3.1.3 Quy trình tín dụng Bƣớc 1: Lập hồ sơ vay vốn Bƣớc cán tín dụng thực sau tiếp xúc khách hàng Nhìn chung hồ sơ vay vốn cần phải thu thập thông tin nhƣ:  Năng lực pháp lý, lực hành vi dân khách hàng  Khả sử dụng vốn vay  Khả hoàn trả nợ vay (vốn vay lãi) Bƣớc 2: Phân tích tín dụng Phân tích tín dụng xác định khả tƣơng lai khách hàngtrong việc sử dụng vốn vay hoàn trả nợ vay với mục tiêu: 42  Tìm kiếm tình xảy dẫn đến rủi ro cho ngân hàng, dự đoán khả khắc phục rủi ro đó, dự kiến biện pháp giảm thiểu rủi ro hạn chế tổn thất cho ngân hàng  Phân tích tính chân thật thơng tin thu thập đƣợc từ phía khách hàng bƣớc 1, từ nhận xét thái độ, thiện chí khách hàng làm sở cho việc định cho vay Bƣớc 3: Ra định tín dụng Trong khâu này, ngân hàng định đồng ý từ chối cho vay hồ sơ vay vốn khách hàng Bƣớc 4: Giải ngân Nguyên tắc giải ngân: phải gắn liền vận động tiền tệ với vận động hàng hóa dịch vụ có liên quan, nhằm kiểm tra mục đích sử dụng vốn vay khách hàng đảm bảo khả thu nợ Bƣớc 5: Giám sát tín dụng Nhân viên tín dụng thƣờng xuyên kiểm tra việc sử dụng vốn vay thực tế khách hàng, trạng tài sản đảm bảo, tình hình tài khách hàng để đảm bảo khả thu nợ Bƣớc 6: Thanh lý hợp đồng tín dụng 3.1.4 Thử nghiệm dự đốn rủi ro tín dụng Để nghiên cứu việc ứng dụng khai phá liệu dự đốn rủi ro tín dụng, sử dụng tập liệu ngẫu nhiên gồm: 32 000 khoản vay khứ sau ngày đáo hạn Những thông tin khoản vay đƣợc sử dụng để khai phá liệu gồm:  Loại hình doanh nghiệp khách hàng  Địa khách hàng  Thành phần kinh tế  Ngành kinh tế  Đánh giá khách hàng  Khách hàng chiến lƣợc ngân hàng 43  Khách hàng có quan hệ với nhiều tổ chức tín dụng  Sản phẩm khoản vay  Thời hạn khoản vay  Loại đồng tiền khoản vay  Số tiền xin vay  Mục đích vay vốn  Khoản vay tuần hồn  Hình thức bảo đảm  Phần trăm tài sản bảo đảm cho khoản vay  Nhóm tài sản bảo đảm  Chi nhánh cho vay Sau sử dụng kỹ thuật khai phá liệu thu đƣợc 1400 luật Trong có luật sau:  Nếu

Ngày đăng: 24/09/2015, 08:54

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan