Nghiên cứu ứng dụng luật kết hợp trong phân tích tài chính và kinh doanh ngân hàng

24 580 1
Nghiên cứu ứng dụng luật kết hợp trong phân tích tài chính và kinh doanh ngân hàng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG NGUYỄN THỊ NGUYỆT NGHIÊN CỨU ỨNG DỤNG LUẬT KẾT HỢP TRONG PHÂN TÍCH TÀI CHÍNH KINH DOANH NGÂN HÀNG Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 Người hướng dẫn khoa học: PGS. TS NGUYỄN BÁ TƯỜNG TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI – 2012 1 MỞ ĐẦU Mục đích của luận án này là nghiên cứu tổng quan về khai thác dữ liệu, nghiên cứu một số thuật toán khai thác luật kết hợp trong đó đi sâu vào nghiên cứu, thử nghiệm ứng dụng vào phân tích tài chính ngân hàng, giúp chuyên gia có được những thông tin có tính chất qui luật, trợ giúp quyết định hiệu quả. Nội dung luận văn được chia thành 3 chương: Chương 1: Tổng quan về hoạt động kinh doanh của ngân hàng thương mại: Giới thiệu tổng quan về hoạt động của ngân hàng, các chức năng của ngân hàng thương mại; Những quy chế đặc thù đối với hoạt động ngân hàng; Tìm hiểu bảng cân đối kế toán ngân hàng các chỉ số tài chính. Chương 2: Cơ sở lý thuyết về khai thác dữ liệu: Tổ chức khai thác dữ liệu truyền thống; khai thác dữ liệu và quá trình phát hiện tri thức, các dạng dữ liệu có thể khai thác dữ liệu, nhiệm vụ của khai thác dữ liệu, các phương pháp khai thác dữ liệu. Chương 3: Nghiên cứu luật kết hợp: Trong chương này đi sâu vào nghiên cứu luật kết hợp nhị phân. 2 Chương 1: TỔNG QUAN VỀ HOẠT ĐỘNG KINH DOANH CỦA NGÂN HÀNG THƯƠNG MẠI 1.1. Kinh doanh ngân hàng – một loại hình kinh doanh đặc biệt 1.1.1. Ngân hàng - một trung gian tài chính Để hiểu được chức năng đặc biệt của ngân hàng trong nền kinh tế, chúng ta hãy hình dung một thế giới giản đơn trong đó không tồn tại hoạt động của hệ thống ngân hàng. Trong một thế giới như vậy, những khoản tiết kiệm của dân chúng chỉ có thể được sử dụng hoặc là dưới dạng tiền mặt; hoặc là dưới dạng đầu tư chứng khoán vào các công ty. Nói một cách khái quát, các công ty phát hành chứng khoán để đầu tư vào các tài sản thực, như nhà xưởng, máy móc, nguyên liệu Hình 1.1 mô tả luồng tiền tiết kiệm được luân chuyển từ dân chúng đến các công ty và ngược lại các chứng khoán là cổ phiểu trái phiếu (CP & TP) được luân chuyển từ phía công ty đến dân chúng. Công ty (những người cần vốn) Dân chúng (những người gửi tiết kiệm) CP& Vốn 3 Hình 1.1 Các luồng vốn chứng khoán trong một thế giới không có ngân hàng. Hình 1.2 chỉ ra bức tranh thực tế của thế giới mà chúng ta đang sống, biểu diễn các lượng vốn luân chuyển trong nền kinh tế, qua đó cho thấy vai trò, vị trí của hệ thống ngân hàng là trung gian giữa người đầu tư các công ty là như thế nào. Hình 1.2 Các luồng vốn luân chuyển trong một thế giới mà các hệ thống ngân hàng tồn tại phát triển Ngân hàng thực hiện hai chức năng cơ bản đó là: chức năng luân chuyển tài sản chức năng cung cấp các dịch vụ thanh toán, môi giới chuyển tài sản; chức năng cung cấp các dịch tư vấn. 1.1.2. Các chức năng của ngân hàng thương mại - Tạo tiền; - Thanh toán; Ngân hàng (nhà trung gian) Ngân hàng (nhà luân chuyển tài sản) Dân chúng Các công ty Vốn Ch ứng chỉ TG CP &TP Vốn 4 - Huy động tiết kiệm; - Mở rộng tín dụng; - Tài trợ ngoại thương; - Dịch vụ ủy thác; - Bảo quản an toàn vật có giá; - Dịch vụ kinh kỹ; 1.1.3. Những quy chế đặc thù đối với hoạt động ngân hàng - Qui chế về an toàn trong hoạt động kinh doanh ngân hàng; - Qui chế về chính sách tiền tệ; - Qui chế về phân phối tín dụng; - Qui chế về bảo vệ người tiêu dùng; - Qui chế về bảo vệ người đầu tư; - Qui chế về thành lập ngân hàng cấp giấy phép kinh doanh. 1.2. Tìm hiểu bảng cân đối kế toán ngân hàng các chỉ số tài chính 1.2.1. Các khái niệm 1.2.2. Nội dung kết cấu bảng cân đối kế toán 1.2.3. Mô tả các khoản mục trên bảng cân đối kế toán 1.2.4. Các chỉ số tài chính chủ yếu của ngân hàng 5 Chương 2: CƠ SỞ LÝ THUYẾT VỀ KHAI THÁC DỮ LIỆU 2.1. Tổ chức khai thác dữ liệu truyền thống 2.2. Bước phát triển tiếp theo của việc tổ chức khai thác các cơ sở dữ liệu 2.3. Khai thác dữ liệu quá trình phát hiện tri thức 2.4. Các dạng dữ liệu có thể khai thác dữ liệu Khai thác dữ liệu có khả năng chấp nhận một số kiểu dữ liệu khác nhau điển hình như sau: - Cơ sở dữ liệu quan hệ (relational databases). - Cơ sở dữ liệu đa chiều (multidimention structures, data warehouses, data mart). - Cơ sở dữ liệu giao tác (transactional databases). - Cơ sở dữ liệu quan hệ - hướng đối tượng (object relational databases). - Dữ liệu không gian thời gian (spatial, temporal, and time-series data). - Cơ sở dữ liệu đa phương tiện (Multimedia databases). 2.5. Nhiệm vụ chính của khai thác dữ liệu - Phân lớp (Classification). - Hồi quy (regression). 6 - Phân nhóm (Clustering). - Tóm tắt (summarization). - Mô hình hóa phụ thuộc (Dependency Modeling). 2.6. Các phương pháp khai thác dữ liệu Quá trình khai thác dữ liệu là quá trình phát hiện mẫu, trong đó, giải thuật khai thác dữ liệu tìm kiếm các mẫu đáng quan tâm theo dạng xác định như các luật, cây phân lớp, quy hồi, phân nhóm, v.v… 2.6.1. Các thành phần của giải thuật khai thác dữ liệu - Biểu diễn mô hình. - Đánh giá mô hình. - Tìm kiếm mô hình. 2.6.2. Một số phương pháp khai thác dữ liệu phổ biến 2.6.2.1. Phương pháp quy nạp. 2.6.2.2. Cây quyết định luật. 2.6.2.3. Phát hiện các luật kết hợp. 2.6.2.4. Các phương pháp phân lớp hồi quy phi tuyến. 2.6.2.5. Phân nhóm phân đoạn (Clustering and Segmentation). 2.6.2.6. Các phương pháp dựa trên mẫu. 7 2.6.2.7. Mô hình phụ thuộc dựa trên đồ thị xác suất. 2.6.2.8. Khai thác dữ liệu dạng văn bản (Text Mining). 2.6.2.9. Mạng neuron. 2.6.2.10. Giải thuật di truyền. 2.7. Phương pháp khai thác áp dụng trong luận văn Trong luận văn này, phương pháp khai thác dữ liệu đã được áp dụng chủ yếu là phương pháp khai thác luật kết hợp nhị phân có cải tiến bằng cách xác định những thuộc tính về phải để khám phá những luật thật sự quan tâm, thuật toán khám phá luật kết hợp nhị phân sẽ được trình bày trong chương 3. 8 Chương 3: KHÁM PHÁ LUẬT KẾT HỢP 3.1. Ý nghĩa của luật kết hợp Luật kết hợp là một phương pháp phổ biến quan trọng trong khai thác dữ liệu. Độ hỗ trợ (support) độ tin cậy (confidence) là hai thước đo cho một luật kết hợp. 3.2. Một số hướng tiếp cận trong khai thác luật kết hợp - Luật kết hợp nhị phân (Binary association rule hoặc Boolean association rule). - Luật kết hợp có thuộc tính số thuộc tính hạng mục (quantitative and categorical association rule). - Luật kết hợp tiếp cận theo hướng tập thô (mining association rules base on rought set). - Luật kết hợp nhiều mức (multi-level association rule). - Luật kết hợp mờ (fuzzy assocication rule). - Luật kết hợp với thuộc tính được đánh trọng số (association rule with weighted items). - Khai thác luật kết hợp song song (parallel mining of association rules). 3.3. Phát biểu bài toán khai thác luật kết hợp 9 3.3.1. Dữ liệu để khai thác Cho I = {i1, i2, i3, , in} là tập bao gồm n mục (Item – còn gọi là thuộc tính - attribute). X  I được gọi là tập mục (itemset). T = {t1, t2, , tm} là tập gồm m giao tác (Transaction – còn gọi là bản ghi - record). R là một quan hệ nhị phân trên I T (hay R  IxT). Nếu giao tác t có chứa mục i thì ta viết (i, t) R  (hoặc iRt). Ta sẽ ký hiệu DM = (T, I, R) là dữ liệu (ngữ cảnh) để khai thác. Ví dụ về cơ sở dữ liệu (dạng giao tác): I = {A, B, C, D, E}, T = {1, 2, 3, 4, 5, 6}, thông tin về các giao tác cho ở bảng sau: Bảng 3.1.a Ví dụ về một cơ sở dữ liệu dạng giao tác – (D) DM T I = {A, B, C, D, E} 1 A B D E 2 B C E 3 A B D E 4 A B C E 5 A B C D E 6 B C D [...]... Y))/card(T(X)) = T(X Y) T (X ) ; 3.5 Luật kết hợp có thuộc tính số thuộc tính hạng mục Khai thác luật kết hợp với thuộc tính số thuộc tính hạng mục (quantitative and categorical association 12 rule) là một trong những hướng tiếp cận quan trọng trong lĩnh vực khai thác luật kết hợp Đặc biệt trong phân tích dữ liệu ngân hàng Ví dụ ta xét tập 24 tài khoản của 24 khách hàng như sau: Bảng 3.4 Cơ sở dữ... về ngân hàng thương mại, các chức năng của ngân hàng thương mại bảng tổng kết tài sản cũng như các chỉ số tài chính bổ sung của hoạt động ngân hàng mục tiêu của luận văn Chương 2 chương 3: Luận văn đã trình bày những vấn đề chung về khai thác dữ liệu, trong đó luận văn cũng đã trình bày được phương pháp khai thác dữ liệu được áp dụng trong luận văn là phương pháp khai thác luật kết hợp nhị phân. .. phân bằng cách áp dụng các phương pháp rờ rạc hóa để đưa bảng dữ liệu tài chính về các bảng nhị phân để có thể áp dụng các luật kết hợp Phương pháp khám phá luật dựa trên việc xác định những thuộc tính chỉ xuất hiện ở vế trái những thuộc tính chỉ xuất hiện ở vế phải của luật, như vậy thuật toán khám phá luật kết hợp 23 nhị phân sẽ giảm đáng kể chi phí tập phổ biến chi phí khám phá luật, đồng thời... ta có thể xác định tính độ tin cậy liên quan các luật: Loại tiền gửi => rút đúng hạn Loại tiền gửi => rút trước hạn Loại tiền gửi => gửi tiếp,…v.v 22 KẾT LUẬN 1 Những vấn đề đã giải quyết trong luận văn Với kiến thức về lĩnh vực ngân hàng còn hạn chế, những vấn đề đã được đề cập giải quyết trong luận văn chỉ là một phần trong lĩnh vực phân tích tài chính ngân hàng, tuy nhiên trong luận văn cũng... của luật Độ hỗ trợ của luật kết hợp X => Y Độ hỗ trợ của luật kết hợp X => Y, ký hiệu s(X => Y) là tỷ số của số các giao tác trong D có chứa X  Y trên số tất cả giao tác trong D Hay s(X => Y) = card (T(X  Y))/card(T) = T(X Y) T ; trong đó T(X) là tập giao tác chứa tập mục X Độ tin cậy của luật kết hợp X => Y Độ tin cậy (confidence) của luật X => Y, ký hiệu conf(X => Y) là tỷ số các giao tác trong. .. giao tác trong cơ sở dữ liệu D chứa X trên tổng số các giao tác trong cơ sơ dữ liệu D Hay s(X) = Card (T(X)) / Card (T) = T(X ) T 3.3.4 Luật kết hợp X => Y Cho DM = (T, I, R) là dữ liệu để khai thác X, Y  I là các tập mục thỏa mãn điều kiện X Y   11 Luật kết hợp của X Y, ký hiệu X=>Y, đây là luật chỉ khả năng xuất hiện Y khi X xuất hiện Luật kết hợp có hai độ đo gắn với nó là: độ hỗ trợ độ... những luật thật sự quan tâm, không đưa ra những luật không có ý nghĩa đối với người sử dụng 2 Hướng phát triển của đề tài Do hiểu biết còn hạn chế về hoạt động ngân hàng cũng như thời gian có hạn nên luận văn chưa giải quyết được những vấn đề như: khả năng dự báo rủi ro, dự báo lãi suất, xếp hạng hoạt động của ngân hàng, mối quan hệ giữa lãi suất kết quả huy động vốn khi thay đổi lãi suất, v.v… .và. .. ĐH là có) với độ tin cậy là 3/6 = 50% 3.6 Phương pháp rời rạc hóa dữ liệu để phân tích tài chínhngân hàng Trường hợp 1: Nếu A là thuộc tính số rời rạc hoặc thuộc tính hạng mục có miền giá trị hữu hạn dạng {v1, v2,…, vk} k đủ nhỏ ( GT & conf( TIENGUI1 => GT) = 3/7 = 43% TIENGUI2 => GT & conf( TIENGUI2 => GT) = 6/13 =48% TIENGUI3 => GT & conf( TIENGUI3 => GT) = 1/4 = 25% Vậy số khách hàng có tiền gửi từ 3 trăm triệu đến 3 trăm triệu sẽ gửi tiếp là lớn nhất = 48% Trong khi đó khách hàng gửi từ 5 trăm triệu trở lên chỉ có 25% gửi tiếp Bây giờ ta xét bài toán rời rạc nhị phân hóa . NGHỆ BƯU CHÍNH VIỄN THÔNG NGUYỄN THỊ NGUYỆT NGHIÊN CỨU ỨNG DỤNG LUẬT KẾT HỢP TRONG PHÂN TÍCH TÀI CHÍNH VÀ KINH DOANH NGÂN HÀNG . 3: Nghiên cứu luật kết hợp: Trong chương này đi sâu vào nghiên cứu luật kết hợp nhị phân. 2 Chương 1: TỔNG QUAN VỀ HOẠT ĐỘNG KINH DOANH CỦA NGÂN

Ngày đăng: 17/02/2014, 09:01

Hình ảnh liên quan

Hình 1.1 Các luồng vốn và chứng khoán trong một thế giới - Nghiên cứu ứng dụng luật kết hợp trong phân tích tài chính và kinh doanh ngân hàng

Hình 1.1.

Các luồng vốn và chứng khoán trong một thế giới Xem tại trang 4 của tài liệu.
ở bảng sau: - Nghiên cứu ứng dụng luật kết hợp trong phân tích tài chính và kinh doanh ngân hàng

b.

ảng sau: Xem tại trang 10 của tài liệu.
Bảng 3.4 Cơ sở dữ liệu chi tiết của 24 giao dịch tiền gửi tiết kiệm trong ngân hàng  - Nghiên cứu ứng dụng luật kết hợp trong phân tích tài chính và kinh doanh ngân hàng

Bảng 3.4.

Cơ sở dữ liệu chi tiết của 24 giao dịch tiền gửi tiết kiệm trong ngân hàng Xem tại trang 13 của tài liệu.
Với cơ sở dữ liệu như bảng 3.4 ta có thể rút ra các luật kết hợp như sau:  - Nghiên cứu ứng dụng luật kết hợp trong phân tích tài chính và kinh doanh ngân hàng

i.

cơ sở dữ liệu như bảng 3.4 ta có thể rút ra các luật kết hợp như sau: Xem tại trang 14 của tài liệu.
bảng 3.4 được về bảng mà TIENGUI dạng nhị phân sau: - Nghiên cứu ứng dụng luật kết hợp trong phân tích tài chính và kinh doanh ngân hàng

bảng 3.4.

được về bảng mà TIENGUI dạng nhị phân sau: Xem tại trang 16 của tài liệu.
Khi đó ta có bảng với cột tiền gửi được biến thành - Nghiên cứu ứng dụng luật kết hợp trong phân tích tài chính và kinh doanh ngân hàng

hi.

đó ta có bảng với cột tiền gửi được biến thành Xem tại trang 18 của tài liệu.
Với số liệu như bảng 3.6 ta có thể xác định và tính - Nghiên cứu ứng dụng luật kết hợp trong phân tích tài chính và kinh doanh ngân hàng

i.

số liệu như bảng 3.6 ta có thể xác định và tính Xem tại trang 19 của tài liệu.
Bảng 3.7 Bảng có cột hạng mục TAI  - Nghiên cứu ứng dụng luật kết hợp trong phân tích tài chính và kinh doanh ngân hàng

Bảng 3.7.

Bảng có cột hạng mục TAI Xem tại trang 19 của tài liệu.
Bảng 3.8 Minh họa bảng dữ liệu có cột hạng mục được nhị phân hóa  - Nghiên cứu ứng dụng luật kết hợp trong phân tích tài chính và kinh doanh ngân hàng

Bảng 3.8.

Minh họa bảng dữ liệu có cột hạng mục được nhị phân hóa Xem tại trang 21 của tài liệu.
Từ bảng 3.8 ta có thể xác định và tính độ tin cậy - Nghiên cứu ứng dụng luật kết hợp trong phân tích tài chính và kinh doanh ngân hàng

b.

ảng 3.8 ta có thể xác định và tính độ tin cậy Xem tại trang 22 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan