Ứng dụng phương pháp LASSO trong dự báo rủi ro phá sản của các doanh nghiệp Việt Nam

14 0 0
Ứng dụng phương pháp LASSO trong dự báo rủi ro phá sản của các doanh nghiệp Việt Nam

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài viết Ứng dụng phương pháp LASSO trong dự báo rủi ro phá sản của các doanh nghiệp Việt Nam đánh giá khả năng ứng dụng phương pháp lựa chọn biến chủ động dựa trên dữ liệu LASSO (Least Absolute Shrinkage and Selection Operator) để nâng cao hiệu suất dự báo rủi ro phá sản của các doanh nghiệp Việt Nam.

Ứng dụng phương pháp LASSO dự báo rủi ro phá sản doanh nghiệp Việt Nam Lê Hải Trung, Trương Thị Thùy Dương Học viện Ngân hàng Ngày nhận: 07/01/2023 Ngày nhận sửa: 15/02/2023 Ngày duyệt đăng: 21/03/2023 Tóm tắt: Dự báo rủi ro phá sản doanh nghiệp có ý nghĩa quan trọng việc đưa định chủ doanh nghiệp, chủ nợ, nhà đầu tư quan quản lý, giúp thực giám sát cảnh báo sớm sức khỏe tài doanh nghiệp Các mơ hình dự báo thống kê truyền thống mơ hình thơng minh đại dựa kỹ thuật máy học phát triển để dự báo tương đối xác rủi ro phá sản doanh nghiệp Tuy nhiên, hiệu suất dự báo mơ hình phụ thuộc vào biến số dự báo đưa vào mơ hình theo quan điểm chủ quan người thực Bài viết đánh giá khả ứng dụng phương pháp lựa chọn biến chủ động dựa liệu LASSO (Least Absolute Shrinkage and Selection Operator) để nâng cao hiệu suất dự báo rủi ro phá sản doanh nghiệp Việt Nam Kết nghiên Corporate bankruptcy risk prediction in Vietnam: An application with LASSO method Abstract: Corporate bankruptcy risk prediction has important implications to the corporate owners, lenders, investors and regulators in their supervision, decision makings, which provides early warning indicators to the firm’s financial strength Several statistical and machine-learning based models have been developed to predict the corporate bankruptcy risks, however, the performance of these models largely depends on the arguably choice of the predictors In this study, we examine the potentials of the popular variable selection method, namely LASSO (Least Absolute Shrinkage and Selection Operator) to improve the predicting ability of the corporate bankruptcy risks in Vietnam Using data sample from 284 Vietnamese companies in period 2017- 2019, our study shows that the use of the LASSO technique to ex-ante select suitable predictors significantly improve the forecasting power of the prediction models, especially for the machine-learning based models in correctly identifying bankrupted firms in the testing sample Keywords: bankruptcy risks, forecasting, LASSO, machine learning Le, Hai Trung Email: trunglh@hvnh.edu.vn Truong, Thi Thuy Duong Email: duongtt@hvnh.edu.vn Organization of all: Banking Academy of Vietnam © Học viện Ngân hàng ISSN 1859 - 011X 25 Tạp chí Khoa học & Đào tạo Ngân hàng Số 250- Tháng 2023 Ứng dụng phương pháp LASSO dự báo rủi ro phá sản doanh nghiệp Việt Nam cứu thực nghiệm 284 doanh nghiệp Việt Nam giai đoạn 2017-2019 cho thấy, kết hợp với phương pháp LASSO để lựa chọn biến dự báo phù hợp giúp nâng cao hiệu suất mơ hình dự báo so với việc không thực lựa chọn biến dự báo phù hợp Kết có nghĩa cao với mơ hình thơng minh Từ khóa: rủi ro phá sản, dự báo, LASSO, máy học Giới thiệu Những biến động khó dự đốn kinh tế giới kể từ sau đại dịch Covid-19 với tình hình lạm phát tăng cao sau giai đoạn nới lỏng tiền tệ kéo dài, với bất ổn địa trị từ chiến tranh mâu thuẫn trị chiến Ukraine khiến doanh nghiệp đối mặt với rủi ro phá sản gia tăng Điều dẫn đến hệ lụy tiêu cực kinh tế môi trường xã hội tác động lan truyền tới doanh nghiệp khác chuỗi cung ứng suy giảm thu nhập người lao động Chính vậy, việc đưa dự báo có tính xác cao rủi ro phá sản doanh nghiệp thu hút quan tâm tổ chức, doanh nghiệp, nhà quản lý để giám sát cảnh báo sớm sức khỏe tài doanh nghiệp, sở đó, đưa định quản trị, đầu tư quản lý phù hợp Các mơ hình dự báo rủi ro phá sản doanh nghiệp phát triển từ sớm với nghiên cứu tiên phong Beaver (1966) Altman (1968) Các mơ hình truyền thống sử dụng phương pháp phân tích phân biệt hồi quy phi tuyến tính logistics với nhân tố dự báo từ tiêu tài doanh nghiệp (Jones Hensher, 2004; Tian cộng sự, 2015) Sự phát triển mơ hình tính tốn thông minh công nghệ với lực xử lý thuật tốn phức tạp, kỹ thuật tính tốn dựa mơ hình học máy 26 phát triển ứng dụng dự báo khả phá sản (Le Viviani, 2018; Chen cộng sự, 2019) So sánh với phương pháp thống kê, mô hình học máy chứng minh có hiệu suất vượt trội hơn, cho phép xử lý hiệu mối quan hệ phi toán toán có độ phức tạp cao mà khơng địi hỏi nhiều yêu cầu liệu Một số phương pháp tiếp cận bật mơ hình rừng ngẫu nhiên RF- Random Forest (Xie cộng sự, 2009), thuật toán K-Nearest Neighbor (KNN) (Chandra cộng 2009), mơ hình máy học vector hỗ trợ SVMSupport Vectow Machine (Serrano-Cinca GutiéRrez-Nieto, 2013) hay mơ hình thuật tốn tăng cường XGboost- Extreme Gradient Boosting (Heo Zhang, 2014) Barboza cộng (2017) phương pháp dự báo dựa mơ hình thơng minh thể khả dự báo tốt so với mơ hình thống kê truyền thống Bên cạnh đưa dự báo có tỷ lệ xác cao mơ hình dự báo hiệu cần xác định thuộc tính đặc trưng doanh nghiệp có khả giải thích cao rủi ro phá sản doanh nghiệp (Shrivastava cộng sự, 2020) Những thông tin giúp cho nhà quản trị, nhà đầu tư quan quản lý đưa cảnh báo sớm định Một số phương pháp sử dụng đưa vào biến mơ hình loại biến q trình Tạp chí Khoa học & Đào tạo Ngân hàng- Số 250- Tháng 2023 LÊ HẢI TRUNG - TRƯƠNG THỊ THÙY DƯƠNG kiểm thử dự báo Các phương pháp có điểm hạn chế nhạy cảm với liệu (Tian Yu, 2017) Để lựa chọn biến quan trọng mơ hình dự báo, Tibshirani (1996) giới thiệu phát triển phương pháp hàm phạt (LASSO- Least Absolute Shrinkage and Selection Operator), hoạt động ngun tắc loại bỏ biến khơng có nghĩa dự báo thông qua hàm phạt (penalty function) q trình tối ưu hóa quan sát Tian cộng (2015) điểm mạnh LASSO tính ổn định hiệu suất, phương pháp ổn định với nhiễu nhỏ mô hình Do đó, LASSO giải vấn đề đa cộng tuyến loại bỏ biến tính giải thích khỏi mơ hình tránh tượng q mức mơ hình (overfitting) Shrivastava cộng (2020) chứng minh mơ hình LASSO kết hợp với mơ hình học máy có khả nâng cao khả dự báo rủi ro phá sản doanh nghiệp sau loại bỏ biến số khơng có ý nghĩa khả dự báo Nghiên cứu đánh giá hiệu phương pháp LASSO để lựa chọn biến chủ động sở liệu dự báo rủi ro phá sản doanh nghiệp Việt Nam Cụ thể, so sánh chất lượng dự báo phương pháp truyền thống mơ hình học máy trước sau kết hợp với phương pháp LASSO lựa chọn biến chủ động sở liệu Với liệu gồm số tài tính tốn từ báo cáo tài 284 doanh nghiệp Việt Nam ngành xây dựng vật liệu giai đoạn 2017- 2019 thu thập từ nguồn Fiingroup.com Kết thực nghiệm cho thấy, việc kết hợp phương pháp giúp nâng cao khả dự báo rủi ro phá sản doanh nghiệp Việt Nam tất phương pháp Bên cạnh đó, ưu điểm việc ứng dụng phương pháp LASSO giúp biến tài quan trọng có ý nghĩa toán dự báo phá sản để làm sở xây dựng hệ thống cảnh báo sớm rủi ro phá sản doanh nghiệp Việt Nam Bài viết kết cấu thành phần Ngoài phần giới thiệu, mục trình bày tổng quan nghiên cứu phương pháp dự báo khả vỡ nợ doanh nghiệp Mục trình bày mơ hình dự báo rủi ro phá sản phương pháp so sánh hiệu suất dự báo Mục trình bày kết phương pháp dự báo kết luận trình bày Mục Tổng quan nghiên cứu 2.1 Các nghiên cứu dự báo rủi ro phá sản sử dụng mơ hình truyền thống Altman (1968) Beaver (1966) nghiên cứu mở đầu cho phương pháp dự báo rủi ro phá sản truyền thống Beaver (1966) sử dụng mơ hình đơn biến với số tỷ lệ tài địn bẩy tài chính, lợi nhuận tài sản tính khoản để dự báo rủi ro phá sản doanh nghiệp Altman (1968) phát triển mơ hình dự báo dựa phân tích đa biến, qua xây dựng mơ hình điểm số để đánh giá doanh nghiệp Mỹ với tiêu tài để dự báo khả vỡ nợ Sau phát triển thống kê logistic trở thành phương pháp phổ biến toán dự báo phân lớp (Olson cộng sự, 2012) rủi ro phá sản doanh nghiệp Lin (2009) kiểm tra khả dự đốn khó khăn tài mơ hình phân tích khác biệt, logit, probit công ty Đài Loan sau khủng hoảng tài năm 2009 Kết dự báo cho hiệu suất ổn định, nhiên giả định số điều kiện để liệu không thỏa mãn giả Số 250- Tháng 2023- Tạp chí Khoa học & Đào tạo Ngân hàng 27 Ứng dụng phương pháp LASSO dự báo rủi ro phá sản doanh nghiệp Việt Nam thiết thống kê hiệu suất giảm SerranoCinca Gutiérrez-Nieto (2013) khắc phục trường hợp biến có tương quan cao mơ hình phương pháp kết hợp phân tích khác biệt với bình phương nhỏ phần để dự báo khủng hoảng tài ngân hàng Mỹ năm 2008 Hiệu suất kết hợp tương đương với hiệu suất sử dụng mơ hình học máy 2.2 Các nghiên cứu dự báo rủi ro phá sản sử dụng mơ hình thơng minh Các mơ hình thơng minh phát triển tương đối sớm, đó, mơ hình mạng thần kinh (NN) phát triển thống trị thời gian dài vào năm 1990 (Wilson Sharda, 1994) NN áp dụng linh hoạt khơng có u cầu giả định thống kê xử lý với quan hệ phi tuyến Điều quan trọng dự báo phá sản mối quan hệ khả phá sản biến giải thích phi tuyến (Barboza cộng sự, 2017) Sự khác biệt kỹ thuật máy học kỹ thuật thống kê kỹ thuật thống kê đòi hỏi cấu trúc mơ hình trước, từ liệu ước tính tham số mơ hình để dự báo, phương pháp học máy, học từ liệu để đưa mơ hình dự báo Sự khác biệt dẫn đến lợi phương pháp học máy so với thống kê truyền thống khơng địi hỏi giả định mơ hình Các mơ hình học máy có ưu điểm tự cải thiện hiệu suất, cho phép xử lý nhiều tốn có độ phức tạp cao với hiệu suất cao mà khơng địi hỏi nhiều yêu cầu liệu Để so sánh mơ hình truyền thống mơ hình thơng minh, Zhao cộng (2009) so sánh mơ hình logit, NN KNN dự báo doanh nghiệp sử dụng số tài Kết cho thấy NN 28 cho hiệu cao Tương tự, Barboza cộng (2017) kiểm chứng xác dự báo mơ hình rừng ngẫu nhiên, adaboost cao so với logistic phân tích khác biệt Kết tương đồng với nghiên cứu Heo Yang (2014), Kim cộng (2015), Xiao cộng (2016) 2.3 Ứng dụng phương pháp LASSO cải thiện hiệu suất mơ hình dự báo Khả dự báo mơ hình truyền thống thông minh dựa kỹ thuật máy học phụ thuộc vào lựa chọn biến giải thích để đưa vào mơ hình Các nghiên cứu trước thường lựa chọn biến dựa đánh giá chủ quan tác giả khơng có thống cụ thể biến giải thích nên sử dụng với liệu nhóm doanh nghiệp cụ thể (Tian cộng sự, 2015) Để giải vấn đề này, số nghiên cứu gần ứng dụng kỹ thuật lựa chọn biến chủ động dựa liệu để xác định biến giải thích có ý nghĩa quan trọng tăng hiệu suất dự báo Trong đó, LASSO kỹ thuật hồi quy lựa chọn biến chủ động, áp dụng hàm phạt để tự động loại biến không phù hợp khỏi mơ hình cách đưa hệ số hồi quy biến (Tibshirani, 1996) Đối với việc dự báo rủi ro phá sản doanh nghiệp, số nghiên cứu việc kết hợp kỹ thuật LASSO mơ hình dự báo truyền thống thông minh giúp nâng cao hiệu dự báo mơ hình với giảm sai số Một nghiên cứu kể đến nghiên cứu Tian cộng (2015) Sử dụng liệu lớn với 17.000 công ty giai đoạn từ 1980 đến 2009 gần 40 biến giải thích, nhóm tác giả mơ hình có kết hợp kỹ thuật LASSO để lựa chọn biến giải thích dựa sở liệu cho hiệu Tạp chí Khoa học & Đào tạo Ngân hàng- Số 250- Tháng 2023 LÊ HẢI TRUNG - TRƯƠNG THỊ THÙY DƯƠNG suất dự báo cao nhiều so với mơ hình hồi quy phân biệt hay logistic truyền thống Sau đó, Shrivastava cộng (2020) chứng minh tính hiệu LASSO kết hợp với mơ hình thơng minh dự báo khả phá sản doanh nghiệp Ấn Độ Tương tự, việc sử dụng phương pháp lựa chọn thuộc tính cho tốn dự báo phá sản với liệu toàn doanh nghiệp tư nhân vừa nhỏ Na Uy thời gian từ 2006- 2017, Paraschiv cộng (2021) chứng tỏ biến lựa chọn từ LASSO mang lại hiệu suất dự báo cao cho mơ hình Tại Việt Nam số nghiên cứu sử dụng Lasso tốn dự báo Nguyễn Đức Trung Lê Hồng Anh (2021) so sánh ba mơ hình LASSO, mơ hình Vec tơ tự hồi quy Var, mơ hình Mạng nhớ ngắn hạn dài hạn (LSTM) dự báo giá dầu thơ Kết mơ hình LSTM cho độ xác cao Nguyễn Đức Trung cộng (2021) cung cấp so sánh hiệu dự báo tăng trưởng kinh tế lạm phát giữa mơ hình VAR, LASSO, MLP Tuy nhiên, theo hiểu biết nhóm, chưa có nghiên cứu việc ứng dụng kỹ thuật LASSO dự báo rủi ro phá sản doanh nghiệp Việt Nam Chính vậy, viết đóng góp vào khoảng trống nghiên cứu cách đánh giá khả kết hợp kỹ thuật LASSO với mơ hình dự báo truyền thống thơng minh nhằm nâng cao hiệu dự báo rủi ro phá sản doanh nghiệp Việt Nam Phương pháp nghiên cứu 3.1 Các mơ hình dự báo rủi ro phá sản 3.1.1 Mơ hình Logistics Hồi quy logistic phương pháp thống kê truyền thống thường sử dụng để phân lớp đối tượng nhận giá trị nhị phân Giả sử x1, x2, , xn giá trị biến quan sát, p = P(Y = 1|x) xác suất doanh nghiệp có khả phá sản Mơ hình hồi quy logistic thể dạng sau: p/ (1 − p) = eβ0 + β1x1 + β2x2 + + βnxn Phương pháp ước lượng hợp lý cực đại sử dụng để tìm hệ số Logistic sử dụng nhiều toán dự báo phân lớp (Tian cộng sự, 2015; Xiao cộng sự, 2016) Nguồn: Hùng Hùng, 2020 Hình Thuật tốn XGBoost Số 250- Tháng 2023- Tạp chí Khoa học & Đào tạo Ngân hàng 29 Ứng dụng phương pháp LASSO dự báo rủi ro phá sản doanh nghiệp Việt Nam 3.1.2 Mơ hình XBoost Thuật tốn Extreme Gradient Boosting (XGBoost) thuật toán hiệu cao học máy Thuật toán mở rộng thuật toán Gradient Tree Boosting đề xuất Fiedman (2001) Ngun lý mơ hình đào tạo mơ hình tốt từ việc kết hợp mơ hình yếu trước để bù đắp thiếu sót mơ hình trước Hình thể bước thuật tốn XGBoost Từ tập huấn luyện ban đầu X với n quan sát đầu y Tại bước đầu tiên, mơ hình huấn luyện tạo ngẫu nhiên học tập với giá trị đầu f1(X) sai số e1 Để có mơ hình tốt hơn, cần giảm sai số, học tập huấn luyện để ước lượng sai số e1 đồng thời ước lượng giá trị f2(X) với sai số e2 Quá trình học tập thứ n n, giá trị ước lượng ∑ f ( X ) sai số i =1 i nhỏ sau q trình huấn luyện 3.1.3 Mơ hình rừng ngẫu nghiên- RF Random forest (RF) kỹ thuật mở rộng định phát triển từ thuật toán Bagging Các tập huấn luyện lấy ngẫu nhiên, sau tích hợp lại cho kết mơ hình Thuật tốn RF có khả xử lý với giá trị ngoại lai nhiễu (Yeh, Chi, & Lin, 2014) Ngoài thuật toán lợi thuật toán khác việc so sánh tầm quan trọng biến Các bước RF là: - Từ tập khác với đặc tính khác lựa chọn ngẫu nhiên - Các liệu lựa chọn chia vào định dán nhãn - Kết cuối tổng hợp từ kết định RF lựa chọn ngẫu nhiên liệu 30 thuộc tính liệu quan sát, nên mơ hình khơng có tượng mức (underfitting) hay có độ lệch cao Tuy nhiên mơ hình tổng hợp từ nhiều cây, hạn chế khắc phục Vì RF ứng dụng nhiều với hiệu suất cao 3.1.4 Mơ hình K-Nearest Neighbor- KNN K-Nearest Neighbor (KNN) thuật toán phân lớp đơn giản dựa hàm khoảng cách Thuật tốn dễ thực khơng địi hỏi điều kiện liệu hay khơng địi hỏi phân phối xác suất liệu quan sát Thuật toán không khai thác thông tin từ tập liệu học, tính tốn thực cần dự đốn nhãn tập liệu dựa vào nhãn hàng xóm có khoảng cách gần Do KNN gọi kỹ thuật dựa nhớ, bước thuật toán sau: - Giả sử có tập học tập liệu cần phân lớp - Chọn K số lân cận cần tính tốn - Tìm khoảng cách từ tập liệu đến điểm tập học, tìm K điểm gần tập liệu nhất, nhãn tập liệu nhãn tập nhãn gần Ưu điểm KNN dễ thực hiện, đào tạo nhanh không bị nhạy nhiễu, phân lớp với liệu có nhiều nhãn Nhược điểm nhạy cảm với cấu trúc liệu, tốn nhớ nhiều thời gian hoạt động 3.1.5 Mơ hình máy học vector hỗ trợ (SVM- Support Vectow Machine) Support vectow machine (SVM) dạng thuật toán giám sát dùng phân loại hồi quy Thuật toán xây dựng đường phân lớp điểm liệu vào lớp Giả sử có giá trị đầu n tập huấn luyện X = {(x, y)|(x1, y1), ,(xk, yk)}, k = 1, , N, xk ⸦ Rd mẫu đầu vào thứ k, d số chiều Tạp chí Khoa học & Đào tạo Ngân hàng- Số 250- Tháng 2023 LÊ HẢI TRUNG - TRƯƠNG THỊ THÙY DƯƠNG không gian mẫu, yk giá trị quan sát nhận giá trị {1, -1} đặc trưng cho doanh nghiệp không phá sản phá sản Thuật tốn tìm siêu phẳng wx + b = phân tách điểm liệu Thực tế khơng thể tìm siêu phẳng tách hồn hảo điểm thuật tốn tìm phương án tách tối ưu với sai số nhỏ Thuật toán viết dạng (Vapnik, 1999): với điều kiện yi[w ϕ(xi) + b] ≥ - ξi Trong ξi giá trị cận biên sai số, C tham số điều chỉnh, ϕ(x) hàm phi tuyến T 3.2 Phương pháp lựa chọn biến chủ động LASSO Một vấn đề dự báo rủi ro phá sản mà nhà dự báo gặp phải kết dự báo phụ thuộc vào biến số dự báo đầu vào Một số phương pháp sử dụng đưa vào biến mơ hình loại biến Các phương pháp có điểm hạn chế nhạy cảm với liệu (Tian Yu, 2017) Bên cạnh đó, việc đưa vào biến số có khả dự báo thấp ảnh hưởng tới hiệu việc dự báo rủi ro phá sản doanh nghiệp (Campbell cộng sự, 2008) Để giải hai nhược điềm Tibshirani (1996) giới thiệu phát triển mơ hình hàm phạt LASSO để lựa chọn biến quan trọng mơ hình dự báo sau: + số doanh nghiệp mẫu thống kê thể hàm phạt (penalty function) với điều kiện giá trị ước lượng tham số bị giới hạn hệ số chuyển λ Giá trị λ nhỏ số biến giải thích giữ lại mơ hình dự báo Hàm phạt gọi hàm phạt “l1” Để đảm bảo điều kiện hàm phạt, LASSO tự động đưa ước lượng tham số biến giải thích khơng có ý nghĩa giảm giá trị ước lượng biến giải thích có nghĩa giá trị nhỏ Một ưu điểm phương pháp LASSO việc phương pháp cho phép xử lý vấn đề đa cộng tuyến biến giải thích Điều có lợi việc dự báo rủi ro phá sản, lẽ thông thường nghiên cứu dự báo rủi ro phá sản thường sử dụng nhiều biến số tài có tỷ lệ tương quan cao (Tian cộng sự, 2015) 3.3 Phương pháp đánh giá hiệu suất dự báo Trong nghiên cứu này, sử dụng phương pháp so sánh mơ hình dự báo khả phá sản dựa ma trận nhầm lẫn (Confusion matrix) Đây phương pháp đánh giá hiệu suất phân loại quan sát vào hai lớp phá sản hay không phá sản độ xác mức độ bao quát phép phân loại Lớp phá sản nhận giá trị 1, không phá sản nhận giá trị Ma trận gồm số sau (Bảng 1) TP (true positive) số dự đốn tích cực, nghĩa số lượng công ty phá sản dự báo phá sản TN (true negative) Bảng Ma trận nhầm lẫn cho Trong Yi,t biến nhị phân biểu diễn tình trạng doanh nghiệp i thời điểm t, xi,t-1,k tiêu tài thứ k doanh nghiệp i thời điểm t-1, n Giá trị thật Kết dự báo 1 TP FP FN TN Nguồn: Shrivastava cộng (2020) Số 250- Tháng 2023- Tạp chí Khoa học & Đào tạo Ngân hàng 31 Ứng dụng phương pháp LASSO dự báo rủi ro phá sản doanh nghiệp Việt Nam số lượng doanh nghiệp không phá sản dự báo không phá sản, FP (false positive) (dương tính giả) số lượng doanh nghiệp không phá sản dự báo phá sản, FN (false negative) (âm tính giả) số lượng doanh nghiệp phá sản dự báo khơng phá sản Độ xác mơ hình tỷ lệ dự báo đúng, tính theo cơng thức sau: Accuracy = TP + TN TP + FP + TN + FN Khi đánh giá mơ hình kênh phản ánh hiệu dự báo Xét mặt chi phí xã hội, dự báo sai lầm doanh nghiệp phá sản thành không phá sản gây tổn thất lớn nhiều so với dự báo doanh nghiệp không phá sản thành phá sản đưa sách sai lầm Vì để nâng cao hiệu dự báo mơ hình, ngồi độ xác mơ hình, hai tiêu chí sau sử dụng để đánh giá hiệu dự báo, Precision Recall, xác định đây: Precision cho biết tỷ lệ dự đoán doanh nghiệp phá sản thực phá sản, Recall cho biết tỷ lệ dự báo phá sản tổng doanh nghiệp phá sản Kết thực nghiệm 4.1 Dữ liệu nghiên cứu Để dự báo rủi ro phá sản doanh nghiệp Việt Nam, sử dụng tiêu tài 284 doanh nghiệp Việt Nam thời gian 2017- 2019 từ sở liệu FiinGroup.com Nhóm doanh nghiệp lấy ngành xây dựng vật liệu, doanh nghiệp ngành có đặc điểm tương đồng đảm bảo việc xét tiêu chí thống Các doanh nghiệp đưa vào mẫu nghiên cứu cần đảm bảo có báo cáo tài cơng bố sở liệu FiinGroup.com khoảng thời gian nghiên cứu Nhóm nghiên cứu sử dụng 35 tiêu tài chính, tính tốn từ báo cáo tài chính, tham khảo từ nghiên cứu Tian Yu (2017); Tian cộng (2015) trình bày Bảng Mục tiêu nghiên cứu dự báo rủi ro phá sản doanh nghiệp Việt Nam dựa số tài Do đó, nhóm nghiên cứu sử dụng số z-score Altman (1968) để phân loại doanh nghiệp mẫu nghiên cứu thành nhóm doanh nghiệp có rủi ro phá sản cao Bảng Các biến độc lập mơ hình 32 Tên biến Miêu tả biến ACTLCT Tổng tài sản/nợ ngắn hạn APSALE Khoản phải trả/doanh thu CASHAT Tiền mặt đầu tư ngắn hạn/tổng tài sản CASHMTA Tiền mặt đầu tư ngắn hạn/(vốn chủ sở hữu thị trường + tổng nợ phải trả) CHAT Tiền mặt/tổng tài sản CHLCT Tiền mặt/nợ ngắn hạn (EBIT + DP)/AT (Thu nhập trước lãi thuế + khấu hao khấu hao)/tổng tài sản EBITAT Thu nhập trước lãi thuế/tổng tài sản EBITSALE Thu nhập trước lãi thuế/doanh thu INVCHINVT Tăng trưởng hàng tồn kho/hàng tồn kho Tạp chí Khoa học & Đào tạo Ngân hàng- Số 250- Tháng 2023 LÊ HẢI TRUNG - TRƯƠNG THỊ THÙY DƯƠNG Tên biến Miêu tả biến INVTSALE Hàng tồn kho/bán hàng (LCT-CH)/AT (Nợ ngắn hạn - tiền mặt)/tổng tài sản LCTAT Nợ ngắn hạn/tổng tài sản LCTLT Nợ ngắn hạn/tổng nợ phải trả LCTSALE Nợ ngắn hạn/doanh thu LT/(LT + MKET) Tổng nợ phải trả/(tổng nợ phải trả + vốn chủ sở hữu thị trường) LTAT Tổng nợ phải trả/tổng tài sản LTMTA Tổng nợ phải trả/(vốn chủ sở hữu thị trường + tổng nợ phải trả) LOG(AT) log (tổng tài sản) LOG(SALE) log (bán) MB Tỷ lệ thị trường sổ sách NIAT Thu nhập ròng/tổng tài sản NIMTA Thu nhập ròng/(vốn chủ sở hữu thị trường + tổng nợ phải trả) NISALE Thu nhập ròng/doanh thu OIADPAT Thu nhập hoạt động/tổng tài sản OIADPSALE Thu nhập hoạt động/bán hàng PRICE log (giá) QALCT Tài sản nhanh/nợ ngắn hạn REAT Thu nhập giữ lại/tổng tài sản RELCT Thu nhập giữ lại/nợ RSIZE log (vốn hóa thị trường) SALEAT Doanh thu/tổng tài sản SEQAT Vốn chủ sở hữu/tổng tài sản SIGMA Biến động cổ phiếu WCAPAT Vốn lưu động/tổng tài sản Nguồn: Tian Yu (2017), Tian cộng (2015) Bảng Thống kê mơ tả biến tài doanh nghiệp phân lớp  Biến Doanh nghiệp phá sản  Doanh nghiệp không phá sản Mean Sta.Dev Min Max Mean Std.Dev Min Max ACTLCT 1,366 0,877 0,159 12,374 2,922 6,698 105,703 APSALE 0,553 2,575 0,0025 46,524 0,233 1,226 24,653 CASHAT 0,051 0,066 0,0005 0,6 0,095 0,104 0,0003 0,768 CHAT 0,0278 0,0272 0,0005 0,1698 0,059 0,067 0,768 CHLCT 0,045 0,051 0,0005 0,4519 0,23 0,865 0,0001 15,849 EBITDPAT 0,047 0,058 -0,341 0,325 0,091 0,093 -0,345 0,46 EBITAT 0,03 0,051 -0,345 0,247 0,068 0,081 -0,415 0,46 Số 250- Tháng 2023- Tạp chí Khoa học & Đào tạo Ngân hàng 33 Ứng dụng phương pháp LASSO dự báo rủi ro phá sản doanh nghiệp Việt Nam EBITSALE 0,037 1,144 -21,382 6,561 0,114 0,909 -4,847 18,285 INVCHINVT 0,506 4,875 -0,92 92,007 0,912 7,514 -1 108,495 INVTSALE 2,228 12,145 0,0005 168,38 1,104 7,975 0,0004 126 LCTCHAT 0,482 0,221 0,014 0,932 0,343 0,23 -0,638 0,866 LCTAT 0,521 0,262 0,023 3,26 0,402 0,222 0,009 0,938 LCTLT 0,0741 0,237 0,031 0,999 0,869 0,2 0,072 LCTSALE 2,999 11,206 0,097 182,115 0,955 2,542 0,007 29,725 LTLTMKET 0,68 0,169 0,116 1,173 0,464 0,225 0,011 0,939 LTAT 0,68 0,168 0,116 1,173 0,464 0,226 0,011 0,939 LTMTA 0,68 0,169 0,116 1,173 0,464 0,225 0,011 0,938 LOGAT 12,163 0,65 10,486 14,606 11,719 0,662 9,919 13,620 LOGSALE 11,709 0,696 8,762 14,115 11,589 0,755 7,297 14,014 MB 1,899 1,716 0,019 11,74 1,375 1,226 0,058 15,418 MVEF 52,554 415,678 -0,848 7,659 164,925 1,117 0,646 16,071 NIAT 0,016 0,062 -0,381 0,587 0,06 0,081 -0,852 0,416 NIMTA 0,015 0,062 -0,381 0,587 0,06 0,081 -0,852 0,416 NISALE -0,035 1,376 -23,648 3,103 0,125 0,516 -2,013 7,586 OIADPAT 0,018 0,059 -0,382 0,587 0,072 -0,951 0,449 OIADPSALE -0,038 1,38 -23,647 3,695 0,154 0,621 -2,189 9,97 PRICE 3,909 0,399 2,602 5,216 4,097 0,368 2,845 5,328 QALCT 1,366 0,977 12,374 2,922 6,698 105,704 REAT -0,006 0,167 -1,339 0,538 0,065 0,152 -1,332 0,455 RELCT 0,072 0,411 -2,087 3,453 0,402 2,127 -10,329 38,554 RSIZE 11,425 0,816 9,317 14,588 11,342 0,783 9,334 13,952 SALEAT 0,507 0,372 0,003 2,128 1,154 1,176 0,0004 8,324 SEQAT 0,32 0,169 -0,173 0,884 0,536 0,225 0,061 0,988 SIGMA 0,141 0,697 -0,886 7,478 0,536 0,226 0,611 0,988 WCAPAT -0,094 0,219 -0,683 0,647 0,269 0,225 -0,445 0,985 Nguồn: Tính tốn nhóm tác giả (chỉ số z-score < 1,81) nhóm doanh nghiệp có rủi ro phá sản thấp lành mạnh (chỉ số z-score > 1,81) Altman cộng (2017) số z-score có khả phân loại dự báo rủi ro phá sản doanh nghiệp tốt với khả dự báo xác 75% với hầu hết quốc gia Dữ liệu bao gồm hai nhóm với 134 doanh nghiệp có rủi ro phá sản cao 34 150 doanh nghiệp có rủi ro phá sản thấp lành mạnh Nhóm doanh nghiệp có rủi ro phá sản cao gán giá trị 1, nhóm doanh nghiệp cịn lại gán giá trị để đại diện cho tình trạng doanh nghiệp Bảng thống kê mơ tả biến tài mơ hình hai lớp doanh nghiệp trình bày Bảng ngơn ngữ lập trình Python Có thể thấy, tình hình tài Tạp chí Khoa học & Đào tạo Ngân hàng- Số 250- Tháng 2023 LÊ HẢI TRUNG - TRƯƠNG THỊ THÙY DƯƠNG doanh nghiệp phá sản yếu nhiều so với doanh nghiệp không phá sản Các doanh nghiệp phá sản có tỷ lệ nợ cao (0,68 so với 0,488 tỷ lệ LTAT), doanh thu thấp (0,507 so với 1,154 tỷ lệ SALEAT), biên lãi ròng thấp (-0,035 so với 0,125 tỷ lệ NISALE), khả khoản thấp (0,051 so với 0,095 tỷ lệ CASHAT) vốn lưu động cho hoạt động kinh doanh thấp (-0,094 so với 0,269 tỷ lệ WCAPAT) Kết thảo luận kết Để thực dự báo, tập liệu chia thành hai tập huấn luyện kiểm tra, tập huấn luyện cần tỷ lệ lớn để học từ liệu đưa mơ hình dự báo, tỷ lệ thường 70%, 30% (Le Vivivan, 2018) 75% 25% Nghiên cứu chia mẫu liệu thành hai tập, tập huấn luyện chiếm 75% dùng để thực mơ hình tệp kiểm tra chiếm 25% dùng để kiểm tra hiệu mơ hình Trong số trường hợp xảy tượng mức, để khắc phục tình trạng này, số đặc trưng khơng cần thiết loại khỏi mơ hình Trong nghiên cứu so sánh hiệu mơ hình dự báo với tồn biến mơ hình dự báo với biến sau dược chọn lọc từ phương pháp LASSO Cụ thể, thực hai phần, phần sử dụng hồi quy LASSO tìm biến giải thích quan trọng phản ánh khả phá sản doanh nghiệp Các biến giải thích sử dụng mơ hình dự báo LG, SVC, Adaboost, KNN, XGBoost so sánh với kết mơ hình với liệu đầy đủ biến, mô hình thực ngơn ngữ lập trình Python Bảng cho biết hiệu suất dự báo mơ hình với đầy đủ biến dự báo Kết dự báo phân loại doanh nghiệp tệp kiểm tra cho thấy tất mơ hình cho khả dự báo 77% với mô hình RF cho kết dự báo xác cao với 89,2% Đáng ngạc nhiên mơ hình hồi quy logistic truyền thống (LR) xếp thứ hai với kết dự báo xác tới 84,04%, cao so với mơ hình thơng minh khác SVM, KNN hay XGBoost Chỉ tiêu Recall cao đồng nghĩa với việc bỏ sót doanh nghiệp phá sản thấp, Precision cao phản ánh độ xác dự báo cao Mơ hình tốt mơ hình ngồi độ xác cao cịn có hai tiêu Recall Precision cao Ở hai tiêu mơ hình RF tiếp tục cho hiệu suất dự báo cao Mô hình SVM cho thấy khả bỏ sót doanh nghiệp phá sản thấp, nhiên, xác suất dự báo xác thấp cho thấy tính vững khơng lớn mơ hình Ở bước kế tiếp, để kiểm tra tính hiệu mơ hình LASSO biến tài có ý nghĩa việc dự báo rủi ro phá sản doanh nghiệp, tiến hành thực hồi quy LASSO Bảng Kết dự báo mơ hình với đầy đủ biến Mơ hình TP FP FN TN Accuracy Recall Precision LR 89 20 14 90 84,04 86,41 81,65 RF 95 14 95 89,2 91,35 87,16 SVM 69 40 96 77,46 89,61 63,30 KNN 89 20 29 75 77 75,42 81,65 XGBoost 91 18 19 85 82,63 82,73 83,49 Nguồn: Tính tốn nhóm nghiên cứu Số 250- Tháng 2023- Tạp chí Khoa học & Đào tạo Ngân hàng 35 Ứng dụng phương pháp LASSO dự báo rủi ro phá sản doanh nghiệp Việt Nam Trước hết, sử dụng hồi quy LASSO, kết cho thấy biến chọn ACTLCT, CHAT, LCTAT, LCTLT, LTAT, LOGAT, SALEAT, WCAPAT Các biến đặc trưng cho tổng tài sản/nợ ngắn hạn, tiền mặt/tổng tài sản, nợ ngắn hạn/tổng tài sản, nợ ngắn hạn/tổng nợ phải trả, tổng nợ phải trả/ tổng tài sản, tổng tài sản, giá, doanh thu/tổng tài sản, vốn lưu động/tổng tài sản Kết cho thấy, biến tài thể khả khoản, tỷ lệ đòn bẩy tài chính, khả tạo doanh thu so với quy mơ doanh nghiệp khả trì vốn lưu động ròng so với tổng tài sản chu kỳ kinh doanh có ý nghĩa cao việc phân biệt doanh nghiệp phá sản không phá sản với mẫu liệu doanh nghiệp Việt Nam Cuối cùng, thực lại việc dự báo rủi ro phá sản với mơ hình Bảng 4, thay sử dụng tồn biến tài lựa chọn biến lựa chọn từ kết hồi quy LASSO Hiệu suất mơ hình thể Bảng Kết cho thấy, hiệu suất dự báo phần lớn mơ hình cải thiện, đặc biệt mơ hình dựa kỹ thuật máy học để thực dự báo Mơ hình RF tiếp tục cho thấy hiệu suất dự báo cao nhất, với khả phân biệt mẫu kiểm tra tăng lên từ 91,35 % tới 92,86% Mơ hình KNN mơ hình cải thiện hiệu suất cao với khả dự báo xác chung tăng đáng kể từ 77% (xếp thấp Bảng 4) lên 87,32% (xếp thứ hai Bảng 5) Có thể thấy tỷ lệ Recall Bảng trì tăng lên so với mơ hình tương tự Bảng cho thấy tỷ lệ dự báo tăng lên, tỷ lệ dự báo sót doanh nghiệp phá sản giảm Điều quan trọng dự báo dự báo sai doanh nghiệp phá sản gây hậu nghiêm trọng so với dự báo sai doanh nghiệp không phá sản Kết chứng minh hiệu LASSO chọn biến dự báo khả nâng cao hiệu suất dự báo Kết luận Việc đưa dự báo xác rủi ro phá sản doanh nghiệp có ý nghĩa quan trọng, doanh nghiệp phá sản gây nhiều hệ lụy tiêu cực tới kinh tế xã hội quốc gia Rất nhiều phương pháp dự báo phát triển để nâng cao hiệu suất dự báo với phương pháp thống kê truyền thống Các mơ hình thơng minh phát triển gần dựa kỹ thuật máy học thành công toán dự báo hay phân lớp cho thấy hiệu dự báo cao Tuy vậy, hiệu suất dự báo mơ hình phụ thuộc vào việc lựa chọn biến giải thích, đơi mang nhiều yếu tố chủ quan người thực Trong nghiên cứu này, nhóm tác giả đánh giá khả ứng dụng kỹ thuật lựa chọn biến chủ động LASSO việc nâng cao hiệu Bảng Kết dự báo với biến từ mơ hình Lasso Mơ hình TP FP FN TN Accuracy Recall Precision LR 91 18 16 88 84,04 85,05 83,49 RF 91 18 97 88,26 92,86 83,49 SVM 84 25 14 90 81,69 85,71 77,06 KNN 93 16 11 93 87,32 89,42 85,32 XGBoost 87 22 15 89 82,63 82,86 79,82 Nguồn: Tính tốn nhóm nghiên cứu 36 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 250- Tháng 2023 LÊ HẢI TRUNG - TRƯƠNG THỊ THÙY DƯƠNG suất dự báo rủi ro phá sản mơ hình dự báo bật 284 doanh nghiệp sử dụng thời gian 2017- 2019 thông qua 35 biến tài lấy từ báo cáo tài hàng năm doanh nghiệp Khi sử dụng toàn biến, mơ hình RF cho hiệu dự báo cao mơ hình cịn lại Điều phù hợp với nhiều kết nghiên cứu Kim cộng (2015), Barboza cộng (2017), Xiao cộng (2016) Mặc dù SVM đánh giá cao, kết nghiên cứu khơng tìm thấy chứng chứng minh ưu việt phương pháp so với mơ hình xem xét Kết tương đồng với kết Barboza cộng (2017) Khi sử dụng phương pháp LASSO để lựa chọn biến có ý nghĩa, kết nghiên cứu cho thấy yếu tố đòn bẩy tài chính, khả tốn, khả tạo doanh thu, khả trì vốn lưu động quy mơ tài sản doanh nghiệp có khả phân biệt cao doanh nghiệp phá sản Điều phù hợp với mơ hình phân biệt tiếng Altman (1968) Cuối cùng, kết so sánh tính hiệu hồi quy LASSO lựa chọn biến có khả nâng cao hiệu suất mơ hình dự báo Các mơ hình sử dựng biến từ LASSO có độ xác độ tin cậy cao việc dự báo xác doanh nghiệp phá sản Kết nghiên cứu có nghĩa quan quản lý, nhà đầu tư, chủ nợ chủ doanh nghiệp định Bên cạnh đó, kết đưa khuyến nghị ngân hàng việc đánh giá xếp hạng rủi ro tín dụng khách hàng Tuy nhiên, nghiên cứu cịn tồn số hạn chế sau: (1) Do nghiên cứu sử dụng số tài để dự báo rủi ro phá sản, mẫu liệu bị giới hạn 284 doanh nghiệp có cơng khai báo cáo tài Do đó, kết dự báo chưa bao phủ doanh nghiệp vừa, nhỏ siêu nhỏ doanh nghiệp không công bố báo cáo tài chính; (2) Các biến tài sử dụng làm biến giải thích, chưa bao gồm biến phi tài thực việc dự báo Do đó, nghiên cứu tương lai xem xét mở rộng mẫu liệu kết hợp biến tài phi tài để đánh giá khả nâng cao hiệu suất dự báo rủi ro phá sản doanh nghiệp Việt Nam.■ Tài liệu tham khảo Altman, E I (1968) Financial ratios, discriminant analysis and the prediction of corporate bankruptcy. The journal of finance, 23(4), 589-609 Altman, E.I., Iwanicz‐Drozdowska, M., Laitinen, E.K and Suvas, A., (2017) Financial distress prediction in an international context: A review and empirical analysis of Altman’s Z‐score model Journal of International Financial Management & Accounting, 28(2), pp.131-171 Barboza, F., Kimura, H., & Altman, E (2017) Machine learning models and bankruptcy prediction. Expert Systems with Applications, 83, 405-417 Beaver, W H (1966) Financial ratios as predictors of failure. Journal of accounting research, 71-111 Campbell, J Y., Hilscher, J., & Szilagyi, J (2008) In search of distress risk. The Journal of Finance, 63(6), 2899-2939 Chandra, D K., Ravi, V., & Bose, I (2009) Failure prediction ofdotcom companies using hybrid intelligent techniques Expert Systems with Applications,36, 4830–4837 Chen, M A., Wu, Q., & Yang, B (2019) How valuable isfintech innovation? The Review of Financial Studies,32(5),2062–2106 Friedman, J H (2001) Greedy function approximation: a gradient boosting machine. Annals of statistics, 1189-1232 Heo, J., & Yang, J Y (2014) AdaBoost based bankruptcy forecasting of Korean construction companies. Applied soft computing, 24, 494-499 Số 250- Tháng 2023- Tạp chí Khoa học & Đào tạo Ngân hàng 37 Ứng dụng phương pháp LASSO dự báo rủi ro phá sản doanh nghiệp Việt Nam Kim, M J., Kang, D K., & Kim, H B (2015) Geometric mean based boosting algorithm with over-sampling to resolve data imbalance problem for bankruptcy prediction. Expert Systems with Applications, 42(3), 1074-1082 Jones, S., Hensher, D A (2004) Predicting firm finance distress: a mixed logit model Accounting Review, 79(4), 1011 – 1038 Le, H H., Viviani, J L (2018) Predicting bank failure: An improvement implementing a machine-learning approach to classical financai ratios Research in International Bussiness and Finance, 44, 16 – 25 Lin, T H (2009) A cross model study of corporate financial distress prediction in Taiwan: Multiple discriminant analysis, logit, probit and neural networks models. Neurocomputing, 72(16-18), 3507-3516 Nguyễn, Đức Trung Lê Hoàng Anh (2021) Hiệu dự báo giá dầu thơ: Một so sánh mơ hình VAR, mơ hình LASSO mơ hình LSTM, Tạp chí Kinh tế phát triển, số 288, tr 2-13 Nguyễn Đức Trung, Lê Hoàng Anh Đinh Thị Phương Anh (2021) Dự báo tăng trưởng kinh tế lạm phát Việt Nam: so sánh mơ hình Var, Lasso MLP, Tạp chí khoa học thương mại, số 154, tr 2-13 Olson, D L., Delen, D., and Meng, Y (2012) Comparative analysis of data mining methods for bankruptcy prediction Decision Support Systems, 52(2):464–473 Paraschiv, F., Schmid, M., & Wahlstrøm, R R (2021) Bankruptcy prediction of privately held SMEs using feature selection methods. Available at SSRN 3911490 Serrano-Cinca, C., & GutiéRrez-Nieto, B (2013) Partial least square discriminant analysis for bankruptcy prediction Decision Support Systems, 54(3), 1245–1255 Shrivastava, S., Jeyanthi, P M., & Singh, S (2020) Failure prediction of Indian Banks using SMOTE, Lasso regression, bagging and boosting. Cogent Economics & Finance, 8(1), 1729569 Tian, S., Yu, Y., & Guo, H (2015) Variable selection and corporate bankruptcy forecasts.  Journal of Banking & Finance, 52, 89-100 Tian, S., & Yu, Y (2017) Financial ratios and bankruptcy predictions: An international evidence. International Review of Economics & Finance, 51, 510-526 Tibshirani, R (1996) Regression shrinkage and selection via the LASSO Journal of the Royal Statistical Society Series B (Methodological),58, 267–288 Trương Việt Hùng Hà Mạnh Hùng (2020) Ước lượng khả chịu tải giàn thép sử dụng phân tích trực tiếp thuật tốn XGBoost Tạp chí xây dựng, số (2020) 91 – 94 Vapnik, V N (1999) An overview of statistical learning theory. IEEE Transactions on Neural Networks, 10(5), 988-999 Xiao, H., Xiao, Z., & Wang, Y (2016) Ensemble classification based on supervised clustering for credit scoring. Applied Soft Computing, 43, 73-86 Xie, E., Li, X., Ngai, E., Ying, W (2009) Customer churn prediction using improved balanced random forest Expert Systems with Applications, 36, 5445 – 5449 Yeh, C C., Chi, D J., & Lin, Y R (2014) Going-concern prediction using hybrid random forests and rough set approach Information Sciences, 254, 98–110 Wilson, R L., Sarda, R (1994) Bankruptcy prediction using neural networks Decision Support Systems, 11, 545 – 557 Zhao, H., Sinha, A P., & Ge, W (2009) Effects of feature construction on classification performance: An empirical study in bank failure prediction Expert Systems with Applications, 36(2), 2633–2644 38 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 250- Tháng 2023

Ngày đăng: 26/04/2023, 11:08

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan