Sử dụng phương pháp học máy dự đoán tốc độ phát triển của tảo Chlorella vulgaris trên bề mặt vữa

7 1 0
  • Loading ...

Tài liệu liên quan

Thông tin tài liệu

Ngày đăng: 16/10/2020, 19:00

Bài viết trình bày kết quả dự đoán tốc độ phát triển của vi tảo Chlorella vulgaris trên bề mặt vữa sử dụng phương pháp máy học. Các biến số đầu vào bao gồm loại phụ gia khoáng được sử dụng, hàm lượng phụ gia khoáng và thời gian vi tảo phát triển. Trần Thu Hiền / Tạp chí Khoa học Cơng nghệ Đại học Duy Tân 03(40) (2020) 9-15 03(40) (2020) 9-15 Sử dụng phương pháp học máy dự đoán tốc độ phát triển tảo Chlorella vulgaris bề mặt vữa Using machine learning approaches to estimate algal development on mortar surface Trần Thu Hiềna,b* Thu Hien Trana,b* a Viện Nghiên cứu Phát Triển Công nghệ Cao, Ðại học Duy Tân, Ðà Nẵng, Việt Nam b Khoa Xây dựng, Trường Ðại học Duy Tân, Ðà Nẵng, Việt Nam a Institute of Research and Development, Duy Tan University, Da Nang, 550000, Vietnam b Faculty of Civil Engineering, Duy Tan University, Da Nang, 550000, Vietnam (Ngày nhận bài: 06/01/2020, ngày phản biện xong: 07/02/2020, ngày chấp nhận đăng: 27/6/2020) Tóm tắt Bài báo trình bày kết dự đốn tốc độ phát triển vi tảo Chlorella vulgaris bề mặt vữa sử dụng phương pháp máy học Các biến số đầu vào bao gồm loại phụ gia khoáng sử dụng, hàm lượng phụ gia khoáng thời gian vi tảo phát triển Dữ liệu đầu diện tích bề mặt mẫu vữa bị tảo bao phủ sau thời gian phát triển Hai phương pháp máy học sử sụng mạng trí tuệ nhân tạo Artificial Neural Network (ANN) Least Square Support Vector Machine (LS-SVM) Kết cho thấy phương pháp LS-SVM dự đốn xác nhiều so với phương pháp ANN Từ khóa: Máy học; vi tảo; vữa Abstract This paper presents the results predicting the growth rate of algae Chlorella vulgaris on mortar surface using machine learning methods The input variables include the type of mineral additives used, the content of mineral additives and the growth period The output data is the mortar surface ratio covered by algae after development periods The two machine learning methods used are Artificial Neural Network (ANN), Least Square Support Vector Machine (LSSVM) The results show that the LS-SVM method predicts much more accurately than the ANN method Keywords: Machine learning; algae; mortar Giới thiệu chung Vữa loại vật liệu thường sử dụng để hồn thiện bề mặt cơng trình Tuy nhiên sau thời gian sử dụng bị hư hỏng, phần nguyên nhân phát triển vi sinh vật Các loài vi sinh vật phát triển bề mặt cơng trình đa dạng, vi khuẩn, vi tảo, vi khuẩn lam, nấm, địa y chí dương xỉ thực vật bậc cao Thông thường, vi sinh vật không tồn đơn lẻ bề mặt cơng trình, mà nhiều lồi cộng sinh phát triển Sự phát triển phụ thuộc vào nhiều yếu tố: điều kiện môi trường, kiến trúc cơng trình đặc biệt thành phần, tính chất vật liệu vữa [1,2] Dự đoán phát triển vi sinh vật cung cấp thông tin hữu ích giúp chủ *Corresponding Author: Thu Hien Tran; Institute of Research and Development, Duy Tan University, Da Nang, 550000, Vietnam; Faculty of Civil Engineering, Duy Tan University, Da Nang, 550000, Vietnam Email: tranthuhien197@gmail.com Trần Thu Hiền / Tạp chí Khoa học Cơng nghệ Đại học Duy Tân 03(40) (2020) 9-15 10 đầu tư hoạch định phương án tài để sửa chữa, bảo dưỡng cơng trình chưa tiến hành nhiều tính chất phức tạp đa ngành vấn đề [5] Xi măng loại vật liệu xây dựng sử dụng từ lâu với nhu cầu không ngừng tăng lên Việc sản xuất xi măng gây nhiều tác hại tới môi trường như: cạn kiệt tài nguyên khoáng, gây tiếng ồn khai thác, phát thải bụi đặc biệt phát thải khí hiệu ứng nhà kính Để hạn chế tác động này, tối thiểu hóa hàm lượng clinker xi măng giải pháp khả thi Có nhiều loại phụ gia khống (đầy hoạt tính) để thay phần clinker xi măng có tro trấu muội silic [3] Bài báo nghiên cứu, mô phát triển vi tảo vữa sử dụng thành phần chất kết dính khác Cụ thể xi măng Portland, có khơng trộn thêm hai loại phụ gia khống hoạt tính tro trấu muội silic Nhiều kết nghiên cứu công bố liên quan đến ảnh hưởng hai loại phụ gia tới cường độ (tại nhiệt độ thường cao) tính bền vững vữa, bê tơng (khả chống ăn mịn, tốc độ cacbonat…) [4] Tuy nhiên, mức độ hư hỏng vi sinh vật loại vữa có sử dụng phụ gia tro trấu muội silic chưa đánh giá Mô hình dự đốn tốc độ phát triển vi tảo vữa Dữ liệu thực nghiệm Để mô phỏng, dự đốn hư hỏng vật liệu cơng trình theo thời gian, liệu thực nghiệm tốc độ phát triển vi tảo bề mặt vữa thu thập Tổng cộng có 78 liệu diện tích bề mặt vữa bị vi tảo bao phủ theo thời gian Bảng thống kê thành phần cấp phối năm loại vữa nghiên cứu Hàm lượng xi măng thay 10%, 20% tro trấu muội silic Riêng mẫu có chứa tro trấu, để đảm bảo tính cơng tác vữa, phụ gia siêu hóa dẻo thêm vào Cụ thể 0.57 mL vữa 10% tro trấu, 1.87 mL vữa 20% tro trấu Bảng Thành phần vật liệu vữa STT Xi măng (g) Cát (g) Nước (g) 808.0 727.2 646.5 727.2 646.5 2424.5 2424.5 2424.5 2424.5 2424.5 440.0 440.0 440.0 440.0 440.0 Hàm lượng phụ gia khoáng Tro trấu (g) 0.0 80.8 161.5 Các mẫu vữa có kích thước 20×8×1cm3 cắt từ vữa lớn kích thước 40×16×1cm3 Tấm vữa lớn đúc khn xốp, kích thước 50×25×1cm3, bảo dưỡng đủ 60 ngày tuổi nhiệt độ khoảng 27oC, độ ẩm 100% Sau đó, phần vữa quanh mép khn cắt loại bỏ (10cm theo chiều dài, 9cm theo chiều rộng) nhằm đảm bảo tính đồng Tro trấu (%) 0.0 10 20 Muội silic (g) 0.0 Muội silic (%) 0.0 80.8 10 161.5 20 vật liệu Hỗn hợp vữa cân trộn theo tiêu chuẩn TCVN 6016:2011 [6] Độ sụt vật liệu đo côn đảm bảo nằm khoảng 4-6 cm Trong q trình thí nghiệm, bề mặt vữa định kì tưới dung dịch tảo xanh Chlorella vulgaris theo chu kì lần/ngày, lần dài 90 phút, cách 12 Trong suốt thí nghiệm, Trần Thu Hiền / Tạp chí Khoa học Cơng nghệ Đại học Duy Tân 03(40) (2020) 9-15 thông số bao gồm lưu lượng tưới, cường độ ánh sáng, nhiệt độ, nồng độ ban đầu tảo, góc nghiêng mẫu giữ cố định Bề mặt mẫu vữa thường xuyên số hóa lưu giữ (nhờ máy scan) để phân tích q trình thí nghiệm [2] Diện tích bề mặt mẫu bị vi tảo bao phủ tính theo tỷ lệ % phần diện tích mẫu có tảo xuất tổng diện tích bề mặt mẫu Trong nghiên cứu này, ba yếu tố ảnh hưởng sử dụng để mơ hình hóa tốc độ phát triển 11 tảo Chlorella vulgaris: loại phụ gia khoáng, hàm lượng phụ gia khoáng, thời gian vi tảo phát triển bề mặt vữa Diện tích bề mặt mẫu vữa bị vi tảo bao phủ Y (%) sau thời gian phát triển khác dự đoán Đây kết đầu mơ hình Các thơng số thống kê ba yếu tố ảnh hưởng diện tích mẫu bị bao phủ cho Bảng Bảng Mô tả thống kê tập liệu Biến số X1 X2 X3 Y Loại phụ gia khoáng Hàm lượng phụ gia khống Thời gian phát triển Diện tích mẫu bị tảo bao phủ Đơn vị Min Trung bình Trung vị Độ lệch chuẩn Max % ngày % 0 1.5 10 79 18.64 1.5 10 81 14.6 0.5 8.2 29.8 15.6 20 124 64.49 Hình thể bề mặt mẫu chứa 10% tro trấu sau khoảng thời gian vi tảo phát triển (X3) khác nhau, 60 ngày, 85 ngày 124 ngày a) b) c) Hình Hình ảnh bề mặt vữa chứa 10% sau (a) 60 ngày, (b) 85 ngày, (c) 124 ngày Các phương pháp trí tuệ nhân tạo 3.1 Mạng nơron nhân tạo Mạng nơron nhân tạo (Artificial Neural Network), gọi tắt mạng nơron ANN, mơ hình xử lý thông tin theo cách thức xử lý thơng tin hệ nơron sinh học Nó tạo nên từ số lượng lớn phần tử (gọi phần tử xử lý hay nơron) kết nối với thông qua liên kết làm việc thể thống để giải vấn đề cụ thể Một mạng nơron nhân tạo cấu hình cho ứng dụng cụ thể (nhận dạng mẫu, phân loại liệu, ) thông qua trình học từ tập mẫu huấn luyện Về chất học q trình hiệu chỉnh trọng số liên kết nơron Nhiệm vụ đặt huấn luyện mạng nơ ron để thực xấp xỉ hàm số D f : X  R  Y  R ; đó, D số thuộc tính đầu vào Một mơ hình ANN, bao gồm 12 Trần Thu Hiền / Tạp chí Khoa học Công nghệ Đại học Duy Tân 03(40) (2020) 9-15 lớp đầu vào, lớp ẩn lớp đầu W1 W2 biểu diễn tương ứng ma trận trọng số lớp ẩn lớp đầu ra; N biểu thị số lượng nơ-ron lớp ẩn; b1 = [b11, b12,…,b1N] biểu thị véc tơ phân cực lớp ẩn; b2 véc tơ phân cực lớp đầu ra; fA biểu thị hàm kích hoạt (ví dụ, log-sigmoid) Cấu trúc ANN sử dụng để phân tích hồi quy biểu diễn sau: f ( X )  b  W  ( f A ( b1  W  X )) (1) Nói chung, ma trận trọng số vectơ phân cực ANN thực thơng qua q trình sử dụng quy tắc đẩy lùi lỗi Hơn nữa, sai số bình phương trung bình (MSE) sử dụng hàm mục tiêu để thực cấu trúc ANN cho chức tính tốn xấp xỉ hàm: M ei2  W1 ,W2 ,b1 ,b2 M i 1 MSE  (2) 3.2 Phân tích hồi quy sử dụng LS-SVM (Least Squares Support Vector Machine) LS-SVM đề xuất Suykens cộng [7] LS-SVM phiên sửa đổi SVM (Support Vector Machine) để giảm bớt gánh nặng tính tốn Trong q trình đào tạo LS-SVM, hàm sai số bình phương nhỏ đề nghị để có tập tuyến tính phương trình khơng gian kép Do đó, vấn đề huấn luyện liệu giảm xuống giải tập hợp phương trình tuyến tính thay bậc hai SVM Các nghiên cứu thực để chứng minh tổng quát, độ xác dự đốn tính tốn nhanh LS-SVM [8] Cơng thức tốn học sau mơ tả mối quan hệ kết đầu với nhiều biến đầu vào [9]: y ( x)  w  ( x)  b T (3) nh Trong đó: x  R , y  R ,  ( x) : R  R ánh xạ tới không gian đặc trưng kích thước lớn n n Trong LS-SVM để phân tích hồi quy, tập liệu huấn luyện chuẩn bị, vấn đề đào tạo mơ hình trở thành vấn đề tối ưu hóa sau: Tối thiểu hóa 1 N J p (w, e)  wT w    ek2 2 k 1 Với (4) yk  wT ( xk )  b  ek k  1, , N , Trong đó: ek biến sai số,  >0 biểu thị số ổn định Hàm Lagrangian cho sau: N L(w, b, e;)  J p (w, e)  k {wT(xk )  b  ek  yk } k 1 (5) Các điều kiện để tối ưu: N  L  k ( xk )   w    w k 1  N  L k      b  k 1   L      e , k  1, , N k k  ek   L   wT  ( x )  b  e  y , k  1, N k k k   k (6) Sau loại bỏ e w, hệ tuyến tính thu sau:  b    0 1Tv      1   I /  v     y  y  y1 , , y N 1v  [1; ;1] , Trong đó,   [1; ; N ] (7) Và hàm hạt nhân (kernel function) áp dụng sau:   ( xk )T ( xl )  K ( xk , xl ) (8) Mô hình LS-SVM cho hàm dự đốn, thể sau: N y( x)    k K ( xk , xl )  b k 1 (9) Trần Thu Hiền / Tạp chí Khoa học Cơng nghệ Đại học Duy Tân 03(40) (2020) 9-15 13 Ở k b lời giải hệ phương trình tuyến tính (7) Hàm hạt nhân thường sử dụng hàm RBF (radial basic function) biểu diễn sau: nhỏ khả dự đốn chương trình xác Đồng thời hệ số tương quan R2 gần chứng tỏ giá trị mô giá trị dự đoán gần (10) Trong  tham số hạt nhân (kernel parameter) Kết thảo luận Thêm vào đó, để phục vụ cho q trình xây dựng mơ hình tính tốn, 90% liệu dùng để huấn luyện mô hình, 10% cịn lại sử dụng cho q trình kiểm chứng Các thơng số đầu vào mơ hình mô thay đổi để xem xét mức độ hội tụ chương trình Để đánh giá xác mơ hình hồi quy, nghiên cứu sử dụng hai số RMSE (căn bậc hai sai số bình phương trung bình) R2 (hệ số xác định) RMSE Hình thể giao diện kết thu từ chương trình VS-ANN với thơng số đầu vào sau: số vịng lặp huấn luyện 100, tốc độ huấn luyện 0.1 Hình Kết tính tốn diện tích bề mặt vữa bị tảo bao phủ sử dụng VS-ANN Kết thu với thông số đầu vào khác tập hợp Bảng Bảng Sai số mô sử dụng ANN với tham số khác Số vòng lặp huấn luyện Tốc độ huấn luyện 100 Tập huấn luyện Tập kiểm tra RMSE R2 RMSE R2 0.1 0.88 0.89 0.60 0.93 200 0.1 0.98 0.76 0.76 0.79 300 0.1 0.36 0.96 0.44 0.91 100 0.2 0.88 0.77 0.71 0.90 200 0.2 0.91 0.71 0.65 0.92 300 0.2 0.98 0.83 0.71 0.89 0.83 0.82 0.65 0.89 TRUNG BÌNH Trần Thu Hiền / Tạp chí Khoa học Cơng nghệ Đại học Duy Tân 03(40) (2020) 9-15 14 Kết cho thấy mơ hình mạng nơ ron thần kinh nhân tạo cho phép mơ xác diện tích bề mặt mẫu vữa bị tảo bao phủ theo thời gian Với tập huấn luyện, R2 nhỏ đạt 0.71 Với tập kiểm tra, R2 nhỏ đạt 0.79 Kết tốt thu với số vòng lặp 300 tốc độ huấn luyện 0.1: RMSE= 0.36, R2= 0.96 cho tập huấn luyện RMSE= 0.44, R2 = 0.91 cho tập kiểm tra Trung bình lần chạy mô thu kết sau: RMSE = 0.83, R2 = 0.82 cho tập huấn luyện RMSE = 0.65, R2 = 0.89 cho tập kiểm tra Điều chứng tỏ, liệu tuân theo quy luật mơ tốt, hồn tồn khơng phải ngẫu nhiên Khác với chương trình VS-ANN, chương trình LS-SVM cho phép tự động chia tập liệu thành hai tập: huấn luyện kiểm tra Tuy nhiên, người dùng tùy chọn thay đổi tỷ lệ hai tập Để đánh giá khả dự đốn, mơ hình hóa, ngồi thơng số RMSE R2 chương trình sử dụng thêm thơng số MAPE (giá trị trung bình tỷ lệ sai số giá trị thực tế biến số) Hình thể giao diện kết thu chương trình LS-SVM với thơng số đầu vào sau: tham số ổn định = 10, tham số kernel = Với tập kiểm tra, kết mơ hình thu được: RMSE = 0.28; MAPE = 66.12 % R2 = 0.78 Kết mơ hình tập huấn luyện thể thu sau: RMSE = 0.08; MAPE = 14; 60 % R2 = 0.99 Quan sát đồ thị hình cho thấy, giá trị dự đoán (màu cam) sát với giá trị thực nghiệm (màu xanh) Hình Kết tính tốn diện tích bề mặt vữa bị tảo bao phủ sử dụng LS-SVM Bảng thể kết dự đốn diện tích bề mặt mẫu bị tảo bao phủ với tham số chương trình khác Bảng Sai số mô sử dụng LS-SVM với tham số khác Tham số ổn định Tham số kernel 10 20 30 10 20 30 1 2 TRUNG BÌNH Tập huấn luyện RMSE 0.08 0.08 0.08 0.09 0.08 0.08 0.08 MAPE 14.68 12.08 19.21 15.52 16.29 17.75 15.92 Tập kiểm tra R 0.99 0.99 0.99 0.99 0.99 0.99 0.99 RMSE 0.28 0.25 0.09 0.05 0.23 0.22 0.19 MAPE 66.12 75.89 8.21 52.45 24.44 14.64 40.29 R2 0.78 0.88 0.99 0.97 0.93 0.92 0.91 Trần Thu Hiền / Tạp chí Khoa học Công nghệ Đại học Duy Tân 03(40) (2020) 9-15 Từ kết tập hợp Bảng nhận xét chương trình LS-SVM cho phép dự báo tốt diện tích bề mặt mẫu vữa có tảo bao phủ Với tập huấn luyện R2 đạt 0.99 Với tập kiểm tra R2 đạt lớn 0.99, thấp 0.78 Nếu so sánh với chương trình VS-ANN, chương trình LS-SVM cho kết dự đốn tốt nhiều Kết luận Bài báo trình bày kết mơ dự đốn diện tích bề mặt mẫu vữa bị vi tảo bao phủ theo thời gian Hai chương trình trí tuệ nhân tạo VS-ANN LS-VSM sử dụng Các biến đầu vào chương trình bao gồm: loại phụ gia khoáng (tro trấu hay muội silic), hàm lượng sử dụng phụ gia khoáng thời gian mẫu thí nghiệm phơi nhiễm với vi tảo Kết cho thấy hai chương trình cho phép dự báo tốt diện tích bề mặt mẫu vữa bị bao phủ vi tảo Tuy nhiên, LS-VSM cho kết dự báo sát với thực tế nhiều so với VSANN Bài báo tập trung vào biến số liên quan đến phụ gia khoáng sử dụng để thay xi măng Hướng kiến nghị sau: tổng qt hóa mơ cách đưa thêm nhiều thông số ảnh hưởng đến phát triển vi tảo làm biến đầu vào (liên quan đến vật liệu, đến điều kiện thí nghiệm ) Khi đó, biết trước thành phần vật liệu, điều kiện sử dụng cơng trình, mơ hình trí tuệ nhân tạo cho phép dự đoán trước 15 mức độ hư hỏng tường cơng trình Đây sở thơng tin quan trọng giúp chủ đầu tư lập kế hoạch dự tốn chi phí để sửa chữa bảo dưỡng bề mặt cơng trình Tài liệu tham khảo [1] Ortega-Calvo, J.J., Ariño, X., Hernandez-Marine, M., Saiz-Jimenez, C., 1995 Factors affecting the weathering and colonization of monuments by phototrophic microorganisms Science of The Total Environment 167, 329-341 [2] Tran, T.H., Govin, A., Guyonnet, R., Grosseau, P., Lors, C., Garcia-Diaz, E., Damidot, D., Deves, O., Ruot, B, 2012 Influence of the intrinsic characteristics of mortars on biofouling by Klebsormidium flaccidum Int Biodeterior Biodegrad., 70, 31–39 [3] P K Mehta, 2009 Global concrete industry sustainability, Concrete International 31, pp 45-48 [4] Sata, V., Jaturapitakkul, C and K Kiattikomol, 2007 Influence of pozzolan from various byproduct materials on mechanical properties of high strength concrete Constr Build Mater 21, 1589-98 [5] Tran, T.H., Hoang, N.D., 2019 Predicting algal appearance on mortar surface with ensembles of adaptive neuro fuzzy models: a comparative study of ensemble strategies, International Journal of Machine Learning and Cybernetics 10, 1687–1704 [6] TCVN 6016:2011, Tiêu chuẩn quốc gia Xi măng – Phương pháp thử - Cường độ [7] Suykens, J., Gestel, J.V., Brabanter, J.D., Moor, B.D & Vandewalle, J., 2002 Least Square Support Vector Machines World Scientific Publishing Co Pte Ltd Singapore [8] Samui P, Kothari DP (2011) Utilization of a least square support vector machine (LSSVM) for slope stability analysis Scientia Iranica 18(1):53–58 [9] Suykens, J.A.K., Gestel, T.V., Brabanter, J.D., Moor, B.D & Vandewalle, J 2010 Toolbox LS-SVM lab v1.7 http://www.esat.kuleuven.be/sista/lssvmlab/ ... hưởng sử dụng để mơ hình hóa tốc độ phát triển 11 tảo Chlorella vulgaris: loại phụ gia khoáng, hàm lượng phụ gia khoáng, thời gian vi tảo phát triển bề mặt vữa Diện tích bề mặt mẫu vữa bị vi tảo. .. giá Mơ hình dự đốn tốc độ phát triển vi tảo vữa Dữ liệu thực nghiệm Để mơ phỏng, dự đốn hư hỏng vật liệu cơng trình theo thời gian, liệu thực nghiệm tốc độ phát triển vi tảo bề mặt vữa thu thập... thấy, giá trị dự đốn (màu cam) sát với giá trị thực nghiệm (màu xanh) Hình Kết tính tốn diện tích bề mặt vữa bị tảo bao phủ sử dụng LS-SVM Bảng thể kết dự đốn diện tích bề mặt mẫu bị tảo bao phủ
- Xem thêm -

Xem thêm: Sử dụng phương pháp học máy dự đoán tốc độ phát triển của tảo Chlorella vulgaris trên bề mặt vữa, Sử dụng phương pháp học máy dự đoán tốc độ phát triển của tảo Chlorella vulgaris trên bề mặt vữa