Dự báo mực nước sông cao nhất

10 1 0
Dự báo mực nước sông cao nhất

Đang tải... (xem toàn văn)

Thông tin tài liệu

Dự báo mực nước sông cao nhất và thấp nhất trong ngày là bài toán có tính thực tiễn cao. Đã có nhiều phương án đề xuất để dự báo hai đại lượng này, nhưng do các thông số của mô hình dự báo phụ thuộc vào điều kiện địa lý và phát triển kinh tế khu vực cần dự báo. Vì vậy, đối với từng khu vực dự báo cần phải xác định lại các thông số của mô hình hoặc đề xuất mô hình mới phù hợp để đạt được độ chính xác cao hơn. Bài báo đề xuất ứng dụng mô hình hỗn hợp để ước lượng mực nước sông cao nhất và thấp nhất trong ngày, trong đó thành phần tuyến tính được ước lượng bằng SVD (Singular Value Decomposition) và thành phần phi tuyến ước lượng bằng máy học véctơ hỗ trợ SVM (Support Vector Mechine). Số liệu đầu vào là giá trị mực nước sông cao nhất, thấp nhất và trung bình của các ngày trước đó. Chất lượng của giải pháp đề xuất được kiểm nghiệm trên bộ số liệu thực tế (1.460 ngày, từ 01012017 đến 3182020) ở khu vực hạ lưu sông Thái Bình, Trạm thủy văn Bá Nha, huyện Thanh Hà, tỉnh Hải Dương. Kết quả sai số trung bình tuyệt đối đạt 0.12.

Dự báo mực nước sông cao nhất, thấp ngày sử dụng mơ hình hỗn hợp The daily highest and lowest river water levels are forecasted using a hybrid model Tóm tắt Dự báo mực nước sơng cao thấp ngày tốn có tính thực tiễn cao Đã có nhiều phương án đề xuất để dự báo hai đại lượng này, thơng số mơ hình dự báo phụ thuộc vào điều kiện địa lý phát triển kinh tế khu vực cần dự báo Vì vậy, khu vực dự báo cần phải xác định lại thông số mơ hình đề xuất mơ hình phù hợp để đạt độ xác cao Bài báo đề xuất ứng dụng mơ hình hỗn hợp để ước lượng mực nước sông cao thấp ngày, thành phần tuyến tính ước lượng SVD (Singular Value Decomposition) thành phần phi tuyến ước lượng máy học véctơ hỗ trợ SVM (Support Vector Mechine) Số liệu đầu vào giá trị mực nước sông cao nhất, thấp trung bình ngày trước Chất lượng giải pháp đề xuất kiểm nghiệm số liệu thực tế (1.460 ngày, từ 01/01/2017 đến 31/8/2020) khu vực hạ lưu sơng Thái Bình, Trạm thủy văn Bá Nha, huyện Thanh Hà, tỉnh Hải Dương Kết sai số trung bình tuyệt đối đạt 0.12 Từ khóa: SVD; SVM; mơ hình tuyến tính; mơ hình phi tuyến; mơ hình hỗn hợp Abstract The daily forecast of the highest and lowest river water level is a problem with a high applicability There have been many proposed methods to forecast these two quantities, however the parameters of the forecasting model depend on geographical conditions and regional economic development to forecast Therefore, for each forecast area it is necessary to redefine the model parameters or propose a suitable new model to achieve higher accuracy The paper proposes to apply a hybrid model to estimate the day's highest and lowest river water levels, in which the linear component is estimated by Singular Value Decomposition (SVD) and the nonlinear component estimated by Support Vector Mechine (SVM) vector Input data is the value of the highest, lowest and average river water level of the previous days The quality of the proposed solution was tested on the actual data set (1.460 days, from January 1, 2017 to August 31, 2020) in the downstream area of Thai Binh river, Ba Nha hydrological station, Thanh Ha district, Hai Duong province The result of the absolute average error is 0.12 Keywords: SVD; SVM; linear models; nonlinear models; hybrid model ĐẶT VẤN ĐỀ Bài toán dự báo trường hợp đặc biệt toán ước lượng xây dựng mơ hình ánh xạ đầu vào đầu Dự báo mực nước sơng có ý nghĩa thực tiễn việc phát triển kinh tế khu vực, đặc biệt sản xuất nông nghiệp Biết mực nước sông hàng ngày giúp trạm Thủy văn khu vực điều tiết lưu lượng nước để phục vụ sản xuất tưới, tiêu, chống úng nội đồng… Đã có nhiều mơ hình dự báo thống kê nghiên cứu ứng dụng thành công giới phương pháp hồi quy phi tuyến tính, phi tuyến; phương pháp giá trị cực trị (Extreme Value) mạng nơron nhân tạo (ANN – Artificial Neural Network) [7-11], số đó, mơ hình ứng dụng mạng nơron nhân tạo đạt tiến đáng kể nghiên cứu ứng dụng rộng rãi thời gian qua [1, 3-5, 7-11] Thuật toán máy học véctơ hỗ trợ (SVM) Vapnik giới thiệu năm 1995 [6], nghiên cứu thử nghiệm lĩnh vực dự báo thơng số khí tượng, mơi trường thu kết khả quan, hầu hết nghiên cứu cơng bố, mơ hình dự báo dùng kỹ thuật SVM cho kết tốt so với mơ hình ANN kiểm chứng [12-14] Trong báo này, nhóm tác giả đề xuất ứng dụng kỹ thuật SVM mơ hình hỗn hợp [2] để dự báo mực nước sông khu vực hạ lưu sông Thái Bình Kết nghiên cứu thực nghiệm cho thấy ứng dụng kỹ thuật SVM mơ hình hỗn hợp dự báo mực nước sông cho kết khả quan PHỐI HỢP SVD VÀ SVM TRONG MƠ HÌNH HỖN HỢP DỰ BÁO MỰC NƯỚC SƠNG 2.1 Mơ hình hỗn hợp Mơ hình hỗn hợp [2] tác giả đề xuất để dự báo ngắn hạn phụ tải điện cho kết khả quan; để ước lượng thành phần tuyến tính tác giả sử dụng thuật tốn khai triển theo giá trị kỳ dị SVD, phần ước lượng phi tuyến sử dụng mạng MLP Trong báo này, nhóm tác giả đề xuất phối hợp SVD SVM mơ hình hỗn hợp để dự báo mực nước sông cao (HLmax) mực nước sông thấp (HLmin) ngày khu vực hạ lưu sông Thái Bình 2.1.1 Cấu trúc mơ hình hỗn hợp Tín hiệu đầu vào (x) véctơ chứa số liệu khứ; tín hiệu đầu (d) tổng hai thành phần ước lượng: ước lượng tuyến tính ước lượng phi tuyến Thành phần tuyến tính Thành phần phi tuyến Tín hiệu đầu d Tín hiệu đầu vào x Ước lượng tuyến tính Ước lượng phi tuyến Hình Cấu trúc mơ hình hỗn hợp [2] Khi sử dụng mơ hình hỗn hợp, để giảm bớt mức độ phức tạp mơ hình phi tuyến, trước hết cần ước lượng thành phần tuyến tính, sau ta loại thành phần tuyến tính khỏi số liệu đầu vào để nhằm giữ lại thành phần phi tuyến tín hiệu đối tượng Tín hiệu cịn lại dùng để huấn luyện khối phi tuyến hay nói cách khác: Sai số cịn lại từ khối tuyến tính trở thành đầu vào khối phi tuyến Cấu trúc mơ hình dự báo mực nước sông cao (HLmax) mực nước sông thấp (HLmin) khu vực hạ lưc ngày Hình HLmax (mực nước cao hạ lưu), HLmin (mực nước thấp hạ lưu), HLTB (mực nước trung bình hạ lưu), TLmax (mực nước cao thượng lưu), TLmin (mực nước thấp thượng lưu), TLTB (mực nước trung bình thượng lưu), ngày d ngày dự báo, ngày d-i ngày trước ngày dự báo 2.1.2 Mơ tả tốn học mơ hình hỗn hợp Từ sơ đồ Hình ta có: d = f (x) ≈ Linear(x)+ NonLinear(x) (1) Mơ hình tuyến tính (Linear(x)) xác định trước sau xác định mơ hình phi tuyến (NonLinear(x)) Với số liệu gồm p mẫu {xi, di}, i = 1, 2,… p, mơ hình tuyến tính xác định sở tối ưu hóa hàm sai số tập mẫu số liệu này: ∀i: Linear(xi) ≈ di hay e = Linear(xi)− di i=1 p ∑ → (2) Khi xác định mơ hình tuyến tính, phần sai số cịn lại xấp xỉ mơ hình phi tuyến thuật tốn tối ưu hóa hàm sai số phi tuyến: ∀i : NonLinear(xi ) ≈ di − Linear(xi ) hay e = NonLinear(xi ) − (di − Linear(xi )) i=1 p ∑ → (3) Giả thiết giá trị HLmax ước lượng theo (4) (Ước lượng giá trị HLmin làm tương tự): HLmax(d) ≈ f 1,2, ,K(HLmax(d − i), HLmin(d − i),HLTB(d − i),TLmax(d − i)), TLmin(d − i),TLTB(d − i)+ + ai1⋅ HLmax(d − i)+ ai2 ⋅ HLmin(d − i)+ +ai3⋅ HLTB(d − i)+ ai4 ⋅TLmax(d − i)+ +ai5⋅TLmin(d − i)+ ai6 ⋅TLTB(d − i) ⎡ ⎣ ⎢ ⎢ ⎢ ⎤ ⎦ ⎥ ⎥ i=1 ⎥ K ∑ (4) Trong đó: f(): hàm phi tuyến; aij: hệ số mơ hình tuyến tính; Mơ hình phi tuyến xấp xỉ SVM 2.2 Xây dựng mơ hình hỗn hợp 2.2.1 Lựa chọn đặc tính đầu vào mơ hình dự báo [1, 2] Ứng dụng thuật toán khai triển theo giá trị kỳ dị để lựa chọn đặc tính đầu vào mơ hình dự báo Bài tốn xây dựng mơ hình tuyến tính đưa giải tìm nghiệm x hệ phương trình: A ˙ x = b (5) Trường hợp số phương trình nhiều số ẩn nên thường khơng có nghiệm nhất, nghiệm hệ phương trình xác định từ tốn tối ưu hóa sai số (còn gọi residue r) định nghĩa bởi: A⋅ x − b = r = ? (6) Nghiệm tốn tối ưu (6) xác định dựa kết phân tích ma trận A ϵ~m×n theo giá trị kỳ dị Theo [1, 2], với ma trậnm×n theo giá trị kỳ dị Theo [1, 2], với ma trận không vuông, ta xác định ma trận A+ ϵ~m×n theo giá trị kỳ dị Theo [1, 2], với ma trậnm×n từ phân tích SVD ma trận A Với A = U˙S˙VT A+ = V˙S+ ˙UT (7) Với U, V: ma trận trực giao: S+ = diag( σ , σ ,…, σ r ) ∈!n×m Ma trận đường chéo Khi nghiệm tối ưu phương trình (6) xác định bởi: x = A+ ˙b (8) 2.2.2 Ứng dụng SVM ước lượng thành phần phi tuyến Cho tập liệu gồm N mẫu huấn luyện {(x1, y1),…, (xN, yN)} véctơ đầu vào (D chiều) yi ϵ {±1} mã lớp véctơ đầu vào Bài toán nhị phân phân loại lớp, mã tương ứng lớp +1 lớp -1 Ta cần tìm siêu phẳng w ˙ x + b = để tách tập liệu thành lớp Trong đó: w: véctơ pháp tuyến siêu phẳng, có tác dụng điều chỉnh hướng siêu phẳng; Giá trị b có tác dụng di chuyển siêu phẳng song song với Có thể, có nhiều siêu phẳng để phân tách tập liệu có nhiều thuật tốn để giải toán này, chẳng hạn thuật toán Perceptron Rosenblatt [15], thuật tốn biệt thức tuyến tính Fisher [16] Tuy nhiên, thuật toán SVM, siêu phẳng tối ưu cho siêu phẳng có tổng khoảng cách tới véctơ gần hai lớp lớn Bên cạnh đó, để đảm bảo tính tổng quát hóa cao, biến lỏng (Slack Variable) đưa vào để nới lỏng điều kiện phân lớp Bài tốn đưa đến việc giải tối ưu có ràng buộc: w,b,ξ w T ⋅w+ C ξi i=1 N ∑ Sao cho: yi (w T ⋅ xi + b) + ξi −1≥ 0;ξi ≥ 0,∀i ∈[1,N] (9) Trong đó: C >0: Tham số chuẩn tắc (Regularization Parameter); zi : Biến lỏng Bài tốn (10) đựợc giải phương pháp SMO (Sequential Minimal Optimization) Phương pháp đưa đến giải toán đối ngẫu quy hoạch toàn phương (Quadratic Programming): max α L(α) = αi i=1 N ∑ − αi ⋅α j ⋅ yi ⋅ y j ⋅Φ(xi)⋅Φ(x j) i, j ∑ (10) Thỏa mãn: ≤α i ≤ C,α i ≤α i ≤ C, C,∀i ∈[1,N] α i ⋅ yi i=1 N ∑ = với nhân tử Lagrange Sau có giá trị từ toán (11), ta thu giá trị tối ưu w* b* siêu phẳng Chỉ có mẫu có a ≥ gọi véctơ hỗ trợ Cuối cùng, hàm định phân lớp có dạng: f (x) = sgn αi ⋅ yi ⋅Φ(xi)⋅Φ(x j)+ b* ( ) (11) Gọi K(xi ,x j) = Φ(xi)⋅Φ(x j) hàm nhân không gian đầu vào Theo đó, tích vơ hướng khơng gian đặc trưng tương đương với hàm nhân K(xi ,x j) không gian đầu vào Như vậy, thay tính trực tiếp giá trị tích vơ hướng, ta thực gián tiếp thơng K(xi ,x j) cho tính tốn 2.2.3 Ước lượng HLmax, HLmin ngày 2.2.3.1 Ước lượng thành phần tuyến tính Từ phương trình (4), hàm quan hệ tuyến tính HLmax ngày d với HLmax ngày khứ xác định từ hệ phương trình ước lượng xấp xỉ cơng thức (12) (13) Từ (13) ta cần xác định véctơ a = a1,a2,…,aK ⎡ ⎣ ⎤ ⎦ T để đạt cực tiểu hàm sai số ước lượng Trong thực tế áp dụng, ta cần trả lời hai câu hỏi: (1) Cần sử dụng số liệu khứ?, (2) Đó số liệu Phương pháp xác định thích nghi thực sau: - Trước tiên ta sử dụng số lượng lớn số liệu khứ (trong nghiên cứu sử dụng K = 60 - Tương đương tháng số liệu trước - đủ để dự báo (15)) sử dụng đầu vào cho mơ hình ước lượng thành phần phi tuyến dùng kỹ thuật SVM KẾT QUẢ VÀ THẢO LUẬN Mơ hình nghiên cứu xây dựng phần mềm Matlab®2010b, với SVM sử dụng LSSVMlabv1.8_ R2009b_R2011a thiết kế theo bước sau: (1) Chuẩn bị liệu, (2) Lựa chọn đặc tính cho mơ hình dự báo, (3) Xây dựng kiến trúc mạng, (4) Lựa chọn phương pháp đào tạo mạng, (5) Đánh giá độ tin cậy Chất lượng mô hình kiểm nghiệm số liệu thực tế Trạm thủy văn Bá Nha, huyện Thành Hà, tỉnh Hải Dương (1460 ngày từ 01/01/2017 đến 31/8/2020) 3.1 Kết ước lượng thành phần tuyến tính 3.1.1 Kết ước lượng HLmax Bằng phương pháp phân tích SVD kết hợp với kinh nghiệm thực tế ta xác định yếu tố ảnh hưởng lớn đến mức nước cao (HLmax) cần dự báo: - Ảnh hưởng HLmax khứ đến HLmax dự báo, ta xác định ngày có hệ số phụ thuộc lớn là: d-1, d-4, d-8, d-12 d-15 Tiếp tục khảo sát phụ thuộc HLmax vào số liệu HLmin, HLTB, TLmax, TLmin, TLTB khứ cách làm hoàn toàn tương tự ta được: Ảnh hưởng HLmin khứ đến Tmax dự báo ngày d-1, d-15 d-18; Ngày d-27 xa ngày dự báo nên ta loại - Giá trị HLTB khứ ảnh hưởng đến HLmax dự báo d-1, d-2, d-4 d-8 Ngày d-36 loại - Các giá trị TLmax khứ ảnh hưởng đến HLmax dự báo d-1; Ngày gần d-47 xa ngày dự báo nên loại - Ảnh hưởng TLmin đến HLmax d-5, d-12, d-15 d-16; ngày d-42 xa ngày dự báo nên loại - Ảnh hưởng TLTB đến HLmax d-4, d-13 d-14; ngày d-33 d-51 xa ngày dự báo loại Tổng hợp lại ta có mơ hình lựa chọn để dự báo giá trị HLmax ngày thứ d gồm 20 số liệu khứ có hệ số ảnh hưởng lớn đến ngày dự báo d, phương trình (16) ngày tiếp theo) - Với K số liệu khứ, ta xác định véctơ a = a1,a2,…,aK ⎡ ⎣ ⎤ ⎦ T hàm ước lượng tuyến tính HLmax (d) ≈ ⋅ HLmax ⎡ (d − i) ⎣ ⎤ ⎦ i=1 K ∑ SVD - Xác định thành phần có giá trị tuyệt đối nhỏ véctơ a Thành phần tương ứng với ngày khứ ảnh hưởng tới ngày dự báo ta loại bỏ khỏi số liệu khứ, giảm K=K-1, quay lại bước K>Kmin chọn trước Quá trình lặp bước 2-3 K giảm xuống giá trị đủ nhỏ chấp nhận để mơ hình khơng q phức tạp Cụ thể, báo ta chọn Kmin 3.2 Kết ước lượng thành phần phi tuyến 3.2.1 Kết ước lượng Hlmax Sau xác định thơng số mơ hình tuyến tính, ta tiến hành xây dựng mạng nơron ứng với 20 đầu vào, đầu (tương ứng với mức nước cao cần dự báo); Kết thành phần sai số ước lượng phi tuyến Bảng Bảng Kết sai số sử dụng SVM ước lượng thành phần phi tuyến để dự báo HLmax, HLmin Sai số học Sai số kiểm tra MAE MRE (%) MaxMAE MAEMRE (%) MaxMAE HLmax 0.017 1,52 0.22 0.12 2,35 0.61 HLmin 0.022 1,43 0.26 0.12 2.33 0.87 Hình Sai số học sai số kiểm tra ước lượng HLmax SVM mơ hình phi tuyến 3.2.2 Kết ước lượng HLmin Sau xác định thơng số mơ hình tuyến tính, ta tiến hành xây dựng mơ hình phi tuyến với 16 đầu vào, đầu (ứng với mực nước thấp cần dự báo); Kết thành phần sai số ước lượng phi tuyến Bảng Sai số trung bình tuyệt đối ước lượng HLmax HLmin SVM mơ hình phi tuyến tương đối nhỏ khoảng 0,12 Với sai số phù hợp với tốn dự báo mực nước sơng Hình Kết ước lượng thành phần phi tuyến KẾT LUẬN Khi ước lượng toán phi tuyến, để giảm bớt mức độ phức tạp giải pháp, mơ hình hỗn hợp tách riêng thành phần tuyến tính thành phần phi tuyến để xử lý Thành phần tuyến tính xác định thơng qua việc sử dụng khai triển theo cá giá trị kỳ dị (SVD) Thuật toán cho phép xác định hàm quan hệ tuyến tính mực nước sơng cao (hoặc thấp nhất) ngày ngày trước từ hệ phương trình ước lượng xấp xỉ viết dạng ma trận có số hàng nhiều số cột Thành phần phi tuyến xác định thông qua việc sử dụng kỹ thuật máy học véctơ hỗ trợ SVM; Qua thực nghiệm cho thấy sai số học sai số kiểm tra dự báo ngắn hạn mực nước sông khu vực hạ lưu cao (HLmax) thấp (HLmin) đạt khoảng 0,12, với sai số phù hợp cho tốn dự báo Vì vậy, ta thấy phối hợp SVD SVM mơ hình hỗn hợp cho tốn dự báo mực nước sơng phù hợp TÀI LIỆU THAM KHẢO [1] Trần Hoài Linh (2009), Mạng nơron ứng dụng xử lý tín hiệu, NXB Bách Khoa [2] Nguyễn Quân Nhu (2009), Nghiên cứu ứng dụng mạng nơron logic mờ cho toán dự báo phụ tải điện ngăn hạn, Luận án Tiến sĩ [3] Đỗ Văn Đỉnh, Đinh Văn Nhượng Trần Hồi Linh (2015), Ứng dụng mơ hình hỗn hợp ước lượng giá trị lớn nhỏ nhiệt độ mơi trường ngày, Tạp chí khoa học công nghệ - Đại học Đà Nẵng, số 11(96).2015, 2, trang 35-39 [4] Hồ Việt Hùng, Lê Xuân Hiền, Giha Lee (2018), Ứng dụng mạng thần kinh nhân tạo dự báo lưu lượng dịng chày sơng Hồng Sơn Tây dựa liệu thượng lưu, Tuyển tập cơng trình Hội nghị khoa học Cơ học Thủy khí tồn quốc lần thứ 2018 [5] Hồ Việt Hùng, Hồ Việt Tấn (2020), Ứng dụng mạng nơron LSTM (Long Short-Term Memory neural networks) dự báo mực nước cống-Âu Thuyền Cầu Cất hệ thống Bắc Hưng Hải, Hội nghị [6] V Vapnil (1995), Support-Vector Networks, Machine Learning, 20, 273-297 [7] A Filippo et al (2012), Application of Artificial Neural Network (ANN) to improve forecasting of sea, Ocean & Coastal Management 55, pp 101-110

Ngày đăng: 05/10/2023, 20:48

Tài liệu cùng người dùng

Tài liệu liên quan