PHÁT TRIỂN CÁC MÔ HÌNH VÀ THUẬT TOÁN BIỂU DIỄN, XỬ LÝ, KHAI THÁC DỮ LIỆU KHÔNG GIAN VÀ ỨNG DỤNG GIẢI MỘT SỐ BÀI TOÁN GIS

27 1.1K 0
PHÁT TRIỂN CÁC MÔ HÌNH VÀ THUẬT TOÁN BIỂU DIỄN, XỬ LÝ, KHAI THÁC DỮ LIỆU KHÔNG GIAN VÀ ỨNG DỤNG GIẢI MỘT SỐ BÀI TOÁN GIS

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN NGUYỄN MINH NAM PHÁT TRIỂN CÁC MÔ HÌNH VÀ THUẬT TOÁN BIỂU DIỄN, XỬ LÝ, KHAI THÁC DỮ LIỆU KHÔNG GIAN VÀ ỨNG DỤNG GIẢI MỘT SỐ BÀI TOÁN GIS Chuyên ngành: Đảm bảo toán học cho máy tính và hệ thống tính toán Mã số chuyên ngành: 1.01.10 TÓM TẮT LUẬN ÁN TIẾN SĨ TOÁN HỌC Tp. Hồ Chí Minh, năm 2011 Công trình được hoàn thành tại: Khoa Công Nghệ Thông Tin, Trường Đại Học Khoa Học Tự Nhiên. Người hướng dẫn khoa học: GS.TSKH. Hoàng Văn Kiếm Phản biện 1: PGS. TS. Dương Anh Đức Phản biện 2: PGS. TS. Trần Vĩnh Phước Phản biện 3: TS. Đặng Trường Sơn Phản biện độc lập 1: PGS. TS. Trần Văn Lăng Phản biện độc lập 2: PGS. TS. Lê Văn Trung Phản biện độc lập 3: PGS. TS.Trần Vĩnh Phước Luận án sẽ được bảo vệ trước Hội đồng chấm luận án họp tại trường Đại học Khoa Học Tự nhiên vào lúc………., ngày… tháng… năm… Có thể tìm hiểu luận án tại thư viện: - Thư viện Khoa học Tổng hợp Tp.HCM - Thư viện Trường Đại học Khoa học Tự Nhiên 1 1 Tổng quan 1.1 Yêu cầu thực tiễn và lý do thực hiện đề tài Việc nghiên cứu, ứng dụng khoa học công nghệ nhằm đạt tới trình độ tiên tiến của các nước trong khu vực, góp phần tạo ra các bước đổi mới mạnh mẽ về công nghệ trong việc phát triển các sản phẩm, dịch vụ giá trị gia tăng có hàm lượng trí tuệ cao để phục vụ hiệu quả cho các lĩnh vực phát triển kinh tế-xã hội và bảo đảm an ninh-quốc phòng đã và đang trở thành mục tiêu chủ đạo của quốc gia. Một trong các hướng phát triển công nghệ chủ đạo chính là lĩnh vực Công nghệ Thông tin mà hệ thống Thông tin Địa lý (GIS) là chuyên ngành hẹp. 1.2 Mục tiêu luận án Xuất phát từ yêu cầu thực tiễn, đề tài đặt ra mục tiêu phát triển một số mô hình thuật toán giải quyết các vấn đề nền tảng trong GIS. Một loạt các thuật toán xử lý không gian cần được giải quyết với thời gian thực thi hiệu quả để đáp ứng yêu cầu thực tế. Những mục tiêu cụ thể được đề ra và thực hiện trong luận án gồm:  Nghiên cứu mô hình biểu diễn tích hợp dữ liệu không gian và thuộc tính trong một hệ thống khai thác thống nhất.  Nghiên cứu và cài đặt các thuật toán khai thác dữ liệu không gian, tìm kiếm lân cận và phân tích mạng tuyến.  Thiết lập hệ thống thư viện GIS hạt nhân để hỗ trợ người sử dụng tự giải quyết một loạt bài toán chuyên biệt phức tạp.  Xây dựng các ứng dụng GIS trên môi trường ứng dụng cũng như khai thác trực tuyến trên Internet. Ngoài các cấu trúc dữ liệu không gian kinh điển B-Tree hay R-Tree, thì việc áp dụng lưới tam giác Delaunay và các biến thể của nó cho việc xử lý và khai thác dữ liệu không gian rất đáng được quan tâm. Vấn đề khó nhất của dòng thuật toán này là việc xác định nhanh điểm chèn vào thuộc tam giác nào trong lưới. Công trình nghiên cứu 0đã sử dụng khung lưới chữ nhật phân cấp để hỗ trợ tìm kiếm nhanh nhưng vẫn chưa cải thiện đáng kể. Cách tiếp cận sử dụng khung lưới động kết hợp với tìm kiếm theo hình xoắn ốc (spiral) mà tác giả đề xuất trong mục 2.2.1.1 có tốc độ thực thi hơn hẳn. Thuật toán này cho phép thêm động đối tượng cùng với cấu trúc băm hỗ trợ xác định nhanh điểm thuộc tam giác nào trong lưới và sẽ sử dụng vào các thuật toán tìm kiếm sau này. Phương pháp xây dựng lưới tam giác song song có thể tiếp cận kỹ thuật xử lý vùng đụng độ [3] hay sử dụng phân hoạch theo nguyên lý chia để trị [4] [5] . Ở đây, tác giả đưa ra phương pháp phân hoạch đơn giản để hiện thực thuật toán xây dựng lưới tam giác song song với khả năng ghép song song các cặp 2 lưới tam giác tương ứng được nêu trong mục 2.2.1.3. Trong phần xây dựng thuật toán tạo lưới tam giác Delaunay ràng buộc, tác giả chú trọng phần xử lý khi các cạnh ràng buộc cắt nhau không được nêu lên trong [7] [6] và thực hiện đồng thời việc kiểm tra cắt cạnh ràng buộc, thêm đỉnh mới vào lưới tam giác (giao của hai cạnh ràng buộc nếu có) và hiệu chỉnh toàn bộ thông tin chèn cạnh trong một lần duyệt khác với [8] . Kết quả so sánh các thuật toán có thể xem trong các (Bảng 1, Bảng 2, Bảng 3). Để các thuật toán xây dựng lưới tam giác ứng dụng vào thực tế, tác giả đã phải giải quyết một loạt các bài toán sai số gặp phải. Kỹ thuật xử lý sai số được đề cập trong mục 2.2.3. Dòng các thuật toán tìm kiếm như tìm đối tượng lân cận gần nhất hay tìm đối tượng theo tuyến đều sử dụng cấu trúc băm của thuật toán chèn đỉnh tuần tự được nêu trong mục 2.2.1.1 nên không cần công đoạn tiền xử lý như trong [9] [10] . Xem cơ cấu hoạt động trong Hình 5. Riêng với loại bài toán tìm k-lân cận gần nhất tác giả đã cho phép mở rộng khả năng tìm kiếm đồng thời cho tất cả các đối tượng không gian cơ bản: điểm, đường và vùng (xem 3.3.1). Các bài toán GIS cơ bản: lấy vùng đệm của đối tượng (4.1.1), hiệu chỉnh dữ liệu (4.1.2) hay nhóm bài toán giao thông: xây dựng mạng lưới giao thông (4.2.2) đều dựa trên cấu trúc lưới tam giác Delaunay hoặc Delaunay ràng buộc. Kết quả so sánh các thuật toán này xem trong (Bảng 6, Bảng 7, Bảng 8, Bảng 9). Cuối cùng, tác giả đã thiết kế và hiện thực tập tin quản trị cơ sở dữ liệu không gian và thuộc tính thống nhất GEOBASE (xem các mục 3.2) để áp dụng vào website www.vietbando.com và bộ biên tập bản đồ DOLGIS 8.0. 1.3 Các đóng góp chính của luận án - Cải tiến thuật toán tạo lưới tam giác bằng phương pháp chèn đỉnh tuần tự. - Xây dựng thuật toán tạo lưới tam giác Delaunay theo phương pháp song song. - Xây dựng thuật toán tạo lưới tam giác Delaunay ràng buộc với khả năng xử lý sai số. - Xây dựng một số thuật toán trong GIS dựa trên lưới tam giác Delaunay và lưới tam giác Delaunay ràng buộc (hiệu chỉnh dữ liệu, lấy vùng đệm, tìm lân cận, tìm kiếm lân cận theo tuyến). - Xây dựng mô hình biểu diễn mạng giao thông thực tế và hiện thực một số thuật toán cơ bản (xây dựng mạng giao thông từ dữ liệu thô, tìm đường đi ngắn nhất…). - Xây dựng thuật toán tạo lưới địa hình 3 chiều nhanh từ tập điểm độ cao, đường bình độ. 2 Xử lý dữ liệu không gian Trong chương này, tác giả tổng quan một số cấu trúc chỉ mục không gian nhằm nâng cao hiệu suất truy vấn và xử lý như R-Tree, Kd-Tree. Các cấu trúc chỉ mục này thường chú trọng việc hỗ trợ truy xuất nhanh đến các đối tượng không gian nhưng còn hạn chế cho các 3 thao tác xử lý thông tin không gian. Còn một trong các cấu trúc quan trọng hỗ trợ tốt các thao tác xử lý dữ liệu không gian là lưới tam giác Delaunay. Tuy nhiên, các thuật toán xây dựng lưới tam giác rất phức tạp nên còn hạn chế ứng dụng trong các hệ thống khai thác dữ liệu không gian thương mại. Vì vậy, ở đây tác giả tập trung nghiên cứu mô hình và các thuật toán xây dựng lưới tam giác Delaunay nhằm cải tiến tốc độ thực thi của chúng. 2.1 Cấu trúc chỉ mục không gian Cấu trúc chỉ mục không gian được sử dụng trong các hệ cơ sở dữ liệu không gian để tối ưu hóa truy vấn không gian. Một cách tiếp cận thông dụng là dùng ngăn chứa dữ liệu dựa vào khái niệm khung bao chữ nhật nhỏ nhất. Các đối tượng được gom nhóm thành các phân cấp, rồi lưu trữ chúng trong một cấu trúc chẳng hạn như: Kd-tree, R-tree… 2.2 Lưới tam giác Delaunay Lưới tam giác Delaunay là cấu trúc hình học đa dụng và được sử dụng trong rất nhiều lĩnh vực như hệ thống thông tin địa lý (GIS), vật lý, thiên văn học, tìm kiếm lân cận, phần tử hữu hạn, đồ họa máy tính và đa phương tiện… Bài toán xây dựng lưới tam giác Delaunay là bài toán cơ bản trong hình học tính toán. Lưới tam giác T(V) của tập đỉnh V trên mặt phẳng R 2 là tập các cạnh E cần thỏa:  Không có hai cạnh nào trong E cắt nhau ở một đỉnh không thuộc V và  Các cạnh trong E chia bao lồi của tập đỉnh V ra thành các tam giác. Hình 1. Lưới tam giác Delaunay Hình 2. Một tập các ràng buộc S Hình 3. Lưới tam giác Delaunay ràng buộc của S B.N. Delaunay đã đưa ra tiêu chuẩn dựa vào tính chất đường tròn rỗng để xác định một lưới tam giác có thỏa điều kiện Delaunay hay không. Lưới tam giác T(V) là lưới tam giác Delaunay DT(V) nếu đường tròn ngoại tiếp của bất kỳ tam giác nào cũng không chứa bất kỳ đỉnh nào của V bên trong nó. Lưới tam giác Delaunay ràng buộc CDT là sự mở rộng của lưới tam giác Delaunay DT để điều khiển các ràng buộc. Ta có thể nói rằng CDT là lưới tam giác gần nhất với DT với một số các ràng buộc bổ sung. 2.2.1 Các thuật toán xây dựng lưới tam giác Delaunay 2.2.1.1 Phương pháp chèn đỉnh tuần tự 4 Thực hiện chèn tuần tự từng điểm vào lưới tam giác đang tồn tại. Thuật toán này có tốc độ chậm nhất so với các hướng tiếp cận khác nhưng với kỹ thuật xác định nhanh điểm thêm vào thuộc tam giác nào trong lưới đã tăng đáng kể tốc độ thực thi. Hơn nữa, thuật toán này dễ dàng áp dụng lưu trong bộ nhớ ngoài nên cho phép làm việc với dữ liệu lớn. Xác định vị trí các đỉnh trong lưới tam giác: Cho một phân hoạch phẳng trên mặt phẳng R 0 (trong trường hợp này là lưới tam giác) và một đỉnh  x, y  . Cần tìm một phần tử của phân hoạch phẳng r 0  j  (tam giác) chứa đỉnh đã cho. Để làm điều đó ta cần xây dựng một phân hoạch đơn giản hơn R 0 là R 1 phủ lên R 0 mà trên đó thực hiện nhanh quá trình xác định đỉnh cần tìm. Sau đó đặt mối tương quan giữa phần tử r 1  i  của phân hoạch R 1 và phần tử r 0  j  của phân hoạch R 0 sao cho phần tử r 0  j  gần phần tử r 1  i  nhất có thể. Bắt đầu từ phần tử r 1  i  thông qua chuỗi các tìm kiếm qua các phần tử lân cận sẽ sẽ tìm được phần tử đích r 0  taget  . Sau khi thực hiện thành công quá trình tìm kiếm ta có thể thay thế tương ứng r 1  i   r 0  j  bằng một tương ứng khác tốt hơn chính là r 1  i   r 0  taget  . Do vậy, quá trình tìm kiếm sẽ ngày càng nhanh. Bây giờ ta sẽ tìm cách chọn lựa phân hoạch R 1 tốt nhất có thể. Giải pháp cụ thể được đề nghị ở đây là chọn phân hoạch R 1 là khung lưới chữ nhật đều. Ví dụ ta có một phân hoạch phủ hoàn toàn lên hình vuông kính lưới  0,1  ×  0,1  thì có thể chia nó thành m 2 phần là ô lưới hình vuông. Đánh số thứ tự các ô lưới đó theo số tự nhiên: i, j   0, m  1  N: r 1  ij  . Khi đó, với đỉnh cho trước  x, y  một cách tức thời ta có thể xác định được hình vuông r 1 x m , y m  , ở đây    là ký hiệu lấy phần nguyên. Một trong các cải tiến đáng kể là kích thước lưới chữ nhật phân hoạch sẽ tăng dần theo số lượng đỉnh thêm dần vào lưới để cho ở mọi thời điểm, mỗi ô lưới sẽ chỉ phải phủ một số lượng tam giác xác định đủ nhỏ để quá trình dò tìm lân cận là ít nhất có thể. Ví dụ khi kích thước lưới chữ nhật tăng lên hai lần theo mỗi chiều, ta cần chép thông tin từ mỗi ô cũ sang các ô mới như sau: , : 0,    1               :  1  2,2  ,  1  2,2+1  ,  1  2+1,2  ,  1  2+1,2+1    1  ,  (1) Vậy kích thước lưới chữ nhật sau mỗi lần hiệu chỉnh sẽ tăng lên 4 lần. Khởi tạo các giá trị ban đầu các ô lưới tham chiếu tới rỗng. Ô lưới nào chứa trọng tâm của tam giác đầu tiên thì đặt tham chiếu đến tam giác đó. Tam giác đầu tiên được tạo ra từ ba đỉnh nhân tạo thêm vào như Hình 4. Cần lưu ý rằng nếu có nhiều tam giác cùng phủ lên một ô lưới thì ta chỉ tham chiếu đến một tam giác được cập nhật cuối cùng nhất. Từ một đỉnh kế tiếp tuần tự thêm vào lưới tam giác, một cách tức thời ta có thể xác định ngay nó thuộc r 1  i  . Từ r 1  i  ta tham chiếu được tam giác r 0  j  . Nếu đó chưa phải là tam 5 giác chứa đỉnh thêm vào thì thực hiện lần theo các tam giác lân cận dựa trên mô hình biểu diễn để hướng đến tam giác cần tìm r 0  taget  (xem Hình 5). Hình 4. Phát sinh ba đỉnh nhân tạo tạo thành siêu tam giác Hình 5. Xác định đỉnh thuộc tam giác Độ phức tạp trung bình của thuật toán này với tập N điểm phân bố ngẫu nhiên là O(N). 2.2.1.2 Phương pháp chia để trị Ý tưởng chủ đạo của nguyên lý chia để trị để xây dựng lưới tam giác Delaunay là thực hiện đệ qui chia tập đỉnh ban đầu thành hai tập con có kích thức xấp xỉ nhau cho đến khi mỗi tập dữ liệu con chỉ chứa số lượng đỉnh đủ nhỏ cho việc xây dựng lưới tam giác dễ dàng. Giả sử  =  0 0 là tập đỉnh ban đầu, và giả sử các tập con  0 1 và  1 1 là kết quả của lần đầu tiên phân rã V ở mức  = 1. Chúng ta có thể giả định rằng  0 1 nằm bên trái của  1 1 và hoành độ x của các đỉnh  0 1 là nhỏ hơn của  1 1 . Thể hiện dưới đây là sự đệ qui phân rã tập  cho ba mức đầu tiên, khi tập con    ở mức k sẽ được chia thành hai tập con  2 +1 và  2+1 +1 cho mức kế tiếp  + 1. Hình 6. Sơ đồ phân rã tập đỉnh trong thuật toán chia để trị Hình 7. Sơ đồ ghép lưới tam giác trong thuật toán chia để trị Mỗi lưới tam giác Delaunay chỉ chứa một số tam giác được xây dựng từ tập đỉnh ở mức cuối cùng nhất. Cặp lưới tam giác kề cận sẽ được ghép lại và mỗi lưới tam giác ghép là một lưới tam giác Delaunay. Điều đó có nghĩa là mỗi lưới tam giác ghép phải thỏa điều kiện Delaunay và biên của lưới phải là bao lồi. Quá trình này còn tiếp tục cho đến khi các  0 3  1 3  2 3  3 3  4 3  2 2  5 3  6 3  3 2  7 3  0 2  1 2  1 1  0 1  0 0 =   0 3  1 3  2 3  3 3  4 3  2 2  5 3  6 3  3 2  7 3  0 2  1 2  1 1  0 1  0 0 =  r 1(i) step 2 step 1 r 0(j) r 0(taget) Tam giác tham chiếu tới ô lưới thêm vào Tam giác chứa đỉnh thêm vào Đỉnh thêm vào M  1 =  0,3   0 =  3, 0   2 =  3, 3  6 lưới tam giác  0 1 và  1 1 của tập đỉnh  0 1 và  1 1 ở bước chia đầu tiên được ghép lại thành lưới tam giác     của toàn bộ tập đỉnh đầu vào ban đầu. Độ phức tạp của thuật toán này là O(NlogN). 2.2.1.3 Phương pháp song song Công đoạn đầu tiên của thuật toán này là phân hoạch tập đỉnh thành các khối không giao nhau. Bắt đầu từ khung bao nhỏ nhất chứa tập đỉnh đầu vào, tác giả đề xuất ý tưởng phân hoạch thành các mảnh nhỏ hơn bằng cách luân chuyển thực hiện các lát cắt dọc và ngang ở chính giữa mỗi mảnh để tạo thành các mảnh nhỏ hơn. (Xem Hình 8) Hình 8. Phương pháp phân rã cho nguyên lý “chia để trị” Hình 9. Phương pháp gộp thành lưới tam giác tổng thể Lưu ý rằng việc tạo lưới tam giác nội tại trong mỗi của mảnh ở mức thấp nhất có thể được thực hiện đồng thời. Tuy nhiên, việc ghép các mảnh lân cận phải tuân thủ theo sơ đồ như Hình 9. Đây là quá trình ngược lại của quá trình phân rã và nó cho phép dễ dàng hỗ trợ hiện thực gộp song song thành lưới tam giác tổng thể. Tiếp cận này cho phép cài đặt trên các hệ thống song song mà không phải xử lý đụng độ nên tốc độ cải thiện nhiều. Độ phức tạp của thuật toán này là       , P là số lượng tiểu trình tham gia. 2.2.2 Thuật toán xây dựng lưới tam giác Delaunay ràng buộc Phần này trình bày thuật toán xây dựng lưới tam giác Delaunay ràng buộc từ một lưới tam giác Delaunay đã cho bằng cách thêm vào các cạnh ràng buộc. Thuật toán chèn cạnh tiến hành theo hai bước chính: - Loại các tam giác bị cắt bởi cạnh ab    để tạo ra các đa giác giả. Tạo lưới tam giác cho nó. - Thêm cạnh ràng buộc vào lưới tam giác là đánh dấu chúng như những cạnh cố định, để chúng trở thành một phần của lưới tam giác và không thể thay đổi được. Trong quá trình chèn cạnh ràng buộc, tác giả đã cải tiến bằng cách thực hiện đồng thời việc kiểm tra cắt cạnh ràng buộc, thêm đỉnh mới vào lưới tam giác (giao của hai cạnh ràng buộc nếu có) và hiệu chỉnh toàn bộ thông tin chèn cạnh trong một lần duyệt. Các tình huống mô tả như Hình 10. 5 7 4 6 2 3 1 7 (a) Chèn cạnh ab (b) Cắt cạnh ràng buộc (in đậm) ở giao đỉnh i (c) Các cạnh bị cắt bởi cạnh ràng buộc sẽ bị loại bỏ (d) Tập các đoạn con của cạnh ab được thêm vào và các vùng đa giác giả sẽ được điền đầy Hình 10. Các bước quá trình thêm cạnh ràng buộc vào lưới tam giác 2.2.3 Xử lý sai số Hình 11. Một số tình huống sử lý sai số dựa trên r-epsilon 2.2.4 Các kết quả thử nghiệm 2.2.4.1 Các thuật toán xây dựng lưới tam giác Delaunay hiện thực gồm:  Thuật toán chèn đỉnh tuần tự của Shewchuk JR. (I&I-SH)  Thuật toán chèn đỉnh tuần tự dựa trên chia lưới hai mức của B. Zalik. (I&I-ZL)  Thuật toán chèn đỉnh tuần tự Skvortsov. (I&I-SK)  Thuật toán chèn đỉnh tuần tự Skvortsov cải tiến. (I&I-OWNER) Thời gian thực thi thuật toán (s) Số đỉnh (N) phát sinh ngẫu nhiên 1000000 2000000 3000000 4000000 5000000 I&I-SH 32.031 85.296 153.031 233.266 322.047 I&I-ZL 9.750 26.609 60.640 102.94 181.053 I&I-SK 8.219 19.877 28.737 39.925 52.613 I&I-OWNER 7.453 15.922 24.813 34.187 43.984 Bảng 1.Thời gian (s) thực thi các thuật toán xây dựng lưới tam giác Delaunay t p r-epsilon (b) l p r-epsilon (a) p 1 r-epsilon p 2 r-epsilon l 2 l 1 (c)    d)    c)    b)   a) 8 Công thức tính độ tăng tốc của thuật toán như sau:   =  1   Công thức tính hiệu suất của thuật toán như sau:   =  1   Ở đây:  p là số lượng processors (threads).  T 1 là thời gian thực thi của thuật toán tuyến tính.  T p là thời gian thực thi của thuật toán song song với p processors (threads). Để đánh giá chi tiết mức độ cải thiện của thuật toán xây dựng lưới tam giác Delaunay song song tác giả đã chạy thử nghiệm trên máy Intel(R) Xeon(R) CPU E5420 @ 2.50Ghz (2 processors) 16 GB RAM với hệ điều hành Microsoft Windows Server 2008 Enterspise x64 Edition. Kết quả thực nghiệm được mô tả theo bảng dưới đây: Số lượng điếm ngẫu nhiên N Thời gian thực thi (ms) DT (T 1 ) Parallel-DT 2 threads 4 threads T p S p E p T p S p E p 1000000 3104 1357 2.3 1.1 873 3.6 0.9 2000000 6848 2917 2.3 1.2 1934 3.5 0.9 3000000 11045 4664 2.4 1.2 2964 3.7 0.9 4000000 15647 6318 2.5 1.2 4103 3.8 1.0 5000000 20623 7972 2.6 1.3 5120 4.0 1.0 Bảng 2. Bảng so sánh độ tăng tốc thuật toán Delaunay song song 2.2.4.2 Thuật toán xây dựng lưới tam giác Delaunay ràng buộc Dữ liệu thực tế (các thành phố) Số cạnh Số điểm Thời gian thực thi (s) Thêm điểm Thêm cạnh Tổng cộng Oldenburg 7123 6155 0.047 0.047 0.094 San Joaquin 23867 18301 0.156 0.203 0.359 California 21693 21051 0.250 0.172 0.422 San Francisco 223622 175877 1.547 2.000 3.547 North America 179112 175821 3.094 1.687 4.781 Bảng 3. Thời gian thực thi thuật toán xây dựng lưới tam giác Delaunay ràng buộc [...]... sở dữ liệu khai thác dữ liệu không gian 3.1 Hệ cơ sở dữ liệu không gian Thuật ngữ “hệ cơ sở dữ liệu không gian đã trở nên phổ biến và cơ sở dữ liệu này được xem như là tập các đối tượng trong không gian hơn là các hình ảnh hay bức tranh về không gian Ở một góc độ nhất định, ta có thể xem:  Hệ cơ sở dữ liệu không gian là một hệ cơ sở dữ liệu  Hỗ trợ các kiểu dữ liệu không gian trong mô hình dữ liệu. .. không gian, để được xử lý bởi DBMS và hệ thống con quản trị dữ liệu không gian tương ứng 3.1.2.2 Tích hợp dữ liệu không gian vào hệ DBMS Nghiên cứu một số hệ thống cơ sở dữ liệu tích hợp dữ liệu không gian (ví dụ như MySQL, Oracle, SQLServer…) có thể thấy rằng các hệ thống này có giao diện tích hợp như sau:  Không có sự khác biệt trên nguyên tắc giữa loại dữ liệu chuẩn và dữ liệu không gian  Không. .. được và căn cứ nhu cầu của thực tế, những vấn đề cần tiếp tục nghiên cứu và hoàn thiện là:  Tích hợp hệ thống điều khiển các thông số khai thác sử dụng ngôn ngữ truy vấn và giao diện đồ họa người dùng (GUI)  Xây dựng thành công cụ biểu diễn tri thức và khai thác dữ liệu không gian trực quan  Phát triển các thuật toán song song và xây dựng cơ sở hạ tầng phân bố cho khai thác và xử lý dữ liệu không gian. .. vấn cả dữ liệu thuộc tính và dữ liệu không gian  Hỗ trợ các cấu trúc chỉ mục thích hợp và khả năng phân loại dữ liệu thuộc tính và không gian  Một hệ thống thư viện các chức năng khai thác không gian hoàn chỉnh Hình 13 Sơ đồ lưu trữ trong GeoBase 3.2.2.2 Các thao tác truy xuất dữ liệu không gian và thuộc tính trong GeoBase Hình 14 Sơ đồ truy xuất dữ liệu không gian và thuộc tính Chỉ mục thuộc tính được... Multi-Polygon Hình 12 Mô hình cây phân cấp các lớp hình học 3.1.2 Kiến trúc hệ thống cơ sở dữ liệu không gian Về nguyên tắc, các phần mở rộng sau đây để một kiến trúc tiêu chuẩn cần phải được hỗ trợ:  Biểu diễn các kiểu dữ liệu ở dạng đối tượng không gian  Các thao tác cho các phép toán cơ sở nhất  Các cấu trúc chỉ mục không gian và các kỹ thuật truy cập  Ngôn ngữ truy vấn không gian  Giao diện... trên cơ sở dữ liệu 3.3 Một số thuật toán khai thác dữ liệu không gian 3.3.1 Bài toán lân cận gần nhất (nearest neighbor search – NNS) Trong hệ thống thông tin địa lý thì tìm kiếm lân cận là một trong những ứng dụng quan trọng và được sử dụng nhiều Bài toán tìm kiếm lân cận gần nhất (nearest neighbor search NNS) là bài toán tối ưu hóa việc tìm kiếm đối tượng gần nhất trong không gian Một trong các mở rộng... như thuật toán tìm đối tượng điểm quan tâm dọc theo tuyến đường đáp ứng khả năng truy cập trực tuyến trên Web 22  Cấu trúc lưới tam giác Delaunay còn được sử dụng để xây dựng thuật toán tạo vùng đệm của các đối tượng không gian, thuật toán hiệu chỉnh dữ liệu không gian, thuật toán xây dựng mạng dữ liệu địa hình 3D  Xây dựng hệ quản trị cơ sở dữ liệu không gian GeoBase cho phép tích hợp dữ liệu không. .. 3.1.2.1 Hệ thống đóng Một trong các hệ thống cơ sở dữ liệu không gian đóng là sử dụng mô hình kiến trúc đối ngẫu Trong kiến trúc đối ngẫu tích hợp hai hệ thống con độc lập nhau: DBMS quản trị dữ liệu phi không gian và hệ thống con một lưu trữ và xử lý dữ hiệu không gian Với cách tiếp cận này, mỗi đối tượng không gian được chia thành hai phần Phần thứ nhất chứa các thuộc tính phi không gian và được lưu trữ... liệu trực tuyến từ các nguồn dữ liệu khác nhau không qua việc tiền xử lý trước, đặc biệt là khả năng chồng các lớp thông tin ở dạng ảnh (xem Hình 21, Hình 22) Hình 21 Nắn ảnh TP Hà nội Hình 22 Nắn ảnh TP Hồ Chí Minh 4.2 Các bài toán ứng dụng trên mạng giao thông 4.2.1 Mô hình biểu diễn mạng giao thông Mạng giao thông có thể dễ dàng được mô hình hóa như một đồ thị Các bài toán không gian trên mạng này... phương pháp biểu diễn số trong trắc địa học và cũng là 21 phổ biến nhất Một DEM là một biểu diễn của bề mặt trái đất với các tọa độ ngang X, Y và độ cao Z Độ cao địa hình trong DEM có thể được biểu diễn sử dụng các phương pháp sau:  Dữ liệu lưới đều Dữ liệu lưới có thể được suy ra từ dữ liệu gốc theo các ảnh chụp trên không, ảnh lập thể vệ tinh  Dữ liệu điểm ngẫu nhiên Các đặc trưng địa hình đôi lúc

Ngày đăng: 07/11/2014, 19:55

Từ khóa liên quan

Mục lục

  • Tổng quan

    • Yêu cầu thực tiễn và lý do thực hiện đề tài

    • Mục tiêu luận án

    • Các đóng góp chính của luận án

    • Xử lý dữ liệu không gian

      • Cấu trúc chỉ mục không gian

      • Lưới tam giác Delaunay

        • Các thuật toán xây dựng lưới tam giác Delaunay

          • Phương pháp chèn đỉnh tuần tự

          • Phương pháp chia để trị

          • Phương pháp song song

          • Thuật toán xây dựng lưới tam giác Delaunay ràng buộc

          • Xử lý sai số

          • Các kết quả thử nghiệm

            • Các thuật toán xây dựng lưới tam giác Delaunay hiện thực gồm:

            • Thuật toán xây dựng lưới tam giác Delaunay ràng buộc

            • Xây dựng cơ sở dữ liệu khai thác dữ liệu không gian

              • Hệ cơ sở dữ liệu không gian

                • Mô hình hóa

                • Kiến trúc hệ thống cơ sở dữ liệu không gian

                  • Hệ thống đóng

                  • Tích hợp dữ liệu không gian vào hệ DBMS

                  • Hệ quản trị cơ sở dữ liệu GeoBase.

                    • Giới thiệu GeoBase

                    • Các tính năng cơ bản của GeoBase

                      • Mô hình GeoBase

                      • Các thao tác truy xuất dữ liệu không gian và thuộc tính trong GeoBase

                      • Mô hình hoạt động của GeoBase

                      • Các kiểu dữ liệu và một số thao tác trong GeoBase

                      • So sánh tốc độ thực thi trên một số thao tác cơ sở dữ liệu cơ bản.

Tài liệu cùng người dùng

Tài liệu liên quan