Phương pháp phân cụm dữ liệu không gian và ứng dụng trong việc xác định vị trí tối ưu đặt máy ATM

86 2K 10
Phương pháp phân cụm dữ liệu không gian và ứng dụng trong việc xác định vị trí tối ưu đặt máy ATM

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ - - NGUYỄN SƠN PHƯƠNG PHÁP PHÂN CỤM DỮ LIỆU KHÔNG GIAN VÀ ỨNG DỤNG TRONG VIỆC XÁC ĐỊNH VỊ TRÍ TỐI ƯU ĐẶT MÁY ATM LUẬN VĂN THẠC SỸ HÀ NỘI -2011 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ - - NGUYỄN SƠN PHƯƠNG PHÁP PHÂN CỤM DỮ LIỆU KHÔNG GIAN VÀ ỨNG DỤNG TRONG VIỆC XÁC ĐỊNH VỊ TRÍ TỐI ƯU ĐẶT MÁY ATM Ngành: Chuyên ngành: Mã số: Công nghệ thông tin Hệ thống thông tin 60 48 05 LUẬN VĂN THẠC SỸ NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS Đặng Văn Đức HÀ NỘI -2011 MỤC LỤC CHƢƠNG MỞ ĐẦU CHƢƠNG TỔNG QUAN HỆ THÔNG TIN ĐỊA LÝ VÀ KHAI PHÁ DỮ LIỆU KHÔNG GIAN 2.1 Tổng quan Hệ thông tin địa lý 2.1.1 Một số định nghĩa hệ thông tin địa lý 2.1.2 Các thành phần hệ thông tin địa lý 2.1.3 Biểu diễn liệu địa lý 2.1.4 Phân tích xử lý liệu khơng gian 14 2.1.5 Ứng dụng hệ thông tin địa lý 19 2.2 Tổng quan khai phá liệu 21 2.2.1 Khái niệm 21 2.2.2 Tiến trình khai phá liệu 21 2.2.3 Các mơ hình khai phá liệu 23 2.2.4 Các hƣớng tiếp cận kỹ thuật sử dụng khai phá liệu 24 2.2.5 Các dạng liệu khai phá 25 2.2.6 Các ứng dụng khai phá liệu 25 2.3 Khai phá liệu không gian 26 2.3.1 Các đặc trƣng khai phá liệu không gian 26 2.3.2 Kho liệu không gian chiều liệu 27 2.3.3 Một số ứng dụng khai phá liệu không gian 28 CHƢƠNG PHÂN CỤM DỮ LIỆU KHÔNG GIAN 32 3.1 Khái quát phân cụm liệu 32 3.1.1 Phân cụm phân hoạch 32 3.1.2 Phân cụm phân cấp 35 3.1.3 Phân cụm dựa mật độ 36 3.1.4 Phân cụm dựa lƣới 49 3.2 Phân cụm liệu không gian 50 3.2.1 Các đặc trƣng liệu không gian 50 3.2.2 Các quan hệ/thuộc tính khơng gian liệu không gian 51 3.2.3 Các độ đo tƣơng đồng phân cụm liệu không gian 53 CHƢƠNG ỨNG DỤNG PHÂN CỤM KHƠNG GIAN TRONG BÀI TỐN XÁC ĐỊNH VỊ TRÍ TỐI ƢU LẮP ĐẶT MÁY ATM 62 4.1 Phân tích tốn 62 4.1.1 Nguồn liệu đầu vào phạm vi toán 62 4.1.2 Phƣơng pháp kỹ thuật giải toán 63 4.2 Xây dựng chương trình ứng dụng 64 4.2.1 Phân tích thiết kế hệ thống 64 4.2.2 Cài đặt chƣơng trình 68 4.3 Thử nghiệm đánh giá thuật toán phân cụm 71 CHƢƠNG KẾT LUẬN 75 TÀI LIỆU THAM KHẢO 76 DANH MỤC HÌNH VẼ Hình 1: thành tố GIS Hình 2: Mối quan hệ thành phần GIS Hình Ví dụ biểu diễn vị trí nước bị ô nhiễm Hình Ví dụ biểu diễn đường Hình Ví dụ biểu diễn khu vực hành Hình Biểu diễn vector đối tượng địa lý 13 Hình Biểu diễn giới mơ hình raster 13 Hình 8: Tìm đường ngắn địa điểm đồ Hà Nội 15 Hình 9: Chồng phủ đa giác 17 Hình 10 Tiến trình phủ đa giác 18 Hình 11: Tiến trình khám phá tri thức từ sở liệu 22 Hình 12: Kiến trúc điển hình hệ khai phá liệu 23 Hình 13: Phân cụm polygon để phân tích xu giảm giá trung bình nhà cho thuê xung quanh khu vực Regensburg [ESKS01] 29 Hình 14: Khái qt hóa mơ hình 3D vật thể 29 Hình 15: Phân cụm liệu ảnh viễn thám thu theo tổ hợp tín hiệu kênh màu ảnh viễn thám vùng ven biển California [ESKS01] 30 Hình 16: Phân tích thủy hệ vùng Nebraska, Hoa Kỳ [JOS11] 30 Hình 17: địa phương có tỷ lệ người nghỉ hưu cao [ESKS01] 31 Hình 18: Minh họa thuật toán k-means 34 Hình 19: Phân cụm phân cấp 35 Hình 20: Kề mật độ trực tiếp, q đối tượng lõi (core), p đối tượng biên 37 Hình 21: Kề mật độ 37 Hình 22: Kết nối theo mật độ 38 Hình 23: Minh họa đồ thị khoảng cách 4-dist xếp CSDL 41 Hình 24: Đồ thị k-dist phương pháp ước lượng tham số Eps 42 Hình 25: Đồ thị 4-dist liệu đồ “Hệ thống siêu thị” 42 Hình 26: Đồ thị 4-dist liệu đồ “Ngân hàng” 43 Hình 27: Các cụm phát CLARANS (a) DBSCAN (b) 43 Hình 28: Các cụm phát DBRS(a), DBSCAN(b), K-Means(c), CLARANS(d) [WAHA03] 49 Hình 29: Phân cụm dựa theo lưới vùng 49 Hình 30: Quan hệ hướng đối tượng không gian [ESKS01] 52 Hình 31: Mơ hình 9-intersection [EGFRA94] 53 Hình 32: Quan hệ tô pô đối tượng không gian [ESKS01] 53 Hình 33: Khoảng cận điểm 55 Hình 34: Khoảng cách cận-viễn 56 Hình 35: So sánh khoảng cách Hausdorff với khoảng cách tâm 56 Hình 36: Mối quan hệ tơ pô hai đa giác dựa đối tượng tham chiếu tuyến tính 60 Hình 37: Hình ảnh chồng phủ (vùng màu vàng) cụm “Ngân hàng” (màu xanh) “Siêu thị” (màu đỏ) 68 Hình 38: Kết phân cụm DBRS liệu thử nghiệm tự tạo 69 Hình 39: Kết phân cụm DBRS liệu thực “Nút mạng đường bộ” Tỉnh Thừa Thiên- Huế 69 Hình 40: Kết phân cụm chồng phủ cụm điểm tiện ích “Siêu thị” “Khách sạn” nội thành Hà Nội Vùng màu vàng coi vị trí tối ưu cho việc lắp đặt máy ATM 70 Hình 41: Khả phát nhiễu cụm có hình dạng K-means (trái) DBSCAN (phải) 71 Hình 42: Khả phân cụm theo thuộc tính DBSCAN (trái) DBRS (phải) 72 Hình 43: Đồ thị so thời gian thực phân cụm thuật toán K-measn, DBSCAN DBRS với tập liệu đầu vào 72 Hình 44: Đồ thị thời gian thực phân cụm thuật toán K-measn, DBSCAN DBRS tập liệu khác 73 KÝ HIỆU VIẾT TẮT CSDL Cơ sở liệu GIS Hệ thông tin địa lý KDD Khám phá tri thức từ sở liệu KPDL Khai phá liệu OLAP Xử lý phân tích liệu trực tuyến SDBS Hệ sở liệu không gian SDW Kho liệu không gian CHƢƠNG MỞ ĐẦU Khai phá liệu khơng gian hay cịn gọi khai phá tri thức từ liệu không gian lĩnh vực có nhu cầu cao Bởi lẽ liệu đầu vào bao gồm khối lượng liệu không gian khổng lồ thu thập từ nhiều ứng dụng khác nhau, từ thiết bị viễn thám đến hệ thống thông tin địa lý, từ đồ số, từ hệ thống quản lý đánh giá mơi trường, …Việc phân tích khai thác lượng thông tin khổng lồ ngày tạo thách thức khó khăn, địi hỏi phải có nghiên cứu sâu để tìm kỹ thuật khai phá liệu hiệu Trong năm gần đây, việc nghiên cứu khai phá liệu có xu hướng chuyển từ sở liệu quan hệ sở liệu giao dịch sang sở liệu không gian Sự thay đổi giúp hiểu liệu khơng gian mà cịn giúp khám phá mối quan hệ liệu không gian phi không gian, mơ hình dựa tri thức khơng gian, phương pháp tối ưu câu truy vấn, tổ chức liệu sở liệu không gian, Khai phá liệu không gian sử dụng nhiều hệ thống thông tin địa lý (GIS), viễn thám, khai phá liệu ảnh, ảnh y học, rô bốt dẫn đường, … Khám phá tri thức từ liệu không gian thực nhiều hình thức khác sử dụng quy tắc đặc trưng định, trích rút mơ tả cấu trúc cụm bật, kết hợp không gian, … Các tốn truyền thống hệ thơng tin địa lý trả lời câu hỏi kiểu như: - Những phố dẫn đến Nhà hát lớn Hà Nội ? Những nhà nằm vùng quy hoạch mở rộng phố? Khai phá liệu khơng gian giúp trả lời cho câu hỏi dạng: - Xu hướng dòng chảy, đứt gãy địa tầng ? Nên bố trí trạm tiếp sóng điện thoại di động nào? Những vị trí tối ưu để đặt máy ATM ? Một toán liên quan đến liệu không gian, cụ thể liệu địa lý có ý nghĩa thực tế cao tốn xác định vị trí tối ưu cho việc đặt máy ATM ngân hàng Hiện nay, với chủ trương xây dựng Chính phủ điện tử thúc đẩy giao dịch điện tử Việt Nam, việc toán chuyển dần từ sử dụng tiền mặt sang toán qua tài khoản, đồng thời với nhu cầu sử dụng thẻ tín dụng ngày tăng, ngân hàng nước sử dụng tối đa lợi để cạnh tranh, thu hút khách hàng Một cách để cạnh tranh hiệu thông qua việc thiết lập trạm ATM để khách hàng tự thực giao dịch cách thuận tiện Tính đến cuối năm 2010, số lượng trạm ATM đạt gần 8000 máy, số thẻ ATM phát hành 12 triệu thẻ 40 tổ chức ngân hàng Tuy nhiên, việc phát triển hệ thống trạm ATM chưa quy hoạch theo chiến lược bản, vị trí đặt trạm ATM cịn nhiều bất cập tình trạng thừa thiếu ATM số khu vực, chưa khai thác hết tiềm hình thức giao dịch Xuất phát từ nhu cầu thực tế đó, luận văn giới thiệu số phương pháp phân cụm liệu khai phá sở liệu không gian sử dụng Trên sở cài đặt thử nghiệm ứng dụng sử dụng kỹ thuật phân cụm liệu địa lý, khai thác thông tin địa lý đối tượng địa lý có tầm ảnh hưởng quan trọng đến vị trí đặt máy ATM như: siêu thị, trung tâm thương mại, khách sạn, nhà hàng, khu đông dân cư, đường giao thông… để hỗ trợ giải tốn tìm vị trí tối ưu đặt máy ATM thành phố Hà Nội Luận văn chia thành chương mục sau: - Chương 1: Mở đầu, giới thiệu toán - Chương 2: Tổng quan Hệ thông tin Địa lý (GIS) khai phá liệu không gian - Chương 3: Một số phương pháp phân cụm liệu không gian - Chương 4: Xây dựng chương trình thử nghiệm ứng dụng phân cụm liệu khơng gian hỗ trợ tìm vị trí tối ưu đặt máy ATM khu vực nội thành Hà Nội - Chương 5: Kết luận, đánh giá ... phá liệu không gian - Chương 3: Một số phương pháp phân cụm liệu không gian - Chương 4: Xây dựng chương trình thử nghiệm ứng dụng phân cụm liệu khơng gian hỗ trợ tìm vị trí tối ưu đặt máy ATM. .. đồng phân cụm liệu không gian 53 CHƢƠNG ỨNG DỤNG PHÂN CỤM KHƠNG GIAN TRONG BÀI TỐN XÁC ĐỊNH VỊ TRÍ TỐI ƢU LẮP ĐẶT MÁY ATM 62 4.1 Phân tích toán 62 4.1.1 Nguồn liệu đầu vào... TRƯỜNG ĐẠI HỌC CÔNG NGHỆ - - NGUYỄN SƠN PHƯƠNG PHÁP PHÂN CỤM DỮ LIỆU KHÔNG GIAN VÀ ỨNG DỤNG TRONG VIỆC XÁC ĐỊNH VỊ TRÍ TỐI ƯU ĐẶT MÁY ATM Ngành: Chuyên ngành: Mã số: Công nghệ thông tin

Ngày đăng: 25/03/2015, 10:23

Từ khóa liên quan

Mục lục

  • MỤC LỤC

  • DANH MỤC HÌNH VẼ

  • KÝ HIỆU VIẾT TẮT

  • CHƯƠNG 1. MỞ ĐẦU

  • 2.1. Tổng quan về Hệ thông tin địa lý

  • 2.1.1. Một số định nghĩa về hệ thông tin địa lý

  • 2.1.2. Các thành phần của hệ thông tin địa lý

  • 2.1.3. Biểu diễn dữ liệu địa lý

  • 2.1.4. Phân tích và xử lý dữ liệu không gian

  • 2.1.5. Ứng dụng của hệ thông tin địa lý

  • 2.2. Tổng quan về khai phá dữ liệu

  • 2.2.1. Khái niệm

  • 2.2.2. Tiến trình khai phá dữ liệu

  • 2.2.3. Các mô hình khai phá dữ liệu

  • 2.2.4. Các hướng tiếp cận và kỹ thuật sử dụng trong khai phá dữ liệu

  • 2.2.5. Các dạng dữ liệu có thể khai phá

  • 2.2.6. Các ứng dụng của khai phá dữ liệu

  • 2.3. Khai phá dữ liệu không gian

  • 2.3.1. Các đặc trưng của khai phá dữ liệu không gian

  • 2.3.2. Kho dữ liệu không gian và các chiều dữ liệu

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan