Gộp nhóm các giá trị lặp của các thuộc tính trong các mảnh của cơ sở dữ liệu phân tán

81 219 0
Gộp nhóm các giá trị lặp của các thuộc tính trong các mảnh của cơ sở dữ liệu phân tán

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG - Nguyễn Anh Dũng GỘP NHÓM CÁC GIÁ TRỊ LẶP CỦA CÁC THUỘC TÍNH TRONG CÁC MẢNH CỦA CƠ SỞ DỮ LIỆU PHÂN TÁN Luận văn thạc sĩ khoa học máy tính Thái Nguyên - 2015 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG - Nguyễn Anh Dũng GỘP NHÓM CÁC GIÁ TRỊ LẶP CỦA CÁC THUỘC TÍNH TRONG CÁC MẢNH CỦA CƠ SỞ DỮ LIỆU PHÂN TÁN Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH GV hướng dẫn: PGS NCVC TS Lê Huy Thập Thái Nguyên - 2015 i LỜI CAM ĐOAN Tôi xin cam đoan công trình nghiên cứu tôi, xây dựng từ số liệu kết thực tiễn học tập trường Đại học Công nghệ thông tin Truyền thông Thái Nguyên ứng dụng dựa số liệu UBND huyện Đan Phượng, chưa công bố hay xuất công trình khác Thái Nguyên, tháng 10 năm 2015 Tác giả Nguyễn Anh Dũng ii LỜI CẢM ƠN Trước tiên xin cảm ơn thầy PGS NCVC TS Lê Huy Thập, người trực tiếp giảng dạy người hướng dẫn thực luận văn Tôi xin bày tỏ lòng biết ơn đến thầy, cô giáo Viện Công nghệ thông tin Khoa Công nghệ thông tin - Đại học Thái Nguyên tận tình giảng dạy tạo điều kiện thuận lợi cho suốt trình học tập Tôi xin cảm ơn lãnh đạo Phòng Văn hóa Thông tin huyện Đan Phượng, anh chị đồng nghiệp tạo điều kiện cho tham gia hoàn thành khóa học Tôi xin cảm ơn bạn tôi, người bên cạnh động viên, giúp đỡ đóng góp nhiều ý kiến thiết thực trình học tập thực luận văn Cuối chân thành cảm ơn thành viên gia đình tôi, yêu thương, dìu dắt công việc sống Thái Nguyên, tháng 10 năm 2015 Sinh viên thực Nguyễn Anh Dũng iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC BẢNG BIỂU v DANH MỤC HÌNH vii DANH MỤC CÁC CHỮ VIẾT TẮT viii BẢNG DANH MỤC CÁC KÍ HIỆU ix LỜI NÓI ĐẦU CHƯƠNG 1: CƠ SỞ LÝ THUYẾT 1.1 Logic 1.1.1 Mệnh đề phép toán mệnh đề 1.1.2 Các phép toán mệnh đề 1.1.3 Các luật logic 1.2 Cơ sở liệu phân tán 1.2.1 Phân mảnh ngang 12 1.2.2 Phân mảnh dọc 16 1.2.3 Phân mảnh hỗn hợp 17 CHƯƠNG 2: CÁC THUẬT TOÁN PHÂN MẢNH THEO CÁC GIÁ TRỊ LẶP CỦA CÁC THUỘC TÍNH TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN 18 2.1 Miền giá trị thuộc tính khái niệm giá trị lặp thuộc tính 18 2.1.2 Các giá trị lặp miền giá trị thuộc tính 18 2.2 Các thuật toán phân mảnh theo giá trị lặp thuộc tính 21 2.2.1 Thuật toán phân mảnh dọc 21 2.2.2 Thuật toán phân mảnh ngang theo giá trị lặp gộp nhóm theo tiêu chuẩn giữ lại mảnh ngang 42 2.2.3 Thuật toán phân mảnh hỗn hợp theo giá tri lặp 48 iv 2.2.4 Thuật toán tính size mảnh 50 2.3 Gắn nhãn cho mảnh hỗn hợp…………………………………… ……51 2.4 Kết luận chương 51 CHƯƠNG 3: ỨNG DỤNG QUẢN LÝ VẤN ĐỀ KINH DOANH TẠI HUYỆN ĐAN PHƯỢNG 52 3.1 Thiết kế sở liệu quan hệ kinh doanh huyện Đan Phượng 52 3.2 Mệnh đề phân mảnh giá trị lặp lại thuộc tính theo tiêu chí địa điểm, hộ kinh doanh, loại hình kinh doanh, … 55 3.3 Gộp nhóm giá trị lặp thuộc tính mảnh ngang 64 3.4 Kết luận chương 67 KẾT LUẬN 68 HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI 69 TÀI LIỆU THAM KHẢO 70 v DANH MỤC BẢNG BIỂU Bảng 1.1: Bảng tổng hợp giá trị chân trị phép toán Bảng 1.2: Bảng quan hệ PROJ 10 Bảng 1.3: Quan hệ phân mảnh dọc PROJ1 11 Bảng 1.4: Quan hệ phân mảnh dọc PROJ2 11 Bảng 1.5: Quan hệ phân mảnh ngang với BUGGET ≤ 200 11 Bảng 1.6: Quan hệ phân mảnh ngang với BUGGET > 200 12 Bảng 2.1 Quan hệ PhanNhiem 19 Bảng 2.1.1 Miền giá trị khóa 19 Bảng 2.1.2 Giá trị lặp ChucVu: Giám đốc 20 Bảng 2.1.3 Giá trị lặp ChucVu: Phân tích thiết kế 20 Bảng 2.1 Giá trị lặp ChucVu: Kỹ sư 20 Bảng 2.1.5 Giá trị lặp ThoiGianLV: 24 20 Bảng 2.1.6 Giá trị lặp ThoiGianLV: 48 20 Bảng 2.1.7 Giá trị lặp (ChucVu , ThoiGianLV) 21 Bảng 2.2.1 Mảnh dọc theo ThoiGianLV 21 Bảng 2.2.2 Mảnh dọc theo ChucVu 22 Bảng 2.2.3 Mảnh dọc theo ThoiGianLV 23 Bảng 2.2.4 Mảnh dọc theo ChucVu 24 Bảng 2.2.5 Toàn quan hệ PhanNhiem 24 Bảng 2.2.5’ Toàn quan hệ PhanNhiem 43 Bảng 2.2.6 Quan hệ PhanNhiem 45 Bảng 2.2.7 Các mảnh ngang M21 47 Bảng 2.2.8 Quan hệ PhanNhiem 47 Bảng 2.2.9 Mảnh ngang M11 47 Bảng 2.2.10 Quan hệ PhanNhiem 48 Bảng 2.2.11 Mảnh ngang M12 48 Bảng 3.1: Dữ liệu bảng Dang_Ky_KD 52 Bảng 3.2: Bảng kết mảnh H1 56 vi Bảng 3.3: Bảng kết mảnh H2 57 Bảng 3.4: Bảng kết mảnh H3 58 Bảng 3.5: Bảng kết mảnh H4 59 Bảng 3.6: Bảng kết mảnh H5 61 Bảng 3.7: Bảng kết mảnh H6 62 Bảng 3.8: Bảng kết mảnh H7 63 vii DANH MỤC HÌNH Hình 1.1:Mô tả mối quan hệ quan hệ đường nối………… 14 Hình 1.2: Phân đoạn hỗn hợp …………………………………………… 17 Hình 2.1: Ma trận mẫu giá trị sử dụng thuộc tính……………………… 26 Hình 2.2: Ma trận liên đới thuộc tính…………………………………… 29 Hình 2.3: Tính toán ma trận liên đới CA…………………….…………… 35 Hình 2.4: Định vị điểm tách………………………….……………… 37 Hình 3.1: Giao diện ban đầu chương trình …………………………… 64 Hình 3.2: Giao diện sau trình chọn button “chonDB” ……………… 65 Hình 3.3: Giao diện sau chọn lựa xong bảng quan hệ ………………… 65 Hình 3.4: Giao diện trình chọn thuộc tính lặp ……………………… 66 Hình 3.5: Kết trình phân mảnh ngang …………………………… 67 Hình 3.6: Giao diện liệu mảnh ngang ………………………… 67 viii DANH MỤC CÁC CHỮ VIẾT TẮT CSDL Cở sở liệu CSDLPT Cở sở liệu phân tán SQL Structured Query Language (Ngôn ngữ truy vấn có cấu trúc) 56 tiêu chí cho trình phân mảnh: Một số tiêu chí định số lượng mảnh sau:  Các ràng buộc số lượng liệu có giá trị lặp lại thuộc yếu tố định số lượng mảnh có  Thuộc tính chọn để tiến hành phân mảnh Thông thường, thuộc tính khóa đồng thời tồn nhiều giá trị lặp lại lựa chọn làm thuộc tính phân mảnh ngang  Xây dựng mệnh đề phân mảnh ngang cho tiêu chí chọn Các mệnh đề phân mảnh ngang giá trị lặp lại xây dựng ví dụ 3.1 đây: Ví dụ 3.1: Cho bảng quan hệ Dang_Ky_KD bảng 3.1 Ta tiến hành phân mảnh ngang cho thuộc tính theo thuộc tính địa ngành nghề kinh doanh sau: Các bảng quan hệ thể mệnh đề phân mảnh ngang cho thuộc tính địa chỉ: H1 = Dia_chi =” Tân hội” AND card(H1)>=2 (Dang_Ky_KD) Bảng kết thể cho mảnh H1 thể bảng 3.2 sau: Bảng 3.2: Bảng kết mảnh H1 MaNguoiK TenNguoiK DiaCh D MaKD1 MaKD6 MaKD7 D i So_GP Cụm 13 - Tân 03E800195 Hội Nguyễn Viết Đại Đan Phượng – Hà Nội Cụm 13 - Tân 01S800174 Hội Nguyễn Vỹ Sơn Đan Phượng Hà Nội Cụm Nguyễn Xuân 03E800217 Tân Hội Dân - Đan Phượng - NgayCa CoQuanCa NganhNgh p p e 19/2/2009 Phòng TC- KH Đại lý Internet 10/7/2013 Phòng TC-KH Karaoke 27/1/2010 Phòng TC- KH Buôn bán, sửa chữa điện thoại 57 MaKD23 MaKD24 MaKD25 MaKD26 Nguyễn Đình Thái Nguyễn Văn Định Ngô Thế Tâm Đông Quốc Khánh Hà Nội Cụm – Tân HộiĐan Phượng Hà Nội Cụm 2Tân HộiĐan Phượng Hà Nội Cụm – Tân HộiĐan Phượng Hà Nội Cụm – Tân HộiĐan Phượng Hà Nội 03E800219 03E800260 03E800219 03E800249 13/7/2009 Phòng TC-KH Karaoke 11/6/2010 Phòng TC-KH Karaoke 13/7/2009 Phòng TC-KH Karaoke 02/3/2010 Phòng TC-KH Buôn bán, sửa chữa điện thoại H2 = Dia_chi =” Tân Lập” AND card(H2)>=2 (Dang_Ky_KD) Bảng kết thể cho mảnh H2 thể bảng 3.3 sau: Bảng 3.3: Bảng kết mảnh H2 MaNguoiK TenNguoiK DiaCh D MaKD4 MaKD27 MaKD28 MaKD29 D Nguyễn Khắc Nãi Nguyễn Công Yên Bùi Thị Phóng Trần Ngọc Anh i Cụm - Tân Lập Đan Phượng - Hà Nội Cụm - Tân Lập Đan Phượng - Hà Nội Cụm - Tân Lập Đan Phượng - Hà Nội Cụm -Tân Lập - So_GP 03E800219 03E800164 01S800169 NgayCa CoQuanCa NganhNgh p p e 13/7/2009 Phòng TC-KH Karaoke Buôn bán, 6/6/2008 Phòng TC- KH sửa chữa điện thoại Buôn bán, 25/5/2013 Phòng TC- KH sửa chữa điện thoại 01S800152 06/11/201 Phòng TC- KH Buôn bán, sửa chữa điện 58 MaKD30 Nguyễn Văn Được Đan Phượng - Hà Nội Cụm 12 Tân Lập Đan Phượng - Hà Nội thoại 03E800089 Buôn bán, 25/4/206 Phòng TC-KH sửa chữa điện thoại H3 = Dia_chi =” Thọ Xuân” AND card(H3)>=2 (Dang_Ky_KD) Bảng kết thể cho mảnh H3 thể bảng 3.4 sau: Bảng 3.4: Bảng kết mảnh H3 MaNguoiK TenNguoiK DiaCh D MaKD14 MaKD15 MaKD16 MaKD17 MaKD18 D Trần Minh Quân Đào Ngọc Quân Trần Giang Nam Nguyễn Trung Dũng Hoàng Ngọc Hùng i Cụm – Thọ XuânĐan Phượng - Hà Nội Cụm – Thọ XuânĐan Phượng - Hà Nội Cụm – Thọ XuânĐan Phượng - Hà Nội Cụm – Thọ XuânĐan Phượng - Hà Nội Cụm – Thọ xuânĐan Phượng - Hà Nội So_GP NgayCa CoQuanCa NganhNgh p p e 01S800107 09/12/201 Phòng TC - Đại lý KH Internet 01S800107 09/12/201 Phòng TC - Đại lý KH Internet 30/9/2009 Phòng TC- KH 03E800229 03E800254 26/12/200 01S800165 10/4/2013 Phòng TC- KH Phòng TC- KH Đại lý Internet Đại lý Internet Karaoke 59 MaKD19 Trần Thị Loan MaKD20 Trần Thị Huế MaKD21 Đào Thị Hiên Cụm – Thọ XuânĐan Phượng - Hà Nội Cụm – Thọ XuânĐan Phượng - Hà Nội Cụm – Thọ XuânĐan Phượng - Hà Nội 018001366 10/7/2012 01S800030 07/01/201 1 01S800108 09/12/201 Phòng TC- KH Karaoke Phòng TC- KH Karaoke Phòng TC- KH Đại lý Internet Các bảng quan hệ thể mệnh đề phân mảnh ngang cho thuộc tính ngành nghề kinh doanh: H4 = Nganh_KD =” Đại lý Internet” AND card(H4)>=2 (Dang_Ky_KD) Bảng kết thể cho mảnh H4 thể bảng 3.5 sau: Bảng 3.5: Bảng kết mảnh H4 MaNguoiK TenNguoiK DiaCh D D MaKD1 Nguyễn Viết Đại MaKD2 Nguyễn Văn Thịnh MaKD3 Nguyễn Tiến Ninh i Cụm 13 Tân Hội Đan Phượng - Hà Nội Tiên Tân Hồng Hà Đan Phượng - Hà Nội Cụm - Thọ An Đan Phượng - Hà So_GP NgayCa CoQuanCa NganhNgh p p e 03E800195 19/2/2009 Phòng TC- KH Đại lý Internet 03E800116 29/10/200 Phòng TC- KH Đại lý Internet 03E800217 27/1/2010 Phòng TC- KH Đại lý Internet 60 MaKD10 MaKD11 Nguyễn Thị Huyền Phạm Tuấn Cường MaKD12 Phạm Mạnh Thắng MaKD13 Đào Kiên Định MaKD14 Trần Minh Quân MaKD15 Đào Ngọc Quân MaKD16 MaKD17 Trần Giang Nam Nguyễn Trung Dũng Nội Ích Vinh – Phương Đình Đan Phượng – Hà Nội La ThạchPhương ĐìnhĐan Phượng – Hà Nội Ích Vịnh – Phương ĐìnhĐan Phượng – Hà Nội Ích Vịnh – Phương ĐìnhĐan Phượng – Hà Nội Cụm – Thọ XuânĐan Phượng - Hà Nội Cụm – Thọ XuânĐan Phượng - Hà Nội Cụm – Thọ XuânĐan Phượng - Hà Nội Cụm – Thọ Xuân- 01S800120 23/3/2012 01S800117 20/02/201 01S800075 30/6/2011 Phòng TC- KH Đại lý Internet 01S800172 07/06/201 Phòng TC- KH Đại lý Internet 01S800107 09/12/201 Phòng TC KH Đại lý Internet 01S800107 09/12/201 Phòng TC KH Đại lý Internet 30/9/2009 Phòng TC- KH 03E800229 03E800254 26/12/200 Phòng TC- KH Phòng TC- KH Phòng TC- KH Đại lý Internet Đại lý Internet Đại lý Internet Đại lý Internet 61 MaKD21 Đào Thị Hiên Đan Phượng - Hà Nội Cụm – Thọ XuânĐan Phượng Hà Nội 01S800108 09/12/201 Phòng TC- KH Đại lý Internet H5 = Nganh_KD=” Karaoke” AND card(H5)>=2 (Dang_Ky_KD) Bảng kết thể cho mảnh H5 thể bảng 3.6 sau: Bảng 3.6: Bảng kết mảnh H5 MaNguoiK TenNguoiK DiaCh D MaKD4 MaKD5 MaKD6 MaKD18 MaKD19 D Nguyễn Khắc Nãi Nguyễn Minh Châu Nguyễn Vỹ Sơn Hoàng Ngọc Hùng Trần Thị Loan i Cụm - Tân Lập Đan Phượng - Hà Nội Phố Tây Sơn Thị trấn Phùng Đan Phượng – Hà Nội Cụm 13 Tân Hội Đan Phượng - Hà Nội Cụm – Thọ xuânĐan Phượng - Hà Nội Cụm – Thọ XuânĐan Phượng - Hà So_GP 03E800219 NgayCa CoQuanCa NganhNgh p p e 13/7/2009 Phòng TC-KH Karaoke Phòng TC-KH Karaoke 10/7/2013 Phòng TC-KH Karaoke 10/4/2013 Phòng TC- KH Karaoke 10/7/2012 Phòng TC- KH Karaoke 03E800254 26/12/200 6 01S800174 01S800165 018001366 62 MaKD20 MaKD22 MaKD23 MaKD24 MaKD25 Trần Thị Huế Nguyễn Đức Trường Nguyễn Đình Thái Nguyễn Văn Định Ngô Thế Tâm Nội Cụm - Thọ Xuân Đan Phượng - Hà Nội Cụm – Thọ AnĐan Phượng - Hà Nội Cụm - Tân Hội Đan Phượng - Hà Nội Cụm 2Tân Hội Đan Phượng - Hà Nội Cụm - Tân Hội Đan Phượng - Hà Nội 01S800030 07/01/201 1 03E800251 03E800219 03E800260 03E800219 Phòng TC- KH Karaoke 16/3/2010 Phòng TC- KH Karaoke 13/7/2009 Phòng TC-KH Karaoke 11/6/2010 Phòng TC-KH Karaoke 13/7/2009 Phòng TC-KH Karaoke H6 = Nganh_KD=” buôn bán sửa chữa điện thoại” AND card(H6)>=2 (Dang_Ky_KD) Bảng kết thể cho mảnh H6 thể bảng 3.7 sau: Bảng 3.7: Bảng kết mảnh H6 Số giấy STT Họ tên Địa phép đăng ký kinh doanh MaKD7 MaKD8 MaKD9 03E800217 Ngày tháng năm cấp Nguyễn Xuân Dân Cụm - Tân Hội - Đan Phượng - Hà Nội Nguyễn Quang Đoài Khê – Đan Phượng - Đan Phượng - Hà Nội 03E800050 29/10/200 Tháp Thượng Song Phượng - 03D800141 16/3/2006 Huy Nguyễn Đăng 27/1/2010 Cơ quan cấp PhòngTC-KH Ngành nghề kinh doanh Buôn bán, sửa chữa điện thoại Buôn bán, PhòngTC-KH sửa chữa điện thoại PhòngTC-KH Buôn bán, 63 Đạt MaKD26 MaKD27 MaKD28 MaKD29 MaKD30 Đông Quốc Khánh Nguyễn Công Yên Bùi Thị Phóng Trần Ngọc Anh Nguyễn Văn Được Đan Phượng - Hà Nội Cụm – Tân HộiĐan Phượng - Hà Nội 03E800249 Cụm – Tân LậpĐan Phượng - Hà Nội 03E800164 Cụm – Tân LậpĐan Phượng - Hà Nội Cụm – Tân LậpĐan Phượng - Hà Nội Cụm 12 – Tân Lập- Đan Phượng - Hà Nội sửa chữa điện thoại 7 Buôn bán, 02/3/2010 PhòngTC-KH sửa chữa điện thoại Buôn bán, 6/6/2008 PhòngTC-KH sửa chữa điện thoại Buôn bán, 01S8001693 25/5/2013 PhòngTC-KH sửa chữa điện thoại 01S8001527 03E800089 06/11/201 Buôn bán, PhòngTC-KH sửa chữa điện thoại Buôn bán, 25/4/206 PhòngTC-KH sửa chữa điện thoại Các bảng quan hệ thể mệnh đề phân mảnh ngang cho thuộc tính ngành nghề kinh doanh thuộc tính địa chỉ: H7=Dia_chi =” Thọ Xuân” AND Nganh_KD =” Đại lý Internet” AND card(H3)>=2 (Dang_Ky_KD) Bảng kết thể cho mảnh H7 thể bảng 3.8 sau: Bảng 3.8: Bảng kết mảnh H7 STT Họ tên MaKD14 Trần Minh Quân MaKD15 Đào Ngọc Quân MaKD16 Trần Giang Nam MaKD17 Nguyễn Trung Dũng MaKD21 Đào Thị Hiên Địa Cụm – Thọ Xuân- Đan Phượng - Hà Nội Cụm – Thọ Xuân- Đan Phượng - Hà Nội Cụm – Thọ Xuân- Đan Phượng - Hà Nội Cụm – Thọ Xuân- Đan Phượng - Hà Nội Cụm – Thọ Xuân- Đan Phượng - Hà Nội Số giấy phép đăng ký kinh doanh Ngày tháng năm cấp Cơ quan cấp Ngành nghề kinh doanh 01S800107 09/12/201 PhòngTC-KH Đại lý Internet 01S800107 09/12/201 PhòngTC-KH Đại lý Internet 03E800229 30/9/2009 PhòngTC-KH Đại lý Internet 03E800254 26/12/200 PhòngTC-KH Đại lý Internet 01S800108 09/12/201 PhòngTC-KH Đại lý Internet 64 3.3 Gộp nhóm giá trị lặp thuộc tính mảnh ngang Sau trình thực ví dụ tìm tập tất mệnh đề phân mảnh ngang có thỏa mãn điều kiện phân mảnh ta tiến hành thực nghiệm với chương trình Chương trình thử nghiệm thực môi trường visual studio 2013 SQL 2008 Giao diện ban đầu chương trình thể hình 3.1: Hình 3.1: Giao diện ban đầu chương trình Giao diện chương trình chia thành phần sau: - Phần chọn hiển thị liệu sở liệu đầu vào - Phần thực phân mảnh với số lượng giá trị lặp lại hiển thị - Phần gán định danh cho mảnh tìm Sau đó, bước ta cần tiến hành chọn sở liệu muốn phân mảnh giá trị lặp lại Để thực trình này, ta tiến hành chọn vào button “chonDB” Sau chọn button ta thu giao diện thể hình 3.2: 65 Hình 3.2: Giao diện sau trình chọn button “chonDB” Trong bảng “ChonDB” ta tiến hành chọn sở liệu bảng quan hệ muốn tiến hành phân mảnh Trong chương trình này, tiến hành phân mảnh cho bảng quan hệ đơn lẻ Để tiến hành cho bảng quan hệ khác sở liệu ta tiến hành chạy bảng quan hệ Sau chọn bảng quan hệ, chương trình hiển thị liệu bảng chọn hình (hình 3.3) Hình 3.3: Giao diện sau chọn lựa xong bảng quan hệ 66 Sau trình chọn lựa bảng quan hệ, chương trình cho phép ta lựa chọn thuộc tính khóa mà ta muốn tiến hành phân mảnh ngang giá trị lặp Giao diện trình chọn thuộc tính thể qua hình 3.4: Hình 3.4: Giao diện trình chọn thuộc tính lặp Sau chọn tập thuộc tính ta tiến hành điền giá trị ràng buộc số lượng ghi có giá trị lặp lại nhỏ (mặc định 3) Sau đó, chọn button “Thực phân mảnh” để tiến hành phân mảnh ngang Kết thu tập mảnh ngang định danh chúng thể hình 3.5: 67 Hình 3.5: Kết trình phân mảnh ngang Sau đó, ta lựa chọn hiển thị bảng liệu mảnh liệu (hình 3.6) Hình 3.6: Giao diện liệu mảnh ngang 3.4 Kết luận chương Trong chương này, luân văn trình bày trình tiến thành ứng dụng lý thuyết chương vào toán ứng dụng thực tế huyện Đan Phượng Chương trình bày số vấn đề sau: - Thiết kế xây dựng sở liệu quan hệ kinh doanh huyện Đan Phượng - Đưa mệnh đề giá trị lặp thuộc tính với tiêu chí xác định cho toán phân mảnh hỗn hợp - Tiến hành gộp nhóm gán nhãn tương ứng cho liệu phân mảnh - Các giao diện toán thể tròng phần 68 KẾT LUẬN Với kiến thức lĩnh vực sở liệu phân tán nhiều hạn chế, luận văn tìm hiểu số vấn đề đặt từ hệ thống sở liệu phân tán Tuy nhiên, luận văn giải số vấn đề sau: - Chương 1: Luận văn trình bày kiến thức mệnh đề logic mệnh đề - Chương 2: Luận văn tiến hành tìm hiểu nội dung liên quan đến giá trị lặp lại thuộc tính định nghĩa, miền giá trị chúng Đồng thời tìm hiểu vấn đề mệnh đề phân mảnh, tiêu chuẩn gộp nhóm giữ lại nhóm tiến hành gán nhãn cho giá trị thu - Chương 3: Luận văn tiến hành cài đặt thực nghiệm chương trình ứng dụng thực tế sở liệu kinh doanh huyện Đan Phượng Chương trình bày bước từ trình khảo sát đến xây dựng sở liệu thử nghiệm cuối giao diện kết sau trình thử nghiệm 69 HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI - Tiến hành thử nghiệm hệ thống với sở liệu khác đưa đánh giá cụ thể - Tiến hành cài đặt thêm chức đánh giá trình phân mảnh - Cấp phát mảnh phân mảnh đến nút mạng 70 TÀI LIỆU THAM KHẢO [1] Đoàn Văn Ban, Nguyễn Mậu Hân (2006), Xử lý song song phân tán, NXB Khoa học kỹ thuật [2] Đỗ Xuân Lôi (1996), Cấu trúc liệu giải thuật, NXB Khoa học Kỹ thuật [3] Lê Huy Thập (2010), Cơ sở lý thuyết song song, NXB Thông tin truyền thông [4]Lê Huy Thập (2008), Giáo trình Kỹ thuất lập trình, Tập 1, NXB Khoa học tự nhiên công nghệ [5]Lê Tiến Vương (2000), Nhập môn CSDL quan hệ, NXB Thống Kê [6]Barry Wlkingson, Michael Allen (1999), Parallel Programming, Technique and Applications Using Netwworked Workstations and Parallel Computers, Prentice Hall New Jersey [7]Japan Information Processing Development Corporation, Central Academy of Information Technology (1978), Internal Design And Programming [8]Kenneth H.Rosen, Toán rời rạc ứng dụng tin học, NXB Khoa học Kỹ thuật [9]Seyed H Roo (1999), Parallel processing and Parallel Algorithms, Theory and Coputation [10]Robert Sedgewick (2001), Cẩm nang thuật toán Vol.1 and vol.2, NXB Khoa học Kỹ thuật [11]M.Tamer Ozsu, Patrick Valduriez (1999), Nguyên lý hệ liệu phân tán, Trần Đức Quang biên dịch, NXB Thống kê [...]... và khái niệm giá trị lặp của thuộc tính 2.1.1 Miền giá trị của thuộc tính Cho lược đồ quan hệ R(K, A1,A2,…,An), trong đó K là khóa chính còn A1,A2,…,An là các thuộc tính không khóa Ký hiệu D = (Dk, D1, D2, …, Dn) Với DK = Dom(K) là miền giá trị của khóa K Di = Dom(Ai) là miền giá trị của thuộc tính Ai ( i  1, n ) 2.1.2 Các giá trị lặp trong miền giá trị của thuộc tính Định nghĩa giá trị lặp Cho quan... A1,A2, ,An), trong đó Key là tập thuộc tính khóa có miền giá trị DK; A = {Aj} là tập các thuộc tính không khoá có miền giá trị tương ứng Dj (j = 1, ,n) Nếu giá trị x xuất hiện nhiều lần trong miền giá trị của thuộc tính Dj nào đó thì x được gọi là giá trị lặp của thuộc tính Aj Định nghĩa tương tự cho tập các giá trị lặp của tập con các thuộc tính của tập thuộc tính A Ví dụ 2.1 Cho quan hệ phân công mhiệm... tăng tốc độ xử lý dữ liệu và giảm chi phí truyền thông 2 Đối tượng và phạm vi nghiên cứu Cơ sở dữ liệu phân tán, các loại mảnh và phương pháp phân mảnh trong CSDL phân tán 3 Hướng nghiên cứu của đề tài Phân mảnh các giá trị lặp của các thuộc tính bằng phương pháp phân mảnh hỗn hợp và tìm ra các mảnh có hỗn hợp các kích thước đủ lớn Gán nhãn cho các mảnh hỗn hợp có kích thước thỏa mãn các điều kiện cho... tính có các giá trị lặp lại với kích cỡ đủ lớn Việc tách ở đây thực sự là việc phân mảnh “hỗn hợp” các quan hệ trong cơ sở dữ liệu phân tán Mảnh có các giá trị lặp lại với kích cỡ đủ lớn được gán bí danh, phần còn lại cũng chính là các mảnh Khi cần cập nhật, chỉ cần tái thiết lại mảnh ban đầu từ các mảnh đã phân rã và tham chiếu đến bí danh đã đặt để lấy các giá trị lặp Các mảnh có giá trị lặp lại với... hợp Tính tách biệt được đảm bảo khi các mảnh lá và mảnh trung gian cũng tách biệt 18 CHƯƠNG 2: CÁC THUẬT TOÁN PHÂN MẢNH THEO CÁC GIÁ TRỊ LẶP CỦA CÁC THUỘC TÍNH TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN Một mảnh ngang, dọc hay hỗn hợp đều là các quan hệ con của một quan hệ hay của một số quan hệ (trong phép hợp, trong phép nối,…) tham gia vào câu vấn tin, vì vậy ta sẽ gọi chung là quan hệ 2.1 Miền giá trị thuộc tính. .. iii/ Giá trị lặp đa miền thuộc tính : (ChucVu , ThoiGianLV) Bảng 2.1.7 Giá trị lặp (ChucVu , ThoiGianLV) Bộ t MaNV MaDuAn ChucVu ThoiGianLV t2 NV2 DA1 Phân tích và thiết kế 24 t3 NV2 DA2 Phân tích và thiết kế 24 2.2 Các thuật toán phân mảnh theo các giá trị lặp của các thuộc tính 2.2.1 Thuật toán phân mảnh dọc Phân mảnh dọc một quan hệ R sinh ra các mảnh V1, V2,…, Vd Mỗi mảnh con chứa một tập con thuộc. .. truyền dẫn - Chương 1: Cơ sở lý thuyết - Chương 2: Gộp nhóm các giá trị lặp của các thuộc tính trong cơ sở dữ liệu phân tán - Chương 3: Ứng dụng quản lý vấn đề kinh doanh tại huyện Đan Phượng 3 CHƯƠNG 1: CƠ SỞ LÝ THUYẾT 1.1 Logic 1.1.1 Mệnh đề và các phép toán mệnh đề Chúng ta chỉ xét đến các mệnh đề toán học, có nghĩa là một phát biểu nào đó chỉ có hai giá trị: đúng hoặc sai, giá trị đúng (ký hiệu là... tập hợp dữ liệu có liên đới logic và được phân bố trên các nút của một mạng máy tính Phần lớn các hệ cơ sở dữ liệu phân tán được thiết kế theo hướng từ trên xuống (Top-Down) Thiết kế phân mảnh dữ liệu là công việc đầu tiên phải thực hiện Mục đích của việc phân mảnh dữ liệu là tạo ra các đơn vị cấp phát logic, sao cho chi phí để thực hiện truy vấn thông tin là thấp nhất Trong thiết kế CSDL phân tán, cần... cả các mảnh Vì vậy tính tách biệt trong phân mảnh dọc được hiểu không liên quan gì đến khóa chính của quan hệ 1.2.1 Phân mảnh ngang 1.2.1.1 Giới thiệu Phân mảnh ngang chính là việc chia quan hệ thành nhiều các nhóm bộ Kết quả của quá trình phân mảnh ngang là các quan hệ con, số lượng quan hệ con phụ thuộc vào điều kiện ràng buộc của các thuộc tính Và các bộ trong các quan hệ con là tách biệt nhau Phân. .. nhất một mảnh Ri (i=1, ,n) Quy tắc này đảm bảo cho các mục dữ liệu trong R được ánh xạ hoàn toàn vào các mảnh và không bị mất Mục dữ liệu có thể hiểu là bộ trong phân mảnh ngang và thuộc tính trong phân mảnh dọc 2 Tính phục hồi: Nếu một quan hệ R được phân rã thành các mảnh R1, R2,…,Rn khi đó: R = Ri,  Ri∈ FR Toán tử  thay đổi tùy theo từng loại phân mảnh Khả năng phục hồi quan hệ từ các mảnh sẽ

Ngày đăng: 12/05/2016, 10:46

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan