Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc

64 882 5
Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài Thu Hoạch Chuyên Đề - Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc Mục Lục Mục Lục 1 Lời Cảm Ơn 2 Lời Mở Đầu 3 I. Tổng Quan Về Cơ Sở Dữ Liệu Phân Bố 4 1. Khái quát lại Cơ Sở Dữ Liệu 4 2. Các lý do để sử dụng CSDL phân bố? 5 3. Kiến trúc cơ sở dữ liệu phân bố 7 a. Phân mảnh dữ liệu và cấp phát dữ liệu 9 b. Điều khiển dư thừa 9 c. Độc lập với hệ quản trị cở sở dữ liệu địa phương 9 4. Hệ quản trị cơ sở dự liệu phân bố (DBDMS – Database Distribution Management System) 10 a. Mô hình của hệ quản trị cơ sở dữ liệu phân bố 10 b. Lược đồ hệ quản trị cơ sở dữ liệu phân bố 13 c. Cơ chế quản lý của hệ cơ sở dữ liệu phân bố 14 d. Quản trị và bảo vệ 18 e. Áp đặt luật phân quyền 19 f. Phân lớp người sử dụng 20 II. Tiếp cận thiết kế cơ sở dữ liệu phân bố 22 1. Cơ sở thiết kế cơ sở dữ liệu phân bố 22 2. Đối tượng thiết kế của cơ sở dữ liệu phân bố 23 3. Hướng thiết kế Top-down và Bottom-up cơ sở dữ liệu phân bố 24 III. Thiết kế phân mảnh dọc cho cơ sở dữ liệu phân bố 25 1. Phân mảnh dọc 26 2. Thuật toán năng lượng nối BEA (Bond Energy Algorithm) gom cụm 31 IV. Tổng Quan Chương Trình Phân Mảnh Dọc 41 1.Ngôn ngữ lập trình 41 Hàm CreateAffMatrix(): 44 Hàm CreateCAMatrix(): 46 Hàm CalculateFragments(): 50 2.Demo chương trình phân mảnh dọc 54 Kết Luận 62 Tài Liệu Tham Khảo 63 Nhận Xét Của Giáo Viên 64 SV: Nguyễn Võ Ngọc Huy (CH1101091) Trang 1/64 Bài Thu Hoạch Chuyên Đề - Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc Lời Cảm Ơn Thông qua môn học này, em xin gởi lời cám ơn chân thành đến thầy Đỗ Phúc, thầy đã hệ thống hoá khái niệm và kiến thức cơ sở dữ liệu rất cụ thể, từ cơ sở dữ liệu cơ bản để hệ thống hoá trước, tiếp theo bổ sung các kiến thức cơ sở dữ liệu nâng cao. Những tài liệu thầy giới thiệu, những ý tưởng mở để tìm hiểu thêm kiến thức môn học, những câu hỏi yêu cầu suy nghĩ và điểm nhấn mạnh của thầy thực sự giúp ích em trong việc nghiên cứu thêm. Thông qua bài tiểu luận này, em mong được xem như hệ thống hoá kiến thức và một số điểm tìm hiểu vấn đề trong môn học Cơ Sở Dữ Liệu Nâng Cao. Tuy nhiên, do một số hạn chế về thời gian, cho nên bài báo cáo chắc chắn còn nhiều thiếu sót. Rất mong được sự hướng dẫn và giúp đỡ của các thầy và các bạn. Một lần nữa xin cảm ơn thầy hướng dẫn chúng em tận tình trong môn học Cơ Sở Dữ Liệu Nâng Cao vừa qua. Xin cảm ơn ! SV: Nguyễn Võ Ngọc Huy (CH1101091) Trang 2/64 Bài Thu Hoạch Chuyên Đề - Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc Lời Mở Đầu Ngay khi nói đến máy tính và hệ thống thông tin, chúng ta không thể không biết và không quan tâm đến trung tâm của hệ thống là cơ sở dữ liệu. Mọi vấn đề lưu trữ, truy xuất, hổ trợ ra quyết định đều thao tác trên hàng tỉ giao dịch trên thế giới mỗi giây. Ngày nay, không chỉ dừng lại ở việc thao tác trên cơ sở dữ liệu cục bộ, riêng rẻ; và do nhu cầu ngày nay cơ sở dữ liệu được đặt khắp nơi trên vị trí địa lý khác nhau, ví dụ như những tập đoàn toàn cầu về buôn bám, giao nhận, hệ thống ngân hàng, bảo hiểm toàn cầu, mỗi giao dịch cần được xử lý đơn đồng thời đồng bộ hoá cơ sở dữ liệu trung tâm. Chính vì vậy, chúng ta cần tìm hiểu để thiết kế, triển khai và vận hành những hệ thống cơ sở dữ liệu phân bố khắp nơi như thế. Bằng cách tiếp cận những xu thế mới về lý thuyết cơ sở dữ liệu phân bố, các hệ quản trị cơ sở dữ liệu phân bố ngày nay, cách thiết kế và tối ưu các cơ sở dữ liệu để tránh phân mảnh dữ liệu, toàn vẹn dữ liệu và xử lý dữ liệu nhanh nhất, hiệu quả nhất giữa các site là vấn đề quan trong sống còn cần được tìm hiểu và phân tích trong ứng dụng thực tiễn ngày nay. Trong phạm vi bài thu hoạch này, tập trung vào kiến thức cơ sở dữ liệu phân bố và cách thức phân mảnh dọc để được dữ liệu ở các site hiệu quả. SV: Nguyễn Võ Ngọc Huy (CH1101091) Trang 3/64 Bài Thu Hoạch Chuyên Đề - Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc I. Tổng Quan Về Cơ Sở Dữ Liệu Phân Bố Cơ sở dữ liệu (CSDL) phân bố (Distributed DataBase – DDB) là một tập hợp nhiều CSDL có liên đới logic và được phân bố trên một mạng máy tính. Vì yêu cầu chung của các tổ chức kinh tế xã hội là ở những vị trí địa lý khác nhau cho nên xây dựng một hệ thống thông tin làm việc trên cơ sở dữ liệu phân bố là phù hợp với xu hướng hiện nay. CSDL phân bố ra đời dựa trên nền tảng chính của CSDL tập trung nhưng với đặc điểm riêng nổi bật là thiết kế theo phương pháp phân mảnh dữ liệu và sử dụng các bản sao (replication), dữ liệu phân bố sẽ được cập nhật và lưu tại các nút (site), mỗi nút tương ứng với một database server và chỉ thực hiện một số chức năng nhất định. Việc ứng dụng CSDL phân bố có thể khắc phục được các nhược điểm vốn có của CSDL tập trung. Ngoài ra, việc kết nối giữa các CSDL từ xa được thực hiện qua kết nối database link sẽ đáp ứng được một số tiêu chuẩn cơ bản như cải thiện năng suất thực hiện công việc, đảm bảo an toàn dữ liệu, giảm giá thành truyền thông, bảo mật cao, dễ dàng thay đổi, phát triển. Chính vì vậy, vấn đề đạt được sự tích hợp dữ liệu mà ta không cần sự tập trung hóa và đó chính là lý do để của CSDL phân bố nghiên cứu và ra đời. 1. Khái quát lại Cơ Sở Dữ Liệu Cơ sở dữ liệu (Database) là tập hợp dữ liệu được lưu trữ một cách có tổ chức để phục vụ cho công việc sử dụng thuận tiện nhất. Dữ liệu là số liệu, hình ảnh cần được lưu trữ dưới dạng file, record tiện lợi cho người dùng đối với việc tham khảo, xử lý Mỗi cơ sở dữ liệu cần có chương trình quản lý, xắp xếp, duy trì dữ liệu gọi là hệ quản trị cơ sở dữ liệu (DBMS - Database Management System). Cơ sở dữ liệu được phân chia thành các mức khác nhau. Một cơ sở dữ liệu cơ bản có ba phần chính là mức vật lý, mức khái niệm và mức thể hiện. Tuy nhiên với cơ sở dữ liệu cấp cao thì có thể có nhiều mức phân hoá hơn. - Mức vật lý: là mức thấp nhất của kiến trúc hệ cơ sở dữ liệu, ở mức này dữ liệu được tổ chức dưới nhiều cấp khác nhau như bản ghi, file - Mức khái niệm: là sự biểu diễn trừu tượng của cơ sở dữ liệu vật lý và có thể nói mức vật lý là sự cài đặt cụ thể của cơ sở dữ liệu ở mức khái niệm. - Mức thể hiện: khi cơ sở dữ liệu được thiết kế, những gì thể hiện (giao diện, chương trình quản lý, bảng ) gần gũi với người sử dụng với cơ sở dữ liệu ở mức khái niệm gọi là khung nhìn. Như vậy sự khác nhau giữa khung nhìn và mức khái niệm không lớn. Mô hình phổ biến nhất của cơ sở dữ liệu là mô hình quan hệ: trong mô hinh quan hệ xét tập con của tích Decard của các miền D (Domain) với miền là một tập các giá trị. Gọi D1, D2, D3, Dn là n miền. Tích Decard của các miền D1 D2 SV: Nguyễn Võ Ngọc Huy (CH1101091) Trang 4/64 Bài Thu Hoạch Chuyên Đề - Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc D3 Dn là tập tất cả n bộ (v1,v2,v3 ,vn) sao cho vi Di với i=1, ,n. Mỗi hàng của quan hệ là một bộ (tuples). Quan hệ là tập con của tích Decard D1 D2 D3 Dn gọi là quan hệ n ngôi. Khi đó mỗi bộ có n thành phần ( n cột ), mỗi cột của quan hệ gọi là thuộc tính. 2. Các lý do để sử dụng CSDL phân bố? Có nhiều nguyên nhân để phát triển cơ sở dữ liệu phân bố nhưng tập trung chỉ gồm những điểm sau đây: - Các tổ chức có cấu trúc phân bố: Trong thực tế có nhiều tổ chức được phân bố khắp nơi, trong khi đó, dữ liệu quản lý ngày càng lớn và phục vụ cho đa người dùng nằm phân bố, vì vậy CSDL phân bố là con đường thích hợp với cấu trúc tự nhiên của các tổ chức đó. - Cần kết nối các CSDL có sẵn: CSDL phân bố là giải pháp tự nhiên khi có các CSDL đang tồn tại và sự cần thiết xây dựng một ứng dụng toàn cục. Trong trường hợp này CSDL phân bố được tạo theo tiến trình từ dưới lên dựa trên nền tảng CSDL đang tồn tại. Tiến trình này đòi hỏi phải tái cấu trúc các CSDL cục bộ ở một mức nhất định. - Sự lớn mạnh của tổ chức: Các tổ chức có thể phát triển mở rộng bằng cách thành lập thêm các đơn vị mới, vừa có tính tự trị, vừa có quan hệ với các đơn vị tổ chức khác. - Tính tái sử dụng: Tận dụng những cơ sở dữ liệu sẳn có từ các cơ sở dữ liệu tập trung ở các địa phương. - Giảm chi phí truyền thông: Tăng ứng dụng cục bộ làm giảm chi phí truyền thông. - Nâng cao hiệu suất: Có cơ chế xử lý song song và phân mảnh dữ liệu theo ứng dụng làm cực đại hóa tính cục bộ của ứng dụng. -Tăng độ tin cậy và tính sẵn sàng: Nếu có một thành phần nào đó của hệ thống bị hỏng, hệ thống vẫn có thể duy trì hoạt động. SV: Nguyễn Võ Ngọc Huy (CH1101091) Trang 5/64 Bài Thu Hoạch Chuyên Đề - Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc 3. Khái niệm cơ sở dữ liệu phân bố Như chúng học giai đoạn cơ bản, cơ sở dữ liệu dạng tập trung dùng cơ sở dữ liệu trên trên một khu vực địa lý và đáp ứng được yêu cầu các tổ chức trong suốt thời gian cho đến ngày nay Từ khi có internet ra đời, đặc biệt khái niệm VPN (mạng riêng ảo) thì nhu cầu liên kết cơ sở dữ liệu các toà nhà, các nước. Việc chia xẻ tài nguyên hệ thống với các tài nguyên không bị lệ thuộc về mặt vật lý như ý tưởng của cơ sở dữ liệu phân bố. Để chia xẻ tài nguyên một cách hiệu quả mỗi tài nguyên cần phải được quản lý bởi một chương trình có giao diện truyền thống, có thể được truy nhập, cập nhật một cách tin cậy và nhất quán. CSDL phân là một tập hợp nhiều CSDL có liên đới logic và được phân bố trên một mạng máy tính. Trong khái niệm này có hai thuật ngữ quan trọng trong các định nghĩa này là “liên đới logic” và “phân bố trên một mạng máy tính”. - Liên đới logic: Toàn bộ dữ liệu của CSDL phân bố có một số các thuộc tính ràng buộc chúng với nhau, điều này giúp chúng ta có thể phân biệt một CSDL phân bố với một tập hợp CSDL cục bộ hoặc các tập tin lưu trữ tại các vị trí khác nhau trong một mạng máy tính. - Phân bố trên một mạng máy tính: Toàn bộ dữ liệu của CSDL phân bố không được lưu trữ ở một nơi mà lưu trữ trên nhiều trạm thuộc mạng máy tính, điều này giúp chúng ta phân biệt CSDL phân bố với CSDL tập trung đơn lẻ. Hệ quản trị CSDL phân bố (Distributed Database Management System D-DBMS) được định nghĩa là một hệ thống phần mềm cho phép quản lý các hệ CSDL phân bố và làm cho sự phân bố trở nên “trong suốt” đối với người sử dụng. Hệ CSDL phân bố (Distributed DataBase System – DDBS) được xây dựng dựa trên hai công nghệ cơ bản là CSDL và mạng máy tính. Một hệ CSDL phân bố không phải là một “tập hợp các tập tin” được lưu trữ riêng rẽ tại mỗi nút của một mạng máy tính. Để tạo ra một hệ CSDL phân bố các tập tin không chỉ có liên đới logic mà chúng còn phải có cấu trúc và được truy xuất qua một giao diện chung. SV: Nguyễn Võ Ngọc Huy (CH1101091) Trang 6/64 Bài Thu Hoạch Chuyên Đề - Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc 3. Kiến trúc cơ sở dữ liệu phân bố Trong hệ cơ sở dữ liệu phân bố, những người thiết kế hệ thống đã xây dựng lên một hệ các phần mềm phục vụ yêu cầu người dùng trên cơ sở dữ liệu đã có sẵn. Hình dưới đây trình bày kiến trúc chung của cơ sở dữ liệu phân bố. Tất nhiên kiến trúc này không biểu diễn tường minh cho mọi hệ cơ sở dữ liệu phân bố, nhưng là mô hình cơ bản cho kiến trúc phân bố. Kiến trúc về tổ chức của các cơ sở dữ liệu phân bố nói chung như sau: - Sơ đồ tổng thể: Định nghĩa tất cả các dữ liệu sẽ được lưu trữ trong CSDL phân bố. Trong mô hình quan hệ, sơ đồ tổng thể bao gồm định nghĩa của các tập quan hệ tổng thể. - Sơ đồ phân mảnh: Mỗi quan hệ tổng thể có thể chia thành một vài phần không gối lên nhau được gọi là đoạn (fragments). Có nhiều cách khác nhau để thực hiện việc phân chia này. Ánh xạ (một – nhiều) giữa sơ đồ tổng thể và các đoạn được định nghĩa trong sơ đồ phân mảnh. - Sơ đồ định vị: Các đoạn là các phần logic của quan hệ tổng thể được định vị vật lý trên một hoặc nhiều vị trí trên mạng. Sơ đồ định vị định nghĩa đoạn nào định vị tại các vị trí nào. Lưu ý rằng kiểu ánh xạ được định nghĩa trong sơ đồ định vị quyết định CSDL phân bố là dư thừa hay không. - Sơ đồ ánh xạ địa phương: ánh xạ các ảnh vật lý và các đối tượng được lưu trữ tại một trạm (tất cả các đoạn của một quan hệ tổng thể trên cùng một vị trí tạo ra một ảnh vật lý). SV: Nguyễn Võ Ngọc Huy (CH1101091) Trang 7/64 Bài Thu Hoạch Chuyên Đề - Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc Mức đỉnh của lược đồ là sơ đồ toàn thể: Mô tả mọi dữ liệu nằm trong cơ sở dữ liệu phân bố như không bị phân bố. Tuy nhiên mô hình dữ liệu sử dụng để xác định sơ đồ toàn thể để xác định cách thức ánh xạ đến những mức khác của cơ sở dữ liệu phân bố. Theo cách sử dụng mô hình sơ đồ toàn thể, sơ đồ toàn thể xác định một tập các quan hệ chung nhất của hệ thống. Mỗi quan hệ có thể chia ra các phần không chồng lên nhau gọi là đoạn. Có nhiều cách chia: chia theo chiều ngang, chia theo chiều dọc và chia theo kiểu hỗn hợp theo chiều ngang và chiều dọc. Ánh xạ này giữa quan hệ và các đoạn được xác định trong sơ đồ phân mảnh. Ánh xạ theo kiểu 1:n (một quan hệ sang nhiều đoạn) là một đoạn tương ứng một quan hệ và một quan hệ tương đương với một số đoạn. Đoạn xác định bởi một quan hệ qua chỉ số (chỉ số đoạn dữ liệu). Đoạn là phần logic của quan hệ, được đặt vật lý tại một hay vài vị trí trên mạng máy tính. Sơ đồ cấp phát xác định những vị trí đặt đoạn. Kiểu ánh xạ xác định trong sơ đồ cấp phát cho phép nhận ra một cơ sở dữ liệu phân bố là dư thừa hay không dư thừa Về mặt hình thức ánh xạ thường từ một quan hệ sang nhiều đoạn, trong trường hợp ánh xạ 1:1 thì một đoạn được ánh xạ từ một quan hệ. Mọi đoạn dữ liệu tương ứng với cùng một quan hệ R và đặt ở cùng vị trí j tạo ra “ảnh vật lý” của quan hệ R ở vị trí j. Vì vậy có ánh xạ 1:1 giữa ảnh vật lý và một cặp (quan hệ, đoạn). Mỗi ảnh vật lý có thể được chỉ định bởi một tên quan hệ và một chỉ số vị trí. Để phân biệt ảnh vật lý, quan hệ với đoạn dữ liệu, ký hiệu Rj chỉ ảnh vật lý của quan hệ R ở vị trí j. Thuật ngữ trong suốt mô tả bằng bản sao của đoạn tham chiếu đến vị trí lưu trữ và bản sao xác định qua tên quan hệ và hai chỉ số (chỉ số đoạn và chỉ số vị trí). Trong kiến trúc lược đồ trên có ba mức độ độc lập theo thứ tự giảm: mức tổng thể, mức cấp phát và mức ánh xạ. Vì vậy, ở mức thấp hơn cần thiết phải ánh xạ sang SV: Nguyễn Võ Ngọc Huy (CH1101091) Trang 8/64 Bài Thu Hoạch Chuyên Đề - Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc mức cao hơn. Việc ánh xạ này gọi là sơ đồ ánh xạ và phụ thuộc vào kiểu của cơ sở dữ liệu địa phương. Trong hệ thống đồng nhất mức độ độc lập có một số kiểu khác nhau khi ánh xạ địa phương ở các vị trí khác nhau. Kiến trúc này cung cấp khái niệm cơ sở và dễ hiểu về cơ sở dữ liệu phân bố. Ba đối tượng quan trọng thúc đẩy phát triển cấu trúc này là tính riêng rẽ của việc phân mảnh dữ liệu, cấp phát đoạn, điều khiển dư thừa và độc lập dữ liệu đối với hệ quản trị cơ sở dữ liệu địa phương. a. Phân mảnh dữ liệu và cấp phát dữ liệu Sự chia xẻ này cho phép phân biệt hai mức khác nhau của mức độ trong suốt phân bố, có tên là trong suốt phân mảnh và trong suốt định vị. Trong suốt phân mảnh: là cấp độ cao nhất của mức độ trong suốt, người sử dụng hoặc chương trình ứng dụng chỉ làm việc trên các quan hệ của cơ sở dữ liệu. Trong suốt định vị là cấp độ thấp hơn của độ trong suốt vì hệ thống yêu cầu người sử dụng hay chuơng trình ứng dụng phải làm việc trên đoạn logíc thay vì làm việc trên các quan hệ của cơ sở dữ liệu. Tuy nhiên người đó không biết đoạn đó được đặt ở vị trí nào trong cơ sở dữ liệu. b. Điều khiển dư thừa Kiến trúc tham chiếu cho phép điều khiển dư thừa dữ liệu ở mức đoạn. Các đoạn có thể có dữ liệu giống nhau dùng để kết nối dữ liệu đó là nguyên nhân dư thừa dữ liệu. Chống việc dư thừa dữ liệu nằm rải rác ở các site là điều kiện bắt buộc của cơ sở dữ liệu phân bố. c. Độc lập với hệ quản trị cở sở dữ liệu địa phương Đặc điểm này gọi là ánh xạ trong suốt đối với cơ sở dữ liệu địa phương: quản trị cơ sở dữ liệu phân bố không cần quan tâm đến kiểu dữ liệu xác định của cơ sở dữ liệu địa phương. Mức trong suốt bản sao liên quan chặt chẽ tới mức trong suốt định vị. Mức trong suốt bản sao có nghĩa là người sử dụng không biết bản sao của đoạn đặt ở vị trí nào. Mức trong suốt bản sao tương đương mức trong suốt định vị. Tuy nhiên, trong những trường hợp thực tế người sử dụng không có mức trong suốt định vị nhưng lại có mức trong suốt bản sao. Phân rã quan hệ thành các đoạn thực hiện qua việc áp dụng hai phân mảnh: phân mảnh ngang và phân mảnh dọc. Phân mảnh ngang: một đoạn được xác định qua biểu thức đại số quan hệ với quan hệ là toán tử và các đoạn là kết quả. Hay nói cách khác, việc phân mảnh ngang bao gồm việc chia các bộ của quan hệ thành các tập con. Mỗi tập con này SV: Nguyễn Võ Ngọc Huy (CH1101091) Trang 9/64 Bài Thu Hoạch Chuyên Đề - Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc có thuộc tính vị trí thông thường. Các đoạn này được xác định qua việc coi mỗi đoạn là toán tử chọn trên quan hệ. Phân mảnh dọc: phân mảnh dọc một quan hệ là việc chia nhỏ tập thuộc tính thành nhiều nhóm quan hệ và đoạn dọc. Phân mảnh đúng khi mỗi thuộc tính đều ánh xạ ít nhất sang một thuộc tính của đoạn. Hơn nữa, có thể tạo lại quan hệ ban đầu bằng liên kết các đoạn với nhau. Có một số luật để xác định các đoạn: Điều kiện hợp: mọi dữ liệu của quan hệ phải ánh xạ đến các đoạn. Không xảy ra trường hợp dữ liệu thuộc về quan hệ nhưng không thuộc về một đoạn nào. Điều kiện tái tạo lại quan hệ: luôn luôn có khả năng tạo lại quan hệ từ các đoạn của quan hệ. Điều kiện cần: mỗi đoạn được lưu trữ trong cơ sở dữ liệu phân bố và quan hệ phải xây dựng lại được khi cần thiết. Điều kiện không liên kết: thích hợp khi các đoạn không liên kết với nhau vì vậy các bản dữ liệu lặp lại có thể được điều khiển rõ ràng ở các mức cấp phát. Điều kiện này chủ yếu có ích với phân mảnh ngang. 4. Hệ quản trị cơ sở dự liệu phân bố (DBDMS – Database Distribution Management System) a. Mô hình của hệ quản trị cơ sở dữ liệu phân bố Hệ quản trị cơ sở dữ liệu phân bố cung cấp công cụ như tạo lập và quản lý cơ sở dữ liệu phân bố. Phân tích đặc điểm của hệ thống quản trị cơ sở dữ liệu phân bố như dưới đây để phân biệt hệ thống phát triển theo kiểu thương mại có sẵn và kiểu mẫu phân bố. Hệ thống phát triển theo kiểu thương mại có sẵn được phát triển bởi những người cung cấp hệ cơ sở dữ liệu tập trung. Hệ cơ sở dữ liệu tập trung mở rộng bằng cách thêm vào những phần bổ xung qua cách cung cấp thêm đường truyền và điều khiển giữa các hệ quản trị cơ sở dữ liệu tập trung cài đặt ở những điểm khác nhau trên mạng máy tính. Những phần mềm cần thiết cho việc xây dựng cơ sở dữ liệu phân bố là: ►Phần quản lý cơ sở dữ liệu ( Database Management - DB ). ►Phần truyền thông dữ liệu (Data Communication - DC ). ►Từ điển dữ liệu được mở rộng để thể hiện thông tin về phân bố dữ liệu trong mạng máy tính (Data Dictionary - DD). SV: Nguyễn Võ Ngọc Huy (CH1101091) Trang 10/64 [...]... thống file phân bố và gần đây là trong cơ sở dữ liệu phân bố Kết quả chính của công việc nghiên cứu được dùng để thiết kế cơ sở dữ liệu phân bố: - Phương pháp để có thể phân bố dữ liệu một cách thuận tiện - Cơ sở về mặt toán học dùng để trợ giúp thiết kế trong việc xác định việc phân bố dữ liệu 1 Cơ sở thiết kế cơ sở dữ liệu phân bố Thuật ngữ thiết kế cơ sở dữ liệu phân bố có nghĩa rất rộng và không... xác Thiết kế cơ sở dữ liệu tập trung gồm có các công việc sau: - Thiết kế sơ đồ khái niệm: mô tả cơ sở dữ liệu đã hợp nhất (mọi dữ liệu được sử dụng bởi ứng dụng cơ sở dữ liệu) - Thiết kế cơ sở dữ liệu vật lý: tham chiếu từ lược đồ khái niệm tới vùng lưu trữ và xác định các cách thức truy cập khác nhau Trong cơ sở dữ liệu phân bố, có hai vấn đề xảy ra khi thiết kế sơ đồ toàn bộ và khi thiết kế cơ sở dữ. .. Hoạch Chuyên Đề - Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc ►Phần cơ sở dữ liệu phân bố (Distributed Database DDB) Mô hình các thành phần của hệ quản trị cơ sở dữ liệu phát triển theo kiểu thương mại (Truy cập từ xa trực tiếp) Cơ sở dữ liệu địa phương 1 DB DC DD DDB Cơ sở dữ liệu địa phương 2 DD DB DC DDB Những dịch vụ hệ quản trị cơ sở dữ liệu cung cấp: - Cách thức truy cập dữ liệu từ xa: bằng... - Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc -Mô tả phân mảnh: Trong phân mảnh ngang phân chia dữ liệu thành các đoạn có cùng tính chất hay thuộc tính nào đó như phân chia theo các bộ Phân mảnh dọc là công việc phân chia các thuộc tính thành các nhóm nhỏ Phân mảnh hỗn hợp chỉ là sự kết hợp hai công việc phân mảnh ngang và phân mảnh dọc -Mô tả công việc cấp phát: Đưa ra ánh xạ giữa các đoạn và. .. tranh và điều khiển hồi phục dữ liệu của giao tác phân bố Cách thức truy cập cơ sở dữ liệu từ xa qua chương trình ứng dụng theo hai cách cơ bản: Truy cập từ xa trực tiếp và gián tiếp SV: Nguyễn Võ Ngọc Huy (CH1101091) Trang 11/64 Bài Thu Hoạch Chuyên Đề - Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc Phương thức truy Truy cập cơ cập liệu sở d dữ liệu Chương trình ứng dụng Hệ quản trị cơ sở dữ liệu. .. Thiết Kế Phân Mảnh Dọc viên Vì vậy cơ chế này phải có sự nhất trí của đa số hay của toàn bộ các vị trí trong cùng nhóm hoặc của người quản trị ở cấp cao hơn SV: Nguyễn Võ Ngọc Huy (CH1101091) Trang 21/64 Bài Thu Hoạch Chuyên Đề - Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc II Tiếp cận thiết kế cơ sở dữ liệu phân bố Khi cơ sở dữ liệu phân bố mới ở giai đoạn phát triển ban đầu, những người thiết kế. .. pháp thiết kế là hướng thiết kế Top-dowwn và Bottom-up - Trong hướng thiết kế Top-down, bắt đầu bởi việc thiết kế sơ đồ tổng thể, tiếp tục thiết kế phân mảnh cơ sở dữ liệu và sau đó cấp phát các đoạn này cho các vị trí, tạo hình ảnh vật lý của dữ liệu Hoàn thành hướng này qua việc thực hiện SV: Nguyễn Võ Ngọc Huy (CH1101091) Trang 24/64 Bài Thu Hoạch Chuyên Đề - Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh. .. - Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc b Lược đồ hệ quản trị cơ sở dữ liệu phân bố Hệ quản trị cơ sở dữ liệu phân bố ngày này cung cấp 1 số lược đồ (Scheme) như sau: ► Lược đồ đa cục bộ (Multiple local schema) CSDLPB xem chương trình ứng dụng như một tập hợp các CSDL riêng lẻ Chương trình ứng dụng phải đặt một thiết kế nối đến các site mà chứa dữ liệu được truy xuất Sau khi kết nối được thiết. .. phần cấu trúc dữ liệu của hệ thống 3 .Phân bố bảng danh mục: Các bảng danh mục dùng để thiết lập cơ sở dữ liệu phân bố Công việc phân mảnh, và cấp phát của cơ sở dữ liệu được thiết kế theo các nguyên tắc thiết kế cơ sở dữ liệu phân bố Thông tin của bảng danh mục chỉ lưu trữ lại khi bảng danh mục dùng cho việc dịch, tối ưu hoá và thực hiện các chương trình ứng dụng cũng như sử dụng để liên kết khi có cập... Chuyên Đề - Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc Sau đây là giải thuật cụ thể cho phân mảnh dọc: Một phân mảnh dọc cho một quan hệ R sinh ra các mảnh R 1, R2, ,Rr, mỗi mảnh chứa một tập con thuộc tính của R và cả khoá của R Mục đích của phân mảnh dọc là phân hoạch một quan hệ thành một tập các quan hệ nhỏ hơn để nhiều ứng dụng chỉ cần chạy trên một mảnh Một phân mảnh “tối ưu”là phân mảnh sinh . phân bố 22 2. Đối tượng thiết kế của cơ sở dữ liệu phân bố 23 3. Hướng thiết kế Top-down và Bottom-up cơ sở dữ liệu phân bố 24 III. Thiết kế phân mảnh dọc cho cơ sở dữ liệu phân bố 25 1. Phân mảnh. trị cơ sở dữ liệu 1 Hệ quản trị cơ sở dữ liệu 2 Bài Thu Hoạch Chuyên Đề - Cơ Sở Dữ Liệu Phân Bố Và Thiết Kế Phân Mảnh Dọc b. Lược đồ hệ quản trị cơ sở dữ liệu phân bố Hệ quản trị cơ sở dữ liệu. lý thuyết cơ sở dữ liệu phân bố, các hệ quản trị cơ sở dữ liệu phân bố ngày nay, cách thiết kế và tối ưu các cơ sở dữ liệu để tránh phân mảnh dữ liệu, toàn vẹn dữ liệu và xử lý dữ liệu nhanh

Ngày đăng: 10/04/2015, 14:34

Từ khóa liên quan

Mục lục

  • Mục Lục

  • Lời Cảm Ơn

  • Lời Mở Đầu

  • I. Tổng Quan Về Cơ Sở Dữ Liệu Phân Bố

    • 1. Khái quát lại Cơ Sở Dữ Liệu

    • 2. Các lý do để sử dụng CSDL phân bố?

    • 3. Kiến trúc cơ sở dữ liệu phân bố

    • 4. Hệ quản trị cơ sở dự liệu phân bố (DBDMS – Database Distribution Management System)

    • II. Tiếp cận thiết kế cơ sở dữ liệu phân bố

      • 1. Cơ sở thiết kế cơ sở dữ liệu phân bố

      • 2. Đối tượng thiết kế của cơ sở dữ liệu phân bố

      • 3. Hướng thiết kế Top-down và Bottom-up cơ sở dữ liệu phân bố

      • III. Thiết kế phân mảnh dọc cho cơ sở dữ liệu phân bố

        • 1. Phân mảnh dọc

        • 2. Thuật toán năng lượng nối BEA (Bond Energy Algorithm) gom cụm

        • IV. Tổng Quan Chương Trình Phân Mảnh Dọc

          • 1. Ngôn ngữ lập trình

          • Hàm CreateAffMatrix():

          • Hàm CreateCAMatrix():

          • Hàm CalculateFragments():

          • 2. Demo chương trình phân mảnh dọc

          • Kết Luận

          • Tài Liệu Tham Khảo

          • Nhận Xét Của Giáo Viên

Tài liệu cùng người dùng

Tài liệu liên quan