TÌM HIỂU VỀ PHÂN MẢNH TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN

ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH ĐẠI HỌC CÔNG NGHỆ THÔNG TIN CHUYÊN ĐỀ CƠ SỞ DỮ LIỆU NÂNG CAO BÀI THU HOẠCH TÌM HIỂU VỀ PHÂN MẢNH TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN HƯỚNG DẪN PGS. TS. ĐỖ PHÚC HỌC VIÊN THỰC HIỆN LÊ CUNG TƯỞNG (CH1101152) Hồ Chí Minh, 8/2012 P a g e | 2 Mục lục P a g e | 3 Lời mở đầu Phân tán dữ liệu là nhu cầu cấp thiết khi cần lưu trữ một khối lượng thông tin khổng lồ. Vì thế để phục tốt cho việc phân tán dữ liệu, đòi hỏi cần những phương pháp, chiến lược thực hiện tốt. Hiện nay trên thế giới, các nghiên cứu về Cơ sở Dữ liệu phân tán đã phát triển rất mạnh mẽ. Trong bước đầu tiếp cận với cơ sở dữ liệu phân tán, học phần Cơ sở Dữ liệu nâng cao đã giúp học viên có một cái nhìn tổng quan về các loại cơ sở dữ liệu nâng cao, đặc biệt là cơ sở dữ liệu phân tán. Phục vụ cho mục đích của học phần, bài thu hoạch chỉ dừng lại ở mức tìm hiểu một số thuật toán phân tán dữ liệu cơ bản và cài đặt thuật toán phân mảnh theo chiều dọc. Ngoài ra, trong thời gian sắp tới, học viên sẽ tìm hiểu Cơ sở dữ liệu đồ thị để phục vụ cho công việc học tập và nghiên cứu của mình. P a g e | 4 1. Các vấn đề về phân mảnh dữ liệu 1.1. Lý do phân mảnh Trong thiết kế CSDL phân tán, cần thiết phải thực hiện phân mảnh dữ liệu vì những lý do sau đây:  Trong các hệ quản trị CSDL, các quan hệ được lưu trữ dưới dạng các bảng 2 chiều. Các thao tác đối với CSDL được thực hiện trên các bảng. Tuy nhiên trong thực tế, các ứng dụng chỉ yêu cầu thao tác trên các tập con của các quan hệ, là khung nhìn dữ liệu của người sử dụng. Vì vậy việc xem tập con của quan hệ là đơn vị truy xuất thông tin để phân tán dữ liệu là hợp lý.  Việc phân rã một quan hệ thành nhiều mảnh, mỗi mảnh được xử lý như một đơn vị dữ liệu, sẽ cho phép thực hiện nhiều giao dịch đồng thời. Đồng thời việc phân mảnh các quan hệ cũng cho phép thực hiện song song một câu vấn tin bằng cách chia nó thành một tập các câu vấn tin con hoạt tác trên các mảnh. Vì thế việc phân mảnh sẽ làm tăng mức độ hoạt động đồng thời và tăng lưu lượng hoạt động của hệ thống. Tuy nhiên không phải việc phân mảnh chỉ có ưu điểm hoàn toàn, mà nó cũng thể hiện những hạn chế như:  Nếu ứng dụng có những yêu cầu “xung đột” ngăn cản phân rã thành các mảnh được sử dụng độc quyền.  Những ứng dụng có các khung nhìn được định nghĩa trên nhiều mảnh khác nhau sẽ làm giảm hiệu suất hoạt động của hệ thống, làm tăng chi phí truy xuất dữ liệu đến các mảnh và tăng chi phí kết nối các mảnh  Việc kiểm soát ngữ nghĩa, đặc biệt là vấn đề kiểm tra tính toàn vẹn sẽ khó khăn hơn 1.2. Các kiểu phân mảnh Các quan hệ cơ sở dữ liệu thường được biểu diễn dưới dạng bảng. Việc phân mảnh một quan hệ thành nhiều quan hệ con khác nhau theo các cách khác nhau, sẽ có các cách phân mảnh tương ứng. Có hai kiểu phân mảnh tương ứng với việc chia quan hệ theo chiều dọc và chia quan hệ theo chiều ngang. Phân mảnh theo chiều dọc: Các quan hệ được chia theo chiều dọc. Nghĩa là thiết lập một quan hệ mới chỉ có một số thuộc tính từ quan hệ gốc. Thực chất đây là phép chiếu trên tập con các thuộc tính của quan hệ. Phân mảnh ngang: Quan hệ được chia theo chiều ngang. Thực chất đây là phép chọn trong quan hệ. Chọn những bộ của quan hệ thỏa mãn một biểu thức điều kiên cho trước. P a g e | 5 1.3. Mức độ phân mảnh Phân mảnh Cơ Sở Dữ Liệu đến mức độ nào là đủ, không làm ảnh hưởng đến hiệu năng của việc thực hiện truy vấn. Mức độ phân mảnh có thể là phân mảnh một quan hệ chưa được phân mảnh, có thể phân mảnh các quan hệ đã được phân mảnh. Có thể phân mảnh theo chiều dọc (theo từng thuộc tính) hoặc theo chiều ngang (theo từng bộ trong quan hệ). Một mức độ ứng phân mảnh thích hợp sao cho tránh được các hạn chế khi phân mảnh chỉ được định nghĩa ứng với các ứng dụng sẽ chạy trên cơ sở dữ liệu. 1.4. Các quy tắc phân mảnh Các nguyên tắc để đảm bảo cơ sở dữ liệu khi phân mảnh sẽ đảm bảo tính không thay đổi về ngữ nghĩa. Dưới đây là ba qui tắc phải tuân thủ khi phân mảnh cơ sở dữ liệu quan hệ.  Tính đầy đủ: Quan hệ R được phân rã thành các mảnh R1, R2…Rn, thì mỗi mục dữ liệu có trong quan hệ R sẽ được chứa trong ít nhất một mảnh Ri (i=1, ,n). Quy tắc này đảm bảo cho các mục dữ liệu trong R được ánh xạ hoàn toàn vào các mảnh và không bị mất. Mục dữ liệu có thể hiểu là bộ trong phân mảnh ngang và thuộc tính trong phân mảnh dọc.  Tính phục hồi: Nếu một quan hệ R được phân rã thành các mảnh R1, R2,…,Rn khi đó: R= Ri, Ri FR. Toán tử thay đổi tùy theo từng loại phân mảnh Khả∇ ∀ ∈ ∇ năng phục hồi quan hệ từ các mảnh sẽ đảm bảo bảo toàn các phụ thuộc.  Tính tách biệt: Nếu quan hệ R được phân rã ngang thành các mảnh Ri, i=1, n và mục dữ liệu di nằm trong một mảnh Ri thì nó sẽ không nằm trong mảnh Rk, (k≠j). Quy tắc này đảm bảo các mảnh phân rã rời nhau. Trong trường hợp phân mảnh dọc, khóa chính của quan hệ phải được lập lại trong tất cả các mảnh. Vì vậy tính tách biệt trong phân mảnh dọc được hiểu không liên quan gì đến khóa chính của quan hệ. 1.5. Các kiểu cấp phát Giả sử CSDL đã được phân mảnh, thích hợp và thoả các yêu cầu phải cấp phát cho các vị trí trên mạng. Khi dữ liệu được cấp phát, có thể không nhân bản hoặc có thể được nhân bản. Không nhân bản, thường được gọi là CSDL phân hoạch, các mảnh chỉ được cấp phát trên các trạm và không có bản sao nào trên mạng. Trong trường hợp nhân bản, hoặc toàn bộ CSDL đều có ở trên tất cả các từng trạm (CSDL được nhân bản đầy đủ), hoặc các mảnh của CSDL được phân tán tới các trạm bằng cách các mảnh sao được đặt trên nhiều trạm (CSDL được nhân bản từng phần). Một số các bản sao của mảnh có thể là đầu vào cho thuật toán cấp phát hoặc quyết định giá trị của biến được xác bởi thuật toán. P a g e | 6 Nhân bản làm tăng độ tin cậy và tăng hiệu quả của các câu vấn tin chỉ đọc (Read-only Query). Đặc biệt có thể truy xuất CSDL khi gặp sự cố. Hơn nữa các câu truy vấn đọc truy xuất đến cùng một mục dữ liệu có thể cho thực hiện song song vì các bản sao có mặt tại nhiều vị trí. Bảng 1 so sánh ba cách nhân bản theo một số chức năng của hệ quản trị CSDL phân tán. Việc cấp phát dữ liệu phải được thực hiện sao cho thỏa mãn hai yêu cầu sau:  Chi phí nhỏ nhất.  Hiệu năng lớn nhất: Giảm thiểu thời gian đáp ứng và tăng tối đa lưu lượng hệ thống tại mỗi vị trí. Bảng 1. So sánh các phương pháp nhân bản. Nhân bản hoàn toàn Nhân bản một phần Phân hoạch Xử lý truy vấn Dễ Cùng mức độ khó khăn Quản lý thư mục Dễ hoặc không tồn tại Cùng mức độ khó khăn Điều khiển đồng thời Vừa phải Khó Dễ Độ tin cậy Rất cao Cao Thấp Tính thực tế Có thể áp dụng Thực tế Có thể áp dụng 1.6. Các yêu cầu thông tin Công việc thiết kế cơ sở dữ liệu phân tán phụ thuộc rất nhiều vào các yếu tố có là ảnh hưởng đến một thiết kế tối ưu, tổ chức logic cơ sở dữ liệu, vị trí các ứng dụng, đặc tính truy xuất của các ứng dụng đến cơ sở dữ liệu và các đặc tính của hệ thống máy tính tại mỗi vị trí. Điều này làm cho việc diễn đạt bài toán phân tán trở nên hết sức phức tạp. Các thông tin cần thiết cho thiết kế phân tán bao gồm:  Thông tin cơ sở dữ liệu  Thông tin ứng dụng  Thông tin về mạng  Thông tin về hệ thống máy tính Yêu cầu thông tin về mạng và thông tin về hệ thống máy tính chỉ được sử dụng trong các mô hình cấp phát, không sử dụng trong các thuật toán phân mảnh dữ liệu. Chức vụ, Lương MNV, tênNV, chức vụ MDA, tênDA, ngân sách, địa điểm MNV , MDA, nhiệm vụ, thời gian CT NV DA PC L1 L2 L3 P a g e | 7 2. Phương pháp phân mảnh ngang 1.7. Giới thiệu Phân mảnh ngang chính là việc chia quan hệ thành nhiều các nhóm bộ. Kết quả của quá trình phân mảnh ngang là các quan hệ con, số lượng quan hệ con phụ thuộc vào điều kiện ràng buộc của các thuộc tính. Và các bộ trong các quan hệ con là tách biệt nhau. Phân mảnh ngang thực chất là phép chọn quan hệ thỏa mãn một biểu thức điều kiên cho trước. Có hai chiến lược phân mảnh ngang cơ bản:  Phân mảnh nguyên thuỷ (primary horizontal fragmentation) của một quan hệ được thực hiện dựa trên các vị từ được định nghĩa trên quan hệ đó.  Phân mảnh ngang dẫn xuất (derived horizontal fragmentation) là phân mảnh một quan hệ dựa vào các vị từ được định trên một quan hệ khác. 1.8. Yêu cầu thông tin của phân mảnh ngang 1.8.1. Thông tin về cơ sở dữ liệu Thông tin về CSDL muốn nói đến là lược đồ toàn cục và quan hệ gốc, các quan hệ con. Trong ngữ cảnh này, chúng ta cần xác định được các quan hệ sẽ kết lại với nhau bằng phép nối hay bằng phép tính khác. với mục đích phân mảnh dẫn xuất, các vị từ được định nghĩa trên quan hệ khác, ta thường dùng mô hình thực thể - liên hệ (entity-relatiónhip model), vì trong mô hình này các mối liên hệ được biểu diễn bằng các đường nối có hướng (các cung) giữa các quan hệ có liên hệ với nhau qua một nối. Thí dụ 1: Hình 1. Biểu diễn mối liên hệ giữa các quan hệ nhờ các đường nối. P a g e | 8 Hình 1 trình bày một cách biểu diễn các đường nối giữa các quan hệ. chú ý rằng hướng của đường nối cho biết mối liên hệ một -nhiều. Chẳng hạn với mỗi chức vụ có nhiều nhân viên giữ chức vụ đó, vì thế chúng ta sẽ vẽ một đường nối từ quan hệ CT (chi trả) hướng đến NV (nhân viên). Đồng thời mối liên hệ nhiều- nhiều giữa NV và DA(dự án) được biểu diễn bằng hai đường nối đến quan hệ PC (phân công). Quan hệ nằm tại đầu (không mũi tên) của đường nối được gọi là chủ nhân (owner) của đường nối và quan hệ tại cuối đường nối (đầu mũi tên) gọi là thành viên (member). Thí dụ 2: Cho đường nối L1 của hình 1, các hàm owner và member có các giá trị sau: Owner(L1) = CT Member (L1) = NV Thông tin định lượng cần có về CSDL là lực lượng (cardinality) của mỗi quan hệ R, đó là số bộ có trong R, được ký hiệu là card (R) 1.8.2. Thông tin về ứng dụng Để phân tán ngoài thông tin định lượng Card(R) ta còn cần thông tin định tính cơ bản gồm các vị từ được dùng trong các câu vấn tin. Lượng thông tin này phụ thuộc bài toán cụ thể. Nếu không thể phân tích được hết tất cả các ứng dụng để xác định những vị từ này thì ít nhất cũng phải nghiên cứu được các ứng dụng” quan trọng” nhất. Vậy chúng ta xác định các vị từ đơn giản (simple predicate). Cho quan hệ R(A 1 , A 2, …, A n ), trong đó A i là một thuộc tính được định nghĩa trên một miền biến thiên D(A i ) hay D i . Một vị từ đơn giản P được định nghĩa trên R có dạng: P j : A i θ Value Trong đó θ ∈ {=,<,≠, ≤, >, ≥} và value được chọn từ miền biến thiên của A i (value ∈ D i ). Như vậy, cho trước lược đồ R, các miền trị D i chúng ta có thể xác định được tập tất cả các vị từ đơn giản P r trên R. Vậy P r ={P: A i θ Value }. Tuy nhiên trong thực tế ta chỉ cần những tập con thực sự của P r . Thí dụ 3: Cho quan hệ Dự án như sau: P 1 : TênDA = “thiết bị điều khiển” P 2 : Ngân sách ≤ 200000 Là các vị từ đơn giản. P a g e | 9 Chúng ta sẽ sử dụng ký hiệu Pr i để biểu thị tập tất cả các vị từ đơn giản được định nghĩa trên quan hệ R i. Các phần tử của Pr i được ký hiệu là p ij . Các vị từ đơn giản thường rất dễ xử lý, các câu vấn tin thường chứa nhiều vị từ phức tạp hơn, là tổ hợp của các vị từ đơn giản. Một tổ hợp cần đặc biệt chú ý, được gọi là vị từ hội sơ cấp (minterm predicate), đó là hội (conjunction) của các vị từ đơn giản. Bởi vì chúng ta luôn có thể biến đổi một biểu thức Boole thành dạng chuẩn hội, việc sử dụng vị từ hội sơ cấp trong một thuật toán thiết kế không làm mất đi tính tổng quát. Cho một tập Pr i = {p i1 , p i2 , …, p im } là các vị từ đơn giản trên quan hệ R i , tập các vị từ hội sơ cấp M i ={m i1 , m i2 , …, m iz } được định nghĩa là: M i ={m ij | m ij =Λp * ik } với 1 ≤ k ≤ m, 1 ≤ j ≤ z Trong đó p * ik =p ik hoặc p * ik = ¬p ik . Vì thế mỗi vị từ đơn giản có thể xuất hiện trong vị từ hội sơ cấp dưới dạng tự nhiên hoặc dạng phủ định. Thí dụ 4: Xét quan hệ CT: Chức vụ Lương Kỹ sư điện Phân tích hệ thống Kỹ sư cơ khí Lập trình 40000 34000 27000 24000 Dưới đây là một số vị từ đơn giản có thể định nghĩa được trên PAY. p1: chức vụ=” Kỹ sư điện” p2: chức vụ=” Phân tích hệ thống ” p3: chức vụ=” Kỹ sư cơ khí ” p4: chức vụ=” Lập trình ” p5: Lương ≤ 30000 p6: Lương > 30000 Dưới đây là một số các vị từ hội sơ cấp được định nghĩa dựa trên các vị từ đơn giản này m1: chức vụ=” Kỹ sư điện ”Λ Lương ≤ 30000 m2: chức vụ =” Kỹ sư điện ”Λ Lương > 30000 m3: ¬(chức vụ=” Kỹ sư điện ”)Λ Lương ≤ 30000 m4: ¬(chức vụ=” Kỹ sư điện ”)Λ Lương> 30000 m5: chức vụ=” Lập trình ”Λ Lương ≤ 30000 m6: chức vụ=” Lập trình ”Λ Lương > 30000 Chú ý: P a g e | 10 + Phép lấy phủ định không phải lúc nào cũng thực hiện được. Thí dụ: xét hai vị từ đơn giản sau: Cận_dưới ≤ A; A ≥ Cận_trên. Tức là thuộc tính A có miền trị nằm trong cận dưới và cận trên, khi đó phần bù của chúng là: ¬(Cận_dưới ≤ A); ¬(A ≥ Cận_trên) không xác định được. Giá trị của A trong các phủ định này đã ra khỏi miền trị của A. Hoặc hai vị từ đơn giản trên có thể được viết lại là: Cận_dưới ≤ A Cận_trên có phần bù là: ¬(Cận_dưới ≤ A ≤ Cận_trên) không định nghĩa được. Vì vậy khi nghiên cứu những vẫn đề này ta chỉ xem xét các vị từ đẳng thức đơn giản. Vì vậy không phải tất cả các vị từ hội sơ cấp đều có thể định nghĩa được. + Một số trong chúng có thể vô nghĩa đối với ngữ nghĩa của quan hệ Chi trả. Ngoài ra cần chú ý rằng m3 có thể được viết lại như sau: m3: chức vụ ≠ “Kỹ sư điện ” Λ Lương ≤ 30000 Theo những thông tin định tính về các ứng dụng, chúng ta cần biết hai tập dữ liệu.  Độ tuyển hội sơ cấp (minterm selectivity): số lượng các bộ của quan hệ sẽ được truy xuất bởi câu vấn tin được đặc tả theo một vị từ hội sơ cấp đã cho. chảng hạn độ tuyển của m1 trong Thí dụ 4 là zero bởi vì không có bộ nào trong CT thỏa vị từ này. Độ tuyển của m2 là 1. Chúng ta sẽ ký hiệu độ tuyển của một hội sơ cấp m i là sel (m i ).  Tần số truy xuất (access frequency): tần số ứng dụng truy xuất dữ liệu. Nếu Q={q 1 , q 2 , ,q q } là tập các câu vấn tin, acc (q i ) biểu thị cho tần số truy xuất của q i trong một khoảng thời gian đã cho. Chú ý rằng mỗi hội sơ cấp là một câu vấn tin. Chúng ta ký hiệu tần số truy xuất của một hội sơ cấp là acc(m i ) 1.9. Phân mảnh ngang nguyên thuỷ Phân mảnh ngang nguyên thuỷ được định nghĩa bằng một phép toán chọn trên các quan hệ chủ nhân của một lược đồ của CSDL. Vì thế cho biết quan hệ R, các mảnh ngang của R là các R i : R i = σ Fi (R), 1 ≤ i ≤ z. Trong đó F i là công thức chọn được sử dụng để có được mảnh R i . Chú ý rằng nếu F i có dạng chuẩn hội, nó là một vị từ hội sơ cấp (m j ). Thí dụ 5: Xét quan hệ DA [...]... Một phân mảnh dọc cho một quan hệ R sinh ra các mảnh R 1, R2, ,Rr, mỗi mảnh chứa một tập con thuộc tính của R và cả khoá của R Mục đích của phân mảnh dọc là phân hoạch một quan hệ thành một tập các quan hệ nhỏ hơn để nhiều ứng dụng chỉ cần chạy trên một mảnh Một phân mảnh “tối ưu”là phân mảnh sinh ra một lược đồ phân mảnh cho phép giảm tối đa thời gian thực thi các ứng dụng chạy trên mảnh đó Phân mảnh. .. ý: Trong lược đồ CSDL, chúng ta hay gặp nhiều đường nối đến một quan hệ R Như thế có thể có nhiều cách phân mảnh cho quan hệ R Quyết định chọn cách phân mảnh nào cần dựa trên hai tiêu chuẩn sau: 1 Phân mảnh có đặc tính nối tốt hơn 2 Phân mảnh được sử dụng trong nhiều ứng dụng hơn Tuy nhiên, việc áp dụng các tiêu chuẩn trên còn là một vấn đề rắc rối 3 Phương pháp phân mảnh dọc 1.11 Khái niệm phân mảnh. .. sẽ tái thiết lại đúng R Một điểm quan trọng là mỗi mảnh Ri phải chứa các thuộc tính khoá của R 4 Phân mảnh hỗn hợp Trong đa số các trường hợp, phân mảnh ngang hoặc phân mảnh dọc đơn giản cho một lược đồ CSDL không đủ đáp ứng các yêu cầu từ ứng dụng Trong trường hợp đó phân mảnh dọc có thể thực hiện sau một số mảnh ngang hoặc ngược lại, sinh ra một lối phân hoạch có cấu trúc cây Bởi vì hai chiến lược... Bước 2: Chạy thuật toán o Click vào nút “run” o Thu được kết quả: ma trận AA, ma trận CA, các mảnh cần phân P a g e | 31 Tài liệu tham khảo [1] Nguyễn Vũ Quốc Hưng, Bài giảng Cơ sở dữ liệu phân tán (Sử dụng nội bộ), ĐHSP Hà nội, 2005 [2] Phạm Thị Quế, Bài giảng Cơ sở dữ liệu phân tán (Sử dụng nội bộ), Học viện Công nghệ Bưu chính Viễn Thông, 2009 ... bước, nối một số mảnh lại cho đến khi thỏa một tiêu chuẩn nào đó Kỹ thuật này được được đề xuất lần đầu cho các CSDL tập trung và về sau được dùng cho các CSDL phân tán - Tách mảnh: Bắt đầu bằng một quan hệ và quyết định cách phân mảnh có lợi dựa trên hành vi truy xuất của các ứng dụng trên các thuộc tính P a g e | 19 1.12 Thông tin cần thiết của phân mảnh dọc Vì phân hoạch dọc đặt vào một mảnh các thuộc... ta bớt đi một vị từ bất kỳ trong Pr thì tập còn lại không đầy đủ Lý do cần phải đảm bảo tính đầy đủ là vì các mảnh thu được theo tập vị từ đầy đủ sẽ nhất quán về mặt logic do tất cả chúng đều thoả vị từ hội sơ cấp Chúng cũng đồng nhất và đầy đủ về mặt thống kê theo cách mà ứng dụng truy xuất chúng Vì thế chúng ta sẽ dùng một tập hợp gồm các vị từ đầy đủ làm cơ sở của phân mảnh ngang nguyên thủy - Đặc... phải theo các giá trị hiện tại Một số mảnh được định nghĩa theo M={m1,…,m6} có thể rỗng nhưng chúng vẫn là các mảnh Kết quả phân mảnh nguyên thuỷ cho DA là tạo ra sáu mảnh FDA={DA1, DA2, DA3, DA4, DA5, DA6}, ở đây có hai mảnh rỗng là {DA2, DA5 } DA1 MDA P1 TênDA Thiết bị đo đạc Ngân sách Địa điểm 150000 Montreal DA3 MDA TênDA Ngân sách Địa điểm P2 Phát triển dữ liệu 135000 New York MDA TênDA Ngân sách... bảo dưỡng 310000 Paris 1.10 Phân mảnh ngang dẫn xuất Phân mảnh ngang dẫn xuất được định nghĩa trên một quan hệ thành viên của đường nối dựa theo phép toán chọn trên quan hệ chủ nhân của đường nối đó Như thế nếu cho trước một đường nối L, trong đó owner (L)=S và member(L)=R, và các mảnh ngang dẫn xuất của R được định nghĩa là: Ri=R|>< Si , 1 ≤ i ≤ w Trong đó w là số lượng các mảnh được định nghĩa trên... trên R, và S i=σFi(S) với Fi là công thức định nghĩa mảnh ngang nguyên thuỷ Si Thí dụ 9: Xét đường nối NV CT P a g e | 17 MNV TênNV Chức vụ E1 J.Doe Kỹ sư điện E2 M.Smith Phân tích E2 M.Smith Phân tích E3 A.Lee Kỹ sư cơ khí E3 A.Lee Kỹ sư cơ khí E4 J.Miller Programmer E5 B.Casey Phân tích hệ thống E6 L.Chu Kỹ sư điện E7 R.david Kỹ sư cơ khí E8 J.Jones Phân tích hệ thống Chức vụ, Lương NV L1 MNV, TênNV,... Chức vụ E3 A.Lee Kỹ sư cơ khí E1 J.Doe Kỹ sư điện E4 J.Miller Lập trình viên E2 M.Smith Phân tích E7 R.David Kỹ sư cơ khí E5 B.Casey Phân tích hệ thống E6 L.Chu Kỹ sư điện E8 J.Jones Phân tích hệ thống P a g e | 18 Chú ý: + Muốn thực hiện phân mảnh ngang dẫn xuất, chúng ta cần ba nguyên liệu (input): 1 Tập các phân hoạch của quan hệ chủ nhân (Thí dụ: CT1, CT2) 2 Quan hệ thành viên 3 Tập các vị từ nối . nghiên cứu về Cơ sở Dữ liệu phân tán đã phát triển rất mạnh mẽ. Trong bước đầu tiếp cận với cơ sở dữ liệu phân tán, học phần Cơ sở Dữ liệu nâng cao đã giúp học viên có một cái nhìn tổng quan về các. các loại cơ sở dữ liệu nâng cao, đặc biệt là cơ sở dữ liệu phân tán. Phục vụ cho mục đích của học phần, bài thu hoạch chỉ dừng lại ở mức tìm hiểu một số thuật toán phân tán dữ liệu cơ bản và. TP. HỒ CHÍ MINH ĐẠI HỌC CÔNG NGHỆ THÔNG TIN CHUYÊN ĐỀ CƠ SỞ DỮ LIỆU NÂNG CAO BÀI THU HOẠCH TÌM HIỂU VỀ PHÂN MẢNH TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN HƯỚNG DẪN PGS. TS. ĐỖ PHÚC HỌC VIÊN THỰC HIỆN LÊ

TÌM HIỂU VỀ PHÂN MẢNH TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN

Thông tin tài liệu

Từ khóa liên quan

Mục lục

Mục lục

Lời mở đầu

1. Các vấn đề về phân mảnh dữ liệu

1.1. Lý do phân mảnh

1.2. Các kiểu phân mảnh

1.3. Mức độ phân mảnh

1.4. Các quy tắc phân mảnh

1.5. Các kiểu cấp phát

1.6. Các yêu cầu thông tin

2. Phương pháp phân mảnh ngang

1.7. Giới thiệu

1.8. Yêu cầu thông tin của phân mảnh ngang

1.8.1. Thông tin về cơ sở dữ liệu

1.8.2. Thông tin về ứng dụng

1.9. Phân mảnh ngang nguyên thuỷ

1.10. Phân mảnh ngang dẫn xuất

3. Phương pháp phân mảnh dọc.

1.11. Khái niệm phân mảnh dọc

1.12. Thông tin cần thiết của phân mảnh dọc

1.13. Tụ lực của các thuộc tính

1.14. Thuật toán năng lượng nối BEA (Bond Energy Algorithm)

1.15. Thuật toán phân hoạch

1.16. Kiểm tra tính đúng đắn:

4. Phân mảnh hỗn hợp

Trích đoạn

Tài liệu cùng người dùng

Tài liệu liên quan