Phân tích các dạng chuẩn hoá dữ liệu trong mô hình quan hệ và một số thuật toán

60 2.5K 3
Phân tích các dạng chuẩn hoá dữ liệu trong mô hình quan hệ và một số thuật toán

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Lý thuyết cơ sở dữ liệu nguyên cứu các cơ chế, nguyên lý và phương pháp tổ chức dữ liệu trên các vật mang tin để khai thác có hiệu quả dữ liệu trong các hệ thống tin học ứng dụng cũng như trong các hệ lưu trữ và tra cứu thông tin.

Trang1 Luận văn tốt nghiệp Nguyễn Văn Giang LỜI GIỚI THIỆU Ngày nay, ngành, lĩnh vực đời sống, khoa học kinh doanh mặt vận động xã hội quy mô từ xí nghiệp nhà máy, cơng ty đến quốc gia, quốc tế áp dụng công nghệ thông tin vào quản lý nhiều lĩnh vực khác như: điều khiển trình sản xuất, điều khiển tự động, trợ giúp định, thương mại điện tử Môn sở liệu môn quan trọng liên quan đến vấn đề thu thập, xử lý cho thông tin cần thiết từ liệu Mục tiêu mơn đưa phương pháp để tổ chức thông tin cho tối ưu khâu liệu[3] Để tiến hành mục tiêu trên, người ta xây dựng mơ hình liệu, sở mơ hình liệu người ta xây dựng hệ sở liệu Từ mô hình này, nhân loại đạt nhiều thành cơng rực rỡ lĩnh vực mà sản phẩm thương mại hố khắp giới như: Foxbase, Foxpro, DBase, Access, SQL for Windows, Lý thuyết sở liệu nguyên cứu chế, nguyên lý phương pháp tổ chức liệu vật mang tin để khai thác có hiệu liệu hệ thống tin học ứng dụng hệ lưu trữ tra cứu thông tin Trong số mơ hình cho việc tổ chức khai thác sở liệu (CSDL), thực tế mơ hình quan hệ [6] quan tâm Bởi mơ hình xây dựng sở lý thuyết quan hệ có sở toán học chặt chẽ, xử dụng rộng rãi cơng cụ đại số logíc Trong sở liệu quan hệ, quan hệ có hình ảnh trực quan bảng biểu thông thường mà ta hay gặp Điều tạo nên thuận lợi việc thực thao tác quan hệ, ngôn ngữ thao tác sở Trang2 Luận văn tốt nghiệp Nguyễn Văn Giang liệu quan hệ có khả tổ hợp cao hiệu Việc cập nhật liệu mơ hình quan hệ dễ dàng Điều đáng quan tâm sở liệu quan hệ cho phép đảm bảo tính an tồn liệu, tính qn liệu tính độc lập liệu [5] Trong q trình nguyên cứu xử lý bảng biểu, bảng chuyên gia lĩnh vực tin học đề xuất ra, năm 1970, người sáng lập mơ hình liệu quan hệ đề xuất dạng chuẩn để chuẩn hoá tệp liệu (các bảng biểu) Nhờ dạng chuẩn này, xử lý tệp liệu người ta tách liệu gốc ( chuyên gia lĩnh vực đề xuất ) Vì tệp liệu dạng chuẩn xử lý người ta lưu trữ tệp liệu máy tệp liệu lớn, điều quan trọng là, để khỏi mát thơng tin ( có tính pháp lý ) phải phục hồi tệp gốc thời điểm cần, muốn hồi phục người ta phải dùng phép nối tự nhiên nối tất tệp liệu ta tệp liệu gốc lớn Việc lưu trữ tệp liệu thường chiếm nhớ tệp liệu gốc to, tốc độ chuẩn hoá tệp liệu chuẩn hoá nhanh nhiều tệp liệu chưa chuẩn hoá ( tệp liệu gốc to) Nhờ có đóng góp mà người sáng lập nhận giải thưởng Turing[3] Cho đến tất hãng máy tính giới xây dựng Mơ hình liệu quan hệ ( xử lý tệp liệu ) áp dụng phụ thuộc hàm dạng chuẩn ngôn ngữ sử lý họ, đặc biệt phép kết nối tự nhiên Mục tiêu luận văn tập chung nghiên cứu tính chất phụ thuộc hàm dạng chuẩn mơ hình liệu quan hệ Nội dung đề tài trình bày chương Trang3 Luận văn tốt nghiệp Nguyễn Văn Giang Chương 1: Tổng quan sở liệu Chương 2: Giới thiệu phụ thuộc hàm số tính chất chúng Chương 3: Các dạng chuẩn hoá liệu mơ hình quan hệ số thuật tốn chúng Chương 4: Cài đặt số chương trình thực cho thuật toán nêu Trong thời gian hoàn thành luận văn tốt nghiệp, em xin chân thành cảm ơn khoa CNTT thầy cô giáo giúp đỡ truyền đạt cho em kiến thức năm học vừa qua Đặc biệt em xin chân thành cảm ơn thầy Đoàn Văn Ban - Viện CNTT tận tình giúp đỡ dẫn cho em kiến thức phương pháp làm việc để em hoàn thành luận văn tốt nghiệp Trang4 Luận văn tốt nghiệp Nguyễn Văn Giang CHƯƠNG I : TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU I.1 KHÁI NIỆM VỀ CƠ SỞ DỮ LIỆU Để lý giải cho khái niệm, trước hết xem xét hệ thống bán xe máy công ty HONDA Việt Nam máy tính Dữ liệu lưu trữ máy tính bao gồm thơng tin hành khách, loại xe, phân khối giá Mọi thông tin mối quan hệ biểu diễn máy thông qua việc đặt mua xe khách hàng.Vậy để biểu diễn liệu bảo đảm cho khách hàng mua xe mà đăng kí Những liệu nêu lưu trữ máy theo quy định gọi sở liệu (CSDL) Phần chương trình để xử lý, thay đổi số liệu hệ quản trị sở liệu [6] Tổng quát có định nghĩa sau : Cơ sở liệu: Là khối liệu phản ánh thông tin lưu trữ hệ thống theo cấu trúc gọi tắt sở liệu ( CSDL ) Hệ quản trị sở liệu: Là hệ thống phần mềm quản lý sở liệu tập thao tác xử lý liệu Hệ quản trị sở liệu quan trọng, diễn dịch với ngôn ngữ bậc cao nhằm giúp người sử dụng dùng hệ thống mà nhiều khơng cần quan tâm đến thuật toán chi tiết biểu diễn máy Chức hệ quản trị sở liệu a Thiết lấp sở liệu : Gồm giai đoạn - Khai báo - Định nghĩa Trang5 Luận văn tốt nghiệp Nguyễn Văn Giang - Nạp liệu vào sở liệu b Cập nhật liệu: - Bổ sung liệu vào sở liệu, - Loại bỏ liệu khỏi sở liệu, - Sửa liệu sở liệu c Khai thác liệu sở liệu - Tìm kiếm thơng tin theo u cầu, - Kết xuất thông tin theo yêu cầu I.2 KHÁI QT CHUNG VỀ MƠ HÌNH DỮ LIỆU Thơng thường việc thiết kế xây dựng hệ thống thông tin quản lý, cần xử lý tệp (tệp ) liệu, tệp bao gồm nhiều ghi ( record ) có cấu trúc xác định Đồng thời, ghi phân chia thành trường liệu Mỗi sở liệu hệ thống tệp liệu , tệp có cấu trúc ghi khác Mỗi hệ quản trị sở liệu hệ thống quản lý điều hành tệp liệu Trong trình thiết kế xây dựng hệ quản trị sở liệu, người ta tiến hành xây dựng mơ hình liệu Mơ hình liệu phải thể chất mối quan hệ liệu mà liệu phản ánh mối quan hệ thực thể giới thực Có thể thấy mơ hình liệu phản ánh khía cạnh cấu trúc logíc mà khơng vào khía cạnh vật lý sở liệu Yếu tố quan trọng cấu trúc sở liệu dạng cấu trúc liệu lưu trữ mơ tả Có thể thấy loại liệu tảng việc mô tả mối quan hệ loại ghi Bởi ràng buộc loại ghi tạo chất cấu trúc sở liệu Vì dựa việc xác định ràng buộc loại Trang6 Luận văn tốt nghiệp Nguyễn Văn Giang liệu cho mà phân loại mô hình liệu Có nghĩa từ cách nhìn người sử dụng việc mô tả liệu ràng buộc liệu thực Hiện có nhiều loại mơ hìmh liệu Bốn loại mơ hình liệu sử dụng rộng rãi là: Mơ hình phân cấp, Mơ hình mạng, Mơ hình quan hệ, Mơ hình hướng đối tượng I.2.1 Mơ hình phân cấp [6] Mơ hình dưc liệu cây, nút biểu diễn tập thực thể, nút cha liên hệ theo mối quan hệ xác định ( Dựa cấu trúc cây) Ví dụ hình sau: Gốc Alà thực thể lớn, ta chia thực thể A làm thực thể nhỏ B,C,D Trong thực thể B ta lại chia làm thực thể nhỏ G,H,I, tương tự C có hai thực thể nhỏ K L, D có thực thể nhỏ M,N P A B G C H I D K L M I.2.2 Mơ hình mạng [6] Mơ hình biểu diễn đồ thị có hướng ( Cấu trúc đồ thị ) A B C D E N P Trang7 Luận văn tốt nghiệp Nguyễn Văn Giang Ví dụ: Mơ tả cho mơ hình liệu mạng: Cho đỉnh A,B,C,D,E Các đỉnh nối với đường, đỉnh A gọi tệp liệu lớn phân chia thành tệp liệu nhỏ Tương tự ta có đỉnh thể giống đỉnh A chúng biểu diễn hình I.2.3 Mơ hình quan hệ [6] Mơ hình dựa sở khái niệm lý thuyết tập hợp quan hệ, tức tập k _ với k cố định, ràng buộc thể qua quan hệ (bảng ) I.2.4 Mơ hình hướng đối tượng Hệ thống xem tập thực thể ( Đối tượng ), tác động qua lại với thông qua thông báo để thực nhiệm vụ đặt Đây mơ hình tập trung nghiên cứu phát triển ứng dụng Trong loại mơ hình mơ hình quan hệ có nhiều ưu điểm nhiều người quan tâm cả, lẽ mô hình liệu quan hệ có tính độc lập liệu cao, lại rễ sử dụng Điều quan trọng mơ hình quan hệ hình thức hố tốn học tốt, nghiên cứu, phát triển cho nhiều kết lý thuyết ứng dụng thực tiễn Mơ hình liệu quan hệ mơ hình tiện lợi để mơ tả cấu trúc Logíc sở liệu Như vậy, mức logíc mơ hình bao gồm tệp biểu diễn dạng bảng Do đơn vị sở liệu quan hệ bảng, dịng bảng ghi liệu cụ thể ( thể cụ thể ghi ) cịn tên cột bảng thuộc tính Trang8 Luận văn tốt nghiệp Nguyễn Văn Giang Trên sở mơ hình liệu quan hệ, đến phát triển thêm số loại mơ hình khác nhằm mô tả thể giới thực cách xác phù hợp mơ hình quan hệ thực thể ( Entily Relationship Model), mơ hình liệu hướng đối tượng ( Object Oriented Model ), Theo cách nhìn người sử dụng sở liệu quan hệ tập bảng biến đổi theo thời gian Với ưu điểm tính cấu trúc đơn giản khả hình thức hoá phong phú sở liệu quan hệ dễ dàng mô hệ thống thông tin tiết kiệm có tính độc lập cao, dễ sửa đổi, bổ xung khai thác liệu Mặt khác, việc khai thác áp dụng kĩ thuật tổ chức sử dụng nhớ cho phép cài đặt sở liệu quan hệ đem lại hiệu cao làm cho sở liệu khẳng định ưu thị trường Trang9 Luận văn tốt nghiệp Nguyễn Văn Giang Trang10 Luận văn tốt nghiệp Nguyễn Văn Giang CHƯƠNG II : CÁC PHỤ THUỘC HÀM Đặt vấn đề: - Khái niệm thực thể: Là đối tượng có thực tế mà cần khảo sát giải nhiều vấn đề liên qua đến đối tượng Ví dụ: Thực thể sinh viên, thực thể người, thực thể hệ thống kế toán tài vụ , Thông thường người ta chia thực thể lớn thành thực thể đơn giản đến thực thể mô tả bàng tệp liệu Hệ thống quản lý công chức Hệ thống cơng chức ban tổ chức cán phủ Các bộ, ngành Tỉnh, Huyện Hệ thống công chức ban tổ chức TW Tổng cơng đồn Hội phụ nữ Các ban - Các thuộc tính: Là đặc trưng thực thể Các thuộc tính dùng để phân biệt thực thể với thực thể khác Ví dụ: Thực thể sinh viên có thuộc tính sau :Mã_SV, Họ_tên, Giới_tính, Nơi_sinh, Quê_quán Trang47 Luận văn tốt nghiệp Nguyễn Văn Giang Dạng chuẩn hai dạng chuẩn quan trọng để chống dư thừa thông tin III.2.4 Định nghĩa 2NF cho sơ đồ quan hệ Giả sử s = < R,F >là sơ đồ quan hệ ,trong R = {a1,a2, ,an } F = < A1→B1, ,At → Bt > Z=∪K K∈Kr Khi s 2NF với K ∈ Kr a∈R-Z ta có a phụ thuộc hồn tồn vào K Định nghĩa tương tự định nghĩa 2NF, không yêu cầu s 1NF , sơ đồ quan hệ khơng có liệu Dạng chuẩn 2NF sơ đồ quan hệ phổ biến Thông thường người ta đưa tệp liệu sơ đò quan hệ dạng chuẩn hai III.2.5 Định nghĩa phụ thuộc bắc cầu Giả sử r = {h1, h2 , , hm} tệp liệu tập cột R = {a1,a2, ,an} f A B (A xác định hàm f r vào B) r Là phụ thuộc bắc cầu ∃ C cho C # A C # B A f r , C C f r B Trang48 Luận văn tốt nghiệp Nguyễn Văn Giang , Tương tự ta có định nghĩa sơ đồ quan hệ có phụ thuộc bắc cầu Phụ thuộc bắc cầu xuất nhiều tệp liệuvà sơ đồ quan hệ ,người ta chứng tỏ phụ thuộc bắc cầu tạo nên dư thừa thông tin, không minh bạch mối quan hệ phụ thuộc hàm Nói cách khác cản trở tốc độ xử lý tệp liệu sơ đồ quan hệ B A C Ngược với phụ thuộc bắc cầu, người ta gọi phụ thuộc trực tiếp, có nghĩa phụ thuộc phần tử C mà ∃ A→B bắc cầu ∃ C: C # A, C# B A f r C f , C B r Thì người ta gọi phụ thuộc trực tiếp Ví dụ: Xét hai quan hệ HỐĐƠN11 HỐĐƠN12 ví dụ Quan hệ HỐĐƠN11 dạng chuẩn khơng cịn thuộc tính ngồi khố chính, Quan hệ HỐĐƠN12 dạng chuẩn khơng cịn phụ thuộc bắc cầu , Trang49 Luận văn tốt nghiệp Nguyễn Văn Giang Rõ ràng hai quan hệ dạng chuẩn Như với quan hệ HOÁĐƠN ban đầu, để đạt mức quan hệ dạng chuẩn, ta phải phân rã thành HOÁĐƠN11, HOÁĐƠN12, HOÁĐƠN13 Trên sở ví dụ có định nghĩa dạng chuẩn sau: III.2.6 Định nghĩa 3NF Giả sử r = {h1, h2 , , hm} tệp liệu tập cột R = {a1,a2, ,an} Khi r 3NF : - r 2NF - Với K∈ Kr a thứ cấp K f trực tiếp ( Z = ∪K a ∈ R - Z ) (a) r K∈Kr Như dạng chuẩn giống dạng chuẩn 2, xét tập hợp khoá tối tiểu thuộc tính thứ cấp Vậy dạng chuẩn địi hỏi phụ thuộc hồn tồn trực tiếp tập khoá tối tiểu tập thuộc tính thứ cấp Cho đến người ta biến đổi tệp liệu sơ đồ quan hệ dạng chuẩn III.2.7 Định nghĩa 3NF cho sơ đồ quan hệ Giả sử s = < R,F >là sơ đồ quan hệ ,trong R = {a1,a2, ,an } F = < A1→B1, ,At → Bt > Khi s 3NF nếu: - s 2NF Trang50 Luận văn tốt nghiệp Nguyễn Văn Giang - Với K∈Kr a thứ cấp K→ {a} ∈ F+ trực tiếp ( Z = ∪K a ∈ R - Z) K∈Kr Trên thực tế sơ đồ quan hệ khơng có dạng chuẩn III.2.8 Định nghĩa BCNF Giả sử r tệp liệu s sơ đồ quan hệ Khi ta nói r BCNF (s BCNF) với a ∈ A (A→{a} ∈ F+ ) A+r = R ( A+ = R ) A f (a) r Theo định nghĩa với tập A thuộc tính a nằm ngồi A Dễ thấy sơ đồ quan hệ (tệp liệu ) dạng chuẩn BCNF đương nhiên 3NF Dạng chuẩn BCNF dạng chuẩn cực đoan, thơng thường người ta chuyển tệp liệu sơ đồ quan hệ 3NF mà Trước biến đổi tệp liệu sơ đồ quan hệ phải kiểm tra 3NF hay BCNF hay chưa, 3NF hay BCNF thơi, trường hợp ngược lại ta tiến hành III.3 CÁC THUẬT TỐN CHUẨN HOÁ SƠ ĐỒ QUAN HỆ III.3.1 Kiểm tra sơ đồ quan hệ có BCNF khơng Input: s = < R, F > Trong R = {A1→B1, ., At→Bt} Và Bi tập thực Ai Output: s có BCNF khơng ? Trang51 Luận văn tốt nghiệp Nguyễn Văn Giang Thực thuật tốn: Bước i: A+i = R sang bước 2, ngược lại s không BCNF Với i = 1,2, ,t Bước t + 1: Kết luận: s BCNF III.3.2 Kiểm tra tệp liệu có BCNF không Input: Cho r = {h1,h2, ,hm}là tệp liệu tập thuộc tính R = {a1,a2, ,an} Output: r có 3NF khơng = ? Thực thuật tốn: Bước 1: Tính E r = {Ei j :

Ngày đăng: 25/04/2013, 13:29

Hình ảnh liên quan

Với định nghĩa này chúng ta lập được một bảng tương đương sau: - Phân tích các dạng chuẩn hoá dữ liệu trong mô hình quan hệ và một số thuật toán

i.

định nghĩa này chúng ta lập được một bảng tương đương sau: Xem tại trang 12 của tài liệu.
Khoá đây chính là hình ảnh của cột mã số hay cột số thứ tự trong Tệp dữ liệu nào đó . - Phân tích các dạng chuẩn hoá dữ liệu trong mô hình quan hệ và một số thuật toán

ho.

á đây chính là hình ảnh của cột mã số hay cột số thứ tự trong Tệp dữ liệu nào đó Xem tại trang 20 của tài liệu.
Biểu diễn hình thức phép hợp có dạng: r∪t :={s ∈r hoặc s∈ t} Từ hai quan hệ cho trước ta có phép hợp của hai quan hệ r và t: r ∪t:     =  - Phân tích các dạng chuẩn hoá dữ liệu trong mô hình quan hệ và một số thuật toán

i.

ểu diễn hình thức phép hợp có dạng: r∪t :={s ∈r hoặc s∈ t} Từ hai quan hệ cho trước ta có phép hợp của hai quan hệ r và t: r ∪t: = Xem tại trang 25 của tài liệu.
Hình thức phép chọn được định nghĩa như sau: - Phân tích các dạng chuẩn hoá dữ liệu trong mô hình quan hệ và một số thuật toán

Hình th.

ức phép chọn được định nghĩa như sau: Xem tại trang 29 của tài liệu.
Ví dụ: Ta có bảng thực thể R= (a1, a2,..., a5.) - Phân tích các dạng chuẩn hoá dữ liệu trong mô hình quan hệ và một số thuật toán

d.

ụ: Ta có bảng thực thể R= (a1, a2,..., a5.) Xem tại trang 35 của tài liệu.
Để xem một quan hệ (bảng) có ở dạng chuẩn 2 hay không trong thực tế người ta không tìm tất cả các khối tiểu của nó mà chỉ tìm ra một khoá tối tiểu gọi là khoá chính  - Phân tích các dạng chuẩn hoá dữ liệu trong mô hình quan hệ và một số thuật toán

xem.

một quan hệ (bảng) có ở dạng chuẩn 2 hay không trong thực tế người ta không tìm tất cả các khối tiểu của nó mà chỉ tìm ra một khoá tối tiểu gọi là khoá chính Xem tại trang 44 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan