Loại bỏ các mẫu tin nhân bản thừa trong cơ sở dữ liệu quan hệ

79 473 0
Loại bỏ các mẫu tin nhân bản thừa trong cơ sở dữ liệu quan hệ

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CNTT & TRUYỀN THÔNG NGUYỄN LÊ HOÀN LOẠI BỎ CÁC MẪU TIN NHÂN BẢN THỪA TRONG CƠ SỞ DỮ LIỆU QUAN HỆ LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên – 2012 i LỜI CAM ĐOAN Tôi xin cam đoan bản luận văn này là công trình nghiên cứu của riêng tôi, không sao chép ở bất kỳ công trình khoa học nào trước đây. Các kết quả nêu trong luận văn có nguồn gốc rõ ràng và được trích dẫn đầy đủ. Nếu có gì sai, tôi xin chịu hoàn toàn trách nhiệm. Học viên Nguyễn Lê Hoàn ii MỤC LỤC Trang MỞ ĐẦU 1 CHƯƠNG 1: CƠ SỞ LÍ THUYẾT 2 1.1. Tổng quan CSDL quan hệ 2 1.1.1. Định nghĩa quan hệ 2 1.1.2. Phụ thuộc hàm 2 1.1.3. Khóa 4 1.1.3. Các loại chuẩn 7 1.2. Hệ chuyên gia 14 1.2.1. Thể hiện dấu hiệu không chắc chắn 16 1.2.2. Thể hiện các luật không chắc chắn 19 1.2.3. Lan truyền chắc chắn đối với các luật có nhiều giả thiết 22 CHƯƠNG 2: LOẠI BỎ CÁC MẪU TIN NHÂN BẢN THỪA 25 2.1. Các dạng lệnh SQL 25 2.2. Các loại mảnh và cách phân mảnh quan hệ 32 2.2.1. Các lý do phân mảnh 40 2.2.2. Các kiểu phân mảnh. 40 2.3. Thể hiện dấu hiệu không chắc chắn cho các thuộc tính không khóa 50 2.4. Thể hiện luật không chắc chắn cho các thuộc tính có giá trị lặp 51 2.4.1. Thuật toán 52 2.4.2. Mệnh đề 53 2.5. Kết luận 54 CHƯƠNG 3: ỨNG DỤNG GIẢI MỘT SỐ BÀI TOÁN THỰC TẾ 55 3.1. Giới thiệu các quan hệ trong CSDL quản lí nhân sự 55 3.1.1. Bài toán phân mảnh tối ưu 55 iii 3.1.2. Bài toán phân mảnh ứng dụng. 55 3.2. Tư vấn 67 3.3. Kết luận và hướng phát triển 67 3.3.1. Kết luận 67 3.3.2. Hướng phát triển 67 TÀI LIỆU THAM KHẢO 68 iv DANH MỤC CÁC KÍ HIỆU CÁC KÍ HIỆU Ý NGHĨA  Phép giao  Phép hợp  Kí hiệu không thuộc  Kí hiệu thuộc + Phép cộng - Phép trừ X Tích đề các Phép nối  Phép chiếu  Tê ta > Phép so sánh lớn hơn < Phép so sánh nhỏ hơn  Phép so sánh lớn hơn hoăc bằng  Phép so sánh nhỏ hơn hoăc bằng \ Phép chia * Phép nhân v AND Phép và OR Phép hoặc  Tập rỗng  Phủ định = Phép bằng  Phép chọn  Kí hiệu với mọi  Pi vi DANH MỤC CÁC CHỮ VIẾT TẮT 1NF Fisrt Normal Form (Dạng chuẩn thứ nhất) 2NF Second Normal Form (Dạng chuẩn thứ hai) 3NF Third Normal Form (Dạng chuẩn thứ ba) 4NF Fourth Normal Form (Dạng chuẩn thứ bốn) 5NF Fifth Normal Form (Dạng chuẩn thứ năm) BCNF Boye Codd Normal Form (Dạng chuẩn BOYE CODD) CF Certainty Factor (Nhân tố chắc chắn) CSDL Cơ sở dữ liệu DDBM Distributed Database Managerment (Hệ quản trị CSDL phân tán) FD Functional Dependancy (Phụ thuộc hàm) GCS Global Conception Schema (lược đồ khái niệm toàn cục) LCS Local Conception Schema (lược đồ khái niệm địa phương) LTM Long Term Memory (bộ nhớ vĩnh cửu) MB Measure of Belief (Độ chắn chắn) MD Measure of Disbelief (Độ không chắn chắn) SQL Structured Query Langguage (Ngôn ngữ truy vấn có cấu trúc) STM Short Term Memory (bộ nhớ tạm thời) vii DANH MỤC CÁC BẢNG BIỂU Trang Bảng 1.1. HS 3 Bảng 1.2. HangHoa 5 Bảng 1.3. Khoa 6 Bảng 1.4.Luong 7 Bảng 1.5. TienLuong 8 Bảng 1.6.XeMay 8 Bảng 1.7. XeMay1 9 Bảng 1.8. XeMay2 9 Bảng 1.9. SV 10 Bảng 1.10. Xe 12 Bảng 1.11. R1 13 Bảng 1.12. R2 13 Bảng 1.13. R3 13 Bảng 1.14. Miêu tả các giá trị CF 23 Bảng 2.1. So sánh các lựa chọn nhân bản 39 Bảng 2.2. Truong 42 Bảng 2.3. Hocsinh 42 Bảng 2.4. Monhoc 42 Bảng 2.5.Diemthi 43 Bảng 2.6. Truong 1 44 Bảng 2.7. Truong2 45 Bảng 2.8. Hocsinh 1 46 Bảng 2.9. Hocsinh 2 46 Bảng 2.10.Monhoc 1 48 viii Bảng 2.11.Monhoc2 50 Bảng 3.1. Quan hệ R 56 Bảng 3.2. Mảnh ngang t1 56 Bảng 3.3. Mảnh ngang t2 56 Bảng 3.4. Mảnh ngang t3 57 Bảng 3.5. Mảnh ngang t4 57 Bảng 3.6. Mảnh ngang t5 57 Bảng 3.7. Mảnh ngang t6 57 Bảng 3.8. Mảnh ngang t7 58 Bảng 3.9. Mảnh ngang t8 58 Bảng 3.10. Mảnh ngang t9 58 Bảng 3.11. Mảnh ngang t10 58 Bảng 3.12. Mảnh ngang t11 59 Bảng 3.13. Mảnh ngang t12 59 Bảng 3.14. Mảnh ngang 1 60 Bảng 3.15. Mảnh ngang 2 60 Bảng 3.16. Mảnh ngang 3 61 Bảng 3.17. Mảnh ngang 4 61 Bảng 3.18. Mảnh ngang 5 61 Bảng 3.19. Mảnh ngang 6 61 Bảng 3.20. Mảnh ngang 7 62 Bảng 3.21. Mảnh HV1 62 Bảng 3.22. Mảnh HV2 62 Bảng 3.23. Mảnh HV3 63 Bảng 3.24. Mảnh HV4 63 Bảng 3.25. Mảnh HV5 63 Bảng 3.26. Mảnh HV6 63 ix Bảng 3.27. Mảnh HV7 63 Bảng 3.28. Mảnh R1 64 Bảng 3.30. Mảnh ngang tR21 65 Bảng 3.31. Mảnh ngang tR22 65 Bảng 3.32. Mảnh ngang tR23 65 Bảng 3.33. Mảnh ngang tR24 65 Bảng 3.34. Mảnh ngang R2a 65 Bảng 3.35. Mảnh HV8 66 Bảng 3.37. Mảnh R22 66 Bảng 3.38. Mảnh ngang tR22 66 [...]... cần phải loại bỏ tất cả các bộ được nhân bản thừa trong CSDL quan hệ Để làm việc này chúng ta có thể dựa vào phương pháp heuristics 2 CHƯƠNG 1: CƠ SỞ LÍ THUYẾT 1.1 Tổng quan CSDL quan hệ Một số khái niệm cơ bản về hệ cơ sở dữ liệu: Để dễ dàng cho việc giải thích các khái niệm, trước hết chúng ta quan sát qua hệ thống bán vé máy bay bằng máy tính Dữ liệu lưu dữ trong máy tính bao gồm các thông tin về... thông tin về mối quan hệ này được biểu diễn trong máy tính thông qua việc đặt chỗ của khách hàng Vậy làm thế nào để biểu diễn được dữ liệu đó và để đảm bảo khách hàng đi đúng tuyến Phần thông tin lưu trữ trong máy tính đó theo một định dạng nào đó gọi là cơ sở dữ liệu( Database) Phần chương trình để xử lý cơ sở dữ liệu gọi là hệ quản trị cơ sở dữ liệu( Database management system), hệ quản trị cơ sở dữ liệu. .. thì nó có dạng Z ->>A * Các phụ thuộc kết nối và dạng chuẩn năm Việc phân rã các quan hệ có chuẩn 4NF cũng chưa loại bỏ được các dư thừa trong quan hệ Kết luận này đã được Nicole năm 1978 hay Fagin năm 1979 khẳng định điều này 12 Ví dụ 7: Cho quan hệ Xe(Ten, Mau, Mac) và dữ liệu cho ở bảng 1.7 về người dùng xe có màu và mác xe Bảng 1.7 dữ liệu cho thấy quan hệ này vẫn dư thừa dữ liệu và vấn đề cần phải... này là cơ sở nền tảng cho thiết kế các máy giải quyết vấn đề dựa trên tri thức mà ta gọi là hệ chuyên gia * Cơ sở của hệ chuyên gia: + Cơ sở tri thức 16 Định nghĩa 1.2-3 Cơ sở tri thức là thành phần chính bên cạnh các thành phần giải vấn đề trong hệ thống dựa trên tri thức Trong hệ chuyên gia thì cơ sở tri thức được định nghĩa là một phần trong hệ chuyên gia chứa các tri thức về lĩnh vực Trong hệ chuyên... hay dữ liệu chi tiết; + Cập nhật dữ liệu (thêm, sửa, xóa dữ liệu) ; + Thêm cột mới; + Sao chép dữ liệu từ bảng này sang bảng khác; + Các tiện ích khác giúp tổ chức, in dữ liệu SQL là một ngôn ngữ phi thủ tục, chuẩn mực và điển hình Phép toán cơ bản trong ngôn ngữ SQL là phép ánh xạ được miêu tả như một khối SELECT – FROM – WHERE Định nghĩa dữ liệu trong SQL chính là tạo ra các bảng bằng cấu trúc các. .. Hay nói cách khác: Hệ chuyên gia gồm máy tính và chương trình được dùng để mô phỏng và bắt chước cách giải quyết vấn đề của các chuyên gia * Hệ chuyên gia bao gồm hai khối cơ bản: + Khối cơ sở tri thức, dùng để lưu các tri thức chuyên xâu về lĩnh vực, nó bao gồm các khái niệm, các sự kiện, các quan hệ và các luật suy diễn, lựa chọn, … + Khối suy luận là một bộ xử lý, nó được mô hình hóa theo cách lập... biểu rõ ràng là các tri thức ngụ ý, khi các tri thức được tổ chức để chia sẻ thì đó là những tri thức có cấu trúc Để chuyển đổi được dạng tri thức rõ ràng sang tri thức không rõ ràng cần được cấu trúc hóa và định dạng lại Cơ sở tri thức chứa các tri thức chuyên sâu về lĩnh vực chuyên gia Cơ sở tri thức bao gồm: các sự kiện, các luật, các khái niệm và các quan hệ Trong cuộc sống, sở dĩ các chuyên gia... Ví dụ 1: Cho quan hệ hàng hóa HangHoa(MSMH, TenHang, SoLuong) cho dữ liệu bởi bảng 1.2 như sau: 5 MSHH TenHang SoLuong 1011 Bàn phím 505 1012 Chuột quang 500 1013 Màn hình 600 Bảng 1.2 HangHoa Trong ví dụ biểu diễn quan hệ hàng hóa (HangHoa) trong đó mã số mặt hàng (MSMH) là khóa Mỗi giá trị của thuộc tính MSMH đều xác định duy nhất một loại mặt hàng trong quan hệ hàng hóa (HangHoa) và trong đó ti(MSHH)... jose, California cho hệ thống quản trị cơ sở dữ liệu lơn điển hình là System-R Trong System-R SQL vừa đóng vai trò là một ngôn ngữ có thể thao tác độc lập với người sử dụng đầu cuối, đồng thời lại có khả năng là một ngôn ngữ con được nhúng trong ngôn ngữ chủ PL/1 SQL đảm bảo các lệnh theo cú pháp tiếng Anh Trong bảng - quan hệ các chức năng của SQL gồm: + Tạo, xóa một bảng; + Tìm dữ liệu Người ta có thể... 1.1.3 Các loại chuẩn Trong quá trình cập nhật dữ liệu không thể tránh khỏi những sai sót gây ra các dị thường cho nên các quan hệ cần thiết phải được biến đổi thành các dạng chuẩn Quá trình đó được xem là quá trình chuẩn hóa Một quan hệ được chuẩn hóa là một quan hệ trong đó mỗi miền của một thuộc tính chỉ chứa một giá trị nguyên tố, tức là không thể phân chia nhỏ thêm được nữa và do đó mỗi giá trị trong . HỌC CNTT & TRUYỀN THÔNG NGUYỄN LÊ HOÀN LOẠI BỎ CÁC MẪU TIN NHÂN BẢN THỪA TRONG CƠ SỞ DỮ LIỆU QUAN HỆ LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH . lưu trữ trong máy tính đó theo một định dạng nào đó gọi là cơ sở dữ liệu( Database). Phần chương trình để xử lý cơ sở dữ liệu gọi là hệ quản trị cơ sở dữ liệu( Database management system), hệ quản. CSDL quan hệ. Để làm việc này chúng ta có thể dựa vào phương pháp heuristics. 2 CHƯƠNG 1: CƠ SỞ LÍ THUYẾT 1.1. Tổng quan CSDL quan hệ Một số khái niệm cơ bản về hệ cơ sở dữ liệu: Để

Ngày đăng: 22/10/2014, 07:07

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan