QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

92 1.2K 8
QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

- 1 - Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên htt p ://www.lr c - tnu. ed u. v n LỜI CẢM ƠN Em xin gửi lời cảm ơn chân thành nhất đến PGS.TS Đặng Văn Đức, người đã tận tình hướng dẫn, giúp đỡ em trong suốt thời gian thực hiện luận văn này. Con cảm ơn Cha, Mẹ và gia đình, những người đã dạy dỗ, khuyến khích, động viên con trong những lúc khó khăn, tạo mọi điều kiện cho chúng con nghiên cứu học tập. Em cảm ơn các thầy, trong Viện Công Nghệ Thông Tin Hà Nội cùng các thầy trong Khoa Công nghệ thông tin – ĐH Thái Nguyên đã dìu dắt, giảng dạy em, giúp em những kiến thức quý báu trong những năm học qua. Cảm ơn các bạn đã tận tình động viên đóng góp ý kiến cho luận văn của tôi. Mặc đã cố gắng hết sức cùng với sự tận tâm của thầy giáo hướng dẫn song do trình độ còn hạn chế, nội dung đề tài còn mới mẻ nên Luận văn khó tránh khỏi những thiếu sót. Em rất mong nhận được sự thông cảm và góp ý của thầy và các bạn. Thái Nguyên, tháng 11 / 2008 Học viên Phạm Thị Ngọc - 2 - Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên htt p ://www.lr c - tnu. ed u. v n MỤC LỤC MỤC LỤC 2 DANH MỤC CÁC TỪ TIẾNG ANH VÀ VIẾT TẮT . 5 DANH MỤC CÁC BẢNG . 6 DANH MỤC CÁC HÌNH, ĐỒ THỊ 6 MỞ ĐẦU . 7 CHƯƠNG 1: TỔNG QUAN HỆ QUẢN TRỊ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS) . 8 1.1 Mục đích của MDBMS 8 1.2 Các yêu cầu của một MDBMS 11 1.2.1 Khả năng quản trị lưu trữ lớn 13 1.2.2 Hỗ trợ truy vấn và khai thác dữ liệu 14 1.2.3 Tích hợp các phương tiện, tổng hợp và thể hiện 14 1.2.4 Giao diện và tương tác. 15 1.2.5 Hiệu suất. .15 1.3 Các vấn đề của MDBMS .16 1.3.1 Mô hình hoá dữ liệu MULTIMEDIA 16 1.3.2 Lưu trữ đối tượng MULTIMEDIA .17 1.3.3 Tích hợp Multimedia, thể hiện và chất lượng của dịch vụ (QoS) 19 1.3.4 Chỉ số hoá Multimedia 20 1.3.5 Hỗ trợ truy vấn Multimedia, khai thác và duyệt qua. 21 1.3.6 Quản trị CSDL Multimedia phân tán 22 1.3.7 Sự hỗ trợ của hệ thống 23 1.4 Kết luận 23 CHƯƠNG 2: MỘT SỐ KỸ THUẬT CHỈ MỤC VÀ TÌM KIẾM VĂN BẢN THEO NỘI DUNG 25 2.1 Giới thiệu hệ tìm kiếm thông tin 25 2.1.1 Kỹ thuật tìm kiếm thông tin 25 2.1.2 Một số vấn đề trong tìm kiếm thông tin 26 - 3 - Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên htt p ://www.lr c - tnu. ed u. v n 2.1.3 Hệ thống tìm kiếm thông tin – IR 27 2.1.4 Sự khác biệt giữa các hệ thống IR và các hệ thống thông tin khác .32 2.1.5 Các hệ tìm kiếm văn bản thường được sử dụng hiện nay 34 2.2 Một số kỹ thuật tìm kiếm văn bản theo nội dung 35 2.2.1 Chỉ mục tự động văn bản và mô hình tìm kiếm Bool 35 2.2.1.1. Mô hình tìm kiếm Bool sở 35 2.2.1.2 Tìm kiếm Bool mở rộng .37 2.2.1.3 Các bước để xây dựng hệ thống tìm kiếm thông tin – IR 39 2.2.1.4 Lập chỉ mục tài liệu 40 2.2.2 Mô hình tìm kiếm không gian vector 51 2.2.2.1 Mô hình tìm kiếm không gian vector sở 51 2.2.2.2. Kỹ thuật phản hồi phù hợp (Relevance Feedback Technique) .53 2.2.3. Thước đo hiệu năng 55 2.3 Ví dụ 56 2.4 Kết luận .58 CHƯƠNG 3: MỘT SỐ KỸ THUẬT NÂNG CAO HIỆU NĂNG TÌM KIẾM VĂN BẢN .59 3.1 Giới thiệu .59 3.2 Một số kỹ thuật nâng cao hiệu năng tìm kiếm đa phương tiện 60 3.2.1 Lọc bằng phân lớp, thuộc tính cấu trúc và các từ khóa .60 3.2.2 Các phương pháp trên sở tính không đều tam giác 61 3.2.3 Mô hình tìm kiếm trên sở cụm (cluster-based) .63 3.2.3.1 Sinh cụm .63 3.2.3.2 Tìm kiếm trên sở cụm .64 3.2.4 Chỉ mục ngữ nghĩa tiềm ẩn (LSI) để tìm kiếm thông tin trên sở không gian vector 64 3.3 Kỹ thuật LSI 66 3.3.1 Giới thiệu LSI 66 3.3.2 Phương pháp luận LSI .67 - 4 - Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên htt p ://www.lr c - tnu. ed u. v n CHƯƠNG 4: PHÁT TRIỂN CHƯƠNG TRÌNH THỬ NGHIỆM 79 4.1 Giới thiệu bài toán .79 4.2 Chức năng chương trình .79 4.3 Quy trình phát triển ứng dụng 79 4.3.1 Xây dựng ma trận Term – Doc .80 4.3.2 Lập chỉ mục tài liệu 80 4.3.3 Xây dựng ma trận trọng số 80 4.3.4 Tìm kiếm theo mô hình vector 81 4.3.5 Phương pháp LSI .81 4.2 Cài đặt thử nghiệm .82 4.2.1 Giao diện màn hình lập chỉ mục 82 4.2.2 Giao diện màn hình cập nhập chỉ mục .83 4.2.2 Tìm kiếm tài liệu theo mô hình vector 83 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 84 TÀI LIỆU THAM KHẢO 86 - 5 - Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên htt p ://www.lr c - tnu. ed u. v n DANH MỤC CÁC TỪ TIẾNG ANH VÀ VIẾT TẮT Từ gốc Giải nghĩa Cluster-based CSDL DBMS (Database Management System) MDBMS (Multimedia Database Management System) Doc Docs DSS (Decision Support Systems) Exact match IMS (Information Management System) Index IR (Information Retrieval) IRS (Information Retrieval System) LSI (Latent Semantic Indexing) MultiMedia Precision QAS (Question Anser System) Query Term Ranking Record Recall SC (Similarity Coeficient) SVD (Singular Value Decomposition) Text-partern The Term Discrimination Value The Signal – Noise Ratio sở cụm sở dữ liệu Hệ quản trị sở dữ liệu Hệ quản trị sở dữ liệu đa phương tiện Tài liệu Nhiều tài liệu Hệ hỗ trợ ra quyết định Đối sánh chính xác Hệ quản lý thông tin Chỉ mục Truy tìm thông tin Hệ truy tìm thông tin Chỉ mục ngữ nghĩa tiềm ẩn Truyền thông da phương tiện Độ chính xác Hệ trả lời câu hỏi Truy vấn Thuật ngữ (từ) Sắp xếp Bản ghi Khả năng tìm thấy Độ tương quan Kỹ thuật tách giá trị đơn Mẫu văn bản Giá trị phân biệt từ Độ nhiễu tín hiệu - 6 - Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên htt p ://www.lr c - tnu. ed u. v n DANH MỤC CÁC BẢNG Bảng 2.2: Cách tập tin nghịch đảo lưu trữ .43 Bảng 2.3 Cách tập tin trực tiếp lưu trữ 43 Bảng 2.4: Thêm một tài liệu mới vào tập tin nghịch đảo 44 Bảng 2.5: Danh sách từ dừng của tiếng Anh 49 Bảng 3.1: Bảng khoảng cách của từng đối tượng trong CSDL đến từng vector so sánh 62 DANH MỤC CÁC HÌNH, ĐỒ THỊ Hình1.1. Kiến trúc bậc cao cho một MDBMS đáp ứng các yêu cầu cho dữ liệu MULTIMEDI 10 Hình 1.2. Mô hình khả năng lưu trữ của các hệ thống Multimedia .13 Hình 2.1. Mô hình tổng quát tìm kiếm thông ti n .28 Hình 2.3. Mô hình kiến trúc của hệ tìm kiếm thông tin .31 Hình 2.4. Cấu trúc hệ tìm kiếm thông tin tiêu biểu .31 Hình 2.5. Các từ được sắp theo thứ tự .46 Hình 2.6. Mô hình minh hoạ mối quan hệ giữa 5 tài liệu D1 đến D5 và thuật ngữ “CAR” .48 Hình 2.7. Quá trình chọn từ làm chỉ mục .50 Hình 2.8. Mô hình thước đo hiệu năng .55 Hình 2.9. Đồ thị so sánh hiệu năng 56 Hình 3.1. Mô hình LSI .67 Hình 3.2. Mô hình tính toán và xếp thứ hạng cho các tài liệu .68 Hình 3.3. Minh hoạ kỹ thuật Chỉ số hoá ngữ nghĩa tiềm ẩn (LSI) .69 Hình 3.4. Mô hình minh hoạ tách giá trị đơn (SVD) .75 Hình 4.1. Giao diện màn hình lập chỉ mục .82 Hình 4.2. Giao diện màn hình cập nhập chỉ mục 83 Hình 4.3. Giao diện tìm kiếm theo mô hình vector .83 - 7 - Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên htt p ://www.lr c - tnu. ed u. v n MỞ ĐẦU Cùng với sự phát triển nhanh chóng của công nghệ tin học thì khối lượng dữ liệu đa phương tiện (Multimedia) được thu thập và lưu trữ dưới dạng số ngày càng nhiều dẫn tới việc tìm kiếm dữ liệu đa phương tiện trở nên khó khăn vì vậy cần các hệ thống tìm kiếm thông tin (Information Retrieval) hỗ trợ người dùng tìm kiếm một cách chính xác và nhanh chóng các thông tin mà họ cần trên kho tư liệu khổng l ồ này. Hiện nay một số hệ thống tìm kiếm như GoogleDesktop, DTSearch, Lucene, tuy nhiên các hệ thống này sử dung các kỹ thuật tìm kiếm đơn giản nên hiệu quả còn chưa cao. Vì vậy mục tiêu của luận văn này nhằm tìm hiểu một số kỹ thuật nâng cao tìm kiếm thông tin, cụ thể ở đây là tìm kiếm văn bản theo nội dung trong sở dữ liệu đa phương tiện nhằm đáp ứng nhu cầu cấp thiết của thời đại bùng nổ thông tin điện tử hiện nay. Bố cục của luận văn gồm các phần sau: + CHƯƠNG 1: TỔNG QUAN VỀ HỆ QUẢN TRỊ CSDL ĐA PHƯƠNG TIỆN: Phần này sẽ giới thiệu tổng quan về hệ quản trị CSDL đa phương tiện. + CHƯƠNG 2: MỘT SỐ KỸ THUẬT CHỈ MỤC VÀ TÌM KIẾM VĂN BẢN - Trình bày các v ấn đềvề hệ tìm kiếm thông tin. - Trình bày kỹ thuật sở chỉ mục văn bản trên sở mô hình Bool và mô hình vector. + CHƯƠNG 3: MỘT SỐ KỸ THUẬT NÂNG CAO HIỆU NĂNG TÌM KIẾM VĂN - Trình bày sở lý thuyết về một số kỹ thuật chỉ mục nâng cao. - Giới thiệu kỹ thuật chỉ mục nâng cao LSI. + CHƯƠNG 4: PHÁT TRIỂN CHƯƠNG TRÌNH THỬ NGHIỆM: Chương này phát triển chương trình thử nghiệm áp dụng kỹ thuật chỉ mục và kỹ thuật tìm kiếm văn bản theo nội dung trong sở dữ liệu đa phương tiện. + KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN: Trình bày các kết quả đạt được trong luận văn và nêu phương hướng phát triển của đề tài trong tương lai. + TÀI LIỆU THAM KHẢO và PHỤ LỤC: Trình bày các thông tin liên quan đến luận văn. - 8 - Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên htt p ://www.lr c - tnu. ed u. v n CHƯƠNG 1: TỔNG QUAN HỆ QUẢN TRỊ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS) Trung tâm của một hệ thống thông tin đa phương tiện (MULTIMEDIA) chính là hệ quản trị CSDL MULTIMEDIA (MDBMS - Multimedia Database Management System). Theo truyền thống, một CSDL bao gồm một bộ các dữ liệu liên quan về một thực thể cho trước hoặc một hệ quản trị CSDL (DBMS) là một bộ các dữ liệu liên quan đến nhau với một tập hợp các chương trình được dùng để khai báo, tạo lập, lưu trữ, truy cập và truy vấn CSDL. Tương tự như vậy, chúng ta thể xem một CSDL MULTIMEDIA là một tập các loại dữ liệu Multimedia như văn bản, hình ảnh, video, âm thanh, các đối tượng đồ hoạ…. Một hệ quản trị CSDL MULTIMEDIA cung cấp hỗ trợ cho các loại dữ liệu MULTIMEDIA trong việc tạo lập, lưu trữ, truy cập, truy vấn và kiểm soát. Sự khác nhau của các kiểu dữ liệu trong CSDL MULTIMEDIA thể đòi hỏi các phương thức đặc biệt để tối ưu hoá việc lưu trữ, truy cập, chỉ số hoá và khai thác. MDBMS cần phải cung cấp các yêu cầu đặc biệt này bằng cách cung cấp các chế tóm tắt bậc cao để quản lý các kiểu dữ l iệu khác nhau cũng như các giao di ện thích hợp để thể hiện chúng. 1.1 Mục đích của MDBMS Một MDBMS cung cấp một môi trường thích hợp để sử dụng và quản lý các thông tin CSDL MULTIMEDIA. Vì vậy, nó phải hỗ trợ các kiểu dữ liệu MULTIMEDIA khác nhau bên cạnh việc phải cung cấp đầy đủ các chức năng của một DBMS truyền thống như khai báo và tạo lập CSDL, khai thác dữ liệu, truy cập và tổ chức dữ liệu, độc lập dữ liệu, tính riêng, toàn vẹn dữ liệu, kiểm soát phiên bản. Các chức năng của MDBMS bản tương tự như các chức năng của DBMS, tuy nhiên, bản chất của thông tin MULTIMEDIA tạo ra các đòi hỏi mới. Bằng cách sử dụng các chức năng tổng quát của DBMS chúng ta thể trình bày mục đích của MDBMS như sau: - 9 - Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên htt p ://www.lr c - tnu. ed u. v n  Sự thống nhất: bảo đảm rằng một dữ liệu không phải tạo lại khi các chương trình khác nhau đòi hỏi dữ liệu đó.  Độc lập dữ liệu: Đảm bảo sự tách rời giữa CSDL và các chức năng quản trị từ các chương trình ứng dụng.  Điều khiển nhất quán: đảm bảo sự toàn vẹn của CSDL MULTIMEDIA thông qua các quy tắc được áp dụng trên các giao dịch đồng thời.  Sự tồn tại: bảo đảm các đối tượng dữ liệu tồn tại qua các giao dịch khác nhau cũng như các yêu cầu của chương trình.  Tính riêng: ngăn chặn c ác truy cập và sửa chữa các dữ liệu được lưu trữ một cách trái phép.  Kiểm soát sự toàn vẹn: bảo đảm sự toàn vẹn của CSDL từ một giao dịch này sang một giao dịch khác thông qua việc áp đặt các ràng buộc.  Khả năng phục hồi: phải các phương thức cần thiết để đảm bảo rằng kết quả của các giao dịch thất bại không làm ảnh hưởng đến dữ liệu lưu trữ.  Hỗ trợ truy vấn: bảo đảm các chế truy vấn phù hợp với dữ liệu MULTIMEDIA.  Kiểm soát phiên bản: tổ chức và quản lý các phiên bản khác nhau của các đối tượng lưu trữ thể được yêu cầu bởi các ứng dụng. - 10 - Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên htt p ://www.lr c - tnu. ed u. v n Hình1.1. Kiến trúc bậc cao cho một MDBMS đáp ứng các yêu cầu cho dữ liệu MULTIMEDI Đối với việc điều khiển nhất quán, một giao dịch là một chuỗi các hướng dẫn được thực thi một cách hoàn toàn hoặc không hoàn toàn, đối với trường hợp không hoàn toàn CSDL sẽ được khôi phục lại trạng thái trước đó, việc đưa ra được một chế tương ứng đ ảm bảo cho việc nhất quán là một vấn đề khó khăn đối với CSDL MULTIMEDIA. Các CSDL quan hệ truyền thống sử dụng một bản ghi hoặc một bảng duy nhất như là một đơn vị nhất quán. CSDL MULTIMEDIA thường sử dụng một đối tượng đơn lẻ (hoặc đối tượng ghép) như là một đơn vị logic của truy cập. Như vậy một đối tượng MULTIMEDIA đơn lẻ thể tạo thành đơn vị nhất quán. Đối với vấn đề lưu trữ, một phương thức đơn giản là lưu trữ các tệp MULTIMEDIA trong các tệp tương ứng của hệ điều hành. Tuy nhiên với đặc thù là dung lượng lớn, các dữ liệu MULTIMEDIA là cho chi phí triển khai theo cách thức này trở nên tốn kém. Hơn nữa, hệ thống cũng cần phải lưu trữ các metadata MULTIMEDIA và thể cả các đối tượng MULTIMEDIA tổng hợp. Vì vậy, hầu hết các MDBMS phân loại thành 2 phần là cố định và tạm thời và chỉ lưu trữ các dữ liệu cố định sau khi các giao dịch đượ c cập nhật. Các dữ liệu tạm thời [...]... ngoại Hệ quản tri sở dữ liệu một tập các lệnh để hỗ trợ cho người sử dụng truy vấn đến dữ liệu của mình Vì vậy muốn truy vấn đến sở dữ liệu trong hệ quản trị sở dữ liệu ta phải học hết các tập lệnh này Nhưng ngược lại nó sẽ cung cấp cho ta các dữ liệu đầy đủ và hoàn toàn chính xác Hệi n nay hệ quản trị sở dữ liệu được sử dụng rộng rãi trên thế giới Một số hệ quản trị sở dữ liệu thông... được lưu trữ (gọi là sở dữ liệu) cần thiết cho việc truy cập Do đó hệ quản trị sở dữ liệu đơn giản là một hệ thống được thiết kế nhằm thao tác và duy trì điều khiển sở dữ liệu DBMS tổ chức lưu trữ các dữ liệu của mình dưới dạng các bảng Mỗi một sở dữ liệu được lưu trữ thành nhiều bảng khác nhau Mỗi một cột trong bảng là một thuộc tính, và mỗi một dòng là một bộ dữ liệu cụ thể Trong mỗi... và đang là những vấn đề mang tính thời sự của - 23 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn CNTT Trong chương này của bản luận văn đã đề cập được một số vấn đề mang tính chất sở của cơ sở dữ liệu đa phương tiện như cách thức và mô hình lưu trữ dữ liệu, cách thức chỉ số hoá cũng như các yêu cầu và các vấn đề cần được giải quyết đối với một hệ thống quản trị sở. .. một hệ thống quản trịsở dữ liệu đa phương tiện (MDBMS) Tuy nhiên, với mục đích và yêu cầu của chủ đề nghiên cứu là trình bày các vấn đề liên quan đến việc tìm kiếm dữ liệu văn bản theo nội dung trong c ơ sở dữ liệu đa phương tiện nên trong ch ương tiếp theo của luận v ăn này sẽ trình bày một số kỹ thuật chỉ mục và tìm kiếm tài liệu văn bản - 24 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên... các dữ liệu Multimedia tương ứng với mức tối ưu hoá trong hệ thống lưu trữ phân cấp Các chế nén dữ liệu kết hợp với các chế chuyển đổi dữ liệu giúp phần làm giảm các yêu cầu khổng lồ về mặt lưu trữ, phương thức bản được sử dụng ở đây là chuyển đổi dữ liệu Multimedia sang một số vùng chuyển đổi để loại bỏ sự thừa của dữ liệu gốc, các quá trình giải nén sẽ làm nhiệm vụ chuyển đổi ngược các dữ. .. dữ liệu thông dụng: Access, SQL Server, Oracle Hệ quản lý thông tin (IMS): Hệ quản lý thông tin là hệ quản trị sở dữ liệu nhưng thêm nhiều chức năng về việc quản lý Những chức năng quản lý này phụ thuộc vào giá trị của nhiều kiểu dữ liệu khác nhau Nói chung bất kỳ hệ thống nào mục đích đặc biệt phục vụ cho việc quản lý thì ta gọi nó là hệ quản lý thông tin Hệ hỗ trợ ra quyết định (DSS) Hệ... các hệ thống thông tin quan trọng nhất là: hệ quản trị sở dữ liệu (DBMS), hệ quản lý thông tin (MIS), hệ hỗ trợ ra quyết định (DSS), hệ trả lời câu hỏi (QAS) và hệ tìm kiếm thông tin (IR) Việc hiểu biết sự khác nhau giữa hai hệ thống tìm kiếm văn bản (IR) và các hệ thống thông tin khác giúp ta hểi u rõ các kỹ thuật tìm kiếm văn bản Hệ quản trị sở dữ liệu: Bất cứ hệ thống thông tin tự động nào cũng... cung cấp khả năng để tích hợp các loại dữ liệu này để tạo nên các kiểu dữ liệu MULTIMEDIA mới và thể hiện các dữ liệu này khi yêu cầu trong một khung thời gian yêu cầu Độ phức tạp của việc tích hợp, tổng hợp và thể hiện bị tăng thêm bởi các đặc tính bản của dữ liệu MULTIMEDIA như tính liên tục (tạm thời) của dữ liệu MULTIMEDIA đặc biệt là với các kiểu dữ liệu như video, hoạt hình hoặc âm thanh... triển các mô hình dữ liệu thực thụ dành cho dữ liệu MULTIMEDIA từ đầu chứ không xây dựng trên sở của các CSDL truyền thống, tuy nhiên mọi người đều nhất trí rằng các nỗ lực như vậy đều phải dựa trên kỹ thuật hướng đối tượng 1.3.2 Lưu trữ đối tượng MULTIMEDIA Lưu trữ vật lý các dữ liệu Multimedia đòi hỏi các phương thức để chuyển đổi, quản lý, trao đổi và phân phối một số lượng dữ liệu khổng lồ, các... trọng bao gồm: • Mô hình hoá dữ liệu Multimedia • Lưu trữ đối tượng Multimedia • Tích hợp, trình diễn, chất lượng dịch vụ Multimedia • Chỉ số hoá, khai thác và duyệt • Hỗ trợ truy vấn Multimedia • Quản trị dữ liệu Multimedia phân tán • Hỗ trợ của hệ thống 1.3.1 Mô hình hoá dữ liệu MULTIMEDIA Mô hình dữ liệu là đơn vị trung tâm của một hệ thống CSDL MULTIMEDIA Một mô hình dữ liệu cần phải tách rời người

Ngày đăng: 26/04/2013, 11:38

Hình ảnh liên quan

Hình1.1. Kiến trúc bậc cao cho một MDBMS đáp ứng các yêu cầu cho dữ liệu MULTIMEDI - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

Hình 1.1..

Kiến trúc bậc cao cho một MDBMS đáp ứng các yêu cầu cho dữ liệu MULTIMEDI Xem tại trang 10 của tài liệu.
Hình 1.2. Mô hình khả năng lưu trữ của các hệ thống Multimedia - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

Hình 1.2..

Mô hình khả năng lưu trữ của các hệ thống Multimedia Xem tại trang 13 của tài liệu.
Hình 2.2 Tiến trình truy vấn tài liệu cơ sở - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

Hình 2.2.

Tiến trình truy vấn tài liệu cơ sở Xem tại trang 30 của tài liệu.
Các mô hình IR khác nhauửs dụng các phương pháp khác nhau trong đại diện truy vấn và đại diện tài liệu, đối sánh tương đồng hoặc/và phản hồi thích hợp. - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

c.

mô hình IR khác nhauửs dụng các phương pháp khác nhau trong đại diện truy vấn và đại diện tài liệu, đối sánh tương đồng hoặc/và phản hồi thích hợp Xem tại trang 31 của tài liệu.
Hình 2.3. Mô hình kiến trúc của hệ tìm kiếm thông tin - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

Hình 2.3..

Mô hình kiến trúc của hệ tìm kiếm thông tin Xem tại trang 31 của tài liệu.
Bảng 2.1: So sánh IRS với các hệ thống thông tin khác: - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

Bảng 2.1.

So sánh IRS với các hệ thống thông tin khác: Xem tại trang 34 của tài liệu.
Bảng 2.2: Cách tập tin nghịch đảo lưu trữ Doc - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

Bảng 2.2.

Cách tập tin nghịch đảo lưu trữ Doc Xem tại trang 43 của tài liệu.
Bảng 2.3 Cách tập tin trực tiếp lưu trữ Term - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

Bảng 2.3.

Cách tập tin trực tiếp lưu trữ Term Xem tại trang 43 của tài liệu.
Bảng 2.4: Thêm một tài liệu mới vào tập tin nghịch đảo Doc - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

Bảng 2.4.

Thêm một tài liệu mới vào tập tin nghịch đảo Doc Xem tại trang 44 của tài liệu.
Hình 2.5 Các từ được sắp theo thứ tự - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

Hình 2.5.

Các từ được sắp theo thứ tự Xem tại trang 46 của tài liệu.
Khi đó ta có bảng trọng số Wij tính theo công thức tf.idf: - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

hi.

đó ta có bảng trọng số Wij tính theo công thức tf.idf: Xem tại trang 48 của tài liệu.
Hình 2.6: Mô hình minh hoạ mối quan hệ giữa 5 tài liệu D1 đến D5 và thuật ngữ “CAR” - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

Hình 2.6.

Mô hình minh hoạ mối quan hệ giữa 5 tài liệu D1 đến D5 và thuật ngữ “CAR” Xem tại trang 48 của tài liệu.
các từ dừng của tiếng Anh như trong Bảng 2.5. Bảng 2.5: Danh sách từ dừng của tiếng Anh - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

c.

ác từ dừng của tiếng Anh như trong Bảng 2.5. Bảng 2.5: Danh sách từ dừng của tiếng Anh Xem tại trang 49 của tài liệu.
Hình 2.7 Quá trình chọn từ làm chỉ mục - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

Hình 2.7.

Quá trình chọn từ làm chỉ mục Xem tại trang 50 của tài liệu.
Hình 2.8. Mô hình thước đo hiệu năng - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

Hình 2.8..

Mô hình thước đo hiệu năng Xem tại trang 56 của tài liệu.
Hình 2.9. Đồ thị so sánh hiệu năng - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

Hình 2.9..

Đồ thị so sánh hiệu năng Xem tại trang 57 của tài liệu.
Các kết quả tính trọng số được tổng kết trong bảng 2.5: - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

c.

kết quả tính trọng số được tổng kết trong bảng 2.5: Xem tại trang 57 của tài liệu.
tính toán trước như trong bảng 3.1: - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

t.

ính toán trước như trong bảng 3.1: Xem tại trang 63 của tài liệu.
Mô hình LSI - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

h.

ình LSI Xem tại trang 68 của tài liệu.
Hình 3.2. Mô hình tính toán và xếp thứ hạng cho các tài liệu - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

Hình 3.2..

Mô hình tính toán và xếp thứ hạng cho các tài liệu Xem tại trang 69 của tài liệu.
Hình 3.3. Minh hoạ kỹ thuật Chỉ số hoá ngữ nghĩa tiềm ẩn (LSI) - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

Hình 3.3..

Minh hoạ kỹ thuật Chỉ số hoá ngữ nghĩa tiềm ẩn (LSI) Xem tại trang 70 của tài liệu.
Hình 3.4. Mô hình minh hoạ tách giá trị đơn (SVD) - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

Hình 3.4..

Mô hình minh hoạ tách giá trị đơn (SVD) Xem tại trang 79 của tài liệu.
Công thức tính toán để tính các giá trị tương đồng cosin trong mô hình không gian  vector cơ sở - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

ng.

thức tính toán để tính các giá trị tương đồng cosin trong mô hình không gian vector cơ sở Xem tại trang 88 của tài liệu.
4.2.2 Giao diện màn hình cập nhập chỉ mục - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

4.2.2.

Giao diện màn hình cập nhập chỉ mục Xem tại trang 89 của tài liệu.
Hình 4.2: Giao diện màn hình cập nhập chỉ mục - QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (MDBMS)

Hình 4.2.

Giao diện màn hình cập nhập chỉ mục Xem tại trang 89 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan