Thông tin tài liệu
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Trần Hoài Nam
CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN
YÊU CẦU VÀ CÁC VẤN ĐỀ
LUẬN VĂN THẠC SĨ
Hà Nội – 2004
2
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Trần Hoài Nam
CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN
YÊU CẦU VÀ CÁC VẤN ĐỀ
Chuyên ngành : Công nghệ thông tin
Mã số : 1.01.10
LUẬN VĂN THẠC SĨ
Người hướng dẫn khoa học: PGS.TS. Vũ Đức Thi
Hà Nội – 2004
3
Mục lục
BẢNG THUẬT NGỮ VÀ CÁC CHỮ VIẾT TẮT 4
LỜI CẢM ƠN 5
MỞ ĐẦU 7
CHƯƠNG 1 10
GIỚI THIỆU CHUNG VỀ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN 10
1.1 Các kiểu truyền thông và multimedia 11
1.1.1. Cơ sở dữ liệu và các DBMS 12
1.1.2. Truy tìm thông tin tài liệu văn bản 12
1.1.3. Truy xuất và chỉ số hoá multimedia 13
1.1.4. Trích rút đặc trưng, biểu diễn nội dung và chỉ số hoá 13
1.2 Sự cần thiết đối với MIRS 13
1.2.1. Sự phát triển về dữ liệu multimedia và các đặc trưng của nó 14
1.2.2. Các DBMS và vai trò của chúng trong việc xử lý dữ liệu multimedia 15
1.2.3. Hệ thống IR và vai trò của nó trong việc truy xuất multimedia 18
1.2.4. Cách tiếp cận tích hợp việc truy xuất và chỉ số hoá thông tin multimedia
19
1.3 Tổng quan về MIRS 19
1.4 Các ứng dụng nói chung và khả năng mong đợi của MIRS 20
CHƯƠNG 2 24
CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (Multimedia Database) 24
2.1 Kiến trúc cho việc tổ chức nội dung 25
2.4.1 Nguyên lý tự trị 25
2.4.2 Nguyên lý đồng nhất 26
2.4.3 Nguyên lý lai ghép 27
2.2 Tổ chức dữ liệu multimedia dựa trên nguyên lý đồng nhất. 30
2.3 Cấu trúc tóm tắt media 32
2.4.1 Dữ liệu ảnh như là một tóm tắt media. 33
2.4.2 Dữ liệu video như là một tóm tắt media. 34
2.4.3 Định nghĩa về một CSDL Multimedia đơn giản 36
2.4.4 Định nghĩa về một CSDL Multimedia có cấu trúc 37
2.4 Ngôn ngữ truy vấn khai thác dư liệu multimedia 39
2.4.1 Truy vấn SMDSs (mô tả đồng nhất) 40
2.4.2 Truy vấn dữ liệu multimedia mô tả dưới kiến trúc lai tạo. 43
2.4.3 Chỉ số hoá SMDS với chỉ số đảo 46
CHƯƠNG 3 52
HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯONG TIỆN – YÊU CẦU VÀ CÁC VẤN
ĐỀ 52
3.1 Mục đích của MDBMS 52
4
3.2
Các yêu cầu của một MDBMS 55
3.2.1 Khả năng quản trị lưu trữ lớn 57
3.2.2 Hỗ trợ truy vấn và khai thácdữ liệu. 58
3.2.3 Tích hợp các phương tiện, tổng hợp và thể hiện 59
3.2.4 Giao diện và tương tác 59
3.2.5 Hiệu suất. 60
3.3 Các vấn đề của MDBMS 60
3.3.1 Mô hình hoá dữ liệu MULTIMEDIA 60
3.3.2 Lưu trữ đối tượng MULTIMEDIA 62
3.3.3 Tích hợp multimedia, thể hiện và chất lượng của dịch vụ (QoS) 63
3.3.4 Chỉ số hoá multimedia 64
3.3.5 Hỗ trợ truy vấn multimedia, khai thác và duyệt qua 65
3.3.6 Quản trị CSDL multimedia phân tán 66
3.3.7 Sự hỗ trợ của hệ thống 67
CHƯƠNG 4 69
XÂY DỰNG HỆ THỐNG MUA BÁN HÀNG QUA MẠNG 69
4.2.1. Giới thiệu 69
4.2.2. Ứng dụng CSDL đa phương tiện vào hệ thống bán hàng qua mạng 70
4.2.1. Xây dựng kho dữ liệu hình ảnh 2D và 3D 71
4.2.2. Xây dựng cơ chế truy vấn đối với kho dữ liệu hình ảnh 71
4.2.3. Hệ thống bán hàng qua mạng 73
4.3.1. Mô hình hệ thống 73
4.3.2. Các chức năng cơ bản của hệ thống 75
4.3.3. Các công cụ phát triển hệ thống 76
4.3.4. Quy trình thực hiện giao dịch của hệ thống 77
4.3.5. Cài đặt hệ thống 78
4.4. Giải pháp tích hợp các hệ thống khác 80
4.4.1. Hệ thống quản lý và cấp phát chứng chỉ số (CA) 80
4.4.2. Hệ thống thanh toán trực tuyến (VASC Payment) 81
4.5. Một số giao diện chính của hệ thống 83
KẾT LUẬN 86
TÀI LIỆU THAM KHẢO 87
BẢNG THUẬT NGỮ VÀ CÁC CHỮ VIẾT TẮT
5
STT Ký hiệu viết tắt Giải thích
1 Web browser Trình duyệt Web
2 CSDL Cơ sở dữ liệu
3 DBMS Hệ quản trị cơ sở dữ liệu
4 MDBMS Hệ quản trị cơ sở dữ liệu đa phương tiện
5 Video frame Khung hình video
6 RDBMS Hệ quản trị cơ sở dữ liệu quan hệ
7 Multimedia Đa phương tiện
8 MIRS Hệ thống truy vấn thông tin đa phương tiện
9 Metadata Siêu dữ liệu
10 Media Phương tiện
11 SMDS Hệ thống cơ sở dữ liệu đa phương tiện có cấu trúc
12 Information Retrival(IR) Truy xuất thông tin
13 Multimedia Information
Retrieval System (MIRS)
Hệ thống truy xuất thông tin đa phương tiện
LỜI CẢM ƠN
6
Tôi xin bầy tỏ lòng kính trọng và biết ơn sâu sắc tới PGS.TS Vũ Đức Thi, người thầy,
người đồng nghiệp đã trực tiếp hướng dẫn, cho tôi những định hướng và những ý kiến
rất quý báu về cơ sở dữ liệu đa phương tiện. Tôi cũng xin chân thành cám ơn các đồng
nghiệp của tôi tại phòng Các hệ thống quản trị dữ liệu – Viện Công nghệ thông tin đ
ã
giúp đỡ tôi rất nhiều trong quá trình công tác để tôi có thể hoàn thành bản luận văn này
một cách tốt đẹp
Xin chân thành cám ơn các bạn bè của tôi, trong nước cũng như ngoài nước đã giúp đỡ
tôi rất nhiều trong quá trình tìm tòi và sưu tầm tài liệu.
Cuối cùng xin châm thành cám ơn các thành viên trong gia đình đã động viên và tạo
mọi điều kiện thuận lợi để tôi có được kết quả như ngày hôm nay.
Hà nội ngày 20/06/2004
Học viên
Trầ
n Hoài Nam
7
MỞ ĐẦU
Công nghệ multimedia liên quan tới việc mô tả sự kết hợp các dạng thức thông tin
khác nhau (văn bản, dữ liệu, hình ảnh, âm thanh, video) dưới dạng tín hiệu số. Có thể
nêu ra đây một số ứng dụng multimedia như :
• E-learning.
• Hội thảo Video (Video Conferencing).
• Thư viện điện tử (Elibrary).
• Hiện tại ảo (Vitual Reality).
Các công nghệ truyền dùng để thao tác, truyền phát, điều khiển các dữ liệu multimedia
đ
ã và đang được nghiên cứu một cách rất sôi động.
Các hệ thống multimedia cần có một hệ thống phân phối nhằm mục đích thu thập các
đối tượng multimedia và đưa chúng đến người dùng, một trong số các phương tiện đầu
tiên được dùng dến là đĩa từ và đĩa quang. Ngày nay, Internet cũng như các giao thức
khác như TCP/IP, NetBIOS, các mạng Lan đang trở thành các phương tiện để truyền
bá dữ liệu multimedia . Khả năng mô tả phong phú c
ũng như khả năng đồ họa của các
web browser cùng với các tính năng đang được tiếp tục tăng cường như hoạt họa, âm
thanh và Video khiến các web browser đang trở thành một phương tiện mới để mang
lại các dữ liệu multimedia cho người dùng[5]
Các công nghệ chủ yêu liên quan đến multimedia bao gồm:
• Kỹ thuật nén.
• Video Servers.
• Các kỹ thuật về mạng (internet, tokenring, ethernet, ATM …vv).
• Các công nghệ truyền dữ liệu.
•
Các công nghệ về cáp truyền dẫn.
• Công nghệ xác thực.
• Các công nghệ về CSDL.
8
Một CSDL là tập hợp của các dữ liệu có liên quan đến nhau. Một hệ quản trị CSDL
(DBMS) là hệ thống phần mềm trợ giúp cho các quá trình khai báo, xây dựng và thao
tác với CSDL phục vụ cho các ứng dụng khác nhau. CSDL multimedia bao gồm thêm
các kiểu dữ liệu khác như:
• Văn bản.
• Hình ảnh.
• Âm thanh.
• Video.
• Hoạt hình.
Các kiểu dữ liệu khác này đòi hỏi phải có các phương thức đặc biệt nhằm m
ục đích tối
ưu hóa cho việc lưu trữ, truy cập, chỉ số hoá và khai thác. Một MDBMS phải cung cấp
một môi trường thích hợp để quản lý và sử dụng CSDL multimedia.
Một MDBMS cần phải đảm bảo các tính năng cơ bản của một DBMS, ngoài ra nó còn
phải có các tính năng khác như:
• Tích hợp các phương tiện khác (Media Intergration).
• Khả năng sắp xếp và mô tả thông tin.
• Khả năng khai thác dữ liệu
• Kh
ả năng lưu trữ lớn.
• Giao diện multimedia.
• Hỗ trợ truy vấn tương tác multimedia.
Thông thường các đối tượng riêng lẻ của một hình ảnh hoặc một video frame sẽ có một
vài mối liên hệ bộ phận với các đối tượng khác. Các mối liên hệ này đưa đến một số
các ràng buộc trong quá trình tìm kiếm các đối tượng trong CSDL multimedia. Căn cứ
trên cơ sở này việc triển khai các ứng dụng multimedia trên nề
n các hệ quản trị CSDL
hướng đối tượng sẽ thuận lợi hơn so với các RDMBS hiện thời[1].
9
Mục tiêu chính của bản luận văn này nhằm nghiên cứu và tìm hiểu một số vấn đền cơ
bản của một MDBMS:
• Tổng quan về cơ sử dữ liệu đa phương tiện
• Các yêu cầu của một MDBMS cũng như kiến trúc, thiết kế và truy vấn đối với
một MDBMS.
Luận văn này được bố cục thành 5 phần chính:
• Chương I: Giớ
i thiệu chung về CSDL multimedia.
• Chương II: Cơ sở dữ liệu multimedia.
• Chương III: Hệ quản trị cơ sở dữ liệu multimedia – Yêu cầu và các vấn đề
• Chương IV: Xây dựng hệ thống bán hàng qua mạng.
• Kết luận
10
CHƯƠNG 1
GIỚI THIỆU CHUNG VỀ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN
Dữ liệu multimedia được chia thành hai lớp là các dữ liệu liên tục và các dữ liệu không
liên tục. Các dữ liệu liên tục bao gồm các dữ liệu âm thanh, video thay đổi theo thời
gian. Các dữ liệu không liên tục là các dữ liệu không phục thuộc vào thời gian, các loại
dữ liệu đặc trưng cho dạng này là các dữ liệu văn bản (có hoặc không có định dạng),
hình ảnh tĩnh và các đối tượng đồ họa. Các kiểu dữ liệu thông thường của một CSDL
multimedia bao gồm:
• Dữ liệu văn bản (có hoặc không có định dạng).
• Đồ họa: là các bản vẽ, minh họa được mã hóa như các tệp postscript.
• Hình ảnh: là các hình ảnh được mã hóa sử dụng các dạng thức chuẩn như là
JPEG hoặc MPEG.
• Các hoạt hình.
• Âm thanh.
• Video.
Các đặc tính chung của dữ liệu multimedia bao gồm:
• Thiếu cấu trúc: Các dữ liệu multimedia có khuynh hướng phi cấu trúc vì vậy
các tác nghi
ệp quản trị dữ liệu chuẩn như chỉ số hoá, tìm kiếm nội dung, truy
vấn dữ liệu thường là không áp dụng được.
• Tính tạm thời: Một vài kiểu dữ liệu multimedia như là Video, âm thanh và hoạt
hình đều phụ thuộc vào yếu tố thời gian liên quan mật thiết đến việc lưu trữ,
thao tác và mô tả chúng.
• Có dung lượng lớn: các dữ liệu video và âm thanh thường đòi hỏi các thiết bị
lưu trữ lớn.
[...]... nhanh theo yêu cầu Không chỉ là đang tăng về số lượng dữ liệu đang được lưu trữ, mà còn cả các kiểu dữ liệu và các đặc trưng của chúng là khác nhau từ dữ liệu ký tự chữ Có những đặc trưng chính của dữ liệu multimedia như sau: • Dữ liệu multimedia, nhất là âm thanh và video, là dữ liệu có số lượng lớn Ví dụ, một video 10’ trung bình chiếm 1,5 GB chưa nén • Âm thanh và video có chiều thời gian và chúng... xuất 24 CHƯƠNG 2 CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (Multimedia Database) Khi thiết kế một hệ thống CSDL multimedia mô tả các loại dữ liệu multimedia khác nhau, chúng ta bắt buộc phải đối diện với một số câu hỏi quan trọng được đặt ra về cách thức tổ chức hệ trống như: • Việc tổ chức về mặt nội dung đối với dữ liệu của các loại dữ liệu multimedia • Việc lưu trữ vật lý của các dữ liệu này trên các thiết bị lưu... xử lý dữ liệu multimedia Nhưng các BLOB được sử dụng chỉ để lưu dữ liệu có khối lượng lớn Trong khi các đối tượng chứa vài thuộc tính đơn giản, nhiều chức năng hơn nên được 18 phát triển để xử lý việc truy xuất multimedia dựa vào nội dung Một vài các khả năng được yêu cầu như sau: • Các công cụ, tự động hoá hoặc bán tự động trích rút các nội dung và các đặc trưng trong dữ liệu multimedia ; • Các cấu... thường của các mục cơ sở dữ liệu như tên tác giả và ngày tạo lập Một Ví dụ là câu hỏi 21 theo yêu cầu trên video (VOD) có thể là “liệt kê tên các phim được sản xuất vào năm 1997” Loại này được vận dụng bằng DBMS • Các câu hỏi dựa trên chú giải: Đây là câu hỏi chỉ ra các mô tả dạng văn bản trong nội dung của cơ sở dữ liệu Các câu hỏi đều ở trong từ khoá hoặc tronng phần văn bản miễn phí và việc truy... khối dữ liệu Một dạng khác của các DBMS là hệ thống quản trị CSDL hướng đối tượng (OODBMS) Các OODBMS kết nối các khả năng của cơ sơ dữ liệu (như lưu trữ và tìm kiếm) và các đặc trưng hướng đối tượng (tóm lược, sự thừa kế, tính đồng nhất đối tượng) Một phương pháp tiếp cận chung là kết nối các đặc điểm hướng đối tượng với cơ sở dữ liệu quan hệ Hệ thống đã được kết nối thì được gọi là một hệ thống cơ sở. ..11 • Các ứng dụng hỗ trợ: các dữ liệu phi chuần có thể đòi hỏi các quy trình xử lý phức tạp như việc sử dụng các thuật toán nén dữ liệu đối với các ứng dụng CSDL multimedia 1.1 Các kiểu truyền thông và multimedia Truyền thông đề cập đến các kiểu thông tin hoặc các kiểu biểu diễn thông tin, ví dụ như dữ liệu vần chữ cái, hình ảnh, âm thanh, truyền hình Có nhiều cách phân lớp truyền thông Những cách... cùng, các MIRS sẽ tập trung vào chính thông tin thay thế các loại truyền thông và việc miêu tả chúng có thể được sắp xếp hoặc dịch ra từ loại truyền thông này đến loại truyền thông khác Ví dụ, một video tài liệu cần phải được sử dụng video, hình ảnh, văn từ, âm thanh, lời nói và những thứ tương tự như vậy Vì vậy phương tiện dò tìm phải kết nối các câu hỏi (dữ liệu) với các mục cơ sở dữ liệu Các loại... sau: Trước hết, dữ liệu multimedia đang được dùng ngày càng nhiều và đang được chú ý Để sử dụng thông tin đó (chứa trong dữ liệu đó), đòi hỏi có một hệ thống truy xuất và chỉ số hoá hiệu quả và có hiệu lực Thứ hai, dữ liệu multimedia có những đặc tính và những yêu cầu đặc biệt mà lại khác nhau đáng kể từ số liệu bảng chữ cái Bởi vậy, 14 DBMS truyền thống không thích hợp cho việc xử lý dữ liệu multimedia... ta có thể thấy rằng các DBMS và IR không thể đáp ứng đầy đủ các yêu cầu về chỉ số hoá và truy xuất multimedia, vì vậy cần có các công nghệ mới để vận dụng những đặc trưng riêng của multimedia Tuy vậy, vẫn nhận thấy rằng các DBMS và IR vẫn đóng vai trò quan trọng trong các MDBMS Các phần của dữ liệu multimedia như ngày và tác giả tạo lập của tài liệu multimedia là có cấu trúc Dữ liệu có kết cấu này... giải thích cùng 1 bức tranh theo cách khác nhau hoàn toàn riêng • Dữ liệu multimedia là giàu về thông tin, nhiều tham số được đòi hỏi mới trình diễn đủ nội dung của nó 1.2.2 Các DBMS và vai trò của chúng trong việc xử lý dữ liệu multimedia Các DBMS ngày nay được xây dựng khá tốt và được sử dụng rộng rãi đối với dữ liệu có cấu trúc Các DBMS trội nhất là các hệ quản trị dữ liệu quan hệ (RDBMS) Trong RDBMS, . CHUNG VỀ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN
Dữ liệu multimedia được chia thành hai lớp là các dữ liệu liên tục và các dữ liệu không
liên tục. Các dữ liệu liên. dữ liệu
3 DBMS Hệ quản trị cơ sở dữ liệu
4 MDBMS Hệ quản trị cơ sở dữ liệu đa phương tiện
5 Video frame Khung hình video
6 RDBMS Hệ quản trị cơ sở dữ
Ngày đăng: 12/03/2014, 11:25
Xem thêm: cơ sở dữ liệu đa phương tiện yêu cầu và các vấn đề, cơ sở dữ liệu đa phương tiện yêu cầu và các vấn đề