ĐỀ TÀI " MỘT SỐ THUẬT TOÁN PHÂN HẠNG ẢNH PHỔ BIẾN VÀ ÁP DỤNG TRONG HỆ THỐNG TÌM KIẾM ẢNH LỚP TRÊN THỬ NGHIỆM " pot

75 431 0
ĐỀ TÀI " MỘT SỐ THUẬT TOÁN PHÂN HẠNG ẢNH PHỔ BIẾN VÀ ÁP DỤNG TRONG HỆ THỐNG TÌM KIẾM ẢNH LỚP TRÊN THỬ NGHIỆM " pot

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Lê Thị Kim Dung MỘT SỐ THUẬT TOÁN PHÂN HẠNG ẢNH PHỔ BIẾN ÁP DỤNG TRONG HỆ THỐNG TÌM KIẾM ẢNH LỚP TRÊN THỬ NGHIỆM KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin HÀ NỘI - 2010 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Lê Thị Kim Dung MỘT SỐ THUẬT TOÁN PHÂN HẠNG ẢNH PHỔ BIẾN ÁP DỤNG TRONG HỆ THỐNG TÌM KIẾM ẢNH LỚP TRÊN THỬ NGHIỆM KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin Cán bộ hướng dẫn: PGS.TS Hà Quang Thụy Cán bộ đồng hướng dẫn: ThS Nguyễn Cẩm Tú HÀ NỘI - 2010 Lời cảm ơn Trước tiên, tôi xin gửi lời cảm ơn lòng biết ơn sâu sắc nhất tới Phó Giáo sư Tiến sĩ Hà Quang Thụy Thạc sĩ Nguyễn Cẩm Tú, người đã tận tình chỉ bảo hướng dẫn tôi trong suốt quá trình thực hiện khoá luận tốt nghiệp. Tôi chân thành cảm ơn các thầy, cô đã tạo những điều kiện thuận lợi cho tôi học tập nghiên cứu tại trường Đại h ọc Công nghệ. Tôi cũng xin gửi lời cảm ơn tới các anh chị các bạn sinh viên trong nhóm “Khai phá dữ liệu” đã giúp tôi rất nhiều trong việc hỗ trợ kiến thức chuyên môn để hoàn thành tốt khoá luận. Cuối cùng, tôi muốn gửi lời cảm vô hạn tới gia đình bạn bè, những người thân yêu luôn bên cạnh động viên tôi trong suốt quá trình thực hiện khóa luận tốt nghiệp. Tôi xin chân thành cảm ơn! Sinh viên Lê Thị Kim Dung Tóm tắt Sự tăng không ngừng về lượng ảnh trên Web tạo nguồn ảnh phong phú đáp ứng được nguồn cung ảnh cho nhu cầu của con người. Mặc dù một số máy tìm kiếm ảnh đã ra đời đáp ứng phần nào nhu cầu tìm kiếm ảnh, song nâng cao chất lượng tìm kiếm luôn là vấn đề được đặt ra. Bài toán xếp hạng ảnh là bài toán cốt lõi của các máy tìm kiếm ảnh, nâng cao chất lượng xếp hạng ả nh đã đang nhận được sự quan tâm đặc biệt. Đầu tiên, khóa luận khảo sát các thuật toán tính hạng ảnh, đặc biệt là VisualRank [39] theo độ đo tương đồng giữa các ảnh được tính theo các đặc trưng nội dung văn bản nội dung hiển thị. Sau đó, khóa luận đề xuất một mô hình hệ thống tìm kiếm ảnh lớp trên (image meta-search engine [18] [11]), trong đó sử dụng thuật toán nói trên làm thành phần xếp hạng ảnh. H ệ thống tìm kiếm ảnh này sử dụng mộtsở dữ liệu lưu trữ các câu truy vấn các ảnh tương ứng với chúng như một giải pháp nhằm rút ngắn thời gian đáp ứng yêu cầu truy vấn. Đồng thời, hệ thống sử dụng một bộ từ điển dùng trong việc hỗ trợ các truy vấn dạng tiếng Việt. Thực nghiệm do khóa luậ n tiến hành bước đầu đã thu được những kết quả tương đối khả quan, độ chính xác của hệ thống khi áp dụng thuật toán với đặc trưng văn bản đặc trưng hiển thị đạt 81.2%. Trong phạm vi các thử nghiệm của khóa luận, kết quả này là tốt hơn so với hai máy tìm kiếm ảnh lớn là Google Yahoo đã khẳng định được tính khả thi của mô hình. Mục lục Mở đầu 1  Chương 1. Khái quát về các thuật toán tính hạng 3  1.1.  Giới thiệu về bài toán tính hạng 3  1.2.  Tính hạng trang Web 4  1.2.1.  Tính hạng theo liên kết 4  1.2.2.  Tính hạng định hướng ngữ cảnh 15  1.3.  Tính hạng thực thể 17  1.4.  bộ về tính hạng ảnh 18  1.5.  Một số công trình nghiên cứu liên quan 20  Tóm tắt chương một 22  Chương 2. Một số thuật toán tính hạng ảnh phổ biến 23  2.1.  Giới thiệu 23  2.2.  VisualRank 23  2.3.  Multiclass VisualRank 26  2.4.  Visual contextRank 28  2.5.  Nhận xét 32  Tóm tắt chương hai 32  Chương 3. Mô hình máy tìm kiếm ảnh lớp trên 34  3.1.  Kiến trúc chung của máy tìm kiếm lớp trên 34  3.1.1.  Giao diện người dùng 35  3.1.2.  Bộ điều vận 35  3.1.3.  Bộ xử lý kết quả 36  3.1.4.  Mô đun tính hạng 36  3.2.  Mô hình máy tìm kiếm ảnh lớp trên MetaSEEk 37  3.2.1.  Truy vấn trực quan dựa trên nội dung 38  3.2.2.  Giao diện truy vấn 38  3.2.3.  Bộ điều vận 40  3.2.4.  Thành phần hiển thị 42  3.2.5.  Đánh giá 43  3.3.  Xếp hạng ảnh trong máy tìm kiếm ảnh lớp trên 43  Tóm tắt chương ba 45  Chương 4. Thử nghiệm 46  4.1.  Mô hình thử nghiệm 46  4.1.1.  Cách tiếp cận 46  4.1.2.  Mô hình đề xuất các thành phần trong mô hình 47  4.2.  Môi trường các thành phần trong hệ thống phần mềm 50  4.2.1.  Cấu hình phần cứng 50  4.2.2.  Các thành phần trong hệ thống phần mềm 50  4.3.  Xây dựng tập dữ liệu 52  4.3.1.  Tập truy vấn 52  4.3.2.  Tập máy tìm kiếm nguồn 53  4.3.3.  Từ điển 53  4.4.  Quy trình, các phương án thử nghiệm 53  4.5.  Kết quả thử nghiệm đánh giá 54  Kết luận 60  Tài liệu tham khảo 62  Danh sách các bảng Bảng 1. Ví dụ về bản ghi của một ảnh trongsở dữ liệu 42  Bảng 2. Cấu hình phần cứng sử dụng trong thực nghiệm 50  Bảng 3. Một số phần mềm sử dụng 50  Bảng 4. Một số thư viện sử dụng 50  Bảng 5. Độ chính xác trung bình trên 35 truy vấn 56  Danh sách hình vẽ Hình 1. Mô tả tính chất authority hub 13  Hình 2. Mở rộng tập cơ sở T từ tập nhân S 14  Hình 3. Một mô hình học xếp hạng trong máy tìm kiếm thực thể 18  Hình 4. Một minh họa về đồ thị độ tương đồng của ảnh 24  Hình 5. Biến đổi ma trận kề 27  Hình 6. Kết quả xếp hạng của 3 phương pháp với truy vấn “Notre Dame” 28  Hình 7. Mô hình xếp hạng ảnh sử dụng thuật toán ContextRank 29  Hình 8. Một ví dụ về biểu diễn visual words 32  Hình 9. Kiến trúc của một máy tìm kiếm lớp trên điển hình 34  Hình 10. Một thiết kế của bộ điều vận 35  Hình 11. Kiến trúc tổng thể của MetaSEEk 37  Hình 12. Giao diện hiển thị của MetaSEEk 39  Hình 13. Cấu trúc phân cấp của cơ sở dữ liệu 42  Hình 14. Mô hình đề xuất 48  Hình 15. Giao diện của chương trình 52  Hình 16. Biểu đồ so sánh độ chính xác trung bình giữa các hệ thống 57  Hình 17. Biểu đồ độ chính xác mức K của một số truy vấn tiếng Việt 58  Hình 18. 10 kết quả đầu tiên của truy vấn “sun” trong các máy tìm kiếm 59  Danh sách các từ viết tắt CSDL Cơ sở dữ liệu AP Average Precision Google CSE Google Custom Search Engine HIST Hypertext Induced Topic Search MAP Mean Average Precision SIFT Scale Invariant Feature Transform Danh sách các thuật ngữ STT Thuật ngữ tiếng Anh Nghĩa tiếng Việt 1 Content-based Image Ranking Xếp hạng ảnh dựa trên nội dung hiển thị 2 Content-based visual query Truy vấn trực quan dựa trên nội dung hiển thị 3 Display interface Thành phần hiển thị 4 Edge Cạnh 5 Image tag Thẻ ảnh 6 Inter-image Context Modeling Mô hình ngữ cảnh ngoại ảnh 7 Intra-mage Context Modeling Mô hình ngữ cảnh nội ảnh 8 Local features Các thuộc tính cục bộ 9 Offline Ngoại tuyến 10 Online Trực tuyến 11 Performance database Cơ sở dữ liệu hiệu suất 12 Performance score Điểm số hiệu suất 13 Query dispatcher Bộ điều vận truy vấn 14 Query translator Bộ dịch truy vấn 15 Random surfer model Mô hình duyệt ngẫu nhiên 16 Re-rank Xếp hạng lại 17 Scoring module Mô đun tính hạng 18 Text-based Image Ranking Xếp hạng ảnh dựa trên văn bản 19 Texture Kết cấu 20 Title Tiêu đề 21 Topic Sensitive PageRank PageRank theo chủ đề 22 Visual hyperlink Siêu liên kết trực quan 23 Visual vocabulary Tập từ vựng trực quan [...]... hạng ảnh phổ biến áp dụng trong hệ thống tìm kiếm ảnh lớp trên thử nghiệm nhằm khảo sát, phân tích các giải pháp phân hạng ảnh, đồng thời trình bày một mô hình máy tìm kiếm ảnh lớp trên thi hành giải pháp phân hạng ảnh trong máy tìm kiếm ảnh lớp trên thử nghiệm Khóa luận gồm những nội dung chính cơ bản như sau: Chương 1: Khái quát về các thuật toán tính hạng trình bày một số thuật toán tính hạng. .. điển hình đã đang được sử dụng rộng rãi trong các máy tìm kiếm Cùng với đó, chương này cũng nêu lên một số nét cơ bản về bài toán xếp hạng thực thể xếp hạng ảnh Đồng thời, chương 1 cũng đề cập đến một số công trình nghiên cứu liên quan ở trong nước trên thế giới Chương 2: Giới thiệu một số thuật toán tính hạng ảnh phổ biến tập trung trình bày một số thuật toán tính hạng ảnh dựa trên nội dung... hiển thị của ảnh Mỗi thuật toán đều được phân tích, đánh giá, đưa ra các ưu nhược điểm Từ đó, khóa luận đề xuất thuật toán tính hạng ảnh áp dụng VisualRank cho các đặc trưng hiển thị đặc trưng văn bản của ảnh Chương 3: Mô hình máy tìm kiếm ảnh lớp trên trình bày mô hình tổng quan của một máy tìm kiếm lớp trên Đồng thời, chương 3 đi chi tiết vào một mô hình tìm kiếm ảnh lớp trên MetaSEEk để tìm hiểu... lớn công việc tìm kiếm sẽ trở nên vô cùng khó khăn Để giải quyết vấn đề này, đã có các hệ thống tìm kiếm ảnh ra đời như: Yahoo, MSN, Google Image Search, Bing… Cũng như đối với các hệ thống tìm kiếm thông thường các hệ thống tìm kiếm thực thể khác, mô đun xếp hạngmột phần quan trọng cốt lõi trong máy tìm kiếm ảnh Hiện nay, bài toán xếp hạng ảnh đã trở thành một trong những bài toán điển hình... PageRank Phần lớn các nghiên cứu tìm kiếm Web là tập trung vào tìm kiếm các trang Web (tài liệu dạng văn bản) chỉ một số ít trong đó là về tìm kiếm các thông tin đa phương tiện trên Web (ảnh, video, MP3…) Tuy nhiên, trong những năm gần đây, vấn đề tìm kiếm xếp hạng các đối tượng đa phương tiện trên Web (đặc biệt là vấn đề tìm kiếm xếp hạng ảnh) đang trở thành một vấn đề thu hút được rất nhiều sự... tìm hiểu các thành phần cần thiết trong hệ thống máy tìm kiếm ảnh 1 lớp trên Từ đó, định hình ra những thành phần cần phải xây dựng mô hình máy tìm kiếm ảnh lớp trên định xây dựng Chương 4: Thực nghiệm đưa ra mô hình máy tìm kiếm ảnh lớp trên áp dụng thử nghiệm thuật toán đã được đề xuất ở chương 2 Chương này trình bày các thành phần của mô hình các công việc thực nghiệm mà khóa luận đã tiến hành... sát, phân tích các phương pháp học xếp hạng đang được quan tâm hiện nay từ đó đưa ra mô hình xếp hạng thực thể áp dụng vào máy tìm kiếm thực thể trong tiếng Việt, cụ thể là tìm kiếm thực thể thuốc học xếp hạng để tạo nhãn cho cụm tài liệu Các kết quả thu được đã chứng minh vai trò hiệu quả của học xếp hạng áp dụng vào máy tìm kiếm Nguyễn Hoàng Trung [5] đã tiến hành xây dựng thử nghiệm một. .. cứu về các thuật toán tính hạng ảnh và sau đó áp dụng vào việc xây dựng 1 http://vietnamnet.vn/cntt/2005/11/517349/ 21 một mô hình máy tìm kiếm lớp trên thử nghiệm cho ảnh Tôi tin rằng những nghiên cứu của mình là rất thiết thực sẽ là nền tảng cho những nghiên cứu tiếp theo của mình Tóm tắt chương một Trong chương một, khóa luận đã tập trung khảo sát, phân tích một số thuật toán tính hạng trang... của bức ảnh Dựa vào hai loại đặc trưng này của các ảnh trên Web, các thuật toán xếp hạng ảnh cũng phân thành hai hướng là: xếp hạng ảnh dựa theo nội dung hiển thị xếp hạng ảnh dựa theo văn bản Các máy tìm kiếm ảnh thông dụng hiện nay như: Google Image Search, Yahoo! Image Search, MSN, AltaVista, … xếp hạng các ảnh trả về dựa trên vùng văn bản đi kèm với ảnh Các hệ thống này cho phép người sử dụng nhập... các máy tìm kiếm thương mại bằng cách trích rút tập N ảnh trả về đầu tiên khi truy vấn vào các máy tìm kiếm thương mại thông thường, sau đó tiến hành xây dựng đồ thị tương đồng tính VisualRank chỉ trên tập con N ảnh này Thuật toán VisualRank trình bày một kỹ thuật đơn giản để kết hợp các lợi điểm trong việc sử dụng liên kết phân tích mạng cho tìm kiếm trang Web vào tìm kiếm ảnh Thuật toán đã . liên quan trong công trình nghiên cứu khoa học sinh viên. Khóa luận tốt nghiệp với đề tài Một số thuật toán phân hạng ảnh phổ biến và áp dụng trong hệ thống tìm kiếm ảnh lớp trên thử nghiệm nhằm. HỌC CÔNG NGHỆ Lê Thị Kim Dung MỘT SỐ THUẬT TOÁN PHÂN HẠNG ẢNH PHỔ BIẾN VÀ ÁP DỤNG TRONG HỆ THỐNG TÌM KIẾM ẢNH LỚP TRÊN THỬ NGHIỆM KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH. khảo sát, phân tích các giải pháp phân hạng ảnh, đồng thời trình bày một mô hình máy tìm kiếm ảnh lớp trên và thi hành giải pháp phân hạng ảnh trong máy tìm kiếm ảnh lớp trên thử nghiệm. Khóa

Ngày đăng: 27/06/2014, 16:20

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan