ÁP DỤNG PHẢN HỒI LIÊN QUAN TRONG NÂNG CAO CHẤT LƯỢNG TRA CỨU ẢNH DỰA VÀO NỘI DUNG

32 10 0
ÁP DỤNG PHẢN HỒI LIÊN QUAN TRONG NÂNG CAO CHẤT LƯỢNG TRA CỨU ẢNH DỰA VÀO NỘI DUNG

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ÁP DỤNG PHẢN HỒI LIÊN QUAN TRONG NÂNG CAO CHẤT LƯỢNG TRA CỨU ẢNH DỰA VÀO NỘI DUNG Chương 1. Tổng quan về tra cứu ảnh dựa vào nội dung. 1.1. Bài toán tra cứu ảnh. 1.2. Các đặc trưng trong tra cứu ảnh. 1.3. Các độ đo sử dụng trong tra cứu ảnh. 1.4. Kết luận chương 1. Chương 2. Phản hồi liên quan và ứng dụng trong tra cứu ảnh dựa vào nội dung. 2.1. Tra cứu khởi tạo. 2.2. Chiến lược phản hồi liên quan. 2.3. Ứng dụng phản hồi liên quan trong tra cứu ảnh dựa vào nội dung. 2.4. Kết luận chương 2. Chương 3. Cài đặt và đánh giá hệ thống. 3.1. Môi trường thực nghiệm. 3.2. Giao diện hệ thống. 3.3. Đánh gia và kết quả thực nghiệm 3.4. Kết luận chương 3. Kết luận và hướng nghiên cứu trong tương lai. Những kết quả đạt được. Những hạn chế và hướng phát triển. Kết luận. Chương 1. Tổng quan về tra cứu ảnh dựa vào nội dung. 1.1. Bài toán tra cứu ảnh. Ngày nay, lĩnh vực tra cứu ảnh nhận được sự quan tâm ngày càng lớn. Lý do một phần là sự phát triển của công nghệ chế tạo thiết bị thu nhận và lưu trữ ảnh cũng như sự phát triển mạnh mẽ của mạng Internet. Người sử dụng trong nhiều lĩnh vực khác nhau có cơ hội để truy cập và sử dụng các kho lưu trữ ảnh thuộc đủ loại chủ đề và với nhiều kiểu định dạng ảnh khác nhau. Các dạng nguồn đa phương tiện khác nhau (văn bản, tiếng nói, ảnh, video) đang tăng lên nhanh chóng, chẳng hạn dữ liệu được trực quan trong các điện thoại thông minh, các ứng dụng 2D3D, nội dung web... Thế giới đang chứng kiến một sự tiến hóa về lượng, sự sẵn có, độ phức tạp, sự đa dạng và sự quan trọng của các ảnh trong tất cả các lĩnh vực. Nhu cầu về các dịch vụ ảnh trở nên quan trọng hơn bao giờ hết. Các ảnh đóng một vai trò quan trọng trong một phạm vi rộng các ứng dụng và các lĩnh vực như giáo dục, chăm sóc y tế, dự báo thời tiết, nghiên cứu về tội phạm, quảng cáo, thiết kế nghệ thuật, web, phương tiện xã hội và giải trí. Tuy nhiên, phương tiện trực quan yêu cầu một lượng xử lý và lưu trữ đáng kể, cần có các phương pháp hiệu quả cao để đánh chỉ số, lưu trữ, phân tích và tra cứu thông tin trực quan từ các cơ sở dữ liệu ảnh. Do đó, tra cứu các ảnh nhanh, chính xác và hiệu quả cho tất cả các loại tập ảnh trở thành một trong những nhiệm vụ thách thức nhất. CBIR là một ứng dụng của các kỹ thuật thị giác máy tính đối với bài toán tra cứu ảnh. Mục tiêu của hệ thống CBIR là sử dụng nội dung trực quan của các ảnh để tìm các ảnh quan tâm từ một cơ sở dữ liệu ảnh lớn. “Tra cứu ảnh dựa vào nội dung có nghĩa là tra cứu sẽ phân tích nội dung của ảnh hơn là các siêu dữ liệu như từ khóa, thẻ và các mô tả văn bản đi kèm với ảnh. Thuật ngữ nội dung ở đây được hiểu là màu, hình dạng, kết cấu hoặc bất cứ một thông tin nào mà có thể lấy ra từ bản thân ảnh. Trong CBIR, các ảnh có thể được tra cứu hoặc sử dụng các đặc trưng mức thấp hoặc sử dụng các đặc trưng mức cao hay các đặc trưng ngữ nghĩa. Kiến trúc của hệ thống tra cứu ảnh dựa vào nội dung được chỉ ra trên Hình 1.1.1.

TRƯỜNG ĐẠI HỌC ĐIỆN LỰC KHOA CÔNG NGHỆ THÔNG TIN ĐỒ ÁN TỐT NGHIỆP ĐỀ TÀI: ÁP DỤNG PHẢN HỒI LIÊN QUAN TRONG NÂNG CAO CHẤT LƯỢNG TRA CỨU ẢNH DỰA VÀO NỘI DUNG Sinh viên thực : NGUYỄN TRỌNG KIÊN Mã sinh viên : 1681310038 Giảng viên hướng dẫn : THS PHƯƠNG VĂN CẢNH Ngành : CÔNG NGHỆ THÔNG TIN Chuyên ngành : CÔNG NGHỆ PHẦN MỀM Lớp : D11CNPM Khóa : 2016-2021 Hà Nội, tháng 12 năm 2021 PHIẾU CHẤM ĐIỂM Sinh viên thực hiện: Họ tên Chữ ký Ghi Chữ ký Ghi Nguyễn Trọng Kiên Giảng viên chấm: Họ tên Giảng viên chấm : Giảng viên chấm : Giảng viên chấm : Mục lục LỜI CAM ĐOAN Lời cảm ơn Lời nói đầu Chương Tổng quan tra cứu ảnh dựa vào nội dung .8 1.1 Bài toán tra cứu ảnh .8 1.2 Các đặc trưng tra cứu ảnh 1.2.1 Đặc trưng màu sắc 1.2.2 Đặc trưng kết cấu 11 1.2.3 Đặc trưng hình dạng 12 1.2.4 Đặc trưng không gian 12 1.3 Các độ đo sử dụng tra cứu ảnh 14 1.3.1 Khoảng cách Minkoski 14 1.3.2 Khoảng cách Mahalanobis: 14 1.3.3 Khoảng cách Cosine 15 1.3.4 Khoảng cách Kullback-Leibler Jeffrey divergence 15 1.3.5 Khoảng cách Hamming 15 1.3.6 Khoảng cách Earth Mover 16 1.3.7 Khoảng cách Euclid 17 1.4 Kết luận chương .18 Chương Phản hồi liên quan ứng dụng tra cứu ảnh dựa vào nội dung 19 2.1 Tra cứu khởi tạo .21 2.2 Chiến lược phản hồi liên quan .23 2.3 Ứng dụng phản hồi liên quan tra cứu ảnh dựa vào nội dung 25 2.4 Kết luận chương 25 Chương Cài đặt đánh giá hệ thống 26 3.1 Môi trường thực nghiệm 26 3.2 Giao diện hệ thống 26 3.3 Đánh giá kết thực nghiệm 27 3.4 Kết luận chương 27 Kết luận hướng nghiên cứu tương lai 28 Kết đạt .28 Những hạn chế hướng phát triển .28 Kết luận 28 Tài liệu tham khảo .29 Hình 1.1 Kiến trúc hệ thống tra cứu ảnh dựa vào nội dung .9 Hình 2.1 Mơ hình hoạt động hệ thống tra cứu ứng dụng phản hồi liên quan 20 LỜI CAM ĐOAN Tôi xin cam đoan đồ án “Áp dụng phản hồi liên quan nâng cao chất lượng tra cứu ảnh dựa vào nội dung” tơi thực hướng dẫn giảng viên hướng dẫn ThS Phương Văn Cảnh Tất tham khảo từ nghiên cứu liên quan nêu nguồn gốc cách rõ ràng từ danh mục tài liệu tham khảo đồ án Trong đồ án, khơng có việc sử dụng tài liệu, cơng trình nghiên cứu người khác mà không rõ tài liệu tham khảo Các chương trình thực nghiệm tơi thực mà có được, khơng chép từ nguồn Hà Nội ngày 31 tháng 12 năm 2020 Sinh viên Nguyễn Trọng Kiên Lời cảm ơn Trong lời báo cáo đồ án tốt nghiệp “Áp dụng phản hồi liên quan nâng cao chất lượng tra cứu ảnh dựa vào nội dung” này, em muốn gửi lời cám ơn biết ơn chân thành tới tất người hỗ trợ, giúp đỡ em kiến thức tinh thần trình thực đồ án Trước hết, em xin chân thành cám ơn Thầy Giáo - Ths Phương Văn Cảnh, Giảng viên Khoa Công Nghệ Thông Tin, Trường Đại học Điện Lực, người trực tiếp hướng dẫn, nhận xét, giúp đỡ em suốt trình thực đồ án Xin chân thành cảm ơn thầy cô Khoa Cơng Nghệ Thơng Tin phịng ban nhà trường tạo điều kiện tốt cho em bạn khác suốt thời gian học tập làm tốt nghiệp Cuối em xin gửi lời cảm ơn đến gia đình, bạn bè, người thân giúp đỡ động viên em nhiều trình học tập làm Đồ án Tốt Nghiệp Do thời gian thực có hạn, kiến thức cịn nhiều hạn chế nên Đồ án thực chắn không tránh khỏi thiếu sót định Em mong nhận ý kiến đóng góp thầy giáo bạn để em có thêm kinh nghiệm tiếp tục hồn thiện đồ án Em xin chân thành cảm ơn! Sinh viên thực Kiên Nguyễn Trọng Kiên Lời nói đầu Ngày nay, lĩnh vực tra cứu ảnh nhận quan tâm ngày lớn Lý phần phát triển công nghệ chế tạo thiết bị thu nhận lưu trữ ảnh phát triển mạnh mẽ mạng Internet Người sử dụng nhiều lĩnh vực khác có hội để truy cập sử dụng kho lưu trữ ảnh thuộc đủ loại chủ đề với nhiều kiểu định dạng ảnh khác Phương pháp tra cứu ảnh theo nội dung (Content-Based Image Retrieval) sử dụng nội dung trực quan ảnh màu sắc, hình dạng, kết cấu (texture) phân bố không gian để thể đánh số ảnh Trong hệ thống tra cứu ảnh theo nội dung điển hình nội dung trực quan ảnh trích chọn mơ tả véctơ đặc trưng nhiều chiều Tập hợp véctơ đặc trưng ảnh sở liệu ảnh tạo thành sở liệu đặc trưng Hệ thống chuyển mẫu thành véc tơ đặc trưng tính tốn giống (hay độ tương tự) véc tơ đặc trưng ảnh mẫu véc tơ đặc trưng ảnh sở liệu Sau việc tra cứu tiến hành với trợ giúp sơ đồ đánh số Sử dụng sơ đồ đánh số cách hiệu để tìm kiếm sở liệu ảnh Cấu trúc đề tài: Chương Tổng quan tra cứu ảnh dựa vào nội dung 1.1 Bài toán tra cứu ảnh 1.2 Các đặc trưng tra cứu ảnh 1.3 Các độ đo sử dụng tra cứu ảnh 1.4 Kết luận chương Chương Phản hồi liên quan ứng dụng tra cứu ảnh dựa vào nội dung 2.1 Tra cứu khởi tạo 2.2 Chiến lược phản hồi liên quan 2.3 Ứng dụng phản hồi liên quan tra cứu ảnh dựa vào nội dung 2.4 Kết luận chương Chương Cài đặt đánh giá hệ thống 3.1 Môi trường thực nghiệm 3.2 Giao diện hệ thống 3.3 Đánh gia kết thực nghiệm 3.4 Kết luận chương Kết luận hướng nghiên cứu tương lai - Những kết đạt - Những hạn chế hướng phát triển - Kết luận Chương Tổng quan tra cứu ảnh dựa vào nội dung 1.1 Bài toán tra cứu ảnh Ngày nay, lĩnh vực tra cứu ảnh nhận quan tâm ngày lớn Lý phần phát triển công nghệ chế tạo thiết bị thu nhận lưu trữ ảnh phát triển mạnh mẽ mạng Internet Người sử dụng nhiều lĩnh vực khác có hội để truy cập sử dụng kho lưu trữ ảnh thuộc đủ loại chủ đề với nhiều kiểu định dạng ảnh khác Các dạng nguồn đa phương tiện khác (văn bản, tiếng nói, ảnh, video) tăng lên nhanh chóng, chẳng hạn liệu trực quan điện thoại thông minh, ứng dụng 2D/3D, nội dung web Thế giới chứng kiến tiến hóa lượng, sẵn có, độ phức tạp, đa dạng quan trọng ảnh tất lĩnh vực Nhu cầu dịch vụ ảnh trở nên quan trọng hết Các ảnh đóng vai trị quan trọng phạm vi rộng ứng dụng lĩnh vực giáo dục, chăm sóc y tế, dự báo thời tiết, nghiên cứu tội phạm, quảng cáo, thiết kế nghệ thuật, web, phương tiện xã hội giải trí Tuy nhiên, phương tiện trực quan yêu cầu lượng xử lý lưu trữ đáng kể, cần có phương pháp hiệu cao để đánh số, lưu trữ, phân tích tra cứu thông tin trực quan từ sở liệu ảnh Do đó, tra cứu ảnh nhanh, xác hiệu cho tất loại tập ảnh trở thành nhiệm vụ thách thức CBIR ứng dụng kỹ thuật thị giác máy tính tốn tra cứu ảnh Mục tiêu hệ thống CBIR sử dụng nội dung trực quan ảnh để tìm ảnh quan tâm từ sở liệu ảnh lớn “Tra cứu ảnh dựa vào nội dung có nghĩa tra cứu phân tích nội dung ảnh siêu liệu từ khóa, thẻ mô tả văn kèm với ảnh Thuật ngữ nội dung hiểu màu, hình dạng, kết cấu thông tin mà lấy từ thân ảnh Trong CBIR, ảnh tra cứu sử dụng đặc trưng mức thấp sử dụng đặc trưng mức cao hay đặc trưng ngữ nghĩa Kiến trúc hệ thống tra cứu ảnh dựa vào nội dung Hình 1.1.1 Hình 1.1 Kiến trúc hệ thống tra cứu ảnh dựa vào nội dung 1.2 Các đặc trưng tra cứu ảnh Các đặc trưng ảnh bao gồm đặc tính đặc tính ngữ nghĩa/logic Các đặc tính là: màu sắc (color), hình dạng (shape), kết cấu (texture), vị trí khơng gian (spatial location) Chúng trích xuất tự động bán tự động Đặc tính logic cung cấp mơ tả trừu tượng liệu hình ảnh cấp độ khác Thơng thường, đặc tính logic chiết xuất tay bán tự động Một nhiều đặc trưng sử dụng ứng dụng cụ thể 1.2.1 Đặc trưng màu sắc Đặc trưng màu đặc trưng thị giác rộng quan hệ chặt chẽ với đối tượng ảnh, tiền cảnh, Màu đặc trưng trực quan mạnh khơng phụ thuộc vào trạng thái nội dung ảnh hướng, cỡ góc Các biểu diễn màu phổ biến lược đồ màu, mô men màu, tương quan màu ma trận đồng màu Không gian màu phân lớp thành khơng gian màu tuyến tính (tức RGB, XYZ, CMY, YIQ YUV) không gian màu phi tuyến (tức L*a*b, HSV, Nxyz L*u*v) Không gian màu RGB khơng gian màu cộng tính Khoảng cách Earth Mover mạnh kỹ thuật đối sánh dựa vào lược đồ có nhiều ưu điểm so với xác định khác khoảng cách phân bố 21 Đầu tiên, khoảng cách Earth Mover áp dụng dấu hiệu mà gộp lược đồ Điều giữ ưu điểm nén mềm dẻo dấu hiệu lợi ích việc xử lý cấu trúc có cỡ thay đổi độ đo khoảng cách Thứ hai, chi phí Earth Mover phản ảnh khái niệm gần mà không cần tồn vấn đề lượng tử hóa hầu hết độ đo khác Thứ ba, khoảng cách Earth Mover đưa đối sánh phần, chẳng hạn, để xử lý với hỗn loạn đút nút ứng dụng tra cứu ảnh Thứ tư, khoảng cách độ đo với tổng trọng số ngang hai dấu hiệu, khoảng cách Earth Mover cho phép không gian ảnh với cấu trúc độ đo 1.3.7 Khoảng cách Euclid Khoảng cách Euclid hai điểm p q chiều dài đoạn thẳng Trong hệ tọa độ Descartes, p = (p1, p2, , pn) q = (q1, q2, , qn) hai điểm khơng gian Euclid n chiều, khoảng cách từ p đến q bằng: Dạng chuẩn Euclid khoảng cách điểm đến điểm gốc không gian Euclid: phương trình sau tích vơ hướng Đây chiều dài p, ta xem Véc-tơ Euclid có gốc nằm gốc tọa độ Khoảng cách 1.4 Kết luận chương Trong chương trình bày đặc trưng mức thấp ảnh, cấu trúc hệ thống tra cứu ảnh dựa vào đặc trưng mức thấp phân tích số phương 17 pháp tra cứu ảnh dựa vào đặc trưng mức thấp Bên cạnh đó, đồ án trình bày số phương pháp giảm khoảng cách ngữ nghĩa theo cách tiếp cận phản hồi liên quan Một số kỹ thuật tra cứu ảnh với ngữ nghĩa mức cao phân tích 18 Chương Phản hồi liên quan ứng dụng tra cứu ảnh dựa vào nội dung 19 Hình 2.1 Mơ hình hoạt động hệ thống tra cứu ứng dụng phản hồi liên quan 20 2.1 Tra cứu khởi tạo Một hệ thống tra cứu dựa vào nội dung tiêu biểu chia thành hai pha: trích rút đặc trưng ngoại tuyến tra cứu ảnh trực tuyến Trong pha ngoại tuyến, hệ thống trích rút tự động thuộc tính trực quan mức thấp (mầu, kết cấu hình dạng) Trong pha tra cứu ảnh, người dùng cung cấp ảnh mẫu cho hệ thống tra cứu để tìm kiếm ảnh mong muốn Hệ thống tra cứu ảnh biểu diễn ảnh mẫu véc tơ đặc trưng khoảng cách (hoặc độ tương tự) véc tơ đặc trưng ảnh mẫu ảnh sở liệu đặc trưng tính tốn Cuối hệ thống phân hạng ảnh theo thứ tự tăng dần khoảng cách hay giảm dần độ tương tự trả cho người dùng Nếu không thỏa mãn với kết tra cứu, người dùng cung cấp phản hồi liên quan cho hệ thống tra cứu, hệ thống học nhu cầu thông tin người dùng Hình 21 22 Tiến hành tra cứu khởi tạo với tập ảnh dataset ảnh truy vấn có kích thước 120x80 pixels Các ảnh sử dụng ba đặc trưng màu sắc (histogram), hình dạng (hu moment), kết cấu (haralick) để phân tích ngữ nghĩa Kết phân tích trả dạng vector có 531 chiều, đặc trưng màu sắc chiếm 512 chiều, đặc trưng hình dạng chiếm chiều, đặc trưng kết cấu chiếm 13 chiều Sau phân tích ta vector trích chọn đặc trưng ảnh truy vấn mảng n vector trích chọn đặc trưng tập ảnh dataset (với n số ảnh tập dataset) Sau có kết phân tích, tiến hành tính trung bình trích chọn đặc trưng tập dataset với trích chọn đặc trưng ảnh truy vấn Việc tính khoảng cách biết độ tương tự giửa ảnh tập dataset với ảnh truy vấn, từ ta xác định ảnh có khả mang ngữ nghĩa giống với ảnh truy vấn Độ đo Euclid phương pháp tính nhanh chóng, xác thuận tiện với cơng thức: Sau tính tốn khoảng cách, ta có tập ảnh kết với độ tương tự giảm dần (hay khoảng cách so với ảnh truy vấn tăng dần) Đây tập truy vấn khởi tạo 2.2 Chiến lược phản hồi liên quan Phản hồi liên quan (RF - Relevance Feedback) trình trực tuyến mà cố gắng học mục đích người dùng q trình cơng cụ mạnh sử dụng truyền thống hệ thống tra cứu thơng tin Mục đích mang người dùng vào lặp tra cứu để giảm khoảng cách ngữ nghĩa mà truy vấn biểu diễn người dùng nghĩ Bằng việc tiếp tục học thông qua tương tác với người dùng cuối, phản hồi liên quan cung cấp cải tiến hiệu đáng kể hệ thống CBIR Khi có kết tra cứu khởi tạo, người dùng chọn ảnh liên quan danh sách kết để làm mẫu có nhãn Dựa tập mẫu huấn luyện này, thuật toán máy học thực để điều chỉnh tham số Dựa tham số vừa học, tra cứu ảnh thực Quá trình lặp lại 23 người dùng thỏa mãn Hình 1.1.2 chế hoạt động phản hồi liên quan CBIR Hình 2.2 Cơ chế hoạt động phản hồi liên quan CIBR Để bắt chước hành vi người, thực nghiệm thực mô phản hồi liên quan thử nghiệm Đầu tiên, truy vấn khởi tạo thực để tạo kết truy vấn khởi tạo Tiếp theo, để mô tương tác người dùng việc chọn k ảnh liên quan từ kết tra cứu khởi tạo dựa vào tập thực Những ảnh liên quan từ việc phản hồi phân thành cụm trọng tâm cụm dùng để hình thành truy vấn thực theo cách tiếp cận truy vấn đa điểm lõm, sau kết tra cứu gộp lại để tạo danh sách kết tổng hợp Phản hồi liên quan thực theo chiến lược chọn ảnh liên quan (dựa vào tập thực sự) danh sách kết Trong chiến lược này, trường hợp xấu khơng có ảnh liên quan ngồi ảnh truy vấn 24 trường hợp tốt có k-1 ảnh liên quan ngồi ảnh truy vấn Do đó, số lượng ảnh liên quan dao động từ đến k ảnh (bao gồm ảnh truy vấn) Chiến lược sử dụng để mô người dùng thực tế thực nghiệm đánh giá phương pháp đề xuất Từ k ảnh gán nhãn, tiếp tục trích chọn đặc trưng ảnh thu k vector Tiến hành tính trung bình k vector, thu vector đặc trưng k ảnh gán nhãn gọi Vtb Vector Vtb thay cho vector ảnh truy vấn ban đầu, thực truy vấn phản hồi liên quan lại tập dataset với vector Vtb Từ danh sách kết thu sau hai lần truy vấn thấy số lượng độ xác cải thiện, số lượng ảnh có độ tương tự với ảnh truy vấn tăng lên 2.3 Ứng dụng phản hồi liên quan tra cứu ảnh dựa vào nội dung OpenCV thư viện mã nguồn mở hàng đầu cho thị giác máy tính (computer vision), xử lý ảnh máy học, tính tăng tốc GPU hoạt động thời gian thực OpenCV thư viện mạnh mẽ việc hỗ trợ xử lý phân tích hình ảnh Lược đồ histogram tính tốn hàm calcHist() với đầu vào ma trận ảnh HSV tham số khác Kết trả vector 512 chiều Đặc trung hình dạng tính hàm HuMoments() Kết trả vector chiều Đặc trưng kết cấu 25 Tính vector đặc trưng Tính khoảng cách Tính trung bình vector đặc trưng 2.4 Kết luận chương Ở chương nêu quy trình thực truy vấn khởi tạo việc ứng dụng phản hồi liên quan tra cứu ảnh dựa vào nội dung, tiền đề để phát triển cài đặt hệ thống chương sau 26 Chương Cài đặt đánh giá hệ thống 3.1 Môi trường thực nghiệm - Cơ sở liệu ảnh: Cơ sở liệu sử dụng cho thử nghiệm tập Corel Tập gồm 34 loại2, loại có 100 ảnh, cụ thể là: 290, 700, 750, 770, 840, 1040, 1050, 1070, 1080, 1090, 1100, 1120, 1340, 1350, 1680, 2680, 2890, 3260, 3510, 3540, 3910, 4150, 4470, 4580, 4990, 5210, 5350, 5530, 5810, 5910, 6440, 6550, 6610, 6840 Tất ảnh tập ảnh có tính chất chứa đối tượng tiền cảnh bật Cỡ ảnh có max(chiều rộng, chiều cao)=384 min(chiều rộng, chiều cao)=256 - Véc tơ đặc trưng: Sử dụng đặc trưng ảnh đặc trưng màu, đặc trưng kết cấu, đặc trưng hình dạng 3.2 Giao diện hệ thống  Giao diện hiển thị ban đầu 27  Tải ảnh truy tập dataset 3.3 Đánh giá kết thực nghiệm Thực nghiệm thực chạy 3400 truy vấn cấu hình để nhận độ xác trung bình Bên cạnh đó, có lần lặp phản hồi dùng thực nghiệm Các kết quả, độ xác trung bình 3400 truy vấn, thể số liệu 3.4 Kết luận chương Ở chương này, thực truy vấn hình ảnh lần phản hồi liên quan Kết nhận có độ xác tương đối cao hai lần truy vấn 28 Kết luận hướng nghiên cứu tương lai Kết đạt - Thực truy vấn khởi tạo - Thực truy vấn phản hồi Những hạn chế hướng phát triển - Kết truy vấn chưa thực xác - Thực nghiệm CSDL ảnh có kích thước lớn đa dạng - Sẽ ứng thuật tốn machine learning để cải thiện độ xác cho tốn - Tích hợp kỹ thuật học sâu vào hệ thống tra cứu - Tiếp tục nghiên cứu giải pháp giảm khoảng cách ngữ nghĩa Kết luận 29 Tài liệu tham khảo - [CT1] Quynh Dao Thi Thuy, Quynh Nguyen Huu, Canh Phuong Van, Tao Ngo Quoc (2017), An efficient semantic –Related image retrieval method, Expert Systems with Applications, Volume 72, pp 30-41 (SCIE) - [CT2] Quynh Nguyen Huu, Quynh Dao Thi Thuy, Canh Phuong Van, Can Nguyen Van, Tao Ngo Quoc, An efficient image retrieval method using adaptive weights,Applied Intelligence,Volume 48,pp 3807–3826, (SCI) 30 Ý kiến người hướng dẫn Sinh viên thực ThS Phương Văn Cảnh Nguyễn Trọng Kiên 31 ... ảnh dựa vào nội dung 1.1 Bài toán tra cứu ảnh 1.2 Các đặc trưng tra cứu ảnh 1.3 Các độ đo sử dụng tra cứu ảnh 1.4 Kết luận chương Chương Phản hồi liên quan ứng dụng tra cứu ảnh dựa vào nội dung. .. Chương Phản hồi liên quan ứng dụng tra cứu ảnh dựa vào nội dung 19 2.1 Tra cứu khởi tạo .21 2.2 Chiến lược phản hồi liên quan .23 2.3 Ứng dụng phản hồi liên quan tra cứu. .. pháp giảm khoảng cách ngữ nghĩa theo cách tiếp cận phản hồi liên quan Một số kỹ thuật tra cứu ảnh với ngữ nghĩa mức cao phân tích 18 Chương Phản hồi liên quan ứng dụng tra cứu ảnh dựa vào nội dung

Ngày đăng: 12/02/2022, 00:20

Mục lục

  • LỜI CAM ĐOAN

  • Lời cảm ơn

  • Lời nói đầu

  • Chương 1. Tổng quan về tra cứu ảnh dựa vào nội dung.

    • 1.1. Bài toán tra cứu ảnh.

    • 1.2. Các đặc trưng trong tra cứu ảnh.

      • 1.2.1. Đặc trưng màu sắc.

      • 1.2.2. Đặc trưng kết cấu.

      • 1.2.3. Đặc trưng hình dạng.

      • 1.2.4. Đặc trưng không gian.

      • 1.3. Các độ đo sử dụng trong tra cứu ảnh.

        • 1.3.1. Khoảng cách Minkoski.

        • 1.3.2. Khoảng cách Mahalanobis:

        • 1.3.3. Khoảng cách Cosine.

        • 1.3.4. Khoảng cách Kullback-Leibler và Jeffrey divergence.

        • 1.3.5. Khoảng cách Hamming.

        • 1.3.6. Khoảng cách Earth Mover

        • 1.3.7. Khoảng cách Euclid.

        • 1.4. Kết luận chương 1.

        • Chương 2. Phản hồi liên quan và ứng dụng trong tra cứu ảnh dựa vào nội dung.

          • 2.1. Tra cứu khởi tạo.

          • 2.2. Chiến lược phản hồi liên quan.

          • 2.3. Ứng dụng phản hồi liên quan trong tra cứu ảnh dựa vào nội dung.

          • 2.4. Kết luận chương 2.

Tài liệu cùng người dùng

Tài liệu liên quan