LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH: PHƯƠNG PHÁP TRA CỨU ẢNH DỰA VÀO PHÂN CỤM ẢNH VÀ ỨNG DỤNG VÀO BÀI TOÁN TRA CỨU ẢNH PHONG CẢNH

22 842 1
LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH: PHƯƠNG PHÁP TRA CỨU ẢNH DỰA VÀO PHÂN CỤM ẢNH  VÀ ỨNG DỤNG VÀO BÀI TOÁN TRA CỨU  ẢNH PHONG CẢNH

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

MỞ ĐẦU Tra cứu ảnh dựa theo nội dung là kỹ thuật cho phép trích chọn các đặc điểm dựa vào nội dung trực quan của ảnh như màu sắc, kết cấu, hình dạng và bố cục không gian của ảnh để làm cơ sở cho việc tra cứu, sắp xếp, tổ chức CSDL ảnh. Tuy nhiên, khi CSDL ảnh lớn thì phương pháp tìm kiếm ảnh tuần tự sẽ tốn rất nhiều thời gian. Để tăng tốc hệ thống tra cứu ảnh dựa vào nội dung, cần có một số kỹ thuật tra cứu ảnh nhanh. Đề t ài Phương pháp tra cứu ảnh dựa vào phân cụm ảnh và ứng dụng vào bài toán tra cứu ảnh phong cảnh trình bày ứng dụng thuật toán phân cụm có thứ bậc (Agglomerative Hierarchical Clustering) vào bài toán tra cứu ảnh dựa vào nội dung sử dụng đặc trưng màu với mục đích phân tập ảnh trong CSDL thành các cụm ảnh có màu sắc tương tự nhau, khi tiến hành tra cứu hệ thống chỉ phải so sánh ảnh truy vấn với cụm ảnh tương tự nhất mà không phải so sánh trên toàn bộ ảnh trong CSDL. Luận văn được bố cục thành 3 chương: Chương 1: Giới thiệu tổng quan về tra cứu ảnh dựa vào nội dung, kỹ thuật đánh chỉ số ảnh, một số hạn chế của các phương pháp tra cứu ảnh và nội dung nghiên cứu của đề tài. Chương 2: Trình bày kỹ thuật phân cụm có thứ bậc (Agglomerative Hierarchical Clustering AHC) áp dụng cho bài toán tra cứu ảnh dựa vào nội dung sử dụng đặc trưng màu sắc. Chương 3: Trình bày thiết kế và xây dựng hệ thống thực nghiệm tra cứu ảnh ứng dụng kỹ thuật phân cụm có thứ bậc (AHC) vào bài toán tra cứu ảnh phong cảnh. Cuối cùng chúng tôi đưa ra một số kết luận và đề xuất các hướng nghiên cứu.

BỘ GIÁO DỤC ĐÀO TẠO TẬP ĐOÀN BƯU CHÍNH VIỄN THÔNG VIỆT NAM HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG NGUYỄN QUỲNH ANH PHƯƠNG PHÁP TRA CỨU ẢNH DỰA VÀO PHÂN CỤM ẢNH ỨNG DỤNG VÀO BÀI TOÁN TRA CỨU ẢNH PHONG CẢNH CHUYÊN NGÀNH : KHOA HỌC MÁY TÍNH MÃ SỐ: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH HÀ NỘI – 2011 Luận văn được hoàn thành tại: Học viện Công nghệ Bưu chính Viễn thông Tập đoàn Bưu chính Viễn thông Việt Nam Người hướng dẫn khoa học: Pgs.Ts Ngô Quốc Tạo Phản biện 1: …………………………………………………… …………………………………………………… Phản biện 2: …………………………………………………… …………………………………………………… Luận văn sẽ được bảo vệ trước hội đồng chấm luận văn tại Học viện Công nghệ Bưu chính Viễn thông Vào lúc: giờ ngày tháng năm MỞ ĐẦU Tra cứu ảnh dựa theo nội dung là kỹ thuật cho phép trích chọn các đặc điểm dựa vào nội dung trực quan của ảnh như màu sắc, kết cấu, hình dạng bố cục không gian của ảnh để làm cơ sở cho việc tra cứu, sắp xếp, tổ chức CSDL ảnh. Tuy nhiên, khi CSDL ảnh lớn thì phương pháp tìm kiếm ảnh tuần tự sẽ tốn rất nhiều thời gian. Để tăng tốc hệ thống tra cứu ảnh dựa vào nội dung, cần có một số kỹ thuật tra cứu ảnh nhanh. Đề tài "Phương pháp tra cứu ảnh dựa vào phân cụm ảnh ứng dụng vào bài toán tra cứu ảnh phong cảnh " trình bày ứng dụng thuật toán phân cụm có thứ bậc (Agglomerative Hierarchical Clustering) vào bài toán tra cứu ảnh dựa vào nội dung sử dụng đặc trưng màu với mục đích phân tập ảnh trong CSDL thành các cụm ảnh có màu sắc tương tự nhau, khi tiến hành tra cứu hệ thống chỉ phải so sánh ảnh truy vấn với cụm ảnh tương tự nhất mà không phải so sánh trên toàn bộ ảnh trong CSDL. Luận văn được bố cục thành 3 chương: Chương 1: Giới thiệu tổng quan về tra cứu ảnh dựa vào nội dung, kỹ thuật đánh chỉ số ảnh, một số hạn chế của các phương pháp tra cứu ảnh nội dung nghiên cứu của đề tài. Chương 2: Trình bày kỹ thuật phân cụm có thứ bậc (Agglomerative Hierarchical Clustering -AHC) áp dụng cho bài toán tra cứu ảnh dựa vào nội dung sử dụng đặc trưng màu sắc. Chương 3: Trình bày thiết kế xây dựng hệ thống thực nghiệm tra cứu ảnh ứng dụng kỹ thuật phân cụm có thứ bậc (AHC) vào bài toán tra cứu ảnh phong cảnh. Cuối cùng chúng tôi đưa ra một số kết luận đề xuất các hướng nghiên cứu. Chương 1 TỔNG QUAN VỀ TRA CỨU ẢNH DỰA VÀO NỘI DUNG 1.1 GIỚI THIỆU TỔNG QUAN VỀ TRA CỨU ẢNH DỰA VÀO NỘI DUNG 1.1.1 Giới thiệu chung Sự phát triển mạnh mẽ của công nghệ ảnh số làm số lượng ảnh lưu trữ trên web tăng lên một cách nhanh chóng. Để tìm kiếm bức ảnh theo mong muốn là rất khó khăn. Các kỹ thuật tra cứu ảnh được thực hiện chủ yếu theo hai hướng: kỹ thuật dựa vào văn bản mô tả ảnh, kỹ thuật dựa vào nội dung ảnh. Kỹ thuật tra cứu ảnh dựa vào văn bản đó là sử dụng các từ khóa để mô tả nội dung ảnh, kỹ thuật này có các hạn chế sau: - Sử dụng tập từ khoá mô tả ảnh rất lớn phức tạp - Cần nguồn nhân lực xây dựng các từ khoá đối với mỗi ảnh. - Việc mô tả phụ thuộc vào cảm nhận chủ quan của người xây dựng. Kỹ thuật tra cứu ảnh dựa vào nội dung là sử dụng kỹ thuật trích rút đặc trưng thị giác một cách tự động để cho ra các mô tả nội dung ảnh một cách trực tiếp từ chính bản thân ảnh. Kỹ thuật tra cứu này đã khắc phục được các khó khăn ở trên Hiện nay trên thị trường có nhiều các hệ thống tìm kiếm ảnh theo nội dung đã ra đời như: Google Image Swirl, Tiltomo, Byo Image Search 1.1.2 Đặc trưng thị giác trong tra cứu ảnh dựa vào nội dung Các đặc trưng ảnh bao gồm: Đặc trưng màu: là tiến hành tính toán biểu đồ màu cho mỗi ảnh để xác định tỉ trọng các điểm ảnh của ảnh mà chứa các giá trị đặc biệt. Đặc trưng kết cấu: Kết cấu là tập các điểm trong một vùng thỏa mãn ràng buộc hay qui luật nào đó. Các phương pháp biểu diễn kết cấu có thể được chia thành hai loại: các phương pháp cấu trúc các phương pháp thống kê. Đặc trưng hình dạng: Các đặc trưng hình dạng có quan hệ chặt chẽ với mô tả vùng hoặc các đối tượng được phân đoạn. Đặc trưng hình dạng được trích rút từ các đường bao đối tượng hoặc vùng chứa đối tượng. 1.1.3 Kiến trúc của hệ thống tra cứu ảnh dựa vào nội dung. Kiến trúc chung của hệ thống tra cứu ảnh gồm 2 phần: Phần 1 : Tạo lập CSDL ảnh cùng với thông tin đặc trưng Phần 2 : Tra cứu ảnh Hình 1.2: Kiến trúc hệ thống tra cứu ảnh dựa vào nội dung 1.1.4 Giới thiệu một số hệ thống tra cứu ảnh Dựa trên các nghiên cứu về tra cứu ảnh dựa vào nội dung ảnh, một số hệ thống tra cứu ảnh đã được đưa vào sử dụng thương mại như: QBIC, RetrievalWare, VisualSEEk WebSeek, Google Image Swirl, Tiltomo, Byo Image Search…vv 1.2 KỸ THUẬT ĐÁNH CHỈ SỐ ẢNH Mô hình được hoạt động như sau (xem hình 1.6): Bước 1: Chuyển đổi các đối tượng trong tập ảnh thành các vector đặc trưng. Bước 2: Đo khoảng cách hoặc đo độ tương tự giữa hai vector đặc trưng của hai ảnh bất kỳ. Bước 3: Đánh chỉ số cho các vector đặc trưng tạo thành lược đồ Bước 4: Thực hiện truy vấn ảnh dựa trên lược đồ đánh chỉ số. Hình 1.6: Mô hình truy vần sử dụng kỹ thuật đánh chỉ số trong các ứng dụng đa phương tiện 1.2.1 Kỹ thuật đánh chỉ số nhiều chiều Kỹ thuật đánh chỉ số trong tra cứu ảnh dựa vào nội dung hay trong khai phá dữ liệu đa phương tiện chính là việc gán một mô tả phù hợp cho dữ liệu để có thể phát hiện ra nội dung thông tin của dữ liệu. Mô tả của dữ liệu được trích chọn dựa trên các đặc trưng của dữ liệu. Mô tả nội dung này được tổ chức thành các cấu trúc truy cập phù hợp giúp cho tra cứu được thuận lợi. Chúng tôi giới thiệu hai phương pháp đánh chỉ số: - Sử dụng các cấu trúc cây không gian. - Sử dụng các thuật toán phân cụm. Phương pháp đánh chỉ số sử dụng các cấu trúc không gian thực hiện gồm các bước sau: - Giảm chiều của các vector đặc trưng - Tìm kiếm cấu trúc dữ liệu hiệu quả để đánh chỉ số. - Tìm các độ đo tương tự phù hợp. Phương pháp sử dụng các kỹ thuật phân cụm để đánh chỉ số là thực hiện nhóm các cụm dữ liệu tương tự nhau. Đây cũng là phương pháp được này áp dụng trình bày trong luận văn 1.2.2 Một số cấu trúc cây đánh chỉ số nhiều chiều Các cấu trúc đánh chỉ số có thứ bậc được chia làm 2 loại: - Các cấu trúc đánh chỉ số dựa trên phân chia không gian thực hiện phân chia đệ quy toàn bộ không gian dữ liệu thành các vùng không gian con. Các cấu trúc này bao gồm các cây: Hybrid-tree, kd-tree, KDB-tree, LSD-tree - Các cấu trúc đánh chỉ số dựa trên phân chia dữ liệu bao gồm các vùng bao được hình thành dựa trên các cụm dữ liệu gồm các cấu trúc sau: R-tree,R * -tree, X-tree, SS-tree, SR- tree 1.3 MỘT SỐ HẠN CHẾ CỦA CÁC PHƯƠNG PHÁP TRA CỨU ẢNH Các hệ thống tra cứu ảnh hiện nay thường trích chọn các đặc trưng của ảnh truy vấn so sánh với các đặc trưng tương ứng của tất cả các ảnh được lưu trữ trong CSDL. Vì vậy thời gian tìm kiếm tăng tuyến tính với kích thước của cơ sở dữ liệu. Các kỹ thuật tìm kiếm nhanh khác cũng đã được nhiều nhà nghiên cứu đề xuất như: kỹ thuật tìm kiếm nhanh được Barros các đồng nghiệp sử dụng bất đẳng thức tam giác để giảm thời gian tìm kiếm. Chen các đồng nghiệp đề xuất kỹ thuật lượng hóa vector sử dụng bất đẳng thức tam giác.Cả hai kỹ thuật này đều yêu cầu độ đo tương tự được sử dụng để so sánh hai ảnh phải thỏa mãn bất đẳng thức tam giác. Tuy nhiên hạn chế là không phải tất cả độ đo tương tự đều thỏa mãn được bất đẳng thức tam giác. Các kỹ thuật đánh chỉ số sử dụng cấu trúc cây R-Tree, R*- Tree, SR-Tree, SS-Tree, Kdb-Tree được trình bày ở trên tuy nhiên nhược điểm của các phương pháp này là không thực hiện tốt khi số chiều của các vector đặc trưng lớn. Để khắc phục nhược điểm trên chúng tôi trình bày phương pháp tạo ra một lược đồ được đánh chỉ số bằng cách nhóm các ảnh tương tự nhau theo nội dung của ảnh. 1.4 NỘI DUNG NGHIÊN CỨU CỦA ĐỀ TÀI Nội dung nghiên cứu của đề tài là áp dụng phương pháp phân cụm có thứ bậc Agglomerative Hierarchical clustering (AHC) cho bài toán tra cứu ảnh theo nội dung sử dụng đặc trưng màu. Mục đích của phương pháp là nhóm các ảnh có nội dung về màu sắc tương tự nhau thành các cụm thực hiện tính các tâm cụm. Khi tra cứu ảnh thì chỉ cần tìm kiếm ảnh tương tự trong một cụm ảnh không phải tìm kiếm trong toàn bộ CSDL. 1.5 KẾT LUẬN CHƯƠNG 1 Trong chương này, chúng tôi đã trình bày tổng quan về tra cứu ảnh dựa vào nội dung, trình bày các kỹ thuật đánh chỉ số ảnh. Nghiên cứu, tìm hiểu đưa ra một số hạn chế trong các phương pháp, các công trình liên quan tới tra cứu ảnh nhanh qua đó trình bày nội dung nghiên cứu của luận văn. CHƯƠNG 2 KỸ THUẬT PHÂN CỤM ẢNH CÓ THỨ BẬC ÁP DỤNG CHO TRA CỨU ẢNH DỰA VÀO NỘI DUNG 2.1 CÁC KHÁI NIỆM TRONG KỸ THUẬT TRA CỨU ẢNH THEO ĐẶC TRƯNG MÀU 2.1.1 Đặc trưng màu: Đặc trưng màu là một trong những thành phần quan trọng giúp mắt người nhận dạng ảnh. Là thành phần cơ bản của nội dung ảnh. Nó cung cấp một lượng thông tin lớn cho việc phân loại ảnh. Đặc trưng màu được sử dụng rất hiệu quả cho tra cứu các ảnh màu trong CSDL ảnh. Các mô tả màu được trích rút so sánh tương đối thuận lợi do đó nó thích hợp cho tra cứu dựa vào đặc trưng thị giác. 2.1.2 Lượng hóa màu: Lượng hoá màu là quá trình giảm số các màu được sử dụng để biểu diễn một ảnh. Một lược đồ lượng hoá được xác định bởi không gian màu phân đoạn của không gian màu. 2.1.3 Các không gian màu: Không gian màu là một mô hình đại diện cho màu về mặt giá trị độ sáng. Một không gian màu xác định bao nhiêu thông tin màu được thể hiện. Nó định nghĩa không gian 1, 2, 3 hoặc 4 chiều mà mỗi chiều của nó gọi là một thành phần đại diện cho những giá trị độ sáng. Mô hình không gian màu có thể được phân biệt như hướng phần cứng hướng người dùng. Các không gian màu hướng phần cứng dựa trên l ý thuyết ba màu bao gồm: RGB, CMY YQI. Các không gian màu hướng người dùng dựa trên ba tri giác màu của con người là độ bão hòa, độ sáng đặc trưng màu bao gồm: HLS, HCV, HSV, HSB, MTM, CIE-LAB CIE- LUV. 2.1.4 Lược đồ màu: Lược đồ màu là công cụ hiệu quả trong việc mô tả phân bố màu toàn cục của ảnh. Nó được xác định bằng một tập các bin, trong đó mỗi bin biểu thị xác suất của các pixel của một màu trong ảnh. 2.1.5 Kỹ thuật tra cứu ảnh dựa vào đặc trưng màu: Hai kỹ thuật được sử dụng trong tra cứu ảnh dựa trên màu sắc đó là lược đồ màu toàn cục biểu đồ màu cục bộ 2.1.6 Độ đo tương tự giữa các lược đồ màu: Tra cứu ảnh theo nội dung tính toán độ tương tự thị giác giữa ảnh truy vấn các ảnh trong CSDL. Kết quả tìm kiếm không phải là một ảnh đơn mà là một danh sách các ảnh được sắp xếp theo độ tương tự. Một số độ đo tương tự được sử dụng phổ biến. Khoảng cách Minkowski: Độ đo này chỉ so sánh các bin giống nhau giữa các lược đồ màu được xác định: 1/r ) r N 1i |[i] I H[i] Q H|(I)d(Q,    (2.7) Trong đó Q I là hai ảnh. N là số các bin trong lược đồ màu, ][iH Q là giá trị của bin i trong lược đồ màu Q H , ][iH I là gía trị của bin i trong lược đồ màu I H . Khoảng cách toàn phương (Quadratic metrics): Độ đo này so sánh nhiều bin giữa các lược đồ màu được xác định: ) I H Q A(H t ) I H Q (HI)d(Q,  (2.10) Trong đó: Q I là hai ảnh, Q H là lược đồ màu của ảnh Q I H là lược đồ màu của ảnh I, ]a[A j,i  là ma trận N x N, N là số các bin trong lược đồ màu, j,i a biểu thị sự tương tự giữa màu i màu j. a ij =1-d ij / d max d ij = | H Q [i] - H T [j] | Lược đồ giao (Histogram Intersection): Lược đồ giao được xác định dựa trên tổng số các điểm ảnh phổ biến có trong cả 2 lược đồ màu:    N 1i [i]) I H[i], Q min(HI)I(Q, (2.12) 2.2 GIỚI THIỆU MỘT SỐ KỸ THUẬT PHÂN CỤM Kỹ thuật phân cụm được chia thành hai nhóm chính: - Phân cụm bằng cách phân hoạch (Partitional clustering). - Phân cụm theo thứ bậc (Hierarchical clustering) 2.2.1 Phân cụm phân hoạch (Partitional clustering). Phương pháp phân cụm phân hoạch nhằm phân một tập dữ liệu có n phần tử cho trước thành k nhóm dữ liệu sao cho: mỗi phần tử dữ liệu chỉ thuộc về một nhóm dữ liệu mỗi nhóm dữ liệu có tối thiểu là một phần tử dữ liệu. Cho giá trị k tìm một phân hoạch có k cụm nhằm tối ưu tiêu chuẩn phân hoạch được chọn. Lớp các thuật toán nổi tiếng của nó là thuật toán K-means các cải tiến. 2.2.2 Phân cụm theo thứ bậc (Hierarchical Clustering) Các kỹ thuật phân cụm theo thứ bậc Hierarchical Clustering đưa ra một chuỗi các phần được chia lồng vào nhau với một cụm gốc ở trên cùng các cụm đơn của các đối tượng đơn lẻ ở phía dưới. Các cụm ở cấp độ trên chứa các cụm phía dưới chúng theo thứ bậc. Kết quả của thuật toán phân cụm theo thứ bậc có thể xem như một cây được gọi mà một dendogram ( xem hình 2.13). Hình 2.13: dendogram của phân cụm sử dụng phân cụm có thứ bậc Trong kỹ thuật phân cụm theo thứ bậc có 2 phương pháp Divisive Approach (top down approach): Quá trình ngược lại với Agglomerative Approach, ban đầu chúng ta xem tất cả các đối tượng thuộc cùng 1 cụm, sau đó tiến hành phân thành 2 cụm con. Quá trình này được thực hiện cho đến khi mỗi cụm chỉ còn 1 đối tượng. [...]... thuật toán phân cụm điển hình đó là: thuật toán phân cụm phân hoạch phân cụm có thứ bậc Trong đó áp dụng thuật toán phân cụm có thứ bậc (Agglomerative Hierarchical Clustering- AHC) vào bài toán tra cứu ảnh theo nội dung sử dụng đặc trưng màu nhằm tăng tốc độ của hệ thống tra cứu ảnh Chương 3 XÂY DỰNG ỨNG DỤNG PHÂN CỤM ẢNH VÀO BÀI TOÁN TRA CỨU ẢNH PHONG CẢNH 3.1 GIỚI THIỆU MÔ TẢ HỆ THỐNG TRA CỨU ẢNH. .. nghiên cứu trong lĩnh vực tra cứu ảnh Sau đây là các kết quả đã được trong luận văn:  Nghiên cứu lý thuyết tổng quan về tra cứu ảnh theo nội dung  Nghiên cứu các kỹ thuật đánh chỉ số ảnh một số các thuật toán phân cụm Ứng dụng kỹ thuật phân cụm có thứ bậc (Agglomerative Hierarchical Clustering AHC) vào bài toán tra cứu ảnh sử dụng đặc trưng màu  Xây dựng một phần mềm thực nghiệm đọc vào một ảnh phong. .. không áp dụng thuật toán phân cụm CSDL ảnh gồm 2000 ảnh được sử dụng cho thực nghiệm Trong đó gồm 1500 ảnh được lấy từ tập ảnh của GS Wang[50] 500 ảnh còn lại được chúng tôi sưu tập từ internet camera số Với 2000 ảnh được chia thành 133 cụm, trong đó cụm lớn nhất gồm 40 ảnh cụm nhỏ nhất gồm 2 ảnh Trung bình mỗi cụm có 15 ảnh 3.7 KẾT LUẬN CHƯƠNG 3 Ứng dụng được xây dựng bằng công cụ C# hệ quản... ưu tâm cụm - Bước 4: Tra cứu ảnh Ví dụ: Hình 2.22: Biểu diễn một ví dụ phân cụm có thứ bậc với 8 ảnh Thực hiện phân cụm ảnh: Đặt n là số lượng ảnh trong CSDL Độ tương tự giữa các cặp ảnh được tính toán trước Thuật toán phân cụm được thực hiện như sau: Bước 1: Khởi tạo trong CSDL n ảnh được đặt vào n cụm phân biệt Các cụm này được đánh chỉ số { C1,C2, Cn } Với mỗi cụm thứ k tập Ek biểu thị tập ảnh chứa... TẢ HỆ THỐNG TRA CỨU ẢNH PHONG CẢNH Chúng tôi đã xây dựng một hệ thống tra cứu ảnh phong cảnh theo nội dung sử dụng đặc trưng màu áp dụng kỹ thuật phân cụm có thứ bậc (Agglomerative Hierarchical Clustering- AHC) để phân tập ảnh trong cơ sở dữ liệu ảnh thành các cụm có độ tương tự nhau nhằm mục đích hạn chế việc phải tìm kiếm ảnh trong toàn bộ cơ sở dữ liệu tăng tốc độ tra cứu 3.2 THIẾT KẾ HỆ THỐNG... Giao diện lược đồ màu cục bộ của ảnh 3.5.3 Tính độ tương tự giữa hai ảnh Hình 3.11: Giao diện tính độ tương tự giữa hai ảnh 3.5.4 Giao diện phân cụm ảnh Hình 3.12: Giao diện phân cụm ảnh 3.5.5 Giao diện tra cứu ảnh Hình 3.14: Giao diện tra cứu ảnh 3.6 ĐÁNH GIÁ ĐỘ CHÍNH XÁC CỦA THUẬT TOÁN PHÂN CỤM Thực nghiệm được tiến hành với cơ sở dữ liệu gồm 2000 ảnh thuật toán phân cụm đạt độ chính xác 95% mà chỉ... phong cảnh mẫu tìm kiếm những ảnh phong cảnh tương tự với ảnh mẫu trong một tập hợp các ảnh cho trước  Chúng tôi đã tiến hành thực nghiệm với CSDL gồm 2000 ảnh phong cảnh Kết quả cho thấy thuật toán phân cụm đạt độ chính xác 95% chỉ với 300 phép so sánh thay vì 2000 phép so sánh vét cạn với toàn bộ ảnh trong CSDL KIẾN NGHỊ CÁC HƯỚNG NGHIÊN CỨU TIẾP THEO Trong quá trình nghiên cứu thực hiện luận văn. .. Giả mã thuật toán phân cụm Thực hiện tính tâm cụm: Sau khi thực hiện phân cụm ảnh thì mỗi cụm cần có một tâm cụm để xác định ảnh Tâm cụm được tính là trung bình của các lược đồ của các ảnh trong cụm đó Vì mỗi cụm có thể gồm rất nhiều ảnh nên việc tính trung bình của tất cả các ảnh là rất lớn Một giải pháp đưa ra phải lựa chọn ra một số ảnh đại diện để tính tâm cụm Việc lựa chọn các ảnh này phải phù... Server 2005 trên hệ điều hành Windows Vista Với CSDL ảnh gồm 2000 ảnh thực nghiệm kết quả cho thấy thuật toán phân cụm đạt độ chính xác 95% chỉ với 300 phép so sánh thay vì 2000 phép so sánh khi không thực hiện phân cụm ảnh mà tiến hành so sánh vét cạn với toàn bộ ảnh trong CSDL KẾT LUẬN Việc áp dụng các thuật toán các kỹ thuật đánh chỉ số vào tra cứu ảnh theo nội dung nhằm tăng tốc độ tìm kiếm của... hai cụm ảnh Ck Cl được định nghĩa bằng trung bình độ tương tự giữa các cặp ảnh được biểu diễn trong các cụm này: si, j  i , j  E  E  , i  j  l k    S k ,l  P( N  N ) k l Pn= (n - 1) n 2 (2.16) (2.17) Trình bày thuật toán phân cụm ảnh có thứ bậc 2.3.3 Áp dụng thuật toán phân cụm có thứ bậc được thực hiện qua các bước chính sau: - Bước 1: Thực hiện phân cụm ảnh - Bước 2: Tính tâm cụm - Bước . với kích thước của cơ sở dữ liệu. Các kỹ thuật tìm kiếm nhanh khác cũng đã được nhiều nhà nghiên cứu đề xuất như: kỹ thuật tìm kiếm nhanh được Barros và các đồng nghiệp sử dụng bất đẳng thức. gian. Để tăng tốc hệ thống tra cứu ảnh dựa vào nội dung, cần có một số kỹ thuật tra cứu ảnh nhanh. Đề tài "Phương pháp tra cứu ảnh dựa vào phân cụm ảnh và ứng dụng vào bài toán tra cứu. phát triển mạnh mẽ của công nghệ ảnh số làm số lượng ảnh lưu trữ trên web tăng lên một cách nhanh chóng. Để tìm kiếm bức ảnh theo mong muốn là rất khó khăn. Các kỹ thuật tra cứu ảnh được thực

Ngày đăng: 11/06/2014, 15:59

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan