Báo cáo khoa học nhận dạng mặt người dùng polar cosine transform và mạng radial basis function

7 311 3
Báo cáo khoa học  nhận dạng mặt người dùng polar cosine transform và mạng radial basis function

Đang tải... (xem toàn văn)

Thông tin tài liệu

Một số vấn đề chọn lọc Công nghệ thông tin truyền thông, Cần Thơ, 7-8 tháng 10 năm 2011 NHẬN DẠNG MẶT NGƯỜI DÙNG POLAR COSINE TRANSFORM VÀ MẠNG RADIAL BASIS FUNCTION Võ Hoàng Minh1, Trần Bình Long1, Lê Hoàng Thái2, Trần Hành1 Trường Đại học Lạc Hồng, Đồng Nai Trường Đại học Tự nhiên, Đại học Quốc gia Thành phố Hồ Chí Minh Tóm tắt Nhận dạng mặt người tự động nghiên cứu ứng dụng rộng rãi nhiều lĩnh vực sống: bảo mật, chứng thực dựa sinh trắc học, quản lý truyền thông đa phương tiện, giải trí điện toán Mặc dầu nghiên cứu nhận dạng mặt người tự động thực từ năm 1960, nhiên đến toán toán khó Thách thức việc nhận dạng khả rút trích thông tin hiệu dùng để phân biệt khuôn mặt người khác theo khác biệt dựa đặc tính hình học quang trắc Trong báo đề xuất mô hình dùng Polar Cosine Transform (PCT) mạng Radial Basis Function (RBF) để nhận dạng mặt người Ảnh mặt người sau xử lý, dùng Polar Cosine Transform (PCT), với ưu điểm trực giao, bất biến, để rút trích vector đặc trưng cho mạng Radial Basis Function (RBF) Kết thử nghiệm tiến hành sờ liệu ảnh YALE, gồm tập ảnh mặt 15 người khác nhau, người 11 ảnh, tổng số ảnh 165, với tỉ lệ nhận dạng đạt 96,92% cho thấy tính khả thi phương pháp đề xuất Từ khóa: Nhận dạng mặt người, Polar Cosine Transform, Radial Basis Function Giới thiệu Ảnh mặt người đặc trưng sinh trắc học sử dụng rộng rãi để nhận dạng người tính chất dễ thu thập liệu ảnh Ngày nay, người ta dễ dàng trang bị thiết bị thu nhận ảnh đâu: quan, camera điểm công cộng, thiết bị chuyên dụng điều tra theo dõi tội phạm, thiết bị chụp ảnh quay phim cá nhân ngày trở nên phổ biến Cho đến lĩnh vực nhận dạng mặt người nhận nhiều quan tâm Nhiều phương pháp đề xuất cho mục đích Gabor wavelet [1], PCA [2], LDA [3], ICA [4], Pseudo-Zernike-RBF [5] ., toán nhận dạng mặt người nhìn thẳng, tư nghiêm nói giải triệt để Tuy nhiên lúc ta thu ảnh ý muốn vấn đề liên quan đến nhiễu, che khuất, trạng thái góc độ khác khuôn mặt, … Từ phát sinh vô số vấn đề thách thức, thu hút nhiều quan tâm nhà nghiên cứu Trong số vấn đề liên quan đến nhận dạng ảnh mặt người nhìn thẳng có vấn đề lớn chưa giải tốt: Một trường hợp mát thông tin, ảnh bị 387 Một số vấn đề chọn lọc Công nghệ thông tin truyền thông, Cần Thơ, 7-8 tháng 10 năm 2011 mát thông tin ảnh bị nhiễu trình thu nhận ảnh, khuôn mặt đối tượng bị che khuất đeo kính, đeo trang bị che vật thể khác điều kiện sáng tối chụp làm ảnh hưởng vùng ảnh; Hai trạng thái cảm xúc khuôn mặt, ảnh mặt người chụp trạng thái khác cười, khóc, buồn, vui mức giận dữ… Trên thực tế trình ghi hình đối tượng, thường ta điều kiện thu ảnh rõ ràng, đầy đủ bị che khuất bắt buộc khuôn mặt đối tượng trạng thái nghiêm nghị Do đó, hệ thống nhận dạng ảnh mặt người nhìn thẳng trạng thái bị mát thông tin xác định trạng thái cảm xúc khuôn mặt (ở đây, giới hạn trạng thái khuôn mặt sau: giận dữ, hạnh phúc, ngạc nhiên, sợ hãi, buồn bã, kinh tởm bình thường) thực hữu dụng có giá trị ứng dụng thực tiễn cao Trong phạm vi nghiên cứu đề tài này, tìm hiểu, thử nghiệm đề xuất mô hình dùng Polar Cosine Transform (PCT) rút trích đặc trưng khuôn mặt mạng Radial Basis Function (RBF) để nhận dạng mặt người tư nhìn thẳng có khả giải vấn đề nêu PCT có ưu điểm moment trực giao khác: [6] Legendre moments, Orthogonal Fourier Mellin moment [7], Legendre moments, Zernike moments [8] and Pseudo-Zernike moments [9] nhờ vào đơn giản nên tốc độ tính nhanh, không tốn nhiều thời gian, đa thức PCT ổn định sai số Chúng hy vọng mô hình ứng dụng rộng rãi thực tế mang lại nhiều lợi ích, góp phần hoàn thiện hệ thống nhận dạng mặt người tương lai Phần lại báo tổ chức sau: Hệ thống nhận dạng mặt người tiền xử lý ảnh giới thiệu phần Phần trình bày kỹ thuật rút trích đặc trưng thiết kế phân lớp Phần trình bày kết nghiên cứu sở liệu YALE [10] phần kết luận Hệ thống nhận dạng khuôn mặt Hệ thống nhận dạng mặt người gồm ba phần Phần đầu bước tiền xử lý, ảnh tỉnh mặt người xử lý để chuẩn hóa, loại bỏ nhiểu, phần hai rút trích đặc trưng từ ảnh thu phần Phần ba phân lớp ảnh mặt người dựa vào đặc trưng thu phần Hình.1 388 Một số vấn đề chọn lọc Công nghệ thông tin truyền thông, Cần Thơ, 7-8 tháng 10 năm 2011 Tiền xử lý Rút trích đặc trưng PCT Mạng RBF Hình 1-Hệ thống nhận dạng mặt người Trong hệ thống dùng phương pháp biến đổi Wavelet cho tiền xử lý làm giảm ảnh hưởng độ sáng chuẩn hóa mặt cho việc rút trích đặc trưng cách thay đổi kỹ thuật cân Histogram toàn cục với cân histogram thích nghi giới hạn tương phản Rút trích đặc trưng phân lớp Bằng phân tích moment [11], hình ảnh mô tả lại đầy đủ, phân tích moment phương pháp tiếng sử dụng nhiều xử lý ảnh Trong báo sử dụng moment biến đổi Polar Cosine[12] cho việc rút trích đặc trưng 3.1 Polar Cosine Transform (PCT) Cho ảnh 2D f(x,y), ta chuyển đổi từ hệ tọa độ đề đến hệ tọa độ cực f(r,θ), r θ bán kính góc tương ứng Công thức chuyển đổi từ hệ tọa độ đề sang hệ tọa độ cực: Và r= (1) θ = arctan( ) (2) Ảnh định nghĩa đường tròn đơn vị với r ≤ 1, tái tạo với hàm Hnl(r,θ) f(r,θ) = (3) hệ số (4) Hàm tính bởi: (5) Với (6) Và thỏa mản điều kiện trực giao: (7) Và Trong (8) Kronecker delta Từ (4)và (5)(6) viết lại sau 389 Một số vấn đề chọn lọc Công nghệ thông tin truyền thông, Cần Thơ, 7-8 tháng 10 năm 2011 (9) Với (10) Nhờ đơn giản tính ổn định PCT, qua thực nghiệm với n ≥ 16 cho vec tơ đặc trưng tốt 3.2 Mạng Radial Basis Function Mạng Radial Basis Function (RBF) [13] có cấu trúc hình 2, gồm lớp Lớp nhập tập hợp gồm n nút tương ứng với n yếu tố véc tơ đặc trưng rút trích từ ảnh phương pháp PCT Các nút nhập kết nối đầy đủ với r nút ẩn lớp ẩn, số nút ẩn với số nút nhập Trong lớp ẩn nút ẩn gọi đơn vị RBF, nút ẩn củng kết nối đầy đủ với s nút xuất lớp xuất Mỗi nút xuất khuôn mẩu đặc trưng đại điện cho trạng thái khuôn mặt Lớp nhập Lớp ẩn Lớp xuất Hình -Mạng Radial Basis Function Hàm hoạt động đợn vị ẩn thể sau: (11) Với x vector nhập n chiều, ci vector n chiều gọi tâm đơn vị RBF, σi độ rộng của đơn vị RBF r số lượng đơn vị RBF Hàm hoạt động đặc trưng đơn vị RBF chọn theo hàm Gaussian với véc tơ trung bình ci véc tơ biến σi theo biểu thức: (12) Trong biểu thức đại diện cho đường chéo ma trận hiệp phương sai hàm Gaussian Nút xuất thứ j nút nhập x thề hiên: (13) 390 Một số vấn đề chọn lọc Công nghệ thông tin truyền thông, Cần Thơ, 7-8 tháng 10 năm 2011 Với w2(i, j) trọng số kết nối đơn vị RBF thứ i với nút xuất thứ j b(j) độ lệch nút xuất thứ j Độ lệch bỏ để làm giảm độ phức tạp mạng này,do đó: (14) Kết nghiên cứu Để kiểm tra hiệu hệ thống, thực nghiên cứu sở liệu Yale 4.1 Cơ sở liệu Yale Cơ sở liệu Yale lấy từ trung tâm thị giác máy tính điều khiển Đại học Yale, gồm hình ảnh 15 người khác nhau, người 11 ảnh, tổng số 165 ảnh Tập ảnh thể hình dạng cảm xúc khác người: chiếu sáng giữa, chiếu sáng bên phải, chiếu sáng bên trái, có đeo kính, không đeo kính, vui, buồn, buồn ngủ, ngạc nhiên, nháy mắt bình thường Hình Hình -Những ảnh mặt sở liệu Yale Để đánh giá hiệu hệ thống, kiểm tra sở liệu Yale Ảnh chuẩn hóa giảm kích thước 80x80 pixels, với điều kiện sáng khác biểu lộ khác ảnh gốc Cân histogram adapthisteq waveletada pt wavelethiste q wavelet Hình -Chuẩn hóa ảnh khuôn mặt 391 Một số vấn đề chọn lọc Công nghệ thông tin truyền thông, Cần Thơ, 7-8 tháng 10 năm 2011 4.2 Kết nghiên cứu Để chuẩn hóa vị trí độ sáng ảnh dùng wavelet dựa kỹ thuật chuẩn hóa độ sáng (Hình 4) Tiếp theo, dùng PCT để rút trích tạo véc tơ đặc trưng cho mạng RBF Chúng dùng 100 ảnh huấn luyện 65 ảnh test cho lần thử, sở liệu Yale có giới hạn, tiến hành thử nghiệm nhiều lần để tính tỉ lệ nhận dạng trung bình Kết cho thấy tỉ lệ nhận dạng trung bình phương pháp đề nghị đạt 96.92% Bảng Bảng -Tỉ lệ nhận dạng phương pháp PCT-RBF Test Sáng Sáng phải Sáng trái Đeo kính Không kính Vui Buồn Buồn ngủ Ngạc nhiên Nháy mắt Bình thường 96.98 96.58 96.95 97.01 97.68 96.88 96.45 96.93 96.90 97.27 96.77 96.8 97.88 97.76 96.87 96.64 96.46 96.95 96.78 97.20 96.98 97.02 97.7 96.85 95.92 97.42 96.84 97.45 97.86 97.25 96.98 96.85 97.15 Kiểm tra kết nhận dạng với moment n=20 với tỉ lệ chấp nhận sai (FAR) từ chối sai (FRR) với ngưởng (thres) 0.2954, bảng Tỉ lệ thành công tổng công (TSR) tính theo công thức: (15) Bảng -Kết kiểm tra Moment PCT thres 0.2954 FAR(%) 2.7998 FRR(%) 3.1674 TSR(%) 96.92 Kết luận Trong báo đề xuất phương pháp rút trích đặc trưng dùng biến đổi Polar Cosine khả bất biến, bị ảnh hưởng nhiểu mạng nơ ron RBF để phân lớp thu kết tốt Ở bước tiền xử lý để làm rõ khuôn mặt chuẩn hóa độ sáng (mức xám) dùng wavelet dựa kỹ thuật chuẩn hóa độ sáng Phương pháp test thành công sở liệu Yale, với loại ảnh thường, nhiểu, thay đổi Kết tính toán cho thấy hệ thống cho tỉ lệ nhận dạng đạt 96,92% Hy vọng tương lai tiếp tục cải tiến thêm ứng dụng rộng rãi lĩnh vực cần có nhận dạng với độ xác cao 392 Một số vấn đề chọn lọc Công nghệ thông tin truyền thông, Cần Thơ, 7-8 tháng 10 năm 2011 Tài liệu tham khảo [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] Wei Jiang, Jian Zhang, Ting-zhi Shen, Xiao-hua Wang, “A Novel Facial Features Extraction Algorithm Using Gabor Wavelets”, IEEE Congress on Image and Signal Processing, vol 2, pp 649 – 653, 2008 M Turk and A Pentland, “Face recognition using eigenfaces”, IEEE Conference on Computer Vision and Pattern Recognition, pp 586 – 591, 1991 P.N Belhumeur, J.P Hespanha, and D.J Kriegman, “Eigenfaces vs Fisherfaces: Recognition Using Class Specific Linear Projection”, IEEE Trans on Pattern Analysis and Machine Intelligence, vol 19, pp 711 – 720, 1997 Bruce A Draper, Kyungim Baek, Marian Stewart Bartlett, J Ross BeveRidge, “Recognizing Face with PCA and ICA”, Computer Vision and Image Understanding, pp 115 – 137, 2003 Javad Haddadnia, Majid Ahmadi, Karim Faez, “An efficient feature extraction method with Pseudo-Zernike moment in RBF neural network - based human face recognition system”, Eurasip journal on applied signal processing 2003:9, pp 890 – 901 Liao, S.X., Pawlak, M., (1996)”On image analysis by moments”, IEEE Trans.Pattern Anal mach.Intell.18, 254-266 Sheng, Y.L and Shen, L.X., (1994)”Orthogonal Fourier- Mellin moments for invariant pattern recognition,”J.Opt.Soc.Am.A.11.1748-1757 Hu, M.K., (1962)”Visual pattern recognition by moment invariants”, IRE Trans Inf Theory IT-8,179-187 Chong, C.W., Raveendran, P and Mukundan, R (2003),”The scale invariants of pseudo-Zernike moments,” Pattern Anal Appl 6,176-184 Yale University [Online] available, http://cvc.yale.edu/projects/yalefaces/yaleface.html C Teh and R Chin, ”On image analysis by the method of moments,”IEEE Trans PAMI, 10(4):496-513, 1988 Zhuo Yang, Sei-ichiro KAMATA, “Fast Polar Harmonic Transforms,” 2010 11th Int Conf Control, Automation, Robotics and Vision, pp.673-677, Singapore, 7-10th December 2010 Yegnanarayana, B (1999),“Artificial Neural Networks” (First Edition) –by Prentice Hall of India Private Limited, ISBN-81-203-253-8 393 ... này, tìm hiểu, thử nghiệm đề xuất mô hình dùng Polar Cosine Transform (PCT) rút trích đặc trưng khuôn mặt mạng Radial Basis Function (RBF) để nhận dạng mặt người tư nhìn thẳng có khả giải vấn đề... tế mang lại nhiều lợi ích, góp phần hoàn thiện hệ thống nhận dạng mặt người tương lai Phần lại báo tổ chức sau: Hệ thống nhận dạng mặt người tiền xử lý ảnh giới thiệu phần Phần trình bày kỹ thuật... cứu sở liệu YALE [10] phần kết luận Hệ thống nhận dạng khuôn mặt Hệ thống nhận dạng mặt người gồm ba phần Phần đầu bước tiền xử lý, ảnh tỉnh mặt người xử lý để chuẩn hóa, loại bỏ nhiểu, phần

Ngày đăng: 20/12/2015, 05:48

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan