Nghiên cứu các kỹ thuật xử lý ảnh phục vụ việc nâng cao chất lượng nhận dạng tiếng việt

13 363 0
Nghiên cứu các kỹ thuật xử lý ảnh phục vụ việc nâng cao chất lượng nhận dạng tiếng việt

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN NGUYỄN XUÂN CƢỜNG NGHIÊN CỨU CÁC KỸ THUẬT XỬ LÝ ẢNH PHỤC VỤ VIỆC NÂNG CAO CHẤT LƢỢNG NHẬN DẠNG TIẾNG VIỆT LUẬN VĂN THẠC SĨ Hà Nội - 2015 ĐẠI HỌC QUỐC GIA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN NGUYỄN XUÂN CƢỜNG NGHIÊN CỨU CÁC KỸ THUẬT XỬ LÝ ẢNH PHỤC VỤ VIỆC NÂNG CAO CHẤT LƢỢNG NHẬN DẠNG TIẾNG VIỆT Ngành: Công nghệ Thông tin Chuyên ngành: Quản lý Hệ thống Thông tin Mã số: Chuyên ngành đào tạo thí điẻm LUẬN VĂN THẠC SĨ NGƢỜ I HƢỚNG DẪN KHOA HỌC: Ts Vũ Duy Linh Hà Nội – 2015 LỜI CAM ĐOAN Tôi xin cam đoan rằng, kết nghiên cứu có giúp đỡ lớn thầy hƣớng dẫn đồng nghiệp quan Các nội dung nghiên cứu kết đề tài hoàn toàn trung thực Trong luận văn, có tham khảo đến số tài liệu số tác giả liệt kê phần “Tài liệu tham khảo” cuối luận văn Tác giả luận văn Nguyễn Xuân Cƣờng LỜI CẢM ƠN Em xin chân thành cảm ơn đến Viện Công Nghệ thông tin, Đại học Công Nghệ, Đại học Quốc gia Hà Nội tạo điều kiện cho em học tập thực luận văn Em xin gửi lời cảm ơn chân thành đến Tiến sĩ Vũ Duy Linh, ngƣời tận tình hƣớng dẫn em trình làm luận văn Em xin cảm ơn quý Thầy Cô nhiệt tình giảng dạy cho chúng em năm học vừa qua Cuối cùng, em xin đƣợc gửi lời cảm ơn chân thành đến gia đình nhƣ bạn bè, đồng nghiệp ủng hộ, động viên em để em có điều kiện tốt để học tập nghiên cứu Hà Nội, tháng 6/2015 Nguyễn Xuân Cƣờng – CIO 04 Viện Công nghệ thông tin – Đại học Quốc gia Hà Nội MỤC LỤC BẢNG KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT .6 MỞ ĐẦU CHƢƠNG – TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ THƢ VIỆN OPENCV .9 1.1 Giới thiệu xử lý ảnh 1.1.1 Phần thu nhận ảnh .10 1.1.2 Tiền xử lý 10 1.1.3 Phân đoạn ảnh (phân vùng ảnh) Error! Bookmark not defined 1.1.4 Biểu diễn mô tả Error! Bookmark not defined 1.1.5 Nhận dạng nội suy Error! Bookmark not defined 1.1.6 Cơ sở tri thức Error! Bookmark not defined 1.2 Những vấn đề hệ thống xử lý ảnh Error! Bookmark not defined 1.2.1 Điểm ảnh Error! Bookmark not defined 1.2.2 Độ phân giải ảnh Error! Bookmark not defined 1.2.3 Mức xám ảnh Error! Bookmark not defined 1.2.4 Định nghĩa ảnh số Error! Bookmark not defined 1.2.5 Mối liên hệ điểm ảnh Error! Bookmark not defined 1.3 Những vấn đề khác xử lý ảnh Error! Bookmark not defined 1.3.1 Biến đổi ảnh Error! Bookmark not defined 1.3.2 Nén ảnh Error! Bookmark not defined 1.4 Một số phƣơng pháp biểu diễn ảnh Error! Bookmark not defined 1.4.1 Mã loạt dài Error! Bookmark not defined 1.4.2 Mã xích Error! Bookmark not defined 1.4.3 Mã tứ phân Error! Bookmark not defined 1.5 Thƣ viện OpenCV Error! Bookmark not defined 1.5.1 Tổng quan Error! Bookmark not defined 1.5.2 Những điểm đặc trƣng Error! Bookmark not defined 1.5.3 Các tổ chức Error! Bookmark not defined 1.6 ImageMagick Error! Bookmark not defined CHƢƠNG – MỘT SỐ PHƢƠNG PHÁP TIỀN XỬ LÝ NÂNG CAO CHẤT LƢỢNG ẢNH Error! Bookmark not defined 2.1 Cải thiện ảnh sử dụng toán tử điểm Error! Bookmark not defined 2.1.1 Tăng độ tƣơng phản (Stretching Contrast) Error! Bookmark not defined 4 2.1.2 Tách nhiễu phân ngƣỡng Error! Bookmark not defined 2.1.3 Biến đổi âm (Digital Negative) Error! Bookmark not defined 2.1.4 Cắt theo mức (Intensity Level Slicing) Error! Bookmark not defined 2.1.5 Trích chọn bit (Bit Extraction) Error! Bookmark not defined 2.1.6 Trừ ảnh Error! Bookmark not defined 2.1.7 Nén dải độ sáng Error! Bookmark not defined 2.1.8 Mô hình hóa biến đổi lƣợc đồ xám Error! Bookmark not defined 2.2 Cải thiện ảnh dùng toán tử không gian Error! Bookmark not defined 2.2.1 Làm trơn nhiễu lọc tuyến tính: lọc trung bình lọc dải thông thấp Error! Bookmark not defined 2.2.2 Làm trơn nhiễu lọc phi tuyến Error! Bookmark not defined 2.2.3 Mặt lạ gờ sai phân làm nhẵn Error! Bookmark not defined 2.2.4 Lọc thông thấp, thông cao lọc dải thông Error! Bookmark not defined 2.2.5 Khuyếch đại nội suy Error! Bookmark not defined 2.2.6 Một số kỹ thuật cải thiện ảnh nhị phân Error! Bookmark not defined 2.3 Khôi phục ảnh Error! Bookmark not defined 2.3.1 Các mô hình quan sát tạo ảnh Error! Bookmark not defined 2.3.2 Các lọc Error! Bookmark not defined CHƢƠNG – TRIỂN KHAI CHƢƠNG TRÌNH VÀ KẾT QUẢ Error! Bookmark not defined 3.1 Cài đặt tích hợp thƣ viện OpenCV vào Microsoft Visual Studio Error! Bookmark not defined 3.2 Triển khai chƣơng trình Error! Bookmark not defined 3.2.1 Xử lý phông chứng minh thƣ Error! Bookmark not defined 3.2.2 Xử lý đƣờng kẻ ô văn Error! Bookmark not defined 3.2.3 Xử lý tăng DPI cho văn Error! Bookmark not defined 3.3 Mã chƣơng trình Error! Bookmark not defined 3.3.1 Đƣa ảnh màu đa mức xám Error! Bookmark not defined 3.3.2 Tăng độ nét Error! Bookmark not defined 3.3.3 Tăng độ sáng Error! Bookmark not defined 3.3.4 Tăng độ tƣơng phản Error! Bookmark not defined 3.3.5 Loại bỏ phông Error! Bookmark not defined 3.3.6 Loại bỏ nhiễu Error! Bookmark not defined 3.3.7 Tăng DPI Error! Bookmark not defined 3.3.8 Xóa đƣờng kẻ ô Error! Bookmark not defined 5 3.4 Hình ảnh triển khai chƣơng trình Error! Bookmark not defined CHƢƠNG – KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN Error! Bookmark not defined 4.1 Kết luận Error! Bookmark not defined 4.2 Hƣớng phát triển Error! Bookmark not defined TÀI LIỆU THAM KHẢO 11 BẢNG KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT Ký hiệu OCR Ý nghĩa Optical Character Recognition Nhận dạng ký tự quang học BSD Berkeley Software Distribution MỞ ĐẦU Sự cấp thiết đề tài Xử lý ảnh lĩnh vực mà ngày đƣợc phát triển ứng dụng rộng rãi nhiều lĩnh vực khác nhờ vào phát triển ngày mạnh mẽ hệ thống máy tính, thuật toán công trình nghiên cứu khác nhiều nhà khoa học giới Ở Việt Nam, ứng dụng xử lý ảnh bƣớc đầu đƣợc triển khai số lĩnh vực nhƣ lắp đặt hệ thống nhận dạng biển số xe, nhận dạng vân tay, … Môn học xử lý ảnh trƣờng đại học đƣợc xem môn học bắt buộc số ngành nhƣ công nghệ thông tin, điện tử viễn thông, … Tuy nhiên nhìn cách tổng quan số lƣợng ứng dụng đƣợc triển khai thực tế ít, lĩnh vực phát triển mạnh mẽ tƣơng lai đƣợc quan tâm cách nghiêm túc Một ứng dụng phổ biến liên quan mật thiết với xử lý ảnh nhận dạng ký tự quang học – OCR Các chƣơng trình hỗ trợ OCR nhận dạng đƣợc ký với tỷ lệ 90% ảnh có chất lƣợng nét font chữ thông dụng Đối với hình ảnh chất lƣợng thấp, font chữ đặc biệt, chữ viết tay có phông phức tạp kết cho không khả quan, hầu nhƣ không nhận dạng đƣợc Với phát triển mạnh mẽ công nghệ, ngày có nhiều yêu cầu cao ứng dụng liên quan đến nhận dạng ký tự quang học, yêu cầu nhận dạng xác hơn, nhanh Nội dung luận văn Với mục đích nhƣ luận văn có nội dung nhƣ sau: - Luận văn tổng hợp lý thuyết xử lý ảnh – giải pháp nâng cao chất lƣợng hình ảnh phục vụ cho nhận dạng, cụ thể nhận dạng tiếng Việt - Luận văn mô tả số phƣơng pháp xử lý ảnh Nền tảng lý thuyết đƣợc triển khai thử nghiệm luận văn 8 - Luận văn mô tả bƣớc triển khai xử lý ảnh, đƣa kết sau xử lý Cấu trúc luận văn Với mục tiêu xây dựng ứng dụng tiền xử lý ảnh phục vụ cho nhận dạng, luận văn đƣợc chia làm bốn chƣơng: Chương 1: Tổng quan tiền xử lý ảnh thư viện OpenCV Chƣơng giới thiệu khái niệm xử lý ảnh, giới thiệu qua thƣ viện xử lý ảnh OpenCV Chương 2: Một số phương pháp tiền xử lý nâng cao chất lượng ảnh Từ khái niệm xử lý ảnh đƣợc đƣa Chƣơng I, chƣơng giới thiệu số phƣơng pháp tiền xử lý ảnh nhƣ: nhị phân hóa, tăng cƣờng độ sáng, tăng cƣờng độ tƣơng phản, loại bỏ phông nền, khử nhiễu, … Chương 3: Triển khai chương trình kết Chƣơng giới thiệu chƣơng trình đƣợc triển khai, bƣớc thực kết bƣớc đạt đƣợc Chương 4: Kết luận hướng phát triển Chƣơng tổng kết lại kết đóng góp mà việc thực đề tài đem lại Ngoài ra, đề xuất phƣơng hƣớng nghiên cứu tiếp theo, nhằm giúp cho đề tài trở lên hoàn thiện 9 CHƢƠNG – TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ THƢ VIỆN OPENCV 1.1 Giới thiệu xử lý ảnh Xử lý ảnh lĩnh vực mang tính khoa học công nghệ Nó ngành khoa học mẻ so với nhiều ngành khoa học khác nhƣng tốc độ phát triển nhanh, kích thích trung tâm nghiên cứu, ứng dụng, đặc biệt máy tính chuyên dụng riêng cho Xử lý ảnh đƣợc đƣa vào giảng dạy bậc đại học nƣớc ta khoảng chục năm Nó môn học liên quan đến nhiều lĩnh vực cần nhiều kiến thức sở khác Đầu tiên phải kể đến Xử lý tín hiệu số - môn học cho xử lý tín hiệu chung, khái niệm tính chập, biến đổi Fourier, Laplace, lọc … Thứ hai, công cụ nhƣ Đại số tuyến tính, Xác xuất, thống kê Một số kiến thức cần thiết khác nhƣ Trí tuệ nhân tạo, mạng noron nhân tạo đƣợc đề cập đến trình phân tích đặc biệt nhận dạng – OCR Các phƣơng pháp xử lý ảnh ứng dụng chính: nâng cao chất lƣợng ảnh phân tích ảnh Ứng dụng đƣợc biết đến nâng cao chất lƣợng ảnh báo đƣợc truyền qua cáp từ London đến New York từ năm 1920 Vấn đề nâng cao chất lƣợng ảnh có liên quan tới cân sáng độ phân giải ảnh Việc nâng cao chất lƣợng ảnh đƣợc phát triển vào khoảng năm 1955 Điều giải thích đƣợc sau chiến thứ hai, máy tính phát triển nhanh tạo điều kiện cho trình xử lý ảnh số thuận lợi Năm 1964, máy tính có khả xử lý nâng cao chất lƣợng ảnh từ mặt trăng vệ tinh Ranger Mỹ bao gồm: làm đƣờng biên, lƣu ảnh Từ năm 1964 đến nay, phƣơng tiện xử lý, nâng cao chất lƣợng, nhận dạng ảnh phát triển không ngừng Các phƣơng pháp tri thức nhân tạo nhƣ mạng noron nhân tạo, thuật toán xử lý đại cải tiến, công cụ nén ảnh ngày đƣợc ấp dụng rộng rãi thu nhiều kết khả quan Về bản, bƣớc cần thiết xử lý ảnh bao gồm: 10 Đầu tiên ảnh tự nhiên từ giới đƣợc thu nhận qua thiết bị thu (nhƣ Camera, máy chụp ảnh, scan, …) Trƣớc đây, ảnh thu đƣợc qua máy chụp hình với phim âm bản, tác dụng xử lý ảnh Gần đây, với phát triển công nghệ, ảnh màu đen trắng đƣợc lấy từ Camera, sau đƣợc chuyển trực triếp thành ảnh số tạo thuận lợi cho xử lý – máy ảnh số, chụp qua điện thoại … ví dụ gần gũi Mặt khác, ảnh tiếp nhận từ vệ tinh, quét từ ảnh chụp máy quét ảnh Hình 1.1 dƣới dây mô tả bƣớc xử lý ảnh Thu nhận ảnh Tiền xử lý ảnh Phân đoạn ảnh Biểu diễn mô tả Nhận dạng nội suy Cơ sở tri thức Hình 1.1 Các bƣớc xử lý ảnh 1.1.1 Phần thu nhận ảnh Ảnh nhận qua camera màu đen trắng Camera thƣờng dùng loại loại quét dòng, ảnh tạo có dạng hai chiều Chất lƣợng ảnh thu nhận đƣợc phụ thuộc vào thiết bị thu, vào môi trƣờng (ánh sáng, phong cảnh) 1.1.2 Tiền xử lý Sau thu nhận, ảnh nhiễu, độ tƣơng phản thấp nên cần đƣa vào tiền xử lý để nâng cao chất lƣợng Chức tiền xử lý lọc nhiễu, nâng độ tƣơng phản để làm ảnh rõ hơn, nét 11 TÀI LIỆU THAM KHẢO Nhập môn xử lý ảnh – Lƣơng Mạnh Bá, Nguyễn Thanh Thủy Xử lý ảnh – PGS.TS Nguyễn Quang Hoan Xử lý ảnh – PGS.TS Đỗ Năng Toàn Xử lý ảnh – TS Đỗ Năng Toàn, TS Phạm Việt Bình Ứng dụng xử lý ảnh thực tế với thƣ viện OpenCV C/C++ – Nguyễn Văn Long http://docs.opencv.org/ http://opencvexamples.blogspot.com/ http://stackoverflow.com/ http://www.bogotobogo.com/ 10.http://vi.wikipedia.org/ [...]... cho xử lý tiếp theo – máy ảnh số, chụp qua điện thoại … là những ví dụ gần gũi Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh, có thể quét từ ảnh chụp bằng máy quét ảnh Hình 1.1 dƣới dây mô tả các bƣớc cơ bản trong xử lý ảnh Thu nhận ảnh Tiền xử lý ảnh Phân đoạn ảnh Biểu diễn và mô tả Nhận dạng và nội suy Cơ sở tri thức Hình 1.1 Các bƣớc cơ bản trong xử lý ảnh 1.1.1 Phần thu nhận ảnh Ảnh có thể nhận. .. quá trình xử lý ảnh số thuận lợi Năm 1964, máy tính đã có khả năng xử lý và nâng cao chất lƣợng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổi đƣờng biên, lƣu ảnh Từ năm 1964 đến nay, các phƣơng tiện xử lý, nâng cao chất lƣợng, nhận dạng ảnh phát triển không ngừng Các phƣơng pháp tri thức nhân tạo nhƣ mạng noron nhân tạo, các thuật toán xử lý hiện đại và cải tiến, các công cụ nén ảnh ngày... quét dòng, ảnh tạo ra có dạng hai chiều Chất lƣợng một ảnh thu nhận đƣợc phụ thuộc vào thiết bị thu, vào môi trƣờng (ánh sáng, phong cảnh) 1.1.2 Tiền xử lý Sau bộ thu nhận, ảnh có thể nhiễu, độ tƣơng phản thấp nên cần đƣa vào bộ tiền xử lý để nâng cao chất lƣợng Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tƣơng phản để làm ảnh rõ hơn, nét hơn 11 TÀI LIỆU THAM KHẢO 1 Nhập môn xử lý ảnh – Lƣơng... – OCR Các phƣơng pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng cao chất lƣợng ảnh và phân tích ảnh Ứng dụng đầu tiên đƣợc biết đến là nâng cao chất lƣợng ảnh báo đƣợc truyền qua cáp từ London đến New York từ những năm 1920 Vấn đề nâng cao chất lƣợng ảnh có liên quan tới cân bằng sáng và độ phân giải của ảnh Việc nâng cao chất lƣợng ảnh đƣợc phát triển vào khoảng những năm 1955 Điều này có thể giải... cơ bản, các bƣớc cần thiết trong xử lý ảnh bao gồm: 10 Đầu tiên ảnh tự nhiên từ thế giới ngoài đƣợc thu nhận qua các thiết bị thu (nhƣ Camera, máy chụp ảnh, scan, …) Trƣớc đây, các tấm ảnh thu đƣợc qua máy chụp hình với phim âm bản, không có tác dụng trong xử lý ảnh Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng đƣợc lấy ra từ Camera, sau đó nó đƣợc chuyển trực triếp thành ảnh số tạo...9 CHƢƠNG 1 – TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ THƢ VIỆN OPENCV 1.1 Giới thiệu về xử lý ảnh Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ Nó là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhƣng tốc độ phát triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên dụng riêng cho nó Xử lý ảnh đƣợc đƣa vào giảng dạy ở bậc đại học... đến Xử lý tín hiệu số - một môn học hết sức cơ bản cho xử lý tín hiệu chung, các khái niệm về tính chập, các biến đổi Fourier, Laplace, các bộ lọc … Thứ hai, các công cụ nhƣ Đại số tuyến tính, Xác xuất, thống kê Một số kiến thức cần thiết khác nhƣ Trí tuệ nhân tạo, mạng noron nhân tạo cũng đƣợc đề cập đến trong quá trình phân tích và đặc biệt là nhận dạng – OCR Các phƣơng pháp xử lý ảnh bắt đầu từ các. .. nhiễu, nâng độ tƣơng phản để làm ảnh rõ hơn, nét hơn 11 TÀI LIỆU THAM KHẢO 1 Nhập môn xử lý ảnh – Lƣơng Mạnh Bá, Nguyễn Thanh Thủy 2 Xử lý ảnh – PGS.TS Nguyễn Quang Hoan 3 Xử lý ảnh – PGS.TS Đỗ Năng Toàn 4 Xử lý ảnh – TS Đỗ Năng Toàn, TS Phạm Việt Bình 5 Ứng dụng xử lý ảnh trong thực tế với thƣ viện OpenCV C/C++ – Nguyễn Văn Long 6 http://docs.opencv.org/ 7 http://opencvexamples.blogspot.com/ 8 http://stackoverflow.com/

Ngày đăng: 27/08/2016, 09:08

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan