042_Nghiên cứu và xây dựng hệ thống nhập tài liệu tự động bằng nhận dạng

2 337 0
042_Nghiên cứu và xây dựng hệ thống nhập tài liệu tự động bằng nhận dạng

Đang tải... (xem toàn văn)

Thông tin tài liệu

- 42 - NGHIÊN CỨU XÂY DỰNG HỆ THỐNG NHẬP TÀI LIỆU TỰ ĐỘNG BẰNG NHẬN DẠNG QUANG HỌC Nguyễn Thanh Phúc MSV: 0220247 Email:phucnt@gmail.com Cán bộ hướng dẫn : ThS Đào Kiến Quốc 1. Mở đầu Nhập dữ liệu tự động đang là bài toán ngày càng thu hút nhiều sự chú ý vì khả năng áp dụng rộng rãi vào thực tế cũng như những hiệu quả mà nó mang lại. Trong hệ thống này, khử nhiễu, khử nghiêng phân vùng ảnh là một phần có vai trò đặc biệt quan trọng. Chức năng của nó là chính xác ảnh tách ra các vùng được nhập thông tin để làm đầu vào cho module nhận dạng chữ. Dựa trên đặc điểm phân bố có hướng đồng đều của form văn bản, chúng tôi đã sử dụng phương pháp phép chiếu để khử nghiêng ảnh do phương pháp này đạt được độ chính xác cao đối với những ảnh có đặc trưng trên. Cũng dựa trên đặc điểm của kiểu form văn bản là dữ liệu được nhập vào các ô trên form ( nghĩa là nằm trong giới hạn giữa các đường thẳng), giải pháp đề ra cho phân vùng là thông qua việc xác định các đường thẳng kết hợp với sử dụng hệ tọa độ tương đối để xác định các vùng nhập dữ liệu. Chúng tôi đã tiến hành thực nghiềm trên nhiều kiểu form văn bản khác nhau thu được những kết quả rất khả quan. 2. Tổng quan một số phương pháp khử nghiêng phân vùng ảnh Một văn bản có rất nhiều các đặc trưng so với các loại hình ảnh khác như các đặc trưng về hướng, về cấu trúc phân bố các đối tượng . Từ đó cũng có một số phương pháp xác định góc nghiêng cho ảnh của văn bản như: các phương pháp dựa trên biến đổi Hough, các phương pháp dựa trên Nearest Neighbour, các phương pháp dựa trên registered object… Điểm khác biệt trong việc phân vùng ảnh trên form nhập dữ liệu phân vùng ảnh trên văn bản tổng quát là : đối với form nhập dữ liệu, ta thực hiện phân vùng trên ảnh đã biết trước cấu trúc ta chỉ cần tách ra các vùng đã được định nghĩa từ trước là sẽ được nhập dữ liệu để sau đó tiến hành nhận dạng trên các vùng này. Việc phân vùng có thể được thực hiện dựa trên tọa độ tuyệt đối tọa độ tương đối. 3. Đề xuất giải pháp khử nghiêng phân vùng ảnh a) Giải pháp khử nghiêng Qua việc nghiên cứu rất nhiều dạng Form văn bản khác nhau bao gồm cả văn bản tiếng việt tiếng anh cùng với việc nghiên cứu nhiều thuật toán, chúng tôi thấy rằng phương pháp phép chiếu là một phương pháp thích hợp để xác định góc nghiêng của các form văn bản trong phạm vi của bài toán. Bởi vì : • Phương pháp phép chiếu cho kết quả với độ chính cao trên các form văn bản thuộc pham vi của bài toán. • Có thể thực hiện một số cải tiến để giảm bớt khối lượng tính toán. • Dễ hiểu, dễ bảo trì. b) Giải pháp phân vùng ảnh Dựa trên đặc điểm của kiểu form nhập dữ liệu là dữ liệu được nhập vào các ô trên form ( nghĩa là nằm trong gi ới hạn giữa các đường thẳng) Chúng tôi đưa ra thuật toán xác định vùng nhập dữ liệu thông qua việc xác định các đường thẳng. Trong phương pháp này, trước tiên chúng tôi nhận dạng tất cả các đường thẳng có trong ảnh. Sau đó các đường thẳng này sẽ được đối chiếu với các đường thẳng có trong form mẫu để xác định thứ tự chính xác khử nhiễu. Cuối cùng sau khi nhận dạng được các đường thẳng, vùng nhập dữ liệu sẽ được tính thông qua tọa độ gián tiếp tới các đường thẳng đó. bởi vì các tọa độ gián tiếp này là các tọa độ địa phương nên độ chính xác trong việc xác định các vùng là rất cao. - 43 - 4. Thực nghiệm Với mục đích đánh giá độ chính xác hiệu năng thực hiện của các phương pháp, chúng tôi đã tuyển tập rất nhiều các tài liệu dạng ảnh trên các kiểu form khác nhau như: phiếu đăng ký, phiếu điều tra, hóa đơn, ….Các ảnh này được tìm thấy phần lớn là thông qua trang tìm kiếm Google để có thể đảm bảo được sự đa dạng về kiểu form, về chất lượng ảnh, về kích cỡ ngôn ngữ. a) Thực nghiệm về xác định góc nghiêng của ảnh Thực nghiệm về xác định góc nghiêng của ảnh được cài đặt theo phương pháp phép chiếu trên 60 ảnh, với 300 góc nghiêng khác nhau cho mỗi một ảnh, tổng số ảnh thử nghiệm là 18000 ảnh. Độ lệch trung bình so với góc thực tế Phương pháp phép chiếu ( 0 ) Cat 1 0.0383 Cat 2 0.0351 Cat 3 0.0177 Cat 4 0.0246 Total 0.0289 Từ kết quả thực nghiệm trên ta thấy, độ chính xác việc xác định góc nghiêng là đủ để tiến hành phân vùng nhận dạng ảnh. b) Thực nghiệm về Phân vùng ảnh Tập ảnh thực nghiệm được chia ra làm 2 loại : Loại 1 gồm các ảnh có tập các đường thẳng với độ dày là 1 pixel Loại 2 gồm các ảnh có tập các đường thẳng với độ dày ≥ 2 pixel. Độ chính xác của phương pháp xác định đường thẳng DPI Độ chính xác – Loại 1 (%) Độ chính xác – Loại 2 (%) 100 73.35 96.14 150 87.61 98.85 200 91.53 99.15 300 94.11 99.46 Kết quả thực nghiệm cho thấy việc xác định các đường thẳng cho kết quả chính xác đối với các trường hợp nằm trong phạm vi của bài toán 5. Kết luận Trong quá trình nghiên cứu nhiều dạng Form văn bản cũng như nhiều thuật toán khác nhau, chúng tôi đã lựa chọn, cải tiến đưa ra được một số các giải pháp riêng cũng như cài đặt thành công các thuật toán về lọc nhiễu, tách nền xác định góc nghiêng của ảnh. Các công việc cần được nghiên cứu tiếp: • Tích hợp với module nhận dạng chữ viết tiếng việt. • Xây module quản trị tài liệu dạng Form. • Nâng cao hiệu năng độ chính xác cho module tiền xử lý ảnh phân vùng. Tài liệu tham khảo [1] Lương Mạnh Bá, Nguyễn Thanh Thủy. Nhập môn xử lý ảnh số. Nhà xuất bản khoa học kỹ thuật 5/1999 [2] D. X. Le, G. Thoma. Document Skew Angle Detection Algorithm. 1993 [3] Junichi Kanai, Andrew D. Bagdanov. Projection profile based skew estimation algorithm for JBIG compressed images. IJDAR (1998) [4] Dipti Deodhare, NNR Ranga Suri, R.Amit. Preprocessing and Image Enhancement Algorithms for a Form- based Intelligent Character Recognition System. Vol. II, 2005 . - 42 - NGHIÊN CỨU VÀ XÂY DỰNG HỆ THỐNG NHẬP TÀI LIỆU TỰ ĐỘNG BẰNG NHẬN DẠNG QUANG HỌC Nguyễn Thanh Phúc MSV: 0220247. nền và xác định góc nghiêng của ảnh. Các công việc cần được nghiên cứu tiếp: • Tích hợp với module nhận dạng chữ viết tiếng việt. • Xây module quản trị tài

Ngày đăng: 06/10/2013, 19:20

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan