hệ nhận dạng chữ viết tay

70 554 0
hệ nhận dạng chữ viết tay

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

hệ nhận dạng chữ viết tay

Lời Mở Đầu Nhận dạng toán xuất cách lâu thu hút nhiều quan tâm, nghiên cứu Đặc biệt vài thập niên gần đây, thúc đẩy trình tin học hoá lĩnh vực, toán nhận dạng không dừng lại mức độ nghiên cứu mà trở thành lĩnh vực để áp dụng vào thực tế Các toán nhận dạng ứng dụng thực tế tập trung vào nhận dạng mẫu, nhận dạng tiếng nói nhận dạng chữ Trong số này, nhận dạng chữ toán quan tâm nhiều đạt nhiều thành tựu rực rỡ Các ứng dụng có ý nghĩa thực tế lớn kể đến như: nhận dạng chữ in dùng trình lưu sách báo thư viện, nhận dạng chữ viết tay dùng việc phân loại thư bưu điện, toán tiền nhà băng lập thư viện sách cho người mù (ứng dụng có nghĩa: scan sách bình thường, sau cho máy tính nhận dạng trả dạng tài liệu mà người mù đọc được) Xuất phát từ yêu cầu thực tế, cần có nghiên cứu vấn đề Chính chọn đề tài nhận dạng ký tự viết tay làm đồ án tốt nghiệp với mong muốn phần áp dụng vào toán thực tế Bài toán đặt phải giải yêu cầu sau:  Nhận dạng ký tự từ ảnh đầu vào  Trích chọn đặc trưng ảnh  Tiến hành nhận dạng với thuật toán Markov ẩn Với yêu cầu đặt trên, cấu trúc khóa luận bao gồm nội dung sau đây:  Chương 1: Giới thiệu đề tài Giới thiệu toán nhận dạng chữ viết tay, tình hình nghiên cứu nước, quy trình chung để giải toán phương pháp điển hình việc huấn luyện nhận dạng, phạm vi đề tài  Chương 2: Cơ sở lý thuyết tiền xử lý ảnh ký tự trích chọn đặc trưng 50 Trình bày lý thuyết lọc nhiễu, nhị phân hóa, chuẩn hóa kích thước, trích chọn đặc trưng ảnh ký tự  Chương 3: CƠ SỞ LÝ THUYẾT VỀ MARKOV ẨN Trình bày khái niệm bản, thuật toán mô hình Markov  Chương 4: ỨNG DỤNG MÔ HÌNH MARKOV ẨN TRONG NHẬN DẠNG CHỮ VIẾT TAY Giới thiệu thuật toán nhận dạng Các bước cài đặt thuật toán Những khó khăn giải pháp khắc phục  Chương 5: CÀI ĐẶT CHƯƠNG TRÌNH VÀ ĐÁNH GIÁ KẾT QUẢ Trình bày môi trường cài đặt, giao diện chương trình, số class chương trình Đánh giá kết đưa hướng phát triển tương lại  Phụ lục: Danh mục hình vẽ, bảng biểu tài liệu tham khảo Đồ án không tránh khỏi thiếu sót hạn chế thời gian kiến thức Em mong nhận đóng góp ý kiến thầy hướng dẫn bạn để đạt kết tốt 51 CHƯƠNG I : GIỚI THIỆU ĐỀ TÀI I.1 Giới thiệu nhận dạng chữ viết tay Nhận dạng chữ in: giải gần trọn vẹn (sản phẩm FineReader 9.0 hãng ABBYY nhận dạng chữ in theo 192 ngôn ngữ khác nhau, phần mềm nhận dạng chữ Việt in VnDOCR 4.0 Viện Công nghệ Thông tin Hà Nội nhận dạng tài liệu chứa hình ảnh, bảng văn với độ xác 98%) Nhận dạng chữ viết tay: vấn đề thách thức lớn nhà nghiên cứu Bài toàn chưa thể giải trọn vẹn hoàn toàn phụ thuộc vào người viết biến đổi đa dạng cách viết trạng thái sức khỏe, tinh thần người viết I.1.1 Các giai đoạn phát triển  Giai đoạn 1: (1900 – 1980) - Nhận dạng chữ biết đến từ năm 1900, nhà khoa học người Nga Tyuring phát triển phương tiện trợ giúp cho người mù - Các sản phẩm nhận dạng chữ thương mại có từ năm1950, máy tính lần giới thiệu tính nhập lưu trữ liệu hai chiều bút viết bảng cảm ứng Công nghệ cho phép nhà nghiên cứu làm việc toán nhận dạng chữ viết tay on-line - Mô hình nhận dạng chữ viết đề xuất từ năm 1951 phát minh M Sheppard gọi GISMO, robot đọc-viết - Năm 1954, máy nhận dạng chữ phát triển J Rainbow dùng để đọc chữ in hoa chậm - Năm 1967, Công ty IBM thương mại hóa hệ thống nhận dạng chữ  Giai đoạn 2: (1980 – 1990) - Với phát triển thiết bị phần cứng máy tính thiết bị thu thu nhận liệu, phương pháp luận nhận dạng phát triển giai đoạn trước có môi trường lý tưởng để triển khai 52 ứng dụng nhận dạng chữ - Các hướng tiếp cận theo cấu trúc đối sánh áp dụng nhiều hệ thống nhận dạng chữ - Trong giai đoạn này, hướng nghiên cứu tập trung vào kỹ thuật nhận dạng hình dáng chưa áp dụng cho thông tin ngữ nghĩa Điều dẫn đến hạn chế hiệu suất nhận dạng, không hiệu nhiều ứng dụng thực tế  Giai đoạn 3: (Từ 1990 đến nay) - Các hệ thống nhận dạng thời gian thực trọng giai đoạn - Các kỹ thuật nhận dạng kết hợp với phương pháp luận lĩnh vực học máy (Machine Learning) áp dụng hiệu - Một số công cụ học máy hiệu mạng nơ ron, mô hình Markov ẩn, SVM (Support Vector Machines) xử lý ngôn ngữ tự nhiên I.1.2 Tình hình nghiên cứu nước: Nhận dạng chữ viết tay chia thành hai lớp toán lớn nhận dạng chữ viết tay trực tuyến (online) nhận dạng chữ viết tay ngoại tuyến (offline) Trong nhận dạng chữ viết tay ngoại tuyến, liệu đầu vào cho dạng ảnh quét từ giấy tờ, văn Ngược lại nhận dạng chữ viết tay trực tuyến nhận dạng chữ hình viết Trong hệ nhận dạng máy tính lưu lại thông tin nét chữ thứ tự nét viết, hướng tốc độ nét… Tại Việt Nam, năm 2010, nhóm nghiên cứu Huỳnh Hữu Lộc, Lưu Quốc Hải, Đinh Đức Anh Vũ (Khoa Khoa học Kỹ thuật máy tính, Trường Đại học Bách khoa TP Hồ 53 Chí Minh) đạt bước tiến đáng kể nhận dạng ký tự viết tay Hướng tiếp cận nhóm nghiên cứu nhận dạng dựa thông tin tĩnh Dựa tảng giải thuật rút trích thông tin theo chiều, nhóm tác giả cải tiến đa số bước để đạt độ xác cao việc nhận dạng ký tự (khoảng 95%) có bước tiến đáng kể nhận dạng từ Tuy nhiên sản phẩm chưa nhận dạng chữ viết tay tiếng Việt Như thấy nhận dạng chữ viết tay, đặc biệt chữ viết tay tiếng Việt hướng nghiên cứu quan tâm nhiều vấn đề cần phải hoàn thiện I.1.3 Tình hình nghiên cứu nước ngoài: Nhận dạng chữ viết nghiên cứu 40 năm qua Ngày nhận dạng chữ viết nhận quan tâm đáng kể phát triển máy tính cầm tay điện thoại cầm tay dựa bàn phím, chuột nhiều dạng thiết bị định vị khác Các phương pháp tỏ không hữu hiệu xử lý chậm Do người ta cần nghiên cứu phương pháp nghiên cứu phương pháp nhận dạng chữ viết tay máy Palm Pilot hay máy TABLET PC I.2 Cách tiếp cận giải toán Nhận dạng chữ viết tay thường bao gồm năm giai đoạn: tiền xử lý 54 (preprocessing), tách chữ (segmentation), trích chọn đặc trưng(representation), huấn luyện nhận dạng (training and recognition), hậu xử lý (postprocessing) - Tiền xử lý: giảm nhiễu cho lỗi trình quét ảnh, hoạt động viết người, chuẩn hóa liệu nén liệu - Tách chữ: chia nhỏ văn thành thành phần nhỏ ,tách từ câu hay kí tự từ - Biểu diễn, rút trích đặc điểm: giai đoạn đóng vai trò quan trọng nhận dạng chữ viết tay Để tránh phức tạp chữ viết tay tăng cường độ xác, ta cần phải biểu diễn thông tin chữ viết dạng đặc biệt cô đọng hơn, rút trích đặc điểm riêng nhằm phân biệt ký tự khác - Huấn luyện nhận dạng: phương pháp điển hình so trùng mẫu, dùng thống kê, mạng nơ-ron ,mô hình markov ẩn ,trí tuệ nhân tạo hay dùng phương pháp kết hợp phương pháp - Hậu xử lý: sử dụng thông tin ngữ cảnh để giúp tăng cường độ xác, dùng từ điển liệu - Mô tả trình hệ thống nhận dạng Sơ đồ gồm hai phần chính: đường màu đỏ mô tả bước để huấn luyện cho máy học, đường màu xanh mô tả bước trình nhận dạng: Ban đầu hình ảnh qua giai đoạn chuyển ảnh dạng ảnh nhị phân (giai đoạn tiền xử lý) Ảnh lưu trữ dạng ma trận điểm, vị trí pixel có nét vẽ mang giá trị 1, ngược lại có giá trị Sau đó, ảnh cắt xén để ký tự nằm trọn khung chữ nhật, vùng không gian nét vẽ loại bỏ Giải thuật cắt xén thực đơn giản dựa ảnh nhị phân thu giảm ảnh cắt xén ảnh có kích thước chung quy định trước Tiếp theo, ảnh cắt xén thu nhỏ làm mỏng Quá trình làm mỏng giúp ta lấy thông tin cần thiết hình dạng ký tự loại bỏ pixel dư thừa Các chấm nhỏ hình biểu thị pixel có giá trị ban đầu Sau làm mỏng, pixel có ý nghĩa giữ lại, chúng 55 biểu diễn chấm to hình Ảnh sau trình làm mỏng chứa hầu hết thông tin hình dạng ký tự Những thông tin phân tích để rút trích đặc điểm giúp việc phân loại ký tự với Phương thức dựa thông tin hình dạng ký tự chuyển vị trí chuyển chiều Kết trình véc-tơ đặc điểm chứa thông tin ký tự Các thông tin giúp máy lấy đặc điểm ký tự, phân loại chúng tạo thông tin cần thiết để nhận dạng ký tự có chung ý nghĩa Do chữ viết người khác nên ta thu thập tất nét chữ người để máy học nhận diện mà dựa số mẫu để nhận nét chữ người viết khác Mô hình markov ẩn (Hidden Markov Model) giải vấn đề I.3 Tổng quan phương pháp huấn luyện I.3.1 Mô hình Markov ẩn Mô hình Markov ẩn (Hiden Markov Model - HMM) giới thiệu vào cuối năm 1960 Cho đến có ứng dụng rộng nhận dạng giọng nói, tính toán sinh học (Computational Biology), xử lý ngôn ngữ tự nhiên… HMM mô hình máy hữu hạn trạng thái với tham số biểu diễn xác suất chuyển trạng thái xác suất sinh liệu quan sát trạng thái Mô hình Markov ẩn mô hình thống kê hệ thống mô hình hóa cho trình Markov với tham số trước, nhiệm vụ xác định tham số ẩn từ tham số quan sát Các tham số mô hình rút sau sử dụng để thực phân tích Trong mô hình Markov điển hình, trạng thái quan sát trực tiếp người quan sát, xác suất chuyển tiếp trạng thái tham số 56 Hình 1.4 Mô hình Markov ẩn xi: Các trạng thái mô hình Markov aij: Các xác suất chuyển tiếp bij: Các xác suất đầu yi: Các liệu quan sát Mô hình Markov ẩn thêm vào đầu ra: trạng thái có xác suất phân bố biểu đầu Vì vậy, nhìn vào dãy biểu sinh HMM không trực tiếp dãy trạng thái Ta có tìm chuỗi trạng thái mô tả tốt cho chuỗi liệu quan sát cách tính P(Y | X )  P(Y | X ) / P( X ) Y1 Y2 … … … Yn X1 X2 … … … Xn Hình 1.5 Đồ thị vô hướng HMM Ở Yn trạng thái thời điểm thứ t=n chuỗi trạng thái Y, Xn liệu quan sát thời điểm thứ t=n chuỗi X Do trạng thái phụ thuộc vào trạng thái trước với giả thiết liệu quan sát thời điểm t phụ thuộc trạng thái t Ta tính: n P(Y , X )  P(Y1 ) P( X | Y1 ) P(Yt | Yt 1 ) * P( X t | Yt ) t 2 57 Một số hạn chế mô hình Markov để tính xác suất P(Y,X) thông thường ta phải liệt kê hết trường hợp chuỗi Y chuỗi X Thực tế chuỗi Y hữu hạn liệt kê được, X (các liệu quan sát) phong phú Để giải vấn đề HMM đưa giả thiết độc lập liệu quan sát: Dữ liệu quan sát thời điểm t phụ thuộc vào trạng thái thời điểm Hạn chế thứ hai gặp phải việc sử dụng xác suất đồng thời P(Y, X) không xác với số toán việc sử dụng xác suất điều kiện P(Y | X) cho kết tốt nhiều I.3.2 Máy vector hỗ trợ Có thể mô tả cách đơn giản phân lớp SVM sau: Cho trước tập liệu học, tập thuộc lớp cho trước, phân lớp SVM xây dựng mô hình phân lớp dựa tập liệu Khi có mẫu đưa vào, phân lớp đưa dự đoán xem mẫu thuộc lớp lớp định Phương pháp Vapnik cộng đề xuất năm 1992, lấy tảng từ lý thuyết học thống kê Vapnik & Chervonenkis vào năm 1960 Đặc trưng định khả phân loại phân loại hiệu suất tổng quát hóa, khả phân loại liệu dựa vào tri thức tích lũy trình huấn luyện Thuật toán huấn luyện đánh giá tốt sau trình huấn luyện, hiệu suất tổng quát hóa phân loại nhận cao Hiệu suất tổng quát hóa phụ thuộc vào hai tham số sai số huấn luyện lực máy học Trong sai số huấn luyện tỷ lệ lỗi phân loại tập liệu huấn luyện Còn lực máy học xác định kích thước Vapnik Chervonenkis (kích thước VC) Kích thước VC khái niệm quan trọng họ hàm phân tách (hay phân loại) Đại lượng xác định số điểm cực đại mà họ hàm phân tách hoàn toàn không gian đối tượng, Một phân loại tốt phân loại đơn giản đảm bảo sai số huấn luyện nhỏ Phương pháp SVM xây dựng dựa ý tưởng Công thức SVM 58 Công thức SVM đơn giản trường hợp tuyến tính mà siêu phẳng định nằm hai tập liệu.Trong trường hợp này, không gian giả định tập điểm có phương trình là: f(x) =w.x+b SVM tìm siêu phẳng tối ưu phương án để phân chia hai tập hợp liệu đồng thời sử dụng cho liệu Có hai phương pháp để tìm siêu phẳng tối ưu Thứ tìm siêu phẳng nằm tập đóng Thứ hai cực đại hoá khoảng cách hai mặt phẳng hỗ trợ (cực đại hoá lề) Cả hai phương pháp tìm mặt phẳng định tập hợp điểm hỗ trợ cho định Chúng gọi vector hỗ trợ Siêu phẳng phân chia Hình 1.8 Siêu phẳng phân chia tuyến tính Siêu phẳng có biên độ cực đại Hình 1.9 Biên độ siêu phẳng có biên độ cực đại 59 Hình 4.1 Mô hình nhận dạng chữ viết Hệ thống chia làm phần: phần huấn luyện phần nhận dạng Phần huấn luyện: ảnh ký tự scan đưa vào hệ thống Hệ thống tiến hành giai đoạn tiền xử lý trích chọn đặc trưng từ liệu đưa vào Sau dãy vector đặc trưng đưa vào mô hình cần huấn luyện tương ứng với ký tự đưa vào Ở mô hình huấn luyện chọn mô hình Markov ẩn đề cập bên (được thực cách giải toán toán mô hình Markov ẩn) Các vector đặc trưng dãy quan sát đầu vào mô hình Markov ẩn Các đặc trưng lấy cách: ảnh ký tự chia theo chiều ngang thành khung Những khung có kích thước chồng lên (khoảng 1/3) Đặc trưng rút từ khung tạo thành vector đặc trưng Phần nhận dạng: tương tự phần huấn luyện Anh scan lấy đặc trưng Dãy vector đặc trưng đưa vào mô hình Markov ẩn huấn luyện Mô hình đạt giá trị lớn P(O|) ký tự ứng với mô hình kết nhận dạng (được thực cách giải toán toán mô hình Markov ẩn) Hệ thống có thêm phần hậu xử lý gồm chức như: kiểm tra tả dùng để tăng độ tin cậy hay sửa lỗi tả kết nhận dạng IV.2 Các vấn đề khó khăn hướng giải đối vời toán nhận dạng chữ viết tay tiếng Việt IV.2.1 Khó khăn dấu tiếng Việt 105 Cấu tạo ký tự tiếng Việt gồm phần: phần chữ phần dấu Dấu tầng Chữ Dấu tầng Hình 2.2 Cấu trúc ký tự tiếng Việt Vì xuất dấu tầng dấu tầng nên việc nhận dạng chữ viết tiếng Việt có số đặc điểm khác với việc nhận dạng chữ hệ thống ngôn ngữ la tinh khác Tập hợp chữ tiếng Việt: aăâbcdđeêghiklmnoôơpqrstuưvxy áàảãạ ắằẳẵặ ấầẩẫậ éèẻẽẹ ếềểễệ íìỉĩị óòỏõọ ốồổỗộ ớờởỡợ úùủũụ ứừửữự ýỳỷỹỵ AĂÂBCDĐEÊGHIKLMNOÔƠPQRSTUƯVXY ÁÀẢÃẠ ẮẰẲẴẶ ẤẦẨẪẬ É È Ẻ Ẽ Ẹ Ế Ề Ể Ễ Ệ Í Ì Ỉ Ĩ ỊÓ ÒỎÕỌ ỐỒỔỖỘ ỚỜỞỠỢ ÚÙỦŨỤ ỨỪỬỮỰ ÝỲỶỸỴ Bảng 2.1 Bảng ký tự tiếng Việt Tổng cộng: 178 chữ 106 Tiến trình nhận dạng trình phân loại lớp, có độ xác tỷ lệ nghịch với số lượng lớp Nếu số lớp cần nhận dạng nhiều tỷ lệ nhận dạng thấp Nếu xem chữ tiếng Việt lớp 178 chữ tạo thành 178 lớp Một số lượng lớp lớn, kết nhận dạng bị ảnh hưởng Một hướng tiếp cận để giảm số lượng lớp cần nhận dạng tiếng Việt dùng thuật toán để tách vùng chữ vùng dấu Lúc tiến trình nhận dạng gồm phần: nhận dạng chữ nhận dạng dấu Lúc tập hợp mẫu chữ gồm: abcdđeghiklmnoơpqrstuưvxy ABCDĐEGHIKLMNOƠPQRSTUƯVXY Bảng 2.2 Bảng ký tự tiếng Việt không dấu Tổng cộng: 50 chữ Như số lượng lớp giảm 1/3 so với số lượng lớp đề cập Do kết nhận dạng nâng cao Hơn số lượng dấu tiếng Việt không nhiều, dấu có đặc trưng riêng biệt nên hướng tiếp cận hoàn toàn làm IV.3 Khó khăn biến dạng chữ Mỗi người có nét chữ riêng, toán nhận dạng chữ viết tay gặp khó khăn Ví dụ mẫu chữ viết tay chữ A thể hình Hình 2.3 Mẫu ký tự chữ A viết tay 107 Nhìn hình vẽ ta thấy khác chữ A hình dạng nhiều Do dùng phương pháp đối sánh để nhận dạng chữ viết tay khó so với mẫu, ảnh cần nhận dạng khác xa so với mẫu Hơn phương pháp đối sánh nhạy cảm với độ lệch, độ nghiêng mẫu ảnh cần nhận dạng Trong trường hợp lệch hay nghiêng kết nhận dạng đối sánh giảm nhiều Nhìn ví dụ ta thấy kích thước chữ không đồng với nhau, vị trí nét chữ thay đổi Do dùng hướng tiếp cận đối sánh để giải toán nhận dạng chữ viết tay điều khó Ví dụ mẫu chữ viết tay chữ G thể hình Hình 2.4 Mẫu ký tự chữ G viết tay Nhìn hình vẽ đặc trưng chữ G không rõ ràng Chữ G trái bị thành phần ngang, chữ G phải thành phần ngang không rõ ràng Do dùng phương pháp nhận dạng đặc trưng chữ viết tay vấn đề chọn đặc trưng bất biến nét chữ khác điều khó Những đặc trưng thông dụng thường hay dùng để nhận dạng chữ in như: thành phần đứng, thành phần ngang, thành phần kín,…đều khó hay dùng toán nhận dạng chữ viết tay Ví dụ số mẫu chữ N thể hình Hình 2.5 Mẫu ký tự chữ N viết tay 108 Hình chữ N lấy cách hoàn toàn ngẫu nhiên, lựa chọn tập liệu thử Tất chữ N có nhiều nét khác biệt đặc trưng cho nhiều loại nét chữ Nếu dùng mạng Neural làm mô hình huấn luyện nhận dạng vấn đề chọn đặc trưng để học vấn đề khó giải Điều xảy trình học mạng Neural lần học mẫu chữ hay nhiều lớp Do mạng Neural nhận dạng tốt mẫu vừa học không nhận dạng tốt mẫu học lần lặp xa so với lần lặp đặc trưng chọn không tốt Điều dẫn đến trình hội tụ huấn luyện mạng Neural lâu Hơn dùng mạng Neural huấn luyện, kích thước số chiều vector đầu vào mẫu chữ phải Do trước đưa vào mạng Neural để huấn luyện, mẫu học phải qua trình chuẩn hoá Ngoài mạng Neural có nhược điểm dùng để nhận dạng chữ viết tay nhận dạng ký tự dính, mà vấn đề ký tự dính xảy nhiều toán nhận dạng chữ viết tay Tất vấn đề phần giải dùng mô hình Markov ẩn nhờ tính chất sau: - Đầu vào mô hình Markov ẩn không cần mẫu có số lượng khung - Quá trình học mô hình Markov ẩn tổng hợp tất mẫu khác lớp để đưa mô hình chung cho mẫu học - Với thuật toán Level Building áp dụng với mô hình Markov ẩn dùng để nhận dạng ký tự dính, tích hợp luật văn phạm IV.4 Mô hình nhận dạng huấn luyện Gọi N số phân lớp hệ thống cần nhận dạng (ở tập chữ hoa in tách dấu liệt kê bên trên, N=25) Ta xây dựng N mô hình Markov ẩn, mô hình đại diện cho phân 109 lớp Gọi tên mô hình lần lược là: , , , N Gọi O dãy vector nhận trình trích chọn đặc trưng chữ Quá trình huấn luyện thực thuật toán Baum-Welch hay thuật toán Segmental K means, hay kết hợp hai cách tạo khởi tạo tốt thuật toán Segmental K means dùng thuật toán BaumWelch để tối ưu tham số vừa khởi tạo Quá trình nhận dạng: O thuộc lớp v * với: v N v* arg max[P(O v )] | (2.8) Việc tính P(O v ) dựa vào việc giải toán toán | 110 mô hình Markov ẩn Khi xây dựng mô hình Markov ẩn, thông số cần quan tâm là: số trạng thái, số thành phần hợp trạng thái mô hình Markov ẩn liên tục hay số thành phần hợp thành không gian quan sát mô hình Markov ẩn bán liên tục hay số ký hiệu quan sát phân biệt mô hình Markov ẩn rời rạc Khi chọn lựa số trạng thái mô hình nhận dạng tiếng nói, có nhiều ýkiến khác Một ý tưởng hợp lý chấp nhận ngữ cảnh nhận dạng chữ viết tay xây dựng mô hình Markov ẩn với trạng thái tương ứng với biến đổi cấu trúc đường nét chữ Cuối cần ý đến loại mô hình Markov ẩn phù hợp, tính chất chuyển đổi đường nét từ trái sang phải nên mô hình Markov ẩn chọn mô hình Markov ẩn Bakis Hình 2.12 Mô hình Markov ẩn nhận dạng chữ viết tay Sau nhận dạng chữ hoa, ta tiến hành nhận dạng dấu (sẽ trình bày ởchương sau) Và sau dùng mô hình văn phạm để hiệu chỉnh kết IV.5 Mô hình văn phạm IV.5.1.Mô hình tự điển 111 Cây tự điển mảng đa phân, tạo thành với liệu node ký tự cho từ tự điển tiếng Việt tạo thành đường [1] Ví dụ chữ “anh” hình tạo node gốc làchữ “a”, node cấp chữ “n”, node cấp chữ “h” Vì cấu trúc từ đơn tiếng Việt có tối đa chữ nên từ điển có tối đa mức a b c m b n g h mức mưc mức mức Hình 2.13 Mô hình tự điển Vì cấu trúc từ đơn tiếng Việt có tối đa chữ nên từ điển cótối đa mức Tiếng Việt có gần 8000 từ đơn Nếu lưu trực tiếp 8000 từ đơn không lợi không gian lưu trữ mà khó khăn trình tìm kiếm (phải duyệt tuần tự) Mục đích tổ chức tự điển nhằm tối ưu không gian lưu trữ khả tìm kiếm cao tổ chức mức tăng dần theo trật tự alphabe Cây tự điển có chức chính: kiểm tra lỗi tả sửa lỗi tả Quá trình kiểm tra lỗi tả thực cách duyệt từ trái sang phải ký tự từ ký tự tạo thành đường tự điển từ tả, ngược lại từ sai lỗi tả 112 Quá trình sửa lỗi tả thực cách dùng mô hình trigrammar Ý tưởng mô hình dùng chữ liên kết trước chữliên kết sau chữ từ để hiệu chỉnh lại chữ trường hợp sai lỗi ngữ pháp Trong ngữ cảnh toán nhận dạng họ tên người Việt, việc sửa lỗi tả từ điển không đủ mạnh không tận dụng số tính chất đặc biệt toán IV.5.2 Mô hình lớp từ đơn Vì cấu trúc từ tiếng Việt gồm tối đa chữ nên tổ chức từ tiếng Việt thành lớp: lớp chữ, lớp chữ,…, lớp chữ [1] Từ cần phân lớp ký tự a ký tự ký tự anh ký tự ký tự ký tự Hình 2.13 Mô hình lớp từ đơn Mô hình lớp từ đơn dùng chủ yếu để hiệu chỉnh lỗi tả, trình thực sau: Khi từ tự điển (nghĩa sai lỗi tả) ta tìm lớp từ tương ứng từ sai so với từ đưa vào (sai ký tự nhất) Trong ngữ cảnh toán nhận dạng họ tên người Việt, mô hình hiệu chỉnh lỗi sai tả tốt Bởi họ người Việt có khoảng 150 họ, tần số xuất họ thay đổi lớn, nên tìm từ gần với từ 113 xét ta chọn từ sai có tần số xuất cao Ngoài chữlót tên thực tương tự IV.6 Tổng kết chương Tóm lại, chương này, điểm qua số vấn đề vàcách xây dựng hệ nhận chữ viết tay đơn giản Mô hình nhận dạng nhấn mạnh mô hình Markov ẩn thay đổi đặc trưng chữ cách dễ dàng Trong ngữ cảnh toán nhận dạng chữ viết tay họ tên người Việt Nam, dùng mô hình văn phạm (ở dùng mô hình lớp từ đơn) để nâng cao kết nhận dạng CHƯƠNG V CÀI ĐẶT CHƯƠNG TRÌNH VÀ ĐÁNH GIÁ KẾT QUẢ V.1 Môi trường thực nghiệm  Chương trình cài đặt ngôn ngữ Visual C# thử nghiệm hệ điều hành Windows XP SP2, máy tính PC tốc độ 1,6 GHz, nhớ 256MB RAM  Toàn sở liệu mẫu thiết kế lưu trữ Microsoft Office 2007 V.2 Tạo sở liệu mẫu Trước tiên trương trình cần học qua liệu mẫu Trong trình sử dụng, người dùng cần định nghĩa ký tự chương trình có thêm chức cho người dùng tự định nghĩa Giao diện làm việc trương trình : Hình 5.1: giao diện chương trình V.2.1 Tạo CSDL mẫu cho nhận dạng online Để tạo csdl mẫu cho trình nhận dạng online ta chọn nút Nhận dạng Online form Sau chọn form nhận dạng online hiển thị sau: Hình 5.2: Gao diện form nhận dạng online Sử dụng chuột để vẽ ký tự vào ô Pain Sau vẽ xong, click vào Học để tiến hành huấn luyện cho chương trình Hình 5.3: giao diện form huấn luyện online Chọn chữ tương ứng với ký tự vừa vẽ từ dropdown list sau click vào Khởi tạo để lưu liệu mẫu vào db V.2.2 Tạo CSDL mẫu cho nhận dạng offline Từ form giao diện chọn Nhận dạng Offline Form nhận dạng offline hiển thị sau: Hinnh 5.4: Giao diện form huấn luyện Offline Chọn Open Image để mở file ảnh mẫu ký tự Sau click vào Học mẫu Form học mẫu hiển thị nhu hình Chọn vào checkbox Nhận dạng Offline sau click vào khởi tạo V.3 Hướng phát triển Từ trình thực nghiệm cho thấy, trương trình có thành công định Song bên cạnh nhiều nhược điểm cần cải tiến Trong trình hoàn thành đồ án nhận thấy tâm huyết với toán nhận thấy toán có khả phát triển cao Tôi mong muốn phát triển thành trương trình ứng dụng thực tế Tôi xin đưa số hướng phát triển cho toán  Phát triển để trương trình tích hợp với trương trình quản lý sinh viên, học sinh Phát triển thêm mặt liệu để trương trình hoạt động tốt với liệu trương trình quản ly  Cải tiến số thuật toán tiền xử lý để chương trình có tốc độ tốt  Phát triển giao diện thân thiện với người sử dụng TÀI LIỆU THAM KHẢO Tài liệu tham khảo tiếng Việt: [1] Nguyễn Đức Dũng, Nguyễn Minh Tuấn Một số phương pháp nhận dạng ứng dụng nhận dạng chữ viết tay Khoá luận tốt nghiệp Đại học 2003, Khoa Công nghệ - Đại học Quốc gia Hà nội, tr.17-43 [2] Hoàng Kiếm, Nguyễn Hồng Sơn, Đào Minh Sơn (2001) ứng dụng mạng neuron nhân tạo hệ thống xử lý biểu mẫu tự động Kỷ yếu hội nghị kỉ niệm 25 thành lập Viện Công nghệ Thông tin, tr.1-3 [3] Nguyễn Thị Thanh Tân Nhận dạng chữ viết tay hạn chế dựa mô hình mạng neuron kết hợp với thống kê ngữ cảnh Luận văn thạc sỹ, ĐHQGHN, tr.3-83 Tài liệu tham khảo tiếng Anh: [4] Anil K Jain, Jianchang Mao, K.M Mohiuddin (1996) Artificial Neural Networks A Tutorial IEEE, tr.31-44 [5] Baret O and Simon J.C (1992) Cursive Words Recognition From Pixels to Features III Frontiers in Handwriting Recognition, tr.1-2 [6] Behnke S., Pfister M and Rojas, R (2000) Recognition of Handwritten ZIP Codes in a Real-World Non-Standard-Letter Sorting System Kluwer Academic Publishers, tr.95-115 [7] Dave Anderson and George McNeill (1992) Artificial Neural Networks Technology Prepared for Rome Laboratory RL/C3C Griffiss AFB, NY 134415700, tr 2-17 [8] www.codeproject.com [...]... trình thử nghiệm” được thực hiện với mục đích giải quyết một lớp con các bài toàn nhận dạng chữ viết tay, tập trung vào bước nhận dạng ký tự tiếng Việt đơn lẻ do đây là bước mà mọi hệ nhận dạng chữ viết tiếng Việt cần phải có 62  Từ đó tạo cơ sở để tiếp theo có thể xây dựng và phát triển một sản phẩm nhận dạng chữ viết tay hoàn chỉnh trên các thiết bị di động, áp dụng vào việc hỗ trợ việc học tập và... lĩnh vực nhận dạng tiếng nói Chính sự thành công này đã mở ra một hướng tiếp cận mới trong lĩnh vực nhận dạng ảnh văn bản Có thể nói, thời gian gần đây đã xuất nhiều những công trình nghiên cứu nhận dạng ảnh văn bản bao gồm cả chữ in và chữ viết tay, online và offline sử dụng mô hình này Một trong những điểm mạnh nhất của mô hình Markov ẩn là nó cho phép tích hợp các bước phân đoạn, nhận dạng và xử... mạng neural nhận dạng ký tự So với hai phương pháp còn lại, phương pháp sử dụng mạng Neural được lựa chọn là do những ưu điểm sau đây:  Tính phi tuyến  Mô hình tổng quát cho ánh xạ từ tập vào đến tập ra  Có thể yêu cầu sự tiến hóa nhanh của hàm mục tiêu  Chấp nhận lỗi ở các ví dụ học  Thích ứng với nhiễu dữ liệu I.4 Phạm vi đề tài  Đồ án “Nghiên cứu phương pháp nhận dạng chữ viết tay và cài đặt... tả như các vector mà các phần tử của nó là các giá trị thống kê về hướng Việc chọn đặc trưng để nâng cao độ chính xác của bài tốn nhận dạng là hết sức khó khăn, đòi hỏi rất nhiều thời gian và quyết định rất nhiều đến độ chính xác Hơn nữa, do biến dạng khá lớn trong chữ viết tay nên để hạn chế người ta thường chia ô trên ảnh và đặc trưng được rút trong các ô đó Hình 2.9 Đặc trưng hướng II.4.2 Một số phương... chọn đặc trưng Trích chọn đặc trưng là quá trình tìm ra các thông tin hữu ích và đặc trưng nhất cho mẫu đầu vào để sử dụng cho quá trình nhận dạng Trong lĩnh vực nhận dạng, trích chọn đặc trưng là một bước rất quan trọng, nó có ảnh hưởng lớn đến tốc độ và chất lượng nhận dạng Trích chọn đặc trưng như thế nào để vẫn đảm bảo không mất mát thông tin và thu gọn kích thước đầu vào là điều vẫn đang được các... wavelet Haar Phương pháp trích chọn đặc trưng này sẽ tạo ra một dãy số các đặc trưng giảm dần Với cùng một chữ thì các giá trị lớn ở đầu dãy tương đối ổn định, và có thể đại diện cho hình dạng khái quát của chữ Còn các giá trị ở cuối dãy nhỏ dần và không ổn định, thể hiện sự đa dạng trong từng chi tiết của chữ  Trích chọn đặc trưng chuỗi Fourier 76 Biên của ảnh là một trong những đặc trưng quan trọng nhất... thường được sử dụng nhiều nhất trong các ứng dụng Các kết xuất tương ứng với một mẫu tượng có thể được mô tả ở dạng rời rạc hoặc liên tục Dạng rời rạc như các ký tự từ bảng chữ cái, các vector được lượng hóa từ codebook trong dạng liên tục có thể là các mẫu tiếng nói hoặc bản nhạc được biểu diễn dạng sóng liên tục Trong trường hợp tổng quát một tín hiệu có thể được phân làm hai loại: loại có các đặc tính... hình, aij, sao cho phù hợp với những gì thu nhận được Mô hình hoạt động của hệ thống đèn giao thông theo cách này chính là dạng Markov bậc nhất – trạng thái của mô hình tại thời điểm t chỉ phụ thuộc vào trạng thái ở thời điểm t-1 Một cách tổng quát hơn, ta có thể viết: P[qi = S | qi-1 = Si, qi-1 = Sk, …] = P[qi = S | qi-1 = Si] (2) Mở rộng hơn, ta giả thiết rằng hệ thống đèn thay đổi trạng thái tại mỗi... = 0,16, 0,43 = 0,064 cho ba bước tiếp theo… Đây là dạng mật độ xác suất theo số mũ Raviv mô hình tri thức ngữ cảnh để nhận dạng văn bản bằng cách xấp xỉ sự phụ thuộc giữa các chữ liên tiếp nhau như một chuỗi Markov bậc n Tuy nhiên những mô hình loại này bị giới hạn về độ chính xác khi được sử dụng để mô hình các tiến trình trong thế giới thực Một dạng phức tạp hơn là mô hình Markov ẩn (HMM) HMM rất... tiềp theo II.2 Các công đoạn tiền xử lý Giai đoạn tiền xử lý văn bản là giai đoạn quan trọng, có ảnh hưởng trực tiếp đến độ chính xác của quá trình nhận dạng, tuy nhiên nó cũng làm tăng thời 63 gian chung của cả hệ thống Vì vậy, tùy theo chất lượng ảnh thu nhận được của từng trường hợp cụ thể, mà chúng ta chọn sử dụng một hoặc một số thủ tục tiền xử lý Thậm chí, trong trường hợp văn bản đầu vào có chất ... nghiên cứu nước: Nhận dạng chữ viết tay chia thành hai lớp toán lớn nhận dạng chữ viết tay trực tuyến (online) nhận dạng chữ viết tay ngoại tuyến (offline) Trong nhận dạng chữ viết tay ngoại tuyến,... cao việc nhận dạng ký tự (khoảng 95%) có bước tiến đáng kể nhận dạng từ Tuy nhiên sản phẩm chưa nhận dạng chữ viết tay tiếng Việt Như thấy nhận dạng chữ viết tay, đặc biệt chữ viết tay tiếng... liệu đầu vào cho dạng ảnh quét từ giấy tờ, văn Ngược lại nhận dạng chữ viết tay trực tuyến nhận dạng chữ hình viết Trong hệ nhận dạng máy tính lưu lại thông tin nét chữ thứ tự nét viết, hướng tốc

Ngày đăng: 18/11/2015, 16:04

Từ khóa liên quan

Mục lục

  • II.2.4.3BộlọcGauss

  • II.2.5Làmtrơnảnh,táchbiênđốitượng

  • II.3Cănchỉnhđộlệchtrang

  • II.5Kếtluậnchương

  • III.1Giớithiệu

  • III.2HUẤNLUYỆNVÀCHOĐIỂMHMM

  • TÀILIỆUTHAMKHẢO

Tài liệu cùng người dùng

Tài liệu liên quan