Xử lý ảnh số -P12

48 650 7
Xử lý ảnh số -P12

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Xử lý ảnh số

Chơng Bảy: nhận dạng ảnh 7 nhận dạng ảnhPattern recognitionNh chỉ ra trong hình 1.1-a chơng Một, nhận dạng ảnh là giai đoạn cuối cùng của các hệ thống xử ảnh. Nhận dạng ảnh dựa trên nền tảng thuyết nhận dạng (pattern recognition) nói chung và đã đợc đề cập trong nhiều sách về nhận dạng. ở đây, ta không nhắc lại mà chỉ trình bày mang tính chất giới thiệu một số khái niệm cơ bản và các phơng pháp thờng đợc sử dụng trong kỹ thuật nhận dạng. Và cuối cùng sẽ đề cập đến một trờng hợp cụ thể về nhận dạng đó là nhận dạng chữ viết, một vấn đề đã và đang đợc quan tâm nhiều.Trong thuyết nhận dạng nói chung và nhận dạng ảnh nói riêng có 3 cách tiếp cận khác nhau:- Nhận dạng dựa vào phân hoạch không gian.- Nhận dạng cấu trúc.- Nhận dạng dựa vào kỹ thuật mạng nơ ron.Hai cách tiếp cận đầu là các kỹ thuật kinh điển. Các đối tợng ảnh quan sát và thu nhận đợc phải trải qua giai đoạn tiền xử nhằm tăng cờng chất lợng, làm nổi các chi tiết (chơng 4), tiếp theo là trích chọn và biểu diễn các đặc trng (chơng 5 và chơng 6), và cuối cùng mới qua giai đoạn nhận dạng. Cách tiếp cận thứ ba hoàn toàn khác. Nó dựa vào cơ chế đoán nhận, lu trũ và phân biệt đối tợng mô phỏng theo hoạt động của hệ thần kinh con ngời. Do cơ chế đặc biệt, các đối tợng thu nhận bởi thị giác ngời không cần qua giai đoạn cải thiện mà chuyển ngay sang giai đoạn tổng hợp, đối sánh với các mẫu đã lu trữ để nhận dạng. Đây là cách tiếp cận có nhiều hứa hẹn. Các cách tiếp cận trên sẽ trình bày chi tiết trong các phần dới đây.7.1 tổng quan về nhận dạngNhận dạng là quá trình phân loại các đối tợng đợc biểu diễn theo một mô hình nào đó và gán cho chúng vào một lớp (gán cho đối tợng một tên gọi) dựa theo những quy luật và các mẫu chuẩn. Quá trình nhận dạng dựa vào những mẫu học biết trớc gọi là nhận dạng có thày hay học có thày (supervised learning); trong trờng hợp ngợc lại gọi là học không có thày (non supervised learning). Chúng ta sẽ lần lợt giới thiệu các khái niệm này.7.1.1 Không gian biểu diễn đối tợng, không gian diễn dịchKhông gian biểu diễn đối tợngCác đối tợng khi quan sát hay thu thập đợc, thờng đợc biểu diễn bởi tập các đặc trng hay đặc tính. Nh trong trờng hợp xử ảnh, ảnh sau khi đợc tăng cờng để nâng cao chất lợng, phân vùng và trích Nhập môn xử ảnh số - ĐHBK Hà nội -1 Chơng Bảy: nhận dạng ảnhchọn đặc tính nh đã trình bày trong các chơng từ chơng Bốn đến chơng Sáu, đợc biểu diễn bởi các đặc trng nh biên, miền đồng nhất, v .,v. Ngời ta thờng phân các đặc trng này theo các loại nh: đặc trng tô pô, đặc trng hình học và đặc trng chức năng. Việc biểu diễn ảnh theo đặc trng nào là phụ thuộc vào ứng dụng tiếp theo.ở đây ta đa ra một cách hình thức việc biểu diễn các đối tợng. Giả sử đối tợng X (ảnh, chữ viết, dấu vân tay, v .,v) đợc biểu diễn bởi n thành phần (n đặc trng): X = {x1, x2, ., xn}; mỗi xi biểu diễn một đặc tính. Không gian biểu diễn đối tợng thờng gọi tắt là không gian đối tợng X đợc định nghĩa: X = {X1, X2, ., Xm}trong đó mỗi Xi biểu diễn một đối tợng. Không gian này có thể là vô hạn. Để tiện xem xét chúng ta chỉ xét tập X là hữu hạn.Không gian diễn dịchKhông gian diễn dịch là tập các tên gọi của đối tợng. Kết thúc quá trình nhận dạng ta xác định đợc tên gọi cho các đối tợng trong tập không gian đối tợng hay nói là đã nhận dạng đợc đối tợng Một cách hình thức gọi là tập tên đối tợng: = {w1, w2, .,wk} với wi, i = 1, 2, ., k là tên các đối tợng Quá trình nhận dạng đối tợng f là một ánh xạ f: X ---> với f là tập các quy luật để định một phần tử trong X ứng với một phần tử trong . Nếu tập các quy luật và tập tên các đối tợng là biết trớc nh trong nhận dạng chữ viết (có 26 lớp từ A đến Z), ngời ta gọi là nhận dạng có thày. Trờng hợp thứ hai là nhận dạng không có thày. Đơng nhiên trong trờng hợp này việc nhận dạng có khó khăn hơn.7.1.2 Mô hình và bản chất của quá trình nhận dạng7.1.2.1 Mô hìnhViệc chọn lựa một quá trình nhận dạng có liên quan mật thiết đến kiểu mô tả mà ngời ta sử dụng để đặc tả đối tợng. Trong nhận dạng, ngời ta phân chia làm 2 họ lớn:- Họ mô tả theo tham số- Họ mô tả theo cấu trúc.Cách mô tả đợc lựa chọn sẽ xác định mô hình của đối tợng. Nh vậy, chúng ta sẽ có 2 loại mô hình: mô hình theo tham số và mô hình cấu trúc. Mô hình tham số sử dụng một véctơ để đặc tả đối tợng. Mỗi phần tử của véctơ mô tả một đặc tính của đối tợng. Thí dụ nh trong các đặc trng chức năng, ngời ta sử dụng các hàm cơ sở trực giao để biểu diễn. Và nh vậy ảnh sẽ đợc biểu diễn bởi một chuỗi các hàm trực giao. Giả sử C là đờng bao của ảnh và C(i,j) là điểm thứ i trên đờng bao, i = 1, 2, ., N (đờng bao gồm N điểm). Giả sử tiếp :x0 = xiy0 = yilà toạ độ tâm điểm. Nh vậy, moment trung tâm bậc p, q của đờng bao là:Nhập môn xử ảnh số - ĐHBK Hà nội -2 Chơng Bảy: nhận dạng ảnh àpq =(xi-x0)p(yi-y0)q (7.1)Véctơ tham số trong trờng hợp này chính là các moment àij với i=1, 2, .,p và j=1, 2, .,q. Còn trong số các đặc trng hình học, ngời ta hay sử dụng chu tuyến , đờng bao, diện tích và tỉ lệ T = 4S/p2, với S là diện tích, p là chu tuyến.Việc lựa chọn phơng pháp biểu diễn sẽ làm đơn giản cách xây dựng. Tuy nhiên, việc lựa chọn đặc trng nào là hoàn toàn phụ thuộc vào ứng dụng. Thí dụ , trong nhận dạng chữ (sẽ trình bày sau), các tham số là các dấu hiệu:- số điểm chạc ba, chạc t,- số điểm chu trình,- số điểm ngoặt,- số điểm kết thúc, chẳng hạn với chữ t có 4 điểm kết thúc, 1 điểm chạc t, . Mô hình cấu trúc: Cách tiếp cận của mô hình này dựa vào việc mô tả đối tợng nhờ một số khái niệm biểu thị các đối tợng cơ sở trong ngôn ngữ tự nhiên. Để mô tả đối tợng, ngời ta dùng một số dạng nguyên thuỷ nh đoạn thẳng, cung, v, .,v. Chẳng hạn một hình chữ nhật đợc định nghĩa gồm 4 đoạn thẳng vuông góc với nhau từng đôi một. Trong mô hình này ngời ta sử dụng một bộ kí hiệu kết thúc Vt, một bộ kí hiệu không kết thúc gọi là Vn. Ngoài ra có dùng một tập các luật sản xuất để mô tả cách xây dựng các đối tợng phù hợp dựa trên các đối tợng đơn giản hơn hoặc đối tợng nguyên thuỷ (tập Vt). Trong cách tiếp cận này, ta chấp nhận một khẳng đinh là: cấu trúc một dạng là kết quả của việc áp dụng luật sản xuất theo theo những nguyên tắc xác định bắt đầu từ một dạng gốc bắt đầu. Một cách hình thức, ta có thể coi mô hình này tơng đơng một văn phạm G = (Vt, Vn, P, S) với:- Vt là bộ ký hiệu kết thúc,- Vn là bộ ký hiệu không kết thúc,- P là luật sản xuất,- S là dạng (ký hiệu bắt đầu).Thí dụ, đối tợng nhà gồm mái và tờng, mái là một tam giác gồm 3 cạnh là 3 đoạn thẳng, tờng là một hình chữ nhật gồm 4 cạnh vuông góc với nhau từng đôi một sẽ đợc mô tả thông qua cấu trúc mô tả dựa vào văn phạm sinh nh chỉ ra trong hình 7.1 dới đây. (1) (2) Nhà (3) Mái TờngNhập môn xử ảnh số - ĐHBK Hà nội -3 Chơng Bảy: nhận dạng ảnh (6) (4) Đọạn 1 Đoạn 2 Đoạn 3 Đoạn 3 Đoạn 4 Đoạn 5 Đoạn 6 (5) Hình 7.1 Mô hình cấu trúc của một đối tợng nhà.7.1.2.2 Bản chất của quá trình nhận dạngQuá trình nhận dạng gồm 3 giai đoạn chính:- Lựa chọn mô hình biểu diễn đối tợng.- Lựa chọn luật ra quyết định (phơng pháp nhận dạng) và suy diễn quá trình học.- Học nhận dạng.Khi mô hình biểu diễn đối tợng đã đợc xác định, có thể là định lợng (mô hình tham số) hay định tính (mô hình cấu trúc), quá trình nhận dạng chuyển sang giai đoạn học. Học là giai đoạn rất quan trọng. Thao tác học nhằm cải thiện, điều chỉnh việc phân hoạch tập đối tợng thành các lớp.Việc nhận dạng chính là tìm ra quy luật và các thuật toán để có thể gán đối tợng vào một lớp hay nói một cách khác gán cho đối tợng một tên. Học có thày (supervised learning)Kỹ thuật phân loại nhờ kiến thức biết trớc gọi là học có thày. Đặc điểm cơ bản của kỹ thuật này là ngời ta có một th viện các mẫu chuẩn. Mẫu cần nhận dạng sẽ đợc đem sánh với mẫu chuẩn để xem nó thuộc loại nào. Thí dụ nh trong một ảnh viễn thám, ngời ta muốn phân biệt một cánh đồng lúa, một cánh rừng hay một vùng đất hoang mà đã có các miêu tả về các đối tợng đó. Vấn đề chủ yếu là thiết kế một hệ thống để có thể đối sánh đối tợng trong ảnh với mẫu chuẩn và quyết định gán cho chúng vào một lớp. Việc đối sánh nhờ vào các thủ tục ra quyết định dựa trên một công cụ gọi là hàm phân lớp hay hàm ra quyết định. Hàm này sẽ đợc đề cập trong phần sau.Học không có thày(unsupervised learning)Kỹ thuật học này phải tự định ra các lớp khác nhau và xác định các tham số đặc trng cho từng lớp. Học không có thày đơng nhiên là khó khăn hơn. Một mặt, do số lớp không đợc biết trớc, mặt khác những đặc trng của các lớp cũng không biết trớc. Kỹ thuật này nhằm tiến hành mọi cách gộp nhóm có thể và chọn lựa cách tốt nhất. Bắt đầu từ tập dữ liệu, nhiều thủ tục xử khác nhau nhằm phân lớp và nâng cấp dần để đạt đợc một phơng án phân loại. Một số kỹ thuật tự học sẽ đợc trình bày trong phần 7.2.4.Nhìn chung, dù là mô hình nào và kỹ thuật nhận dạng ra sao, một hệ thống nhận dạng có thể tóm tắt theo đồ sau: Trích chọn đặc tính Phân lớp trả lời Đánh biểu diễn đối tợng ra quyết định giáNhập môn xử ảnh số - ĐHBK Hà nội -4 Chơng Bảy: nhận dạng ảnh Quá trình tiền xử Khối nhận dạngHình 7.2 đồ tổng quát một hệ nhận dạng.7.2 nhận dạng dựa trên phân hoạch không gianTrong kỹ thuật này, các đối tợng nhận dạng là các đối tợng định lợng. Mỗi đối tợng đợc biểu diễn bởi một véctơ nhiều chiều. Trớc tiên, ta xem xét một số khái niệm nh: phân hoạch không gian, hàm phân biệt sau đó sẽ đi vào một số kỹ thuật cụ thể. 7.2.1 Phân hoạch không gianGiả sử không gian đối tợng X đợc định nghĩa : X = {Xi, i=1, 2, .,m}, Xi là một véctơ. Ngời ta nói p là một phân hoạch của không gian X thành các lớp Ci, Ci X nếu: Ci Cj = với i j và Ci = XNói chung, đây là trờng hợp tởng: tập X tách đợc hoàn toàn. Trong thực tế, thờng gặp không gian biểu diễn tách đợc từng phần. Nh vậy phân loại là dựa vào việc xây dựng một ánh xạ f: X ---> p. Công cụ xây dựng ánh xạ này là các hàm phân biệt (Descriminant functions).7.2.2 Hàm phân lớp hay hàm ra quyết địnhĐể phân đối tợng vào các lớp, ta phải xác định số lớp và ranh giới giữa các lớp đó. Hàm phân lớp hay hàm phân biệt là một công cụ rất quan trọng. Gọi {gi} là lớp các hàm phân lớp. Lớp hàm này đợc định nghĩa nh sau: nếu i k, gk(X) > gi(X) thì ta quyết định X lớp k.Nh vậy để phân biệt k lớp, ta cần k-1 hàm phân biệt. Hàm phân biệt g của một lớp nào đó thờng dùng là hàm tuyến tính, có nghĩa là: g(X) = W0 + W1X1 + W2 X2+. . . + Wk Xktrong đó:- Wi là các trọng số gán cho các thành phần Xi.- W0 là trọng số để viết cho gọn.Trong trờng hợp g là tuyến tính, ngời ta nói là việc phân lớp là tuyến tính hay siêu phẳng (hyperplan).Các hàm phân biệt thờng đợc xây dựng dựa trên khái niệm khoảng cách hay dựa vào xác suất có điều kiện.Lẽ tự nhiên, khoảng cách là một công cụ rất tốt để xác định xem đối tợng có " gần nhau" hay không. Nếu khoảng cách nhỏ hơn một ngỡng nào đấy ta coi 2 đối tợng là giống nhau và gộp chúng vào một lớp. Ngợc lại , nếu khoảng cách lớn hơn ngỡng , có nghĩa là chúng khác nhau và ta tách thành 2 lớp.Trong một số trờng hợp, ngời ta dựa vào xác suất có điều kiện để phân lớp cho đối tợng. thuyết xác suất có điều kiện đợc Bayes nghiên cứu khá kỹ và chúng ta có thể áp dụng thuyết này để phân biệt đối tợng. Gọi : P(X/Ci) là xác suất để có X biết rằng có xuất hiện lớp Ci P(Ci /X) là xác suất có điều kiện để X thuộc lớp Ci.Nhập môn xử ảnh số - ĐHBK Hà nội -5 Chơng Bảy: nhận dạng ảnhvới X là đối tợng nhận dạng, Ci là các lớp đối tợng.Quá trình học cho phép ta xác định P(X/Ci) và nhờ công thức Bayes về sác xuất có điều kiện áp dụng trong điều kiện nhiều biến, chúng ta sẽ tính đợc P(Ci/X) theo công thức: P(Ci /X) = (7.2)Nếu P(Ci /X) > P(Ck /X) với i # k thì X Ci. Tuỳ theo các phơng pháp nhận dạng khác nhau, hàm phân biệt sẽ có các dạng khác nhau.7.2.3 Nhận dạng thống kêNếu các đối tợng nhận dạng tuân theo luật phân bố Gauss, mà hàm mật độ sác xuất cho bởi: 1 (x-m)2 f(x) = exp (- ) 22 22ngời ta có dùng phơng pháp ra quyết định dựa vào thuyết Bayes. thuyết Bayes thuộc loại thuyết thống kê nên phơng pháp nhận dạng .dựa trên thuyết Bayes có tên là phơng pháp thống kê.Quy tắc Bayes- Cho không gian đối tợng X = {Xl, l=1, 2, ., L}, với Xl= {x1, x2, ., xp}- Cho không gian diễn dịch = { C1, C2, ., Cr}, r là số lớpQuy tắc Bayes phát biểu nh sau:: X ---> sao cho X Ck nếu P(Ck /X) > P(Cl /X) l <> k, l=1, 2, .,r.Trờng hợp tởng là nhận dạng luôn đúng, có nghĩa là không có sai số. Thực tế , luôn tồn tại sai số trong quá trình nhận dạng. Vấn đề ở đây là xây dựng quy tắc nhận dạng với sai số là nhỏ nhất.Phơng pháp ra quyết định với tối thiểuTa xác định X Ck nhờ xác suất P(Ck/X). Vậy nếu có sai số, sai số sẽ đợc tính bởi 1 - P(Ck/X). Để đánh giá sai số trung bình, ngời ta xây dựng một ma trận L(r,r) giả thiết là có n lớp. Ma trận L đợc định nghĩa nh sau: lk,j > 0 nếu k <>j (tồn tại sai số) (7.3) Lk,j = lk,j <= 0 nếu k = j (không có sai số)Nh vậy, sai số trung bình của sự phân lớp sẽ là: rk(X) = (7.4)Để sai số là nhỏ nhất ta cần có rk là min. Từ công thức 7.2 và 7.4 ta có: rk(X) = P(Cj) (7.5)Vậy, quy tắc ra quyết định dựa trên thuyết Bayes có tính đến sai số đợc phát biểu nh sau: X Ck nếu k < p với p <> k, p=1, 2, ., r. (7.6)với k là rk(X).Trờng hợp đặc biệt với 2 lớp C1 và C2, ta dễ dàng có: X C1 nếu P(X/C1) > (7.7)Giả sử thêm rằng xác suất phân bố là đều (P(C1) = P(C2), sai số là nh nhau ta có: X C1 nếu P(X/C1) > P(X/C2) (7.8)Nhập môn xử ảnh số - ĐHBK Hà nội -6 Chơng Bảy: nhận dạng ảnh 7.2.4 Một số thuật toán nhận dạng tiêu biểu trong tự họcThực tế có nhiều thuật toán nhận dạng học không có thày. ở đây, chúng ta xem xét 3 thuật toán hay đợc sử dụng: Thuật toán nhận dạng dựa vào khoảng cách lớn nhất, thuật toán K- trung bình (K mean) và thuật toán ISODATA. Chúng ta lần lợt xem xét các thuật toán này vì chúng có bớc tiếp nối, cải tiến từ thuật toán này qua thuật toán khác.7.2.4.1 Thuật toán dựa vào khoảng cách lớn nhấta) Nguyên tắcCho một tập gồm m đối tợng. Ta xác định khoảng cách giữa các đối tợng và khoảng cách lớn nhất ứng với phần tử xa nhất tạo nên lớp mới. Sự phân lớp đợc hình thành dần dần dựa vào việc xác định khoảng cách giữa các đối tợng và các lớp.b) Thuật toánBớc 1- Chọn hạt nhân ban đầu: giả sử X1 C1 gọi là lớp g1. Gọi Z1 là phần tử trung tâm của g1.- Tính tất cả các khoảng cách Dj1 = D(Xj,Z1) với j =1, 2, ., m- Tìm Dk1= maxj Dj1. Xk là phần tử xa nhất của nhóm g1. Nh vậy Xk là phần tử trung tâm của lớp mới g2, kí hiệu Z2.- Tính d1 = D12 = D(Z1,Z2).Bớc 2- Tính các khoảng cách Dj1, Dj2.- Dj1 = D(Xj,Z1), Dj2 = D((Xj,Z2). Đặt Dk(2) = max j DjNguyên tắc chọn- Nếu Dk(2) < d1 kết thúc thuật toán. Phân lớp xong.- Nếu không, sẽ tạo nên nhóm thứ ba. Gọi Xk là phần tử trung tâm của g3, kí hiệu Z3.- Tính d3 = (D12 + D13 + D23)/3với là ngỡng cho trớc và D13 = D(Z1,Z3), D23 = D(Z2,Z3).Quá trình cứ lặp lại nh vậy cho đến khi phân xong. Kết quả là ta thu đợc các lớp với các đại diện là Z1, Z2 , ., Zm.7.2.4.2. Thuật toán K trung bình ( giả sử có K lớp)a) Nguyên tắcKhác với thuật toán trên, ta xét K phần tử đầu tiên trong không gian đối tợng, hay nói một cách khác ta cố định K lớp. Hàm để đánh giá là hàm khoảng cách Euclide: Jk = (7-9)Jk là hàm chỉ tiêu với lớp Ck. Việc phân vùng cho k hạt nhân đầu tiên đợc tiến hành theo nguyên tắc khoảng cách cực tiểu. ở đây, ta dùng phơng pháp đạo hàm để tính cực tiểu.Xét với Zk là biến. Ta dễ dàng có (7.9) min khi: = 0 ==> Zk = (7.10)Công thức 7.10 là giá trị trung bình của lớp Ck và điều này giải tên của phơng pháp.Nhập môn xử ảnh số - ĐHBK Hà nội -7 Chơng Bảy: nhận dạng ảnhb)Thuật toán Chọn Nc phần tử (giả thiết có Nc lớp) của tập T. Gọi các phần tử trung tâm của các lớp đó là: X1, X2, ., XNc và ký hiệu là Z1, Z2, ., ZNc. Thực hiện phân lớpX Ck nếu D(X,Zk) = Min D(X,Zj)(1), j =1, ., Nc. (1) là lần lặp thứ nhất.Tính tất cả Zk theo công thức 7.10.Tiếp tục nh vậy cho đến bớc q.X Gk(q-1) nếu D(X,Zk(q-1)) = min l D(X,Zl(q-1)). Nếu Zk(q-1) = Zk(q) thuật toán kết thúc, nếu không ta tiếp tục thực hiện phân lớp.7.2.4.3 Thuật toán ISODATAISODATA là viết tắt của từ Iteractive Self Organizing Data Analysis. Nó là thuật toán khá mềm dẻo, không cần cố định các lớp trớc. Các bớc của thuật toán đợc mô tả nh sau:- Lựa chọn một phân hoạch ban đầu dựa trên các tâm bất kỳ. Thực nghiệm đã chứng minh kết quả nhận dạng không phụ thuộc vào phân lớp ban đầu [2].- Phân vùng bằng cách sắp các điểm vào tâm gần nhất dựa vàp khoảng cách Euclide.- Tách đôi lớp ban đầu nếu khoảng cách lớn hơn ngỡng t1.- Xác định phân hoạch mới trên cơ sở các tâm vừa xác định lại và tiếp tục xác định tâm mới.- Tính tất cả các khoảng cách đến tâm mới.- Nhóm các vùng với tâm theo ngỡng t2.Lặp các thao tác tác trên cho đến khi thoả tiêu chuẩn phân hoạch.7.3 Nhận dạng theo cấu trúc7.3.1 Biểu diễn định tínhNgoài cách biễn diễn theo định lợng nh đã mô tả ở trên, tồn tại nhiều kiểu đối tợng mang tính định tính. Trong cách biểu diễn này, ngời ta quan tâm đến các dạng và mối quan hệ giữa chúng. Giả thiết rằng mỗi đối tợng đợc biểu diễn bởi một dãy ký tự. Các đặc tính biểu diễn bởi cùng một số ký tự. Phơng pháp nhận dạng ở đây là nhận dạng lô gíc, dựa và hàm phân biệt là hàm Bool. Cách nhận dạng là nhận dạng các từ có cùng độ dài.Giả sử hàm phân biệt cho mọi ký hiệu là ga(x), gb(x), ., tơng ứng với các ký hiệu a, b, . . Để dễ dàng hình dung, ta giả sử có từ "abc" đợc biểu diễn bởi một dãy ký tự X = {x1, x2, x3, x4}. Tính các hàm tơng ứng với 4 ký tự và có:ga(x1) + gb(x2) + gc(x3) + gc(x4) Các phép cộng ở đây chỉ phép toán OR. Trên cơ sở tính giá trị cực đại của hàm phân biệt, ta quyết định X có thuộc lớp các từ "abc" hay không. Trong cách tiếp cận này, đối tợng tơng đơng với câu.7.3.2 Phơng pháp ra quyết định dựa vào cấu trúc7.3.2.1 Một số khái niệmThủ tục phân loại và nhận dạng ở đây gồm 2 giai đoạn: Giai đoạn đầu là giai đoạn xác định các quy tắc xây dựng, tơng đơng với việc nghiên cứu một văn phạm trong một ngôn ngữ chính thống. Giai đoạn tiếp theo khi đã có văn phạm là xem xét tập các dạng có đợc sinh ra từ các dạng đó không? Nhập môn xử ảnh số - ĐHBK Hà nội -8 Chơng Bảy: nhận dạng ảnhNếu nó thuộc tập đó coi nh ta đã phân loại xong. Tuy nhiên, văn phạm là một vấn đề lớn. Trong nhận dạng cấu trúc, ta mới chỉ sử dụng đợc một phần rất nhỏ mà thôi.Nh trên đã nói, mô hình cấu trúc tơng đơng một văn phạm G :G = {Vn, Vt, P, S}. Có rất nhiều kiểu văn phạm khác nhau từ chính tắc, phi ngữ cảnh, . Độc giả quan tâm xin xem các tài liệu về thuyết ngôn ngữ hình thức hay ô tô mát . ở đây, xin giới thiệu một ngôn ngữ có thể đợc áp dụng trong nhận dạng cấu trúc: đó là ngôn ngữ PLD (Picture Language Description).Ví dụ: Ngôn ngữ PLDTrong ngôn ngữ này, các từ vựng là các vạch có hớng. Có 4 từ vựng cơ bản:a: b: c: và d: Các từ vựng trên các quan hệ đợc định nghĩa nh sau:+ : a + b - : a - b x: a x b *: a * b Văn phạm sinh ra các mô tả trong ngôn ngữ đợc định nghĩa bởi:GA = {Vn, VT, P, S}với Vn = {A, B, C, D, E} và VT = {a, b, c, d}. S là ký hiệu bắt đầu và P là tập luật sản xuất.Ngôn ngữ này thờng dùng nhận dạng các mạch điện.7.3.2.2 Phơng pháp nhận dạngCác đối tợng cần nhận dạng theo phơng pháp này đợc biểu diễn bởi một câu trong ngôn ngữ L(G). Khi đó thao tác phân lớp chính là xem xét một đối tợng có thuộc văn phạm L(G) không? Nói cách khác nó có đợc sinh ra bởi các luật của văn phạmG không? Nh vậy sự phân lớp là theo cách tiếp cận cấu trúc đòi hỏ phải xác định:- Tập Vt chung cho mọi đối tợng.- Các quy tắc sinh P để sản sinh ra một câu và chúng khác nhau đối với mỗi lớp.- Quá trình học với các câu biểu diễn các đối tợng mẫu l nhằm xác định văn phạmG.- Quá trình ra quyết định: xác định một đối tợng X đợc biểu diễn bởi một câu lx. Nếu lx nhận biết bởi ngôn ngữ L(Gx) thì ta nói rằng X Ck.Nhập môn xử ảnh số - ĐHBK Hà nội -9 Chơng Bảy: nhận dạng ảnhNói cách khác, việc ra quyết định phân lớp là dựa vào phân tích cúGk biểu diễn lớp Ck. pháp của văn phạm. Cũng nh trong phân tích cú pháp ngôn ngữ, có phân tích trên xuống, dới lên, việc nhận dạng theo cấu trúc cũng có thể thực hiện theo cách tơng tự.Việc nhận dạng dựa theo cấu trúc là một ý tởng và dẫu sao cũng cần đợc nghiên cứu thêm.7.4 mạng nơ ron nhân tạo và Nhận dạng theo mạng nơ ronTrớc tiên, cần xem xét một số khái niệm cơ bản về bộ não cũng nh cơ chế hoạt động của mạng nơ ron sinh học. Tiếp theo, để tiện theo dõi, ở đây sẽ đề cập đến một ứng dụng của mạng nơ ron trong nhận dạng chữ viết.7.4.1.Bộ não và nơ ron sinh họcCác nhà nghiên cứu sinh học về bộ não cho ta thấy rằng các nơ ron (tế bào thần kinh) là đơn vị cơ sở đảm nhiệm những chức năng xử nhất định trong hệ thần kinh, bao gồm não, tuỷ sống và các dây thần kinh. Mỗi nơ ron có phần thân với nhân bên trong (gọi là soma), một đầu thần kinh ra (gọi là sợi trục axon) và một hệ thống dạng cây các dây thần kinh vào (gọi là dendrite). Các dây thần kinh vào tạo thành một lới dày đặc xung quanh thân tế bào, chiếm diện tích khoảng 0,25 mm2, còn dây thần kinh ra tạo thành trục dài có thể từ 1 cm cho đến hàng mét. Đờng kính của nhân tế bào thờng chỉ là 10-4m. Trục dây thần kinh ra cũng có thể phân nhánh theo dạng cây để nối với các dây thần kinh vào hoặc trực tiếp với nhân tế bào các nơ ron khác thông qua các khớp nối (gọi là synapse). Thông thờng, mỗi nơ ron có thể gồm vài chục cho tới hàng trăm ngàn khớp nối để nối với các nơ ron khác. Ngời ta ớc lợng rằng lới các dây thần kinh ra cùng với các khớp nối bao phủ diện tích khoảng 90% bề mặt nơ ron (hình 7-3).Các tín hiệu truyền trong các dây thần kinh vào và dây thần kinh ra của các nơ ron là tín hiệu điện và đợc thực hiện thông qua các quá trình phản ứng và giải phóng các chất hữu cơ. Các chất này đợc phát ra từ các khớp nối dẫn tới các dây thần kinh vào sẽ làm tăng hay giảm điện thế của nhân tế bào. Khi điện thế này đạt tới một ngỡng nào đó, sẽ tạo ra một xung điện dẫn tới trục dây thần kinh ra. Xung này đợc truyền theo trục, tới các nhánh rẽ khi chạm tới các khớp nối với các nơ ron khác sẽ giải phóng các chất truyền điện. Ngời ta chia làm hai loại khớp nối: khớp nối kích thích (excitatory) hoặc khớp nối ức chế (inhibitory).Phát hiện quan trọng nhất trong ngành nghiên cứu về bộ não là các liên kết khớp thần kinh khá mềm dẻo, có thể biến động và chỉnh đổi theo thời gian tuỳ thuộc vào các dạng kích thích. Hơn nữa, các nơ ron có thể sản sinh các liên kết mới với các nơ ron khác và đôi khi, lới các nơ ron có thể di trú từ vùng này sang vùng khác trong bộ não. Các nhà khoa học cho rằng đây chính là cơ sở quan trọng để giải thích cơ chế học của bộ não con ngời.Phần lớn các quá trình xử thông tin đều xảy ra trên vỏ não. Toàn bộ vỏ não đợc bao phủ bởi mạng các tổ chức cơ sở có dạng hình thùng tròn với đờng kích khoảng 0,5 mm, độ cao 4 mm. Mỗi đơn vị cơ sở này chứa khoảng 2000 nơ ron. Ngời ta chỉ ra rằng mỗi vùng não có những chức năng nhất định. Điều rất đáng ngạc nhiên chính là các nơ ron rất đơn giản trong cơ chế làm việc, nhng mạng các nơ ron liên kết với nhau lại có khả năng tính toán, suy nghĩ, ghi nhớ và điều khiển. Có thể điểm qua những chức năng cơ bản của bộ não nh sau:Nhập môn xử ảnh số - ĐHBK Hà nội -10 [...]... độ phức tạp tính toán nói chung sẽ phụ thuộc vào số lớp mạng Các thông số cấu trúc mạng nơ ron bao gồm: + Số tín hiệu vào , số tín hiệu ra + Số lớp nơ ron + Số nơ ron trên mỗi lớp ẩn + Số lợng liên kết của mỗi nơ ron (liên kết đầy đủ, liên kết bộ phận và liên kết ngẫu nhiên) Nhập môn xử ảnh số - ĐHBK Hà nội -14 Chơng Bảy: nhận dạng ảnh + Các trọng số liên kết nơ ron Mạng nơ ron nh một hệ thống thích... các nơ ron ra và chỉ các trọng số liên kết tơng ứng đợc hiệu chỉnh Nhập môn xử ảnh số - ĐHBK Hà nội -33 Chơng Bảy: nhận dạng ảnh Điểm khác biệt ở đây là kết quả đầu ra không đợc lu trong mạng dới dạng tập tất cả các trọng số tại mỗi nơ ron ra, mà chỉ là một phần trong số đó Từ đó có thể thấy, số nơ ron ở lớp Kohonen bằng số kết quả đầu ra cần lu trữ và số nơ ron ra bằng số biến thành phần trong mỗi... nhiễu tại 1 điểm ảnh Hình 12: Ma trận trọng số liên kết nơ ron Hình 12 Ma trận trọng số liên kết nơ ron Nhập môn xử ảnh số - ĐHBK Hà nội -23 Chơng Bảy: nhận dạng ảnh Nh vậy, mạng có thể nhận dạng nhầm với 11 trờng hợp đầu vào tơng ứng tơng ứng với một ảnh nhiễu của X1, 5 ảnh nhiễu của X4 và 5 ảnh nhiễu của X5 (Hình 7.16) Ký hiệu Xij = Xi or Xj Ta có 10 ảnh ghép nh trên hình 7.17 Sử dụng các vectơ... nói chunggấp 7 lần số ảnh mẫu N anh cần phải nhớ (đã khôi phục) trong mạng: Nnơ ron = 7 N anh (7) Từ công thức này rút ra hai điều: Thứ nhất, độ phân giải r x r của ảnh phụ thuộc vào cần phải nhớ bao nhiêu ảnh mẫu Chẳng hạn, nếu cần nhớ 100 ảnh mẫu thì cần phải có 700 nơ ron, mỗi nơ ron tơng ứng với một điểm ảnh Do vậy, Nhập môn xử ảnh số - ĐHBK Hà nội -19 Chơng Bảy: nhận dạng ảnh r 2 = Nnơ ron =... là : - Phân tích ảnh ghép thành các thành phần - Lấy phần bù kết quả để đối sánh với ảnh âm bản Nhập môn xử ảnh số - ĐHBK Hà nội -24 Chơng Bảy: nhận dạng ảnh Những điều này có thể đạt đợc khi ta chọn tơng đối cẩn thận tập mẫu học Quả thật khó có thể lựa chọn ngẫu nhiên các mẫu học để tạo ra mạng ABAM đủ thông minh, có khả năng phân tách các ảnh vào ghép Có thể thấy rằng kết quả xử của mạng ABAM... có kích thớc m x Nnơ ron , ở đây m là số tín hiệu vào Nếu mỗi ảnh có kích thớc rxr điểm ảnh, thì ma trận trọng số có kích thớc m x Nnơ ron = r2 x Nanh Khác với mạng Hopfield, ở đây không có ràng buộc giữa độ phân giải rxr của ảnh với số ảnh mẫu Nanh So sánh với kích thớccủa ma trận trọng số của mạng Hopfield, mạng ABAM nhỏ hơn cỡ 7 lần 7.4.3.3 Mạng Kohonen Cách xử thông tin trong các mạng ở trên thờng... nghiệm với các ảnh có nhiễu tại 2,5,13 điểm ảnh (tơng ứng với 13, 31 và 81%) đợc cho trên hình 7.11 Hơn nữa, với ảnh đầu vào có cùng số điểm ảnh biến dạng có thể dẫn tới những hành vi khác nhau (không hội tụ giống nhau, số vòng lặp khác nhau ) Nếu có hơn 50% điểm ảnh biến dạng thì ảnh đợc tái tạo ở đầu ra là âm bản của ảnh gốc E Khả năng nhớ mẫu của mạng Hopfield Kết quả thực nghiệm chỉ ra rằng số nơ ron... sự khác biệt về tốc độ tính toán và khả năng xử song song Các bộ vi xử có thể tính 108 lệnh trong một giây, trong khi đó mạng nơ ron xử chậm hơn, cần khoảng vài miligiây để kích hoạt Tuy nhiên, bộ não có thể kích hoạt hầu nh cùng một lúc tại rất nhiều nơ ron và khớp nối, trong khi đó ngay cả máy tính hiện đại cũng chỉ có một số hạn chế các bộ vi xử song song Nếu chạy một mạng nơ ron nhân... trong số của nơ ron thứ i (Neti=wij.aj) và g'(.) là đạo hàm của hàm kích hoạt g đợc dùng trong các nơ ron - Hiệu chỉnh các trọng số liên kết nơ ron Wjk dẫn tới tất cả lớp ẩn từ nơ ron thứ k sang nơ ron j (các lớp ẩn đợc xét từ dới lên) : Tính tổng sai số tại nơ ron j phải chịu trách nhiệm Hiệu chỉnh trọng số wjk wjk = wjk + ak j Nhập môn xử ảnh số - ĐHBK Hà nội (18) -31 Chơng Bảy: nhận dạng ảnh. .. không gian các tham số W sao cho cực tiểu hàm sai số tổng cộng: ở đây, Yi là giá trị thực nghiệm quan sát đợc tại nơ ron i ở lớp ra, outi là giá trị tính toán của mạng tại nơ ron thứ i ở lớp ra đối với mẫu Xs Khai triển E theo các trọng số thành phần, ta có: Lấy đạo hàm riêng của E theo các wij: Nhập môn xử ảnh số - ĐHBK Hà nội -32 Chơng Bảy: nhận dạng ảnh Việc hiệu chỉnh vectơ trọng số W = (wij) sao . đặc tính. Nh trong trờng hợp xử lý ảnh, ảnh sau khi đợc tăng cờng để nâng cao chất lợng, phân vùng và trích Nhập môn xử lý ảnh số - ĐHBK Hà nội . giáNhập môn xử lý ảnh số - ĐHBK Hà nội -4 Chơng Bảy: nhận dạng ảnh Quá trình tiền xử lý

Ngày đăng: 14/11/2012, 14:19

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan