TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH ĐỀ TÀI: COMUTER VISION THỊ GIÁC NHÂN TẠO

64 2.5K 19
TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH  ĐỀ TÀI:  COMUTER VISION  THỊ GIÁC NHÂN TẠO

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNHĐỀ TÀI: COMUTER VISIONTHỊ GIÁC NHÂN TẠO

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA oOo TIỂU LUẬN MÔN HỌC XỬ ẢNH ĐỀ TÀI: COMUTER VISION THỊ GIÁC NHÂN TẠO Giảng viên hướng dẫn : TS. Ngô Văn Sỹ Học viên thực hiện : Thị Thanh Đào Trần Nguyên Độ Lê Xuân Đức Huỳnh Văn Đông Nhóm : 1 Lớp : K25.KĐT.ĐN Đà Nẵng, 02 - 2014 Tiểu luận môn học xử ảnh Trang 2 Tiểu luận môn học xử ảnh LỜI MỞ ĐẦU Thị giác máy là một lĩnh vực đã và đang phát triển mạnh mẽ trên thế giới hiện nay. Khái niệm về thị giác máy tính – Computer Vision có liên quan tới nhiều ngành học và có nhiều hướng nghiên cứu khác nhau. Cùng với sự phát triển của xã hội, vấn đề an ninh bảo mật ngày càng có những yêu cầu khắt khe. Các hệ thống xác định, nhận dạng con người được ra đời với độ tin cậy cao. Một trong những bài toán nhận dạng con người được ưa chuộng nhận dạng thông qua khuôn mặt bởi nó chính là cách mà con người sử dụng để phân biệt lẫn nhau. Bên cạnh đó, việc thu thập, xử thông tin qua ảnh để nhận biết đối tượng đang được quan tâm và ứng dụng rộng rãi. Với phương pháp này, người ta có thể thu nhận được nhiều thông tin từ đối tượng mà không cần phải tác động nhiều tới đối tượng đó. Với sự hỗ trợ của máy tính, bài toán nhận dạng mặt người từ ảnh số đã có được môi trường phát triển thuận lợi. Các hệ thống nhận dạng mặt người online, offline đã ra đời và đã đạt độ tin cậy nhất định. Dựa trên các thuyết về xử ảnh số, tách mặt người và nhận dạng mặt người, nhóm chúng em đã cùng nhau nghiên cứu thực hiện tiểu luận “THỊ GIÁC NHÂN TẠO” và đã thu được một số kết quả nhất định. Nhóm chúng em xin chân thành cảm ơn thầy TS Ngô Văn Sỹ đã cung cấp cho chúng em những kiến thức hữu ích trong môn học Xử ảnh số cũng như kinh nghiệm làm tiểu luận Đà Nẵng, 27 tháng 04 năm 2014 Trang 3 Tiểu luận môn học xử ảnh MỤC LỤC LỜI MỞ ĐẦU MỤC LỤC Trang 4 Tiểu luận môn học xử ảnh Chương 1 GIỚI THIỆU VỀ THỊ GIÁC NHÂN TẠO COMPUTER VISION Không còn nghi ngờ gì khi nói máy móc có thể “nhìn”, ví dụ hệ thống giám sát giao thông tự động ở những thành phố lớn trên thế giới, những máy rút tiền tự động ATM có thể quét mắt người để nhận diện chủ thẻ và những xe ô tô có thể được lái bởi một máy tính sử dụng đầu vào là một máy camera. Chương này sẽ giới thiệu cái nhìn tổng thể về một số vấn đề và phương pháp của thị giác nhân tạo. Mục tiêu của thị giác nhân tạo là đưa ra quyết định hữu ích về đối tượng vật và cảnh thực dựa trên hình ảnh cảm nhận được. Để đưa ra quyết định về các đối tượng thực, việc luôn luôn cần thiết là xây dựng một số mô tả hoặc mô hình của các đối tượng từ các hình ảnh của chúng. Bởi vì điều này, nhiều chuyên gia sẽ nói rằng “mục tiêu của thị giác nhân tạo là xây dựng bản mô tả cảnh trong những hình ảnh”. Vấn đề quan trọng được nêu ra trong chương này và nghiên cứu trong phần còn lại của tiểu luận bao gồm: - Cảm biến: Làm thế nào để các cảm biến có được hình ảnh của thế giới thực? Làm thế nào để những hình ảnh mã hóa các thuộc tính của thế giới thực, chẳng hạn như vật liệu, hình dáng, ánh sáng và các mối quan hệ không gian? - Thông tin được mã hóa: Làm thế nào để những hình ảnh mang lại thông tin hiểu thế giới thực 3D, bao gồm cả hình học, kết cấu, chuyển động, và nhận dạng của các đối tượng trong nó? - Cách biểu diễn: Cách biểu diễn nào nên được sử dụng cho các mô tả lưu trữ của các đối tượng, các bộ phận, các thuộc tính và các mối quan hệ của chúng? - Các thuật toán: Những phương pháp nào dùng để xử thông tin hình ảnh và xây dựng mô tả của thế giới thực và đối tượng của nó? Những vấn đề này sẽ được nghiên cứu trong các chương tiếp theo. Trong chương này giới thiệu các ứng dụng và một số vấn đề quan trọng khác nảy sinh trong bối cảnh của chúng. 1.1. Các vấn đề ứng dụng Các ứng dụng của máy tính trong phân tích ảnh gần như vô hạn. Chỉ một phần nhỏ trong các ứng dụng có thể trình bày ở đây nhưng chúng sẽ phục vụ cho sự chuyển động và định hướng trong các lĩnh vực nghiên cứu. Trang 5 Tiểu luận môn học xử ảnh 1.1.1. Bản xem trước của ảnh số Một ảnh kỹ thuật số có thể biểu diễn cho một phim hoạt hình, một trang văn bản, khuôn mặt của một người, một bản đồ của Katmandu, hoặc một sản phẩm mua từ một cửa hàng. Một ảnh kỹ thuật số chứa một số cố định hàng và cột của của những điểm ảnh, viết tắt là các thành phần của hình ảnh. Những điểm ảnh như các giá trị lượng tử vuông nhỏ - thường được đánh số từ 0 đến 255, đại diện cho độ sáng tại các điểm của hình ảnh. Tùy thuộc vào các phương pháp mã hóa, 0 có thể là tối nhất và 255 là sáng nhất, hoặc ngược lại. Hình 1.1 - Ảnh bên trái, phía trên: ảnh của một khuôn mặt. Ảnh giữa, phía trên: ảnh phóng to của 8x8 điểm ảnh từ vùng mắt bên phải. Ảnh bên phải, phía trên: vị trí mắt phát hiện bởi chương trình máy tính. Ảnh phía dưới: bảng giá trị cường độ từ ảnh phóng to 8x8. Ảnh bên trái phía trên trong hình 1.1 là một ảnh kỹ thuật số của một khuôn mặt 257 hàng (cao) và 172 cột (rộng). Ảnh ở giữa phía trên là ảnh 8x8 phóng to từ con mắt bên phải của ảnh bên trái. Ở dưới cùng của hình là biểu diễn 64 giá trị độ sáng của các điểm ảnh trong ảnh phóng to. Những giá trị dưới 100 biểu diễn cho sự Trang 6 Tiểu luận môn học xử ảnh phản xạ thấp hơn từ độ tối của mắt, trong khi các con số cao hơn biểu diễn cho độ trắng sáng của mắt. 1.1.2. Truy vấn cơ sở dữ liệu ảnh Bộ nhớ số lớn, truyền tải băng thông cao và máy tính cá nhân đa phương tiện đã tạo điều kiện cho sự phát triển của cơ sở dữ liệu hình ảnh. Sử dụng tốt nhiều hình ảnh hiện tại đòi hỏi các phương pháp phục hồi tốt. Các kỹ thuật cơ sở dữ liệu tiêu chuẩn áp dụng cho các hình ảnh đã được tăng cường với các khóa văn bản, tuy nhiên, phục hồi dựa trên nội dung là cần thiết và là một chủ đề của nhiều nghiên cứu hiện nay. Hình 1.2 - Hình ảnh truy vấn (trái) và hai hình tương tự tạo ra bởi một hệ thống cơ sở dữ liệu ảnh 1.1.3. Kiểm tra bên trong đầu người Thiết bị ảnh cộng hưởng từ tính (MRI) có thể cảm nhận được vật liệu bên trong những đối tượng 3D. Hình 1.3 cho thấy hình ảnh bên trong đầu người: phần sáng có liên quan đến chuyển động của vật chất, vì vậy đây thực sự là một ảnh dòng chảy của máu, có thể “nhìn thấy” các mạch máu quan trọng. Trang 7 Tiểu luận môn học xử ảnh Hình 1.3 - Ảnh cộng hưởng từ (bên trái), nơi sáng liên quan đến dòng máu ảnh nhị phân (bên phải) kết quả từ sự thay đổi tất cả các điểm ảnh với giá trị 208 hoặc cao hơn đến 255 và những giá trị dưới 208 đến 0. Kỹ thuật thị giác máy thường được sử dụng trong phân tích hình ảnh y tế. Sẽ thật tuyệt vời nếu chúng ta có thể “xem” những gì xảy ra trong não. MRI có thể cảm nhận được hoạt động hữu cơ liên quan đến quá trình suy nghĩ và điều này là một lĩnh vực hiện rất thú vị của nghiên cứu. 1.1.4. Xử quét các trang văn bản Một vấn đề thường gặp là chuyển thông tin từ tài liệu giấy sang dạng số cho các hệ thống thông tin. Ví dụ, chúng ta có thể muốn tạo một cuốn sách cũ có sẵn trên Internet, hoặc có thể cần phải chuyển đổi một kế hoạch chi tiết của một số đối tượng thành một tập tin hình học để các phần có thể được tạo bởi một công cụ bằng máy điều khiển số. 1.1.5. Tính toán độ phủ của tuyết sử dụng ảnh vệ tinh Phần lớn bề mặt trái đất được quét thường xuyên từ vệ tinh và vệ tinh truyền tải ảnh về trái đất dưới dạng số. Những hình ảnh này sau đó có thể được xử để trích nhiều thông tin. Ví dụ, thống kê số lượng tuyết trong lưu vực của một dòng sông có thể là quan trọng đối với việc điều chỉnh một đập cho dòng điều khiển, cung cấp nước, hoặc môi trường sống động vật hoang dã. Ước tính khối lượng tuyết có thể được thực hiện bằng cách tính toán số lượng điểm ảnh như tuyết xuất hiện trong ảnh. Một điểm ảnh từ một ảnh vệ tinh có kết quả từ cảm nhận một ô 10m x 10m của trái đất, nhưng một số vệ tinh báo cáo có thể thấy những ô nhỏ Trang 8 Tiểu luận môn học xử ảnh hơn nhiều hơn thế. Thông thường, ảnh vệ tinh phải được so sánh với bản đồ hoặc hình ảnh khác để xác định điểm ảnh trong một khu vực cụ thể hoặc lưu vực sông. Máy tính được biết đến với khả năng xử một lượng lớn dữ liệu, chắc chắn các vệ tinh quét mặt đất sẽ tạo ra một lượng lớn dữ liệu hữu ích cho nhiều mục đích. Ví dụ, số lượng và vị trí của các điểm ảnh tuyết có thể là đầu vào cho một chương trình máy tính mô phỏng chế độ thủy văn của vùng đó (thông tin nhiệt độ cho khu vực là đầu vào cho chương trình). Một ứng dụng khác có liên quan đang tiến hành kiểm kê các loại cây trồng và dự đoán thu hoạch. 1.1.6. “Nhìn” từng bộ phận Tại nhiều điểm của quá trình sản xuất, các bộ phận được chuyển trên băng tải hoặc trong hộp. Các bộ phận phải được đặt riêng lẻ trong máy, đóng gói, kiểm tra Nếu hoạt động phức tạp, một robot dẫn đường có thể cung cấp một giải pháp. Hình 1.4 cho thấy ba phần trong các bộ phận của một thiết bị trong không gian làm việc. Bằng cách nhận biết các cạnh và lỗ, hệ thống thị giác của robot có thể đoán ở cả nhận dạng của một phần và vị trí của nó trong không gian làm việc. Sử dụng một mô hình 3D được thực hiện bởi CAD (thiết kế với hỗ trợ của máy tính) cho mỗi phần dự đoán và vị trí dự đoán của nó, hệ thống thị giác sau đó so sánh các dữ liệu hình ảnh cảm nhận với một đồ họa máy tính được tạo ra từ mô hình và vị trí của nó trong không gian. Các vạch sáng trong hình 1.4 cho thấy ba thành phần chính giữa ảnh và các mô hình của các đối tượng trong nó. Cuối cùng, mắt robot có thể nói với cánh tay robot làm thế nào để nâng một phần và nơi để đặt nó. Hình 1.4 - Việc kiểm tra, lắp ráp robot phù hợp với các mô hình lưu trữ 3D để cảm nhận một hình ảnh 2D. Trang 9 Tiểu luận môn học xử ảnh 1.1.7. Nhận dạng mặt người Nhận dạng khuôn mặt là cách dễ dàng nhất mà con người sử dụng để phân biệt những người khác nhau. Tuy nhiên, công việc có thể xem là dễ dàng với con người này lại là một vấn đề phức tạp khi thực hiện bằng công cụ toán học. Nhận diện mặt người là một dạng của nhận diện vật mẫu (pattern recognition) dựa trên những đặc điểm của một khuôn mặt. Khuôn mặt cần nhận diện được đem so sánh với với khuôn mặt mẫu theo một cách nào đó. Kết quả của quá trình nhận diện này cho biết khuôn mặt có trong ảnh đầu vào là “đã được biết đến” hay “chưa được biết đến”. Trong một hệ thống điều khiển, kết quả đó sẽ được sử dụng để thực hiện các chức năng của điều khiển hệ thống. Phần sau của tiểu luận sẽ tập trung xử bài toán nhận dạng mặt người này. 1.2. Các hoạt động trong ảnh Hoạt động có thể được chia thành các các nhóm khác nhau tùy thuộc vào cấu trúc, mức độ, hoặc mục đích. Một số hoạt động với mục đích cải thiện hình ảnh, trong khi các hoạt động khác yêu cầu tách thông tin để xử đầu ra tự động. Một số hoạt động tạo mới hình ảnh đầu ra, trong khi những hoạt động khác không cho hình ảnh mô tả đầu ra. 1.2.1. Thay đổi những điểm ảnh trong vùng lân cận nhỏ Giá trị điểm ảnh có thể được thay đổi theo cách thức liên quan đến một số lượng nhỏ các điểm ảnh lân cận, ví dụ như các vùng lân cận trong hàng hoặc cột liền kề. Thông thường được cho giá trị 1 hoặc 0 trong một hình ảnh nhị phân sẽ bị đảo ngược để làm cho nó giống như các vùng lân cận. Mục đích của hoạt động này có thể loại bỏ khả năng nhiễu từ các quá trình số hóa. Hoặc nó có thể chỉ là để đơn giản hóa nội dung hình ảnh, ví dụ như để bỏ qua hòn đảo nhỏ trong một hồ nước hoặc điểm không hoàn hảo trong một tờ giấy. Hình 1.5 cho thấy một hình ảnh nhị phân của một số các tế bào hồng cầu đã được làm sạch bằng cách loại bỏ các khu vực nhỏ trong một nền lớn hơn. Trang 10 [...]... định dạng ảnh 2.5.2 Tiêu đề tập tin ảnh Một tiêu đề tập tin là cần thiết để tạo một tập tin tự mô tả hình ảnh do vậy công cụ để xử hình ảnh có thể làm việc với nó Các tiêu đề nên bao gồm không gian hình ảnh, loại, ngày tạo ra, và một số loại tiêu đề Nó cũng có thể chứa một Trang 27 Tiểu luận môn học xử ảnh bảng màu hoặc bảng mã hóa được sử dụng để giải thích các giá trị điểm ảnh Một tính năng... hình ảnh thành nhiều ảnh, trong khi đó, sự Trang 13 Tiểu luận môn học xử ảnh hiểu biết hình ảnh liên quan đến việc ra quyết định dựa trên hình ảnh và xây dựng một cách rõ ràng các mô tả cảnh cần thiết để làm như vậy Xử ảnh được sử dụng phổ biến trong hỗ trợ của sự hiểu biết hình ảnh Việc xử hình ảnh thường được dựa trên mô hình của một hình ảnh như là một hàm liên tục f(x, y) của hai thông số... điểm khác trong hình ảnh di chuyển đến gần hơn với trung tâm hình ảnh Trang 11 Tiểu luận môn học xử ảnh Hình 1.6 - Độ tương phản trong hình ảnh bên trái được thể hiện trong hình ảnh bên phải Trên 10% điểm ảnh về độ tương phản được làm sáng trong khi thấp hơn 90% được thực hiện tối Tương phản là tính từ khu vực 3x3 của mỗi điểm ảnh 1.2.3 Kết hợp nhiều ảnh Một hình ảnh có thể được tạo ra bằng cách thêm... thống thị giác máy Máy ảnh CCD là rất nhiều như một máy ảnh phim 35mm thường được sử dụng cho các bức ảnh gia đình, ngoại trừ trên mặt phẳng ảnh, thay vì bộ phim hóa học phản ứng với ánh sáng, các tế bào trạng thái rắn nhỏ chuyển đổi năng lượng ánh sáng thành điện tích Mỗi tế bào chuyển đổi năng lượng ánh sáng mà nó nhận được vào điện tích Trang 16 Tiểu luận môn học xử ảnh Hình 2.2 - Máy ảnh CCD... cần thiết để tạo ra một hình ảnh mịn như để người một con người cảm nhận được như là trên thiết bị máy thị giác Thứ hai, nhiều mảng CCD đã có điểm ảnh với tỷ lệ 4:3 của chiều rộng và chiều cao vì hầu hết các màn hình cho con người có một tỷ lệ kích thước 4:3 Điểm ảnh vuông và một tham số quy mô duy nhất sẽ được hưởng lợi thị giác máy 2.2.4 Mắt con người Trang 20 Tiểu luận môn học xử ảnh Mắt người... ảnh như là một mảng 2D rời rạc I[r, c] mẫu số nguyên về độ sáng tối Nhận thức tâm con người rất quan trọng vì hai do, đầu tiên, bức ảnh cho người dùng phải nắm các đặc tính của khách hàng, và thứ hai, nghiên cứu về khả năng của con người trong sự hiểu biết hình ảnh có thể hướng dẫn sự phát triển của chúng ta về các thuật toán Trang 14 Tiểu luận môn học xử ảnh Chương 2 CƠ SỞ THUYẾT TẠO ẢNH. .. hình ảnh tĩnh Mục đích chính của JPEG (JFIF /JFI/JPG) là cung cấp cho việc nén ảnh màu tĩnh chất lượng cao Các chương trình mã hóa JPEG là chuỗi định hướng và cho phép phần cứng thời gian thực để mã hóa và giải mã Một hình ảnh có thể có đến 64k x 64k điểm ảnh với mỗi điểm ảnh là 24 bit, mặc dù chỉ có mỗi hình ảnh trên Trang 30 Tiểu luận môn học xử ảnh một tập tin Tiêu đề có thể chứa một hình ảnh. .. điểm ảnh Các ví dụ trong các thảo luận bên dưới, tưởng tượng một tình huống tương tự mà máy ảnh là một máy ảnh truyền hình bao gồm một trò chơi bóng chày và các đối tượng trong cảnh là các cầu thủ, các căn cứ, quả bóng … Trang 33 Tiểu luận môn học xử ảnh Hình 2.14 - Năm tọa độ khung hình cần thiết cho phân tích cảnh 3D: thế giới W, đối tượng O (đối với kim tự tháp Op hoặc khối Ob), máy ảnh C, hình ảnh. .. hình học có mặt trong một số cách trong quá trình chụp ảnh Ống kính có thể không hoàn hảo để các chùm ánh sáng được thu thập từ một yếu tố bề mặt cảnh không bị cong chính xác như dự định Hình ảnh bị méo thường được quan sát cho các ống kính độ dài tiêu cự nhỏ, đường thẳng ở ngoại vi của cảnh xuất hiện từ trung tâm của hình ảnh khi hiển thị ở bên phải trong hình 2.6 Trang 21 Tiểu luận môn học xử ảnh. .. Trang 25 Tiểu luận môn học xử ảnh ảnh thực sự như được thể hiện trong hình 2.8 Nếu các điểm ảnh được chiếu từ mặt phẳng ảnh lại ra nguồn nguyên liệu trong hiện trường, sau đó kích thước của yếu tố đó cảnh là độ phân giải danh nghĩa của cảm biến Hình 2.8 – 4 ảnh kỹ thuật số của 2 khuôn mặt: (a) 127 hàng x 176 cột; (b) (126x176) được tạo ra bằng cách lấy trung bình mỗi 2x2 điểm cạnh nhau từ ảnh (a); . được sản xuất trên chip thường dài khoảng 1cm x 1cm. Nếu mảng có 640x480 điểm ảnh hoặc 512 x 512 điểm ảnh, mỗi điểm ảnh có chiều rộng thực tế của khoảng 0,0 01 inch. Có những cách hữu ích khác của. hơn với trung tâm hình ảnh. Trang 11 Tiểu luận môn học xử lý ảnh Hình 1. 6 - Độ tương phản trong hình ảnh bên trái được thể hiện trong hình ảnh bên phải. Trên 10 % điểm ảnh về độ tương phản được. nội dung là cần thi t và là một chủ đề của nhiều nghiên cứu hiện nay. Hình 1. 2 - Hình ảnh truy vấn (trái) và hai hình tương tự tạo ra bởi một hệ thống cơ sở dữ liệu ảnh 1. 1.3. Kiểm tra bên

Ngày đăng: 17/05/2014, 14:35

Từ khóa liên quan

Mục lục

  • 1.1.1. Bản xem trước của ảnh số

  • Chương 3

  • THIẾT KẾ CHI TIẾT VÀ TRIỂN KHAI HỆ THỐNG

  • 3.1. Thu thập và tách mặt người trong ảnh

  • 3.2. Chuẩn hóa ảnh

  • 3.3. Cắt và xoay chuẩn ảnh

  • 3.4. Trích chọn đặc tính bằng phương pháp PCA

  • 3.4.1. Quá trình học

    • 3.4.1.1. Chuẩn hóa ma trận ảnh

    • 3.4.1.2. Tính trung bình tập ảnh đầu vào

    • 3.4.1.3. Tính eigenface

    • 3.4.2. Quá trình trích chọn đặc tính

    • 3.5. Quá trình nhận dạng

    • Chương 4

    • CHƯƠNG TRÌNH MÔ PHỎNG

    • 4.1. Lưu đồ thuật toán

    • 4.2. Thực hiện chương trình

    • 4.2.1. Khối chụp ảnh từ webcam và thực hiện hiệu chỉnh ảnh

    • 4.2.1.1. Thực hiện chụp ảnh từ webcam

    • 4.2.1.2. Thực hiện hiệu chỉnh ảnh

    • 4.2.2. Khối thực hiện đọc dữ liệu cho quá trình ảnh học

Tài liệu cùng người dùng

Tài liệu liên quan