tiểu luận bảo mật thông tin tìm hiểu về hệ thống nhận dạng sinh trắc học bằng chữ ký viết tay

27 0 0
Tài liệu đã được kiểm tra trùng lặp
tiểu luận bảo mật thông tin tìm hiểu về hệ thống nhận dạng sinh trắc học bằng chữ ký viết tay

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

1.2 Ưu điểmNhận dạng bằng chữ ký mang lại nhiều ưu điểm, bao gồm:- Độc nhất vô nhị: Mỗi người có một cách viết riêng biệt và không giống aikhác, giống như một dấu vân tay nên chữ ký trở

Trang 1

TIỂU LUẬN

MÔN: BẢO MẬT THÔNG TIN

TÌM HIỂU VỀ HỆ THỐNG NHẬN DẠNGSINH TRẮC HỌC BẰNG CHỮ KÝ VIẾT

THÀNH PHỐ HỒ CHÍ MINH, NĂM 2024

Trang 2

TIỂU LUẬN

MÔN: BẢO MẬT THÔNG TIN

TÌM HIỂU VỀ HỆ THỐNG NHẬN DẠNGSINH TRẮC HỌC BẰNG CHỮ KÝ VIẾT

THÀNH PHỐ HỒ CHÍ MINH, NĂM 2024

Trang 3

LỜI CẢM ƠN

Lời đầu tiên, chúng em xin gửi lời cảm ơn chân thành đến Cô Huỳnh Ngọc Tú –Giảng viên khoa Công nghệ thông tin – Trường đại học Tôn Đức Thắng, đã hỗ trợ vàgiúp đỡ nhiệt tình trong quá trình thực hiện tiểu luận này

Chúng em trân trọng cảm ơn Thầy Cô giảng viên Trường đại học Tôn ĐứcThắng nói chung cũng như Thầy Cô giảng viên khoa Công nghệ thông tin nói riêng đãgiảng dạy và truyền đạt nhiều kinh nghiệm quý trong suốt quá trình học tập tại trường.

Mặc dù rất cẩn thận trong quá trình thực hiện nhưng cũng không thể tránh khỏinhững thiếu sót Chúng em rất mong nhận được sự góp ý từ các Thầy/Cô để bài tiểuluận được hoàn thiện hơn.

Chúng em chân thành cảm ơn!

Trang 4

TIỂU LUẬN ĐƯỢC HOÀN THÀNHTẠI TRƯỜNG ĐẠI HỌC TÔN ĐỨC THẮNG

Tôi xin cam đoan đây là bài tiểu luận của riêng chúng tôi và được sự hướng dẫncủa TS Huỳnh Ngọc Tú; Các nội dung nghiên cứu, kết quả trong đề tài này là trungthực và chưa công bố dưới bất kỳ hình thức nào trước đây Những số liệu trong cácbảng biểu phục vụ cho việc phân tích, nhận xét, đánh giá được chính tác giả thu thập từcác nguồn khác nhau có ghi rõ trong phần tài liệu tham khảo.

Ngoài ra, trong tiểu luận còn sử dụng một số nhận xét, đánh giá cũng như sốliệu của các tác giả khác, cơ quan tổ chức khác đều có trích dẫn và chú thích nguồngốc.

Nếu phát hiện có bất kỳ sự gian lận nào chúng tôi xin hoàn toàn chịu tráchnhiệm về nội dung tiểu luận của mình Trường đại học Tôn Đức Thắng không liên

quan đến những vi phạm tác quyền, bản quyền do chúng tôi gây ra trong quá trình thựchiện (nếu có).

TP Hồ Chí Minh, ngày tháng năm Tác giả

(ký tên và ghi rõ họ tên)

Nguyễn Văn B

Trần Văn C

Trang 5

PHẦN XÁC NHẬN VÀ ĐÁNH GIÁ CỦA GIẢNG VIÊN

Phần xác nhận của GV hướng dẫn

Tp Hồ Chí Minh, ngày tháng năm (kí và ghi họ tên)

Phần đánh giá của GV chấm bài

Tp Hồ Chí Minh, ngày tháng năm (kí và ghi họ tên)

Trang 6

TÓM TẮT

Trình bày tóm tắt vấn đề nghiên cứu, các hướng tiếp cận, cách giải quyết vấn đềvà một số kết quả đạt được, những phát hiện cơ bản trong vòng 1 -2 trang.

Trang 7

MỤC LỤC

LỜI CẢM ƠN IPHẦN XÁC NHẬN VÀ ĐÁNH GIÁ CỦA GIẢNG VIÊN IIITÓM TẮT IV

2.2.1 Thu thập dữ liệu chữ ký viết tay 8

2.2.2 Xử lý và tiền xử lý dữ liệu thu thập 9

2.4.1 Giai đoạn tiền xử lý dữ liệu 14

2.4.2 Giai đoạn trích xuất đặc trưng 16

2.4.3 Tạo vector đặc trưng 18

2.4.4 Huấn luyện mạng nơ-ron 18

CHƯƠNG 3 – KẾT LUẬN 18

3.1 TÍNHKHẢTHI 18

3.2 Đ Ộ TIN CẬY VÀBẢOMẬT 19

3.3 ỨNG DỤNG 19

Trang 8

TÀI LIỆU THAM KHẢO 21

Trang 9

DANH MỤC KÍ HIỆU VÀ CHỮ VIẾT TẮTCÁC KÝ HIỆU

f Tần số của dòng điện và điện áp (Hz)p Mật độ điện tích khối (C/m3)

CÁC CHỮ VIẾT TẮT

CSTD Công suất tác dụngMF Máy phát điệnBER Tỷ lệ bít lỗi

Trang 10

DANH MỤC CÁC BẢNG BIỂU, HÌNH VẼ, ĐỒ THỊDANH MỤC HÌNH

Hình 1 Sơ đồ các dạng bảo mật bằng sinh trắc học 5

Hình 2 Kiến trúc của một mô hình nhận dạng chữ ký 11

Hình 3 Mô tả thuật toán random forest 12

Hình 4 Mẫu training set trong mô hình random forest 12

Hình 5 Áp dụng nhận dạng chữ ký bằng mô hình random forest 13

Hình 6 Chuẩn hoá kích thước ảnh 15

Hình 7 Làm mỏng ảnh 15

Hình 8 Tạo hộp bao quanh 16

Hình 9 Tính toán đặc trưng bề mặt 3 phần 17

Hình 10 Tính toán đặc trưng bề mặt 6 phần 17

Trang 11

CHƯƠNG 1 – TỔNG QUAN1.1 Giới thiệu

Ngày nay, nhu cầu về an ninh đang tăng cao trên toàn cầu từ cả cá nhân và tổchức An ninh mạng đã trở thành một trong những vấn đề quan trọng nhất trong thờiđại kỹ thuật số và công nghệ 4.0 hiện nay Một trong những phương pháp quan trọngthường được sử dụng để cung cấp an ninh cho các ứng dụng kỹ thuật số là bảo mật sinhtrắc học

Bảo mật sinh trắc học được định nghĩa bởi các đặc điểm của con người giúpphân biệt giữa mọi người với nhau Bảo mật sinh trắc học có thể phân loại thành 2 loạilà sinh lý hoặc hành vi Khuôn mặt con người, võng mạc, vân tay và con ngươi đượccoi là các đặc điểm sinh lý không thể thay đổi trong khi giọng nói, lực gõ phím và chữký bằng tay, được coi là ví dụ về đặc điểm về hành vi

Hình 1 Sơ đồ các dạng bảo mật bằng sinh trắc học.

Trang 12

Nhận dạng sinh trắc học bằng chữ ký viết tay là quá trình xác định và xác thựccá nhân dựa trên các đặc điểm độc nhất của việc viết tay của họ

1.2 Ưu điểm

Nhận dạng bằng chữ ký mang lại nhiều ưu điểm, bao gồm:

- Độc nhất vô nhị: Mỗi người có một cách viết riêng biệt và không giống aikhác, giống như một dấu vân tay nên chữ ký trở thành một đặc điểm độc nhất của mỗingười.

- Dễ tiếp cận: So với một số phương pháp nhận dạng sinh trắc học khác như vântay hoặc mống mắt, việc thu thập và xác định chữ ký viết tay thường dễ dàng hơn vàkhông đòi hỏi các thiết bị đặc biệt.

- Tính khả diễn giải: Chữ ký có thể được dễ dàng kiểm tra và đối chiếu bởi conngười mà không cần các công nghệ phức tạp Điều này làm cho quá trình xác thực trởnên nhanh chóng và hiệu quả.

- Ứng dụng đa dạng: Chữ ký có thể được sử dụng trong nhiều lĩnh vực khácnhau như giao dịch tài chính, hợp đồng, biên nhận, xác thực truy cập, và các quy trìnhhành chính khác.

- An toàn và bảo mật: Việc sử dụng chữ ký giúp bảo vệ thông tin cá nhân và dữliệu quan trọng bằng cách xác định chính xác người ký và ngăn chặn việc gian lận.

- Khả năng giả mạo: Mặc dù chữ ký được xem là độc nhất vô nhị, nhưng nókhông hoàn toàn miễn nhiễm với việc sao chép hoặc giả mạo Có thể có các kỹ thuậtgiả mạo chữ ký như làm giả hoặc sao chép chữ ký từ một người khác.

Trang 13

- Cần có dữ liệu đủ lớn: Để xây dựng mô hình nhận dạng chữ ký chính xác, cầncó một tập dữ liệu lớn và đa dạng của các chữ ký từ nhiều người khác nhau Việc thuthập và quản lý dữ liệu đó có thể tốn kém và đòi hỏi nhiều công sức.

- Yếu tố kỹ thuật: Việc sử dụng công nghệ để thu thập và xác định chữ ký đòihỏi các thiết bị phức tạp và chi phí Hơn nữa, các phần mềm nhận dạng cần được cậpnhật và duy trì định kỳ để đảm bảo độ chính xác và hiệu suất.

- Sử dụng các biện pháp bảo mật mạng: Nhằm ngăn chặn tấn công trái phép vàodữ liệu chữ ký của người dùng.

- Sử dụng chữ ký độc nhất: Người dùng có thể tự tăng cường bảo mật cho chữký cá nhân bằng cách dùng chữ ký độc nhất và phức tạp Tránh dùng các chữ ký đơngiản vì có khả năng bị giả mạo.

CHƯƠNG 2 – CƠ SỞ LÝ THUYẾT2.1 Chữ ký viết tay

Chữ ký viết tay là một loại dữ liệu sinh trắc học độc đáo, mỗi người có một cáchviết riêng biệt và đặc trưng, tạo nên chữ ký cá nhân của họ Các đặc điểm này bao gồmcách nắm bút, lối viết, đặc điểm hình học của các phần từ chữ ký (như kí tự, dấu nối,kích thước, hình dạng của các nét chữ, và khoảng cách giữa các từ và dòng chữ).2.1.1 Đặc điểm

Đặc điểm của chữ ký:

Chữ ký là hình ảnh, không phải ký tự.

Trang 14

Tính bất biến: Chữ ký phải được cá nhân sử dụng trong một thời gian dài.Tính đơn nhất: Chữ ký phải phân biệt được các cá nhân.

Tính không thể bắt chước: Chữ ký phải có đủ độ khó để tránh việc bị bắtchước quá dễ dàng.

Có thể chia nhỏ và so sánh từng phần.

Các điểm đặc trưng của chữ ký, như điểm bắt đầu, điểm kết thúc và các điểmquan trọng trên đường nét, được sử dụng để xác định và so sánh chữ ký với các mẫu đãbiết.

2.1.2 Tính duy nhất của chữ ký

Cấu trúc cơ bản của chữ ký bao gồm hình dạng, kích thước của từng ký tự, cũngnhư các yếu tố liên quan như độ nghiêng, khoảng cách giữa các chữ cái, và độ dài củadòng chữ.

Chữ ký cũng thể hiện đặc điểm cá nhân của mỗi người, bản tính và cá tính củangười viết được phản ánh trong cách họ viết chữ ký.

Mặc dù có thể nỗ lực để sao chép chữ ký của người khác nhưng việc tái tạo mộtcách chính xác là rất khó khăn vì mỗi người có cách viết riêng biệt và đặc trưng.

Phương pháp ngoại tuyến: Phương pháp này dành cho các chữ ký đượcviết trên giấy Nó sử dụng một máy quét quang học để thu được chữ ký.

2.2.1 Thu thập dữ liệu chữ ký viết tay

Trang 15

Các thiết bị và phương pháp thu thập dữ liệu chữ ký đa dạng và phong phú, dướiđây là một số phương pháp để thu thập dữ liệu chữ ký:

- Bút và giấy: Sử dụng bút và giấy để ghi lại chữ ký của người viết.

- Dùng bảng cảm ứng: Người viết sử dụng bút hoặc ngón tay để viết trên bề mặtcảm ứng, trong khi các cảm biến ghi lại các điểm chạm và đường viết.

- Sử dụng tablet và bút stylus: Đây là một phương pháp phổ biến trong việc thuthập dữ liệu chữ ký Người viết sử dụng bút Stylus để viết trên màn hình của tablet,trong khi các cảm biến ghi lại các đặc điểm của chữ ký.

- Sử dụng camera và phần mềm nhận diện: Được sử dụng để chụp hình chữ kýcủa người viết, sau đó được xử lý bằng các phần mềm nhận diện chữ ký để trích xuấtcác đặc điểm quan trọng của chữ ký.

2.3 Nguyên lý hoạt động của hệ thống

Nguyên lý hoạt động của nhận dạng chữ ký viết tay sinh trắc học dựa trên việc phân tích và so sánh các đặc điểm sinh trắc học của chữ viết tay để xác định danh tính của người viết bao gồm các bước sau:

- Thu thập dữ liệu- Tiền xử lý dữ liệu- Trích xuất đặc trưng- Xây dựng mô hình máy học- Xác thực và đánh giá kết quả

Trang 16

- Neural Networks (NN): Có khả năng mạnh mẽ trong việc nhận dạng chữ kýbằng cách sử dụng các kiến thức học từ dữ liệu Mạng NN có khả năng học các biểudiễn phức tạp của chữ ký và tạo ra các mô hình dự đoán chính xác và linh hoạt.

- Support Vector Machine (SVM): Với khả năng tạo ra các ranh giới phân loạichính xác và linh hoạt SVM có thể xử lý cả dữ liệu tuyến tính và phi tuyến tính, giúpđưa ra các dự đoán chính xác trong các tình huống phức tạp.

- Random Forest: Phương pháp Random Forest là một giải pháp hiệu quả choviệc nhận dạng chữ ký, với khả năng xử lý cả dữ liệu đa chiều và dữ liệu không cấutrúc Bằng cách kết hợp nhiều cây quyết định, Random Forest có thể tạo ra các mô hìnhmạnh mẽ và linh hoạt cho bài toán nhận dạng chữ ký.

2.4 Mô hình Random Forest

Trang 17

- Thuật toán random forest trong nhận dạng chữ ký viết tay sẽ hoạt động theo 5bước:

• Bước 1: Tiền xử lý hình ảnh

• Bước 2: Chọn các mẫu chữ ký ngẫu nhiên từ tập dữ liệu huấn luyện• Bước 3: Xây dựng cây quyết định cho mẫu chữ ký

• Bước 4: Các cây quyết định đưa ra các dự đoán

• Bước 5: Chọn kết quả là chữ ký được dự đoán nhiều nhất là dự đoáncuối cùng

Hình 2 Mô tả thuật toán random forest.

- Training Set: Là tập các hình ảnh nằm trong các thư mục có gắn nhãn hoặccác hình ảnh có nhãn.

Trang 18

Hình 3 Mẫu training set trong mô hình random forest.

- Training Sample: Là các tập được lựa chọn ngẫu nhiên từ tập training set từ đótạo thành các cây quyết định chuẩn bị cho quá trình voting.

- Test: Đưa dữ liệu là hình ảnh chữ ký vào mô hình Kết thúc quá trình votingsẽ là kết quả của dự đoán

Hình 4 Áp dụng nhận dạng chữ ký bằng mô hình random forest.

- Ưu điểm của random forest là thuật toán mang tính chất mô phỏng dễ hìnhdung, không phức tạp nhiều về thuật toán, nó cũng được hỗ trợ trên nhiều thuật toán,trên nhiều lĩnh vực khác nhau.

Trang 19

- Nhược điểm là thuật toán có độ chính xác không cao.

2.5 Mô hình Neural Networks

Quy trình xác thực chữ ký có thể được chia thành 2 giai đoạn:Giai đoạn 1: Giai đoạn training

Giai đoạn 2: Giai đoạn testing

Trong giai đoạn training sẽ được chia làm 4 bước:Thu thập dữ liệu

Tiền xử lý dữ liệu (pre-processing)Trích xuất đặc trưng

Huấn luyện mạng nơ-ron

Giai đoạn testing sẽ được chia làm 5 bước chính:Lấy dữ liệu đầu vào

Tiền xử lý dữ liệuTrích xuất đặc trưng

Áp dụng các đặc trưng vào mạng nơ-ron đã được huấn luyện từ trướcKiểm tra kết quả từ mạng nơ-ron

2.5.1 Giai đoạn tiền xử lý dữ liệu

Ở giai đoạn này, chữ ký sẽ được scan và chuyển thành ảnh xám (gray-scale).Mục đích của giai đoạn này là để chắc chắn rằng chữ ký đã đủ đạt tiêu chuẩn để có thểtrích xuất các đặc trưng cho quá trình huấn luyện mạng nơ-ron Giai đoạn này gồmnhiều bước như sau:

- Chuyển ảnh dạng nhị phân (Converting image to binary) Ảnh xám sau khi: scan sẽ được chuyển thành dưới dạng nhị phân để có thể trích xuất đặc trưng dễ dànghơn.

- Chuẩn hoá kích thước ảnh (Image resizing) Để có thể thuận tiện và đơn giản: hơn hơn trong việc trích xuất thì chúng ta sẽ tiến hành chuẩn hóa kích thước ảnh theomột kích thước tiêu chuẩn như ở dạng 256*256.

Trang 20

Hình 5 Chuẩn hoá kích thước ảnh.

- Cân bằng độ sáng (Brightness equalization): Đảm bảo rằng mức độ sáng củatoàn bộ ảnh là đồng nhất, giúp tránh sự biến động không cần thiết giữa các vùng sángvà tối của chữ ký.

- Cắt cụm chữ ký (Cropping) Loại bỏ các vùng không cần thiết xung quanh chữ: ký, tạo ra một hình ảnh chỉ chứa chữ ký Điều này giúp giảm kích thước của ảnh và tậptrung vào vùng quan trọng

- Làm mỏng (Thinning) Làm mỏng nhằm làm mịn hoặc làm giảm độ dày của: đối tượng trong hình ảnh, giữ lại các đặc điểm cơ bản như hình dạng hoặc cấu trúc củađối tượng sao cho nét chữ trở nên mảnh mai nhưng vẫn giữ được hình dạng và cấu trúcchính xác của chữ ký giúp giảm kích thước của dữ liệu và tăng cường khả năng phânloại hoặc nhận dạng.

Hình 6 Làm mỏng ảnh.

Trang 21

- Tạo hộp bao quanh (Bounding box) Tạo ra một hình chữ nhật bao quanh một: đối tượng hoặc một nhóm các đối tượng trong hình ảnh Được sử dụng để xác định vịtrí và ranh giới của chữ ký trong hình ảnh Điều này giúp tập trung vào vùng quantrọng của hình ảnh và làm giảm kích thước của dữ liệu, đồng thời làm tăng khả năngnhận dạng hoặc phân loại.

Hình 7 Tạo hộp bao quanh.

2.5.2 Giai đoạn trích xuất đặc trưng

- Tính toán biểu đồ tần suất tối đa theo chiều ngang và chiều dọc: Bằng cáchquét qua từng hàng và cột của hình ảnh chữ ký, ta tính được số lượng pixel đen trênmỗi hàng và cột Điều này giúp xác định hàng và cột có số lượng pixel đen tối đa, tạora histogram tối đa theo chiều ngang và dọc.

- Xác định trọng tâm: Hình ảnh chữ ký được chia thành hai phần bằng nhau, sauđó trọng tâm của mỗi phần được tính toán Trọng tâm là điểm trung bình của tất cả cácpixel đen trong mỗi phần, giúp xác định vị trí trọng tâm của chữ ký.

- Tính toán diện tích chuẩn hoá của chữ ký: Diện tích của chữ ký được tính bằngsố lượng pixel đen tạo thành nó Điều này được chia cho diện tích của hộp bao quanhchữ ký để tạo ra diện tích chuẩn hóa của chữ ký.

Trang 22

- Tính toán tỉ lệ khung hình: Tỷ lệ này là tỷ lệ giữa chiều rộng và chiều cao củahình ảnh chữ ký Nó được sử dụng để chuẩn hóa sự biến đổi trong kích thước của chữký (Trường hợp chiều cao hay chiều rộng của chữ ký của người ký có thể thay đổi thìtỉ lệ này vẫn xấp xỉ bằng nhau).

- Tính toán đặc trưng bề mặt ba phần: Chữ ký được chia thành ba phần bằngnhau và diện tích của mỗi phần được tính Sau đó, diện tích chuẩn hóa của mỗi phầnđược tính để tạo ra đặc trưng bề mặt ba phần (Eq1)

Hình 8 Tính toán đặc trưng bề mặt 3 phần.

- Tính toán đặc trưng bề mặt sáu phần: Tương tự như trên, chữ ký được chiathành ba phần và tiến hành tạo hộp bao quanh, sau đó xác định trọng tâm mỗi phần vàtiến hành tạo 1 đường ngang trọng tâm mỗi phần ta sẽ tạo được sáu phần.

Hình 9 Tính toán đặc trưng bề mặt 6 phần.

Trang 23

- Tính toán đặc trưng chuyển đổi: Bằng cách quét hình ảnh chữ ký từ trái sangphải và từ trên xuống dưới, mỗi khi có sự chuyển đổi từ pixel đen sang trắng hoặcngược lại, tỷ lệ giữa vị trí của sự chuyển đổi và chiều rộng của hình ảnh được tính toánvà ghi lại.

2.5.3 Tạo vector đặc trưng

Từ những đặc trưng đã được phân tích trước đó ta tiến hành tạo vector đặctrưng.

2.5.4 Huấn luyện mạng nơ-ron

- Các giá trị trong vector đặc trưng được chuẩn hóa để đưa chúng vào một phạmvi nhất định, thường là từ 0 đến 1, giúp đồng nhất dữ liệu và so sánh được giữa các đặctrưng.

- Sau khi chuẩn hóa, vector đặc trưng được sử dụng làm đầu vào cho mạng ron, được cấu trúc với các lớp ẩn và lớp đầu ra Trọng số của mạng nơ-ron được điềuchỉnh trong quá trình huấn luyện để tối ưu hóa hiệu suất của mô hình trong việc nhậndạng chữ ký.

nơ Trong quá trình huấn luyện, mạng nơnơ ron điều chỉnh các trọng số của nó dựatrên dữ liệu đầu vào và các nhãn đích tương ứng, thông qua việc sử dụng các thuật toántối ưu hóa như gradient descent để tìm ra các trọng số tối ưu cho mạng nơ-ron.

CHƯƠNG 3 – KẾT LUẬN3.1 Tính khả thi

Tính khả thi của việc áp dụng nhận diện sinh trắc học bằng chữ ký viết tay phụthuộc vào nhiều yếu tố, từ khả năng chính xác của hệ thống nhận diện đến sự chấpnhận từ người dùng và mức độ tuân thủ các quy định pháp lý.

Việc sử dụng chữ ký viết tay có tiềm năng để cải thiện tính bảo mật và tiện lợitrong nhiều lĩnh vực như ngân hàng, chính phủ, và các ứng dụng cá nhân Tuy nhiên,

Ngày đăng: 07/05/2024, 16:18

Tài liệu cùng người dùng

Tài liệu liên quan