Ứng dụng mạng neural đánh giá mức độ an toàn của mật khẩu

3 0 0
Ứng dụng mạng neural đánh giá mức độ an toàn của mật khẩu

Đang tải... (xem toàn văn)

Thông tin tài liệu

Bài viết Ứng dụng mạng neural đánh giá mức độ an toàn của mật khẩu đề xuất một phương pháp đánh giá mức độ an toàn của mật khẩu dựa trên một mạng neural được huấn luyện để nhận biết các mật khẩu thông dụng, qua đó đề xuất một khả năng xây dựng dịch vụ đánh giá mức độ an toàn dựa trên dữ liệu sử dụng thực tế thay vì các quy tắc bảo mật được thiết lập bởi quản trị viên.

Tuyển tập Hội nghị Khoa học thường niên năm 2019 ISBN: 978-604-82-2981-8 ỨNG DỤNG MẠNG NEURAL ĐÁNH GIÁ MỨC ĐỘ AN TOÀN CỦA MẬT KHẨU Trương Xuân Nam Trường Đại học Thủy lợi, email: namtx@tlu.edu.vn GIỚI THIỆU CHUNG PHƯƠNG PHÁP NGHIÊN CỨU Mật phương pháp phổ biến việc xây dựng hàng rào bảo mật cho liệu chức có tính riêng tư phân cấp Phương pháp đơn giản, có chi phí thấp phù hợp với đối tượng người sử dụng Tuy nhiên, dùng mật có số điểm bất lợi, mức độ an tồn mật khác Có mật thông dụng dễ dàng bị phá phương pháp thử sai; mật sinh tự động máy tính lại khó nhớ, gây phiền phức cho người sử dụng Để người dùng tạo mật đủ khó, quản trị viên thường đưa tiêu chí cho mật độ dài, mức độ phong phú nội dung; tiêu chí chọn cách chủ quan không dựa nghiên cứu kĩ thuật dò mật Một mật tốt nên dễ nhớ với người sử dụng khó phá với kĩ thuật dị, yêu cầu mà khuyến cáo không đạt Trong báo cáo đề xuất phương pháp đánh giá mức độ an toàn mật dựa mạng neural huấn luyện để nhận biết mật thơng dụng, qua đề xuất khả xây dựng dịch vụ đánh giá mức độ an toàn dựa liệu sử dụng thực tế thay quy tắc bảo mật thiết lập quản trị viên Giải pháp hữu ích cho phép người sử dụng đặt mật hồn tồn theo ý muốn họ, khơng có ràng buộc nào, tạo mật mạnh 2.1 Bài toán đánh giá chất lượng mật Để tạo mật an toàn, theo nghĩa khó đốn phần mềm, quản trị hệ thống người xây dựng quy trình đặt nguyên tắc ràng buộc mật Một vài nguyên tắc thông dụng thường sử dụng: Mật không ngắn Mật không dài (tránh việc khai thác lỗi tràn đệm) Mật không chứa thông tin cá nhân thông dụng người dùng ngày sinh, họ tên, tên lóng, địa nhà, số điện thoại, số chứng minh thư,… Mật không trùng với tên đăng nhập Mật bắt buộc phải chứa chữ hoa, chữ thường, chữ số, dấu ký hiệu Trong thực tế quy tắc đặt làm cho mật khó đốn, khơng có nghĩa mật mạnh Vì thực tế hệ thống thường không lưu lại mật người dùng mà kiểm tra chữ ký số (thường MD5 SHA); việc mật khó nhớ khơng có nghĩa an tồn Điều quan trọng mật khơng nên nằm từ điển mật phần mềm phá khóa Hầu hết phương pháp thơng thường khơng đánh giá chất lượng mật người dùng tạo Chúng sử dụng phương pháp học mạng neural vào toán 168 Tuyển tập Hội nghị Khoa học thường niên năm 2019 ISBN: 978-604-82-2981-8 2.2 Xác định mục tiêu cần giải Chúng xác định toán cụ thể cần giải báo cáo sau: Xây dựng phương pháp hiệu quả, đánh giá chất lượng mật chuỗi văn ngắn, mật khác biệt so với mẫu có tốt Để lượng hóa phương pháp đánh giá này, xây dựng thuật toán đánh giá dựa độ lệch xác suất chọn kí tự liệu thực tế [Bảng 2] Có hai vấn đề tốn cần tiếp tục làm rõ: Mẫu có cụ thể gì? Khác biệt đo đơn vị gì? Với tốn bảo mật mật khẩu, có nhiều cách vượt qua hàng rào này, chẳng hạn: - Tìm kiếm trực tiếp mật thơng qua điểm yếu môi trường giao thức - Vượt qua hàng rào cách lợi dụng lỗi bảo mật lỗi lập trình - Đốn mật phương pháp thử sai Việc đánh giá chất lượng mật giúp tránh việc bị đoán mật nhanh, xác định mẫu mật chuỗi mật thường dùng sở liệu mật thường tin tặc khai thác chuỗi mật sinh phần mềm công thử sai Vấn đề thứ hai phức tạp hơn, có nhiều để đưa tiêu chuẩn định lượng cho khái niệm khác biệt, báo cáo đề nghị đo lường xác suất trùng lặp kí hiệu sinh từ tập mẫu kí hiệu mật Như cách xác định độ đo tốn khuyến khích việc tránh xa cách dùng từ thông dụng, chẳng hạn lặp lại ngày sinh, số điện thoại từ phổ biến 2.3 Học từ liệu mạng neural Mạng neural nhánh mạnh học máy, có nhiều mơ hình khác giúp giải nhiều vấn đề hóc búa tốn học từ liệu Đặc biệt, nhiều loại mạng neural phối hợp với để giải vấn đề phức tạp, việc lớp mạng phối hợp làm việc cảm hứng cho ngành học sâu (deep learning) 2.4 Mạng neural hồi quy Các loại mạng neural hồi quy (Recurrent Neural Networks) phù hợp với việc xử lý liệu văn có chế giúp lưu giữ lại ngữ cảnh đoạn văn Trong báo cáo này, sử dụng cấu trúc dựa LSTM (Long ShortTerm Memory), tế bào neural phù hợp với việc xử lý liệu mức kí tự KẾT QUẢ NGHIÊN CỨU 3.1 Tập liệu huấn luyện Chúng sử dụng hai nguồn liệu Nguồn liệu gồm 353 triệu mật thông dụng mạng wifi [1] Đây sở liệu gom từ nhiều nguồn thống kê mật thường dùng Bộ liệu nhiều hệ thống sử dụng để nhận biết mật yếu Nguồn liệu thứ hai tạo từ API trang https://www.passwordrandom.com, trang web cung cấp dịch vụ tạo mật mạnh Chúng sử dụng mật từ nguồn để tạo liệu kiểm tra thuộc nhóm mật mạnh 3.2 Kiến trúc mạng neural đề xuất Lời giải theo hướng tiếp cận mạng neural hoàn toàn mới, chúng tơi xây dựng ban đầu cấu trúc mạng neural đơn giản có thể, phương pháp tỏ khả quan, tiếp tục nâng cấp mơ hình theo hướng nhiều lớp để học nhiều quy luật nội tập liệu mật Cấu trúc mạng đề xuất sau: - Đầu vào vector binary 96 phần tử, vector one-hot-encoding cho ký tự thông dụng cho mật - Bốn lớp LSTM lớp có 96 phần tử 169 Tuyển tập Hội nghị Khoa học thường niên năm 2019 ISBN: 978-604-82-2981-8 - Đầu softmax trả xác suất dự báo ký tự 3.3 Đánh giá chất lượng mật Sức mạnh mật thể qua khác biệt vector one-hot-encoding thực tế vector dự báo đầu softmax trả (trung bình độ lệch bình phương) V vector dự báo, T vector thực tế, công thức độ lệch: 95 D(T ,V ) = ∑ (Tk − Vk ) k =0 3.5 Chương trình minh họa Chương trình minh họa viết Python sử dụng framework Keras/ Python gồm chương trình huấn luyện mơ hình đề xuất lưu file liệu HDF5 Chương trình kiểm tra viết công nghệ tương tự làm nhiệm vụ nạp mơ hình từ file liệu đánh giá mật đề xuất mức độ yếu, yếu, trung bình, mạnh mạnh tùy theo độ đo khác biệt mạng neural đánh giá Do hạn chế báo cáo tiết chương trình khơng trình bày 3.4 Một số thuật toán KẾT LUẬN Bảng Thuật toán huấn luyện LSTM 1. Tạo model RNN: input = 96 one‐ hot, hidden 1 = LSTM x 96,  hidden 2 = LSTM x 96, hidden 3 =  LSTM x 96, hidden 4 = LSTM x 96,  output = softmax x 96.  2. Tham số huấn luyện: Batch size  = 32, Sequence length: 32,  Learning rate: 0.002, Decay  rate: 0.97, Init = Adam.  3. Huấn luyện model với iteration  = 200000  Lưu model thành file password.hdf5  Bảng Thuật toán đánh giá password 1. Mã hóa password thành danh sách  các vector one‐hot.  2. Nạp model từ file.  3. Lần lượt input các vector từ password vào model, tính độ  lệch theo cơng thức.  4. Tính trung bình của các độ  lệch, đánh giá mức độ mạnh yếu  của mật khẩu theo tiêu chuẩn:  - Dưới 0.125: rất yếu    ‐ 0.125‐0.5: yếu    ‐ 0.5‐0.75: trung bình    ‐ 0.75‐0.9: mạnh    ‐ trên 0.9: rất mạnh.  Trong báo cáo này, chúng tơi trình bày đề xuất lời giải cho tốn đánh giá chất lượng mật dựa mơ hình mạng neural phù hợp với nhiệm vụ xử lý liệu văn Tuy kết ban đầu sơ sài, cho thấy phương pháp áp dụng thực tế nhiều hướng cải tiến Đây hướng tiếp cận khả quan, kết ban đầu cho thấy mở hướng cho việc sử dụng phương pháp học máy vào vấn đề truyền thống Mơ hình có kích cỡ nhỏ, đưa lên thiết bị di động nhúng vốn yêu cầu chặt chẽ nhớ Mặt hạn chế phương pháp tiêu chuẩn không rõ ràng, trường hợp mật bị đánh giá yếu, người sử dụng không đề xuất phải sửa đổi để khắc phục vấn đề TÀI LIỆU THAM KHẢO [1] Berzerk0, 2018, “Probable-Wordlists: Real Password” https://github.com/berzerk0/ProbableWordlists/tree/master/Real-Passwords [2] Andrej Karpathy, Justin Johnson, Li Fei-Fei, 2015, “Visualizing and Understanding Recurrent Networks” https://arxiv.org/abs/1506.02078 170 ... trình - Đoán mật phương pháp thử sai Việc đánh giá chất lượng mật giúp tránh việc bị đốn mật q nhanh, xác định mẫu mật chuỗi mật thường dùng sở liệu mật thường tin tặc khai thác chuỗi mật sinh phần... https://www.passwordrandom.com, trang web cung cấp dịch vụ tạo mật mạnh Chúng sử dụng mật từ nguồn để tạo liệu kiểm tra thuộc nhóm mật mạnh 3.2 Kiến trúc mạng neural đề xuất Lời giải theo hướng tiếp cận mạng neural. .. loại mạng neural phối hợp với để giải vấn đề phức tạp, việc lớp mạng phối hợp làm việc cảm hứng cho ngành học sâu (deep learning) 2.4 Mạng neural hồi quy Các loại mạng neural hồi quy (Recurrent Neural

Ngày đăng: 30/07/2022, 16:17

Tài liệu cùng người dùng

Tài liệu liên quan