Nghiên cứu phương pháp lọc Spam và ứng dụng trong bảo mật hệ thống thư điện tử tại sở thông tin và truyền thông tỉnh Nam Định

81 864 0
Nghiên cứu phương pháp lọc Spam và ứng dụng trong bảo mật hệ thống thư điện tử tại sở thông tin và truyền thông tỉnh Nam Định

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐINH QUANG THÁI NGHIÊN CỨU PHƢƠNG PHÁP LỌC SPAM VÀ ỨNG DỤNG TRONG BẢO MẬT HỆ THỐNG THƢ ĐIỆN TỬ TẠI SỞ THÔNG TIN VÀ TRUYỀN THÔNG TỈNH NAM ĐỊNH nh Mã số: 60 48 01 TS Nguyễn Ngọc Cƣơng Thái Nguyên - 2013 Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ i LỜI CAM ĐOAN Tôi xin cam đoan rằng, cơng trình nghiên cứu tơi có giúp đỡ tận tình thầy hƣớng dẫn thầy cô Học viện An ninh nhân dân, hỗ trợ đồng nghiệp Sở Thông tin Truyền thông Nam Định Các nội dung nghiên cứu kết đề tài hoàn toàn trung thực Trong luận văn, tơi có tham khảo đến số tài liệu số tác giả đƣợc liệt kê phần Tài liệu tham khảo cuối luận văn Thái Nguyên, ngày 15 tháng năm 2013 Tác giả ĐINH QUANG THÁI Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ ii LỜI CẢM ƠN Để hồn thành chƣơng trình Cao học viết luận văn này, nhận đƣợc hƣớng dẫn, giúp đỡ góp ý nhiệt tình q thầy trƣờng Đại học Công nghệ Thông tin Truyền thông Thái Nguyên Trƣớc hết, xin chân thành cảm ơn đến quý thầy cô trƣờng Đại học Công nghệ Thông tin Truyền thông - Đại học Thái Nguyên, thầy cô Học viện An ninh nhân dân, đặc biệt thầy tận tình dạy bảo cho tơi suốt thời gian học tập trƣờng Tôi xin gửi lời biết ơn sâu sắc đến Tiến sĩ Nguyễn Ngọc Cƣơng - Học viện An ninh nhân dân dành nhiều thời gian tâm huyết hƣớng dẫn nghiên cứu giúp tơi hồn thành luận văn tốt nghiệp Nhân đây, xin chân thành cảm ơn Ban giám hiệu trƣờng Đại học Công nghệ Thông tin Truyền thông tạo nhiều điều kiện để học tập hồn thành tốt khóa học Mặc dù tơi có nhiều cố gắng hồn thiện luận văn tất nhiệt tình lực mình, nhiên khơng thể tránh khỏi thiếu sót, tơi mong nhận đƣợc đóng góp q báu q thầy cô bạn Lời cảm ơn sau tơi xin dành cho gia đình ngƣời bạn hết lòng quan tâm tạo điều kiện tốt để tơi hồn thành luận văn tốt nghiệp này! Tôi xin chân thành cảm ơn! Thái Nguyên, ngày 15 tháng năm 2013 Học viên thực Đinh Quang Thái - Lớp CK10A Trƣờng Đại học CNTT&TT – Đại học Thái Ngun Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii DANH MỤC CÁC HÌNH v DANH MỤC CÁC BẢNG vii DANH MỤC TỪ VIẾT TẮT viii MỞ ĐẦU .1 Chƣơng 1: TỔNG QUAN VỀ THƢ ĐIỆN TỬ VÀ SPAM .3 1.1 Các khái niệm 1.1.1 Thƣ điện tử gì? .3 1.1.2 Cấu trúc chung địa thƣ điện tử .3 1.1.3 Sự khác biệt thƣ điện tử với thƣ bƣu .3 1.1.4 Thƣ rác gì? .4 1.1.5 Các loại thƣ rác 1.1.6 Tác hại thƣ rác .6 1.2 Phƣơng thức trao đổi thông tin qua dịch vụ Email 1.2.1 Mơ hình trao đổi thông tin dựa email 1.2.2 Giao thức ngôn ngữ sử dụng 1.3 Các phần mềm lọc nội dung mail nƣớc 11 Chƣơng 2: CÁC PHƢƠNG PHÁP GỬI VÀ KỸ THUẬT LỌC EMAIL - SPAM 15 2.1 Các kỹ thuật gửi mail nặc danh Bomb Mail 15 2.1.1 Thu thập địa email .15 2.1.2 Tìm kiếm máy tính Internet cho phép gửi thƣ 18 2.1.3 Boml Mail 20 2.2 Mơ hình nguyên lý hoạt động hệ thống lọc nội dung Mail 22 2.2.1 Mơ hình hệ thống lọc mail .22 2.2.2 Kiến trúc tổng quan hệ thống lọc mail 24 2.2.3 Các kỹ thuật lọc nội dung thông tin qua mail 26 2.2.4 Kỹ thuật lọc Spam 30 Chƣơng 3: XÂY DỰNG CHƢƠNG TRÌNH THỬ NGHIỆM VÀ ĐỀ XUẤT CÁC GIẢI PHÁP PHÒNG CHỐNG SPAM .44 3.1 Xây dựng chƣơng trình lọc spam cho ứng dụng thƣ điện tử 44 3.1.1 Nhiệm vụ chƣơng trình .44 3.1.2 Các công nghệ sử dụng 44 Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ iv 3.1.3 Các chức chƣơng trình 45 3.2 Thử nghiệm hệ thống thƣ điện tử Sở Thông tin Truyền thông tỉnh Nam Định 46 3.2.1 Khảo sát việc sử dụng mail Sở Thông tin Truyền thông tỉnh Nam Định 46 3.2.2 Dữ liệu thử nghiệm 47 3.2.3 Phƣơng pháp thử nghiệm 48 3.2.4 Thử nghiệm chƣơng trình 49 3.2.4 So sánh phƣơng pháp phân loại .55 3.2.5 Lựa chọn độ dài số lƣợng đặc trƣng 56 3.2.6 Phân biệt theo ngôn ngữ trƣớc lọc .58 3.2.7 Nhận xét kết thử nghiệm 58 3.3 Đề xuất giải pháp phòng chống spam 59 3.3.1 Giải pháp phòng chống mail server 59 3.3.2 Giải pháp phòng chống mail client .65 3.3.3 Giải pháp phía ngƣời sử dụng mail 67 KẾT LUẬN CHUNG 70 TÀI LIỆU THAM KHẢO 71 Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ v DANH MỤC CÁC HÌNH Hình 1.1: Mơ hình lưu chuyển thư điện tử qua Internet .7 Hình 1.2: Mơ hình gửi nhận thư điện tử sử dụng giao thử SMTP .10 Hình 1.3: Mơ hình gửi nhận thư điện tử dùng giao thức IMAP POP .11 Hình 1.4: Phần mềm lọc nội dung mail 12 Hình 2.1: Ví dụ trang web lấy cắp địa email người dùng .16 Hình 2.2: Một số website công ty gửi thư rác 18 Hình 2.3: Minh họa cách gửi thư rác qua mail server (open relay) .19 Hình 2.4: Các phương án trí hệ thống lọc thư .23 Hình 2.5: Kiến trúc chung hệ thống lọc thư .25 Hình 2.6: Mơ hình tổng quát lọc thư rác Tiếng Việt .29 Hình 2.7: Lưu lượng thư môi trường SPF 34 Hình 2.8: Cách thức làm việc SPF .34 Hình 2.9: Lọc thư rác phương pháp chặn IP 35 Hình 2.10: Thơng tin header email 42 Hình 3.1: Nhiệm vụ chương trình lọc thư rác 44 Hình 3.2: Chức phần mềm lọc thư rác 46 Hình 3.3: Giao diện form thiết lập thông số huấn luyện hệ thống 49 Hình 3.4: Lựa chọn thư mục chứa thư mẫu cho việc huấn luyện .50 Hình 3.5: Giao diện form tiến hành huấn luyện tập mẫu thư thường 51 Hình 3.6: Giao diện thiết lập danh sách hòm thư cần chặn lọc .51 Hình 3.7: Cửa sổ xác nhận việc cập nhật danh sách hòm thư cần chặn lọc 52 Hình 3.8: Giao diện thiết lập từ khóa cần chặn lọc 52 Hình 3.9: Cửa sổ xác nhận việc cập nhật danh sách từ khóa cần chặn lọc .52 Hình 3.10: Xác nhận sử dụng tính lọc thư rác chương trình 53 Hình 3.11: Hịm thư chưa chạy chương trình lọc thư rác 53 Hình 3.12: Thống kê kết lọc thư rác chương trình 54 Hình 3.13: Thư rác đánh dấu trình xem thư Outlook .54 Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ vi Hình 3.14: Giao diện tab giới thiệu chương trình 55 Hình 3.15: Xác nhận việc khỏi chương trình 55 Hình 3.16: Độ xác phân loại chung với số lượng đặc trưng khác 57 Hình 3.17: Độ xác phân loại với quy trình lọc khác .59 Hình 3.18: Phương thức hoạt động SPF 60 Hình 3.19: Phương thức hoạt động SPF động 62 Hình 3.20: Phân bố số lượng cặp (tên miền, IP) theo thơi gian .64 Hình 3.21: Hiệu phương pháp SPF động 64 Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ vii DANH MỤC CÁC BẢNG Bảng 1.1: So sánh thư điện tử thư truyền thống Bảng 1.2: Thống kê dạng thư rác máy chủ .6 Bảng 3.1 Bộ liệu thử nghiệm .48 Bảng 3.2 Độ xác phân loại với phương pháp phân loại khác 56 Bảng 3.3 Kết phân loại với độ dài đặc trưng - từ khác 57 Bảng 3.4 : Bảng liệu mẫu sử dụng phương pháp SPF động .63 Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ viii DANH MỤC TỪ VIẾT TẮT SPAM: Thư rác EMAIL: Thư điện tử SMTP: Simple Mail Transfer Protocol IMAP: Internet Message Access Protocol POP: Post Office Protocol Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ MỞ ĐẦU Thư rác (spam) thƣ điện tử đƣợc gửi hàng loạt với nội dung mà ngƣời nhận không mong đợi, không muốn xem, hay chứa nội dung không liên quan đến ngƣời nhận thƣờng đƣợc sử dụng để gửi thông tin quảng cáo Do có giá thành tƣơng đối thấp so với phƣơng pháp quảng cáo khác, thƣ rác chiếm tỷ lệ lớn ngày tăng tổng số thƣ điện tử đƣợc gửi qua Internet Sự xuất gia tăng thƣ rác gây khó chịu làm thời gian ngƣời nhận mà ảnh hƣởng tới đƣờng truyền Internet làm chậm tốc độ xử lý máy chủ thƣ điện tử, gây thiệt hại lớn kinh tế Để loại bỏ giảm thiểu ảnh hƣởng thƣ rác, nhiều cách tiếp cận khác đƣợc nghiên cứu sử dụng Giải pháp đấu tranh với thƣ rác đa dạng, bao gồm từ cố gắng pháp lý việc xây dựng luật ngăn chặn phát tán thƣ rác giải pháp kỹ thuật nhằm phát ngăn chặn thƣ rác giai đoạn khác trình tạo phát tán thƣ Trong số giải pháp đƣợc sử dụng, lọc thư theo nội dung giải pháp đƣợc sử dụng rộng rãi có triển vọng Lọc thƣ theo nội dung phƣơng pháp phân tích nội dung thƣ để phân biệt thƣ rác với thƣ bình thƣờng, kết phân tích sau đƣợc sử dụng để định chuyển tiếp thƣ đến ngƣời nhận hay không (trong phạm vi nghiên cứu này, nội dung thƣ đƣợc giới hạn nội dung trình bày dƣới dạng văn bản) Do việc lọc theo nội dung địi hỏi phân tích phần văn chứa tiêu đề hay nội dung thƣ, thuật toán lọc nội dung cần đƣợc xây dựng phù hợp với ngôn ngữ mà thƣ sử dụng Hiện nay, nhiều thuật toán lọc nội dung hiệu đƣợc nghiên cứu sử dụng cho thƣ viết tiếng Anh Trong vòng vài năm gần đây, việc sử dụng Internet nói chung thƣ điện tử nói riêng ngày phổ biến Việt nam Một hệ phát triển ngày có nhiều thƣ rác gửi tới tài khoản thƣ điện tử Việt nam (tài khoản có vn) Những thƣ rác bao gồm thƣ viết tiếng Anh thƣ viết tiếng Việt Việc xuất ngày nhiều thƣ rác tiếng Việt đặt yêu cầu cấp thiết phải có phƣơng pháp lọc thƣ xử lý đƣợc thƣ rác loại Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ 58 3.2.6 Phân biệt theo ngơn ngữ trƣớc lọc Nhƣ nói trên, phân chia thƣ tiếng Việt tiếng Anh sau tiến hành lọc thƣ rác riêng cho ngôn ngữ lọc ln khơng phân biệt thƣ viết ngơn ngữ Tƣơng tự, phân chia thƣ tiếng Việt có dấu khơng dấu trƣớc lọc Để so sánh quy trình phân loại, thử nghiệm đƣợc tiến hành theo chế độ sau: lọc chung thƣ tiếng Việt tiếng Anh, lọc riêng thƣ tiếng Việt thƣ tiếng Anh, lọc thƣ tiếng Việt khơng phân thành có dấu-khơng dấu phân chia theo dấu trƣớc lọc Với trƣờng hợp phân chia ngôn ngữ, độ dài đặc trƣng đƣợc chọn k = cho tiếng Việt k = cho tiếng Anh Trƣờng hợp không phân chia ngôn ngữ sử dụng k=1 Số lƣợng đặc trƣng n=2000 Kết so sánh ba quy trình lọc đƣợc thể bảng 3.2 Kết cho thấy, việc lọc riêng theo ngôn ngữ tiếng Việt cho kết tốt không phân biệt thƣ tiếng Việt thƣ tiếng Anh Đây kết việc lựa chọn độ dài đặc trƣng phù hợp cho ngôn ngữ Tuy nhiên, mức độ chênh lệch quy trình lọc khơng đáng kể (dƣới 1%) thực tế ta bỏ qua giai đoạn phân loại ngôn ngữ 3.2.7 Nhận xét kết thử nghiệm Kết thực nghiệm cho thấy việc tách từ đơn giản cách sử dụng cụm từ liền có độ dài cho kết phân loại thƣ rác xác cao Đây kết quan trọng cho phép lọc thƣ tránh đƣợc q trình tách từ phức tạp tốn thời gian sử dụng phƣơng pháp tách từ tiếng Việt phức tạp Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ 59 100 Độ xác (%) 99.5 99 98.5 98 97.5 Anh+Việt Anh Việt chung Việt có dấu Việt khơng dấu Hình 3.17: Độ xác phân loại với quy trình lọc khác Số lƣợng đặc trƣng tối ƣu lọc thƣ tiếng Anh tiếng Việt 2000-3000 từ Ngồi việc nâng cao độ xác phân loại, việc khơng phải sử dụng tồn đặc trƣng có tập liệu cịn cho phép giảm u cầu nhớ u cầu tính tốn Kết thử nghiệm không cho thấy khác biệt đáng kể hiệu lọc thƣ lọc riêng thƣ tiếng Việt thƣ tiếng Anh so với lọc chung Trong số ba phƣơng pháp phân loại đƣợc sử dụng, phƣơng pháp Bayes đa thức SVM cho kết tốt nhất, nhiên phƣơng pháp Bayes có ƣu rõ rệt có độ phức tạp tính tốn thấp nhiều Trong phạm vi nghiên cứu đề cập tới việc phân loại thƣ tự động dựa phần nội dung văn thƣ Các hƣớng nghiên cứu bao gồm việc phân loại thƣ có nội dung đƣợc trình bày dƣới dạng hình ảnh, nghiên cứu kết hợp nhiều đặc điểm thƣ nhƣ format, dòng tiêu đề, địa gửi, thời gian gửi 3.3 Đề xuất giải pháp phòng chống spam 3.3.1 Giải pháp phòng chống mail server Chặn lọc hệ thống máy chủ mail bƣớc quy trình phịng chống thƣ rác Tất thƣ điện tử gửi đến ngƣời sử dụng phải đƣợc gửi tới máy chủ mail từ tiếp tục đƣợc chuyển tới hịm thƣ ngƣời nhận Vì vậy, máy chủ đƣợc thiết lập sách lọc thƣ rác tốt hạn chế nhiều thƣ rác đƣợc gửi tới ngƣời sử dụng Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ 60 Sử dụng phương pháp SPF Sender Policy Framework (SPF) kỹ thuật ngăn chặn spam thuộc nhóm phƣơng pháp xác thực địa ngƣời gửi (sender authentication), kỹ thuật giúp ngƣời nhận xác thực địa ngƣời gửi thật hay giả, từ ngăn chặn đƣợc việc phát tán thƣ rác hay lừa đảo trực tuyến Phƣơng pháp SPF tập đoàn American Online (AOL) đƣa Phƣơng pháp yêu cầu xác lập DNS, khai báo máy chủ gửi thƣ từ tên miền Internet định Phía ngƣời nhận thơng qua truy vấn DNS để xác thực địa ngƣời gửi địa IP có phù hợp với khơng, từ biết đƣợc địa ngƣời gửi thật hay giả Hoạt động SPF đƣợc mơ tả Hình 1: Hình 3.18: Phương thức hoạt động SPF Trƣớc hết phía gửi thƣ cần thực thao tác cài đặt máy chủ DNS để khai báo máy chủ email có quyền gửi email sử dụng tên miền phía gửi thƣ Việc khai báo đƣợc thực việc sử dụng ghi TXT liệt kê địa IP máy chủ email đƣợc phép gửi đi: Bƣớc 1: Máy chủ email phía gửi thƣ thiết lập kết nối tới máy chủ email phía nhận thƣ qua giao thức SMTP Tại bƣớc thông tin tiêu đề (header) thƣ đƣợc gửi từ phía gửi sang phía nhận Thông tin tiêu đề bao gồm tên miền bên gửi địa IP máy chủ email bên gửi; Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ 61 Bƣớc 2: Máy chủ email bên nhận thƣ tạo truy vấn DNS gửi đến máy chủ DNS bên gửi, yêu cầu cung cấp danh sách nhƣng máy chủ email đƣợc phép gửi thƣ bên gửi; Bƣớc 3:Máy chủ DNS bên gửi trả kết cho máy chủ email bên nhận Sau máy chủ email bên nhận đối chiếu xem địa IP máy chủ email vừa gửi thƣ có nằm danh sách khơng Nếu có địa ngƣời gửi đƣợc xác nhận hợp lệ Nếu địa ngƣời gửi khơng hợp lệ, thƣ điện tử có nhiều khả spam Tuy nhiên phƣơng pháp SPF đòi hỏi phải thay đổi sở hạ tầng mạng, cụ thể thay đổi xác lập DNS, tình triển khai thực tế gặp phải khơng khó khăn Lý xuất phát từ chất vấn đề: Bên gửi thƣ phải cài đặt lại DNS phía mình, nhƣng ngƣời đƣợc hƣởng lợi trực tiếp từ việc cài đặt lại khơng phải bên gửi thƣ mà bên nhận thƣ Chính lý đó, thực tế trình triển khai SPF chƣa đƣợc bao Tại Việt Nam phƣơng pháp SPF chƣa đƣợc triển khai Phương pháp SPF động Để khắc phục nhƣợc điểm SPF, ta sử dụng phƣơng pháp SPF động (Dynamic Sender Policy Framework) Ý tƣởng phƣơng pháp việc xác thực địa ngƣời gửi đƣợc thực máy chủ DNS đơn vị thứ ba thay thực máy chủ DNS bên gửi thƣ Nhƣ bên nhận thƣ đƣợc hƣởng lợi ích từ SPF mà bên gửi thƣ không cần phải xác lập lại máy chủ DNS Hình mơ tả hoạt động SPF động Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ 62 Hình 3.19: Phương thức hoạt động SPF động Cơ sở liệu SPF động chứa thông tin khai báo máy chủ gửi thƣ từ tên miền Internet định Cơ sở liệu SPF động đƣợc xây dựng thơng qua thống kê, phân tích số liệu lịch sử Dựa vào sở liệu để phán đốn thƣ có phải thƣ rác hay lừa đảo trực tuyến hay không Nếu thƣ đƣợc gửi từ địa chi IP có sở liệu ứng với tên miền địa ngƣời gửi thƣ bình thƣờng, ngồi bị nghi vấn thƣ rác Để hệ thống hoạt động xác sở liệu cần phải xác Các liệu SPF động đƣợc cung cấp cho ngƣời dùng (máy chủ thƣ điện tử) dƣới dạng dịch vụ bên thứ Trong Hình 3., máy chủ nhận đƣợc thƣ điện tử, truy vấn dịch vụ máy chủ cung cấp dịch vụ SPF động để lấy thông số địa ngƣời gửi, từ xác định địa ngƣời gửi thật hay giả Các truy vấn ngƣời dùng đến dịch vụ SPF động đƣợc máy chủ cung cấp dịch vụ ghi lại Số liệu đƣợc dùng để thống kê, phân tích cập nhật CSDL SPF động Ở sử dụng dịchvụ DNS để cung cấp dịch vụ SPF động, nhƣ vậy, ngƣời dùng cài đặt hay thayđổi thiết lập mà sử dụng đƣợc dịch vụ SPF động Thách thức lớn phƣơng pháp SPF động làm để tự động cập nhật CSDL SPF động dựa số liệu lịch sử (log) Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ 63 Cập nhật sở liệu SPF động Những thông tin cần chắt lọc từ mẫu bao gồm: Địa IP máy chủ gửi thƣ; tên miền tƣơng ứng ghi địa thƣ điện tử ngƣời gửi; thời gian gửi thƣ thông tin phân loại thƣ: thƣ rác hay thƣ bình thƣờng Ba thơng tin đầu dễ dàng lấy từ phần header thƣ từ log file máy chủ Qua thu thập log file máy chủ mail sở Thông tin Truyền thông tỉnh Nam Địnhvà chắt lọc thơng tin cần thiết Tồn tập mẫu đƣợc lƣu trữ dƣới dạng sở liệu, cho phép bƣớc nghiên cứu dễ dàng sử dụng Số lƣợng thƣ tập liệu mẫu nhƣ sau: Bảng 3.4 : Bảng liệu mẫu sử dụng phương pháp SPF động Tổng số thƣ: 46810 Tổng số thƣ bình thƣờng: 7855 Tổng số thƣ rác: 38955 Số thƣ có nội dung lừa đảo trực tuyến: 53 Thời gian có hiệu lực máy chủ gửi thư Để lọc địa IP thực tên miền máy chủ gửi thƣ, phải dựa vào thời gian có hiệu lực máy chủ gửi thƣ Hình mơ tả có khác rõ rệtvề phân bố số lƣợng cặp (tên miền, IP) thƣ bình thƣờng thƣ rác: Thời gian có hiệu lực cặp (tên miền IP) gửi thƣ rác tập trung vào dƣới ngày, giảm dầntheo thời gian, thời gian có hiệu lực cặp (tên miền IP) gửi thƣ bình thƣờng chủ yếu lớn ngày Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ 64 Hình 3.20: Phân bố số lượng cặp (tên miền, IP) theo thơi gian Kết khẳng định thơng qua thống kê số liệu lịch sử để chắt lọc địa máy chủ thật cho tên miền Tác giả làm thí nghiệm hiệu phƣơng pháp SPF động sử dụng ngƣỡng thời gian có hiệu lực khác nhau, kết đƣợc trình bày Hình Hình 3.21: Hiệu phương pháp SPF động Trong cho thấy sử dụng ngƣỡng thời gian có hiệu lực khác ta có sai số khác khả lọc thƣ rác, ví dụ ngƣỡng thời gian có hiệu lực ngày, phƣơng pháp SPF động lọc đƣợc 98% tổng số thƣ rác, lọc nhầm 0.1% số thƣ bình thƣờng Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ 65 3.3.2 Giải pháp phịng chống mail client Phần mềm Outlook Express dễ bị tin tặc, virus hay spyware công Mặc dù nâng cấp gần cải thiện đáng kể tính bảo mật nhƣng nguy bị "oanh tạc" cao Để phịng chống thƣ rác ngƣời sử dụng nên thực thao tác: 3.3.2.1.Cập nhật nâng cấp Windows Outlook Express Ngƣời dùng nên thƣờng xuyên nâng cấp cho hệ điều hành Windows XP Outlook Express phần khơng thể tách rời XP vá (patch) hay nâng cấp Outlook Express nằm gói update Windows XP Do đó, bạn đặt chế độ nâng cấp Windows tự động phần mềm Outlook Express đƣợc update lúc 3.3.2.2 Giảm thiểu đọc mail chế độ HTML Đọc tin nhắn dƣới dạng text giúp ngƣời dùng tránh đƣợc nguy bị công Mặc dù định dạng HTML hiển thị nội dung e-mail rõ ràng nhƣng mang lại nhiều rủi ro an ninh cho phần mềm Outlook Express Nếu nhận đƣợc e-mail từ địa không quen biết, không đáng tin cậy việc đọc thƣ dƣới dạng text giải pháp an tồn Để kích hoạt chức này, bạn thực theo hƣớng dẫn: Trong phần menu Tools, bạn chọn Options chọn Read Read all messages in plain text checkbox Apply Nếu cần đọc e-mail dƣới dạng HTML kích hoạt tùy chọn Message in HTML từ menu View Tại hộp thoại tab Read, ngƣời dùng nên xóa tích chọn Automatically download message when viewing in the Preview Pane Chức tự động tải email ngƣời dùng xem cột Preview load tin nhắn có nội dung độc hại Do đó, bạn nên tắt tính 3.3.2.3 Hạn chế tải hình ảnh Outlook Express Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ 66 E-mail dƣới dạng HTML trơng đẹp mắt với hình ảnh kèm nhƣng “bóng bẩy” lại ẩn chứa nhiều virus, spyware mà ngƣời dùng Tin tặc lợi dụng điều để phát tán virus qua file ảnh Do đó, để “kìm hãm” hội cơng tin tặc thực theo hƣớng dẫn sau: Trong hộp thoại Options chọn tab Security chọn vào mục Block images and other external content in HTML e-mail OK để đóng hộp thoại Ngoài việc tăng bảo mật, cài đặt giúp ngƣời dùng đọc download email nhanh “đèo bịng” thêm hình ảnh 3.3.2.4 Chặn file đính kèm khơng an tồn File đính kèm e-mail thuận tiện ngƣời dùng cần gửi tài liệu cho ngƣời khác Tuy nhiên, gửi cho bạn file thực thi (EXE) biết có chứa virus hay khơng Để tránh file đính kèm khơng an tồn bạn nên tùy chỉnh lại cài đặt Outlook Express Trong hộp thoại Options chọn tab Security cịn vào Do not allow attachments to be saved or opened that could potentially be a virus Apply Lúc này, Outlook cho phép ngƣời dùng mở e-mail cịn file đính kèm khơng đƣợc hiển thị Để tắt cài đặt này, bạn hủy nút chọn mục Do not allow attachments to be saved or opened that could potentially be a virus 3.3.2.5 Sử dụng Internet Security Zones Cả Outlook Express Internet Explorer có thiết lập Internet giống hệ điều hành Windows XP Ngƣời dùng nên sử dụng vùng “nghiêm cấm” Restricted sites thay Internet zone để chặn tính khơng an tồn website mở Bạn tùy chỉnh vùng an tồn hộp thoại Options Internet Explorer Tại tab Security chọn biểu tƣợng Restricted sites Ngƣời dùng thêm website vào vùng “hạn chế” mục Custom Level để dễ kiểm sốt 3.3.2.6 Chặn spam Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ 67 Mặc dù Outlook Express khơng có lọc thƣ rác Junk E-Mail nhƣ Outlook nhƣng chặn spam theo cách sau - Chặn e-mail có chứa từ ngữ tục tĩu Tại menu Tools - Messsage Rules - Mail Sẽ xuất bảng “nguyên tắc”New Mail Rule Tại phần số (Select the conditions for your rule), chọn ô Where the Subject line contains specific words Where the message body contains specific words nhấn vào phần dấu gạch chân tƣơng ứng phần số để điền vào từ ngữ xấu xuất thƣ rác Tại phần số (Select the Actions for your rule), bạn chọn ô Move it to the specific folder hay Delete it Các lựa chọn xuất ô số Khi thực xong, nhấn OK để lƣu quy tắc - Chặn địa hay xuất hòm thƣ Cũngtrong mục Message Rules, tạo danh sách chặn địa thƣờng gửi thƣ quấy rối cách chọn vào Blocked Senders Tiếp đó, nhập địa e-mail hay tên miền muốn ngăn chặn 3.3.3 Giải pháp phía ngƣời sử dụng mail Ngoài việc sử dụng lọc chống spam, ngƣời sử dụng đóng vai trị quan trọng việc chống lại “đại dịch” thƣ rác Bởi ngƣời dùng cần tuân theo số nguyên tắc sau: Luôn cập nhật vá phần mềm cài đặt máy Đảm bảo tất máy đƣợc cập nhật phần mềm chống virus chống spam Sử dụng firewall để bảo vệ hệ thống Không trả lời email lạ không rõ nguồn gốc Đối với spammer, nhận đƣợc trả lời từ hàng ngàn email họ gửi chứng minh phƣơng pháp có hiệu Ngồi ra, việc trả lời lại xác nhận địa email bạn có thực đƣợc sử dụng Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ 68 Do địa email bạn “đáng giá” hơn, spammer gửi nhiều thƣ rác Không gửi thơng tin cá nhân bạn (số thẻ tín dụng, mật khẩu, tài khoản ngân hàng, v.v ) thƣ điện tử Các spammer kẻ lừa đảo qua mạng tạo trang web giả mạo tổ chức, ngân hàng đề nghị bạn gửi mật số thông tin thẻ tín dụng bạn qua email Khơng hồi đáp email cách nhấn lên từ nhƣ “loại bỏ” (remove) “ngừng đăng ký” (unsubscribe) dòng tiêu đề nội dung thƣ trừ nguồn đáng tin cậy (các email tiếp thị trực tiếp) Đây tiểu xảo spammer để ngƣời sử dụng hồi đáp lại spam họ Khi nhận đƣợc hồi đáp, spammer không loại bỏ địa email bạn khỏi danh sách mà gửi tới nhiều spam họ biết địa email bạn hoạt động Không bấm vào liên kết URL địa trang web đƣợc ghi spam hƣớng dẫn ngƣời nhận ngừng đăng ký Điều cho ngƣời gửi biết địa email bạn đƣợc sử dụng bạn nhận đƣợc nhiều spam Hãy sử dụng hai địa email khác nhau, địa sử dụng cho việc riêng nhƣ bạn bè, công việc Một địa sử dụng để đăng ký trở thành thành viên diễn đàn, tổ chức nơi mà địa email bạn bị lạm dụng bán Không nên đăng địa email bạn nơi cơng cộng (ví dụ nhƣ diễn đàn, bảng tin, chat room ) nơi spammer thƣờng sử dụng tiện ích để thu thập tìm kiếm địa email Sử dụng dịch vụ email cung cấp cơng cụ chống spam, ví dụ nhƣ Yahoo! Mail, Gmail Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ 69 Không đƣợc chuyển tiếp spam cho ngƣời khác Chuyển spam nhận đƣợc đến ngƣời quản trị hệ thống email Quản trị viên thay đổi chƣơng trình lọc để lần sau hệ thống chặn lại email tƣơng tự nhƣ Có nhiều phƣơng pháp kỹ thuật để lọc chặn thƣ rác áp dụng Mỗi phƣơng pháp có ƣu điểm nhƣợc điểm riêng nhƣ hiệu lọc thƣ rác khác Để việc chặn thƣ rác đƣợc hiệu cần phải có phối hợp đồng nhiều đơn vị, tổ chức thân ngƣời sử dụng email Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ 70 KẾT LUẬN CHUNG Với phân tích trên, thấy thƣ rác ngày phát triển gây thiệt hại lớn kinh tế nhƣ gây nhiều phiền toái cho ngƣời dùng Số lƣợng thƣ rác ngày tăng, nội dung cấu trúc chúng thay đổi cần có hệ thống học máy lọc thƣ để cập nhật, loại bỏ đƣợc mẫu thƣ Hệ thống học máy lọc thƣ rác dựa nội dung sử dụng phƣơng pháp phân loại Bayes đơn giản đƣợc xây dựng đáp ứng đƣợc điều Luận văn đạt đƣợc số kết nhƣ sau: - Khái quát số nội dung thƣ rác, phƣơng pháp lọc thƣ rác - Trình bày chi tiết phƣơng pháp lọc thƣ rác theo nội dung theo phƣơng pháp Bayes đơn giản - Đã tiến hành xây dựng chƣơng trình lọc thƣ rác đơn giản áp dụng phƣơng pháp Bayes đơn giản, cho chạy thực nghiệm phân tích sơ kết - Trong q trình xây dựng lọc thƣ, chúng tơi sử dụng kết hợp việc lọc theo nội dung với phƣơng pháp lọc khác nhƣ sử dụng danh sánh IP cấm, kết hợp lọc theo nội dung với lọc theo tiêu đề thành phần khác thƣ Trong trình nghiên cứu thực luận văn này, tơi nhận đƣợc giúp đỡ nhiệt tình thầy hƣớng dẫn - Tiến sĩ Nguyễn Ngọc Cƣơng - Học viện An ninh thầy, cô Học viện An ninh Trƣờng ĐH Công nghệ thông tin Truyền thông - Đại học Thái Nguyên tạo điều kiện hƣớng dẫn thực luận văn này, lần xin gửi lời cảm ơn tới thầy kính chúc thầy sức khỏe, nhiều thành cơng cơng việc Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ 71 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Vũ Đình Cƣờng, Từng bước khám phá an ninh mạng Thư rác phương pháp phát tán cách phòng chống, Nhà xuất Lao động Xã hội năm 2009; [2] Phạm Tuấn Liêm, Virus & Spam - Những điều cần biết; [3] Phùng Chí Tuệ Bảo mật Email cách phòng chống spam 2009; [4] Các tài liệu bảo mật Email cách phòng chống spam mạng Internet [5] Virus Email phương thức hoạt động cách phòng chống, Nhà xuất Từ điển Bách Khoa, Minh Tâm biên soạn [6] help.outlook.com/vi-vn [7] www.hoangvi.com [8] www.vinaren.vn [9] www.pcworld.com.vn Tiếng Anh [10] Chakrabarti, S (2003), Mining the Web; Discovering Knowiedge from Hypertext Data, Morgan Kaufmann, 2003 [11] Chen, C, Lee, H & Hwang, C (2005) A Hierarchical Neural Network Document Classifier with Linguistic Featura Selection, Applied Intelligence, 23, pp 277-294 [12] R Du, W Surilo, F Safaei and P Boustead (2003); Protecting an MPLS based Programmable Virtural Network using Distributed Fire wall, Technicel Report, University of Wollongong, http://atnac2003.atcre.com/POSTERS/Du.pdf [13] Terry Kuny, Filtering Internet Contents: PICS, Labels and Filters, March 23, 1998 Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ 72 [14] Jeff Heaton, Programming Spiders Bots and Aggretaors in Java, NXB Sybex, 2002 [15] Cancedda, N., Gaussier, E., Goutte, C & Renders, J.M Word sequence kernels Journal of Machine Learning Research, 3, pp 1059-1082, 2003 [16] Greenfield P, Rickwood P and Tran HC, Effectiveness of Internet Filtering Software Products, CSIRO, September 2001 Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ ... TỔNG QUAN VỀ THƢ ĐIỆN TỬ VÀ SPAM Trong chương trình bày khái niệm thư tín truyền thống, thư điện tử, spam mơ hình, ngơn ngữ giao thức sử dụng thư điện tử, phần mềm lọc nội dung thư 1.1 Các khái... trả lời) spammed thƣ điện tử 2.2 Mơ hình ngun lý hoạt động hệ thống lọc nội dung Mail 2.2.1 Mơ hình hệ thống lọc mail Một bƣớc quan trọng xây dựng hệ thống lọc thƣ rác định vị trí hệ thống chu... công nghệ sử dụng 44 Số hóa Trung tâm Học liệu http://lrc.tnu.edu.vn/ iv 3.1.3 Các chức chƣơng trình 45 3.2 Thử nghiệm hệ thống thƣ điện tử Sở Thông tin Truyền thông tỉnh Nam Định

Ngày đăng: 19/11/2014, 19:31

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan