Xây dựng plugin cho internet explorer để chặn các trang web xấu

93 739 1
Xây dựng plugin cho internet explorer để chặn các trang web xấu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Tài liệu tham khảo công nghệ thông tin Xây dựng plugin cho internet explorer để chặn các trang web xấu

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN MẠNG MÁY TÍNH & VIỄN THÔNG LÊ NGUYỄN MINH TUẤN – ĐẶNG THANH VI XÂY DỰNG PLUGIN CHO INTERNET EXPLORER ĐỂ CHẶN CÁC TRANG WEB XẤU KHÓA LUẬN CỬ NHÂN TIN HỌC NIÊN KHÓA 2001 - 2005 Luận văn tốt nghiệp Mạng máy tính GVHD: ThS Đỗ Hoàng Cường TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN MẠNG MÁY TÍNH & VIỄN THÔNG LÊ NGUYỄN MINH TUẤN - 0112468 ĐẶNG THANH VI - 0112455 XÂY DỰNG PLUGIN CHO INTERNET EXPLORER ĐỂ CHẶN CÁC TRANG WEB XẤU KHÓA LUẬN CỬ NHÂN TIN HỌC GIÁO VIÊN HƯỚNG DẪN Th.S ĐỖ HOÀNG CƯỜNG NIÊN KHÓA 2001 – 2005 Lê Nguyễn Minh Tuấn Page 2 of 93 Đặng Thanh Vi Mssv: 0112468 Mssv:0112455 Luận văn tốt nghiệp Mạng máy tính GVHD: ThS Đỗ Hoàng Cường LỜI CẢM ƠN Nhóm chúng tôi xin được gởi lời cảm ơn đến các các thầy cô giảng viên trường Đại học Khoa học Tự nhiên TP.HCM cũng như các bạn đã giúp đỡ chúng tôi nhiều trong quá trình thực hiện luận văn: • Các thầy cô giảng viên trong bộ Mạng máy tính và Viễn thông khoa Công Nghệ Thông Tin đã tạo điều kiện cho chúng tôi thực hiện tốt luận văn. • Ban giám hiệu trường Đại học Khoa học Tự nhiên TP.HCM. • Bạn Phan Trung Hiếu – sinh viên khoa Công Nghệ Thông Tin khóa 2001 đã giúp đỡ hỗ trợ tài liệu cho nhóm chúng tôi trong một số kỹ thuật lập trình. • Bạn Vũ Minh Trọng - sinh viên khoa Công Nghệ Thông Tin khóa 2001 đã giúp đỡ nhóm chúng tôi trong việc tìm hiểu các ý tưởng mới cũng như cung cấp cho chúng tôi các ví dụ thực tế. • Roberto Antollini , lập trình viên cung cấp các class C++ miễn phí dùng để truy cập các cơ sở dữ liệu hỗ trợ ADO trên nền desktop chạy Hệ điều hành Windows(98/2000/XP) ở website www.codeproject.com . • João Paulo Figueira , lập trình viên chuyển đổi các class ADO miễn phí của Roberto Antollini sang phiên bản tương thích với nền tảng Microsoft Windows CE 3.0 ở website www.codeproject.com. • Thầy Lê Thụy Anh – giảng viên khoa Công Nghệ Thông Tin đã giải đáp cho chúng tôi một số thắc mắc về trình duyệt Internet Explorer. Lê Nguyễn Minh Tuấn Page 3 of 93 Đặng Thanh Vi Mssv: 0112468 Mssv:0112455 Luận văn tốt nghiệp Mạng máy tính GVHD: ThS Đỗ Hoàng Cường Đặc biệt , chúng em xin gởi đến thầy Đỗ Hoàng Cường lời cám ơn sâu sắc vì sự nỗ lực và tận tâm mà thầy đã giành cho chúng em. Qua quá trình làm việc với thầy, chúng em đã học được rất nhiều điều bổ ích. Lê Nguyễn Minh Tuấn Page 4 of 93 Đặng Thanh Vi Mssv: 0112468 Mssv:0112455 Luận văn tốt nghiệp Mạng máy tính GVHD: ThS Đỗ Hoàng Cường MỤC LỤC Chương 1: MỞ ĐẦU 12 UChương 2: TỔNG QUAN 14 Chương 3: NGHIÊN CỨU LÝ THUYẾT VÀ CÀI ĐẶT THỰC TẾ .16 3.1 Phân tích yêu cầu: 16 3.2 Phương pháp , thuật toán chính: 18 3.2.1 Phương pháp đánh giá website dựa trên địa chỉ URL .21 3.2.1.1 Đánh giá dựa trên địa chỉ URL đầy đủ: 22 3.2.1.2 Đánh giá dựa trên URL keyword : 24 3.2.1.2.1 Định nghĩa URL keyword: . 25 3.2.1.2.2 Nội dung thuật toán . 26 3.2.1.2.3 Đánh giá thuật toán . 28 3.2.2 Phương pháp đánh giá website dựa trên nội dung website .28 3.2.2.1 Đánh giá dựa trên số lần xuất hiện của các keyword 30 3.2.2.1.1 Nội dung thuật toán . 30 3.2.2.1.2 Đánh giá thuật toán . 32 3.2.2.2 Đánh giá dựa trên trọng số của văn bản 33 3.2.2.2.1 Nội dung thuật toán . 34 3.2.2.2.2 Đánh giá thuật toán . 37 3.2.2.3 Cải tiến phương pháp đánh giá dựa trên trọng số của văn bản: 38 3.3 Các kỹ thuật lập trình và cài đặt thực tế 38 3.4 Ý tưởng chung của chương trình. .40 3.4.1 Encoding của trang web 42 3.4.2 Thiết kế cơ sở dữ liệu: 47 3.4.2.1 Thiết kế logic: . 47 3.4.2.2 Cài đặt thực tế CSDL 52 3.4.3 Viết Plug-in bằng ATL COM 57 3.4.3.1 Một số thông tin: . 57 3.4.3.2 Viết Plug-in cho Internet Explorer bằng ALT COM 58 3.4.3.2.1 Tạo project bằng ATL COM 58 3.4.3.2.2 Tạo plug-in cho Internet Explorer 60 3.4.3.2.3 Cài đặt code để bắt sự kiện của IE . 61 3.4.4 Áp dụng các thuật toán vào plug-in 66 3.4.4.1 Class chứa các thuật toán cài đặt 66 3.4.4.2 Kỹ thuật lập trình lấy thông tin của IE phục vụ cho việc đánh giá . 71 3.4.4.2.1 Lấy URL . 72 3.4.4.2.2 Lấy nội dung trang web. . 72 3.4.5 Các chính sách .77 3.4.5.1 Sử dụng trong gia đình 77 3.4.5.2 Sử dụng ở công sở: . 78 Lê Nguyễn Minh Tuấn Page 5 of 93 Đặng Thanh Vi Mssv: 0112468 Mssv:0112455 Luận văn tốt nghiệp Mạng máy tính GVHD: ThS Đỗ Hoàng Cường 3.5 Giao diện tương tác với plug-in, cách sử dụng chương trình 80 Chương 4: ĐÁNH GIÁ KẾT QUẢ ĐẠT ĐƯỢC 89 Chương 5: KẾT LUẬN 90 Chương 6: HƯỚNG PHÁT TRIỂN 91 Chương 7: DANH MỤC TÀI LIỆU THAM KHẢO .92 Lê Nguyễn Minh Tuấn Page 6 of 93 Đặng Thanh Vi Mssv: 0112468 Mssv:0112455 Luận văn tốt nghiệp Mạng máy tính GVHD: ThS Đỗ Hoàng Cường BẢNG HÌNH VẼ CÁC KÝ HIỆU Database Table trong database User Database Server WorkStation Lê Nguyễn Minh Tuấn Page 7 of 93 Đặng Thanh Vi Mssv: 0112468 Mssv:0112455 Luận văn tốt nghiệp Mạng máy tính GVHD: ThS Đỗ Hoàng Cường DANH SÁCH CÁC HÌNH TRONG LUẬN VĂN Hình 1 Các phương pháp đánh giá website .20 Hình 2 Sơ đồThuật toán đánh giá dựa trên URL đầy đủ .23 Hình 3 Sơ đồ thuật toán đánh giá trên URL keyword. 27 Hình 4 Sơ đồ thuật toán đánh giá trên số lần xuất hiện keyword 31 Hình 5 Đánh giá dựa trên trọng số của văn bản 36 Hình 6 Các kỹ thuật lập trình và cài đặt thực tế. .39 Hình 7 Hook toàn cục 40 Hình 8 Chương trình lọc 41 Hình 9 . Encoding Unicode 43 Hình 10.Mô hình Encoding 47 Hình 11.Tham chiếu khóa .49 Hình 12. Các table trong cơ sở dữ liệu .51 Hình 13 Ví dụ dữ liệu trong bảng .53 Hình 14. Các ký tự tiếng Việt .56 Hình 15. Sơ đồ tham chiếu khóa ngoại .57 Hình 16. Chọn project ATL COM 59 Hình 17. Các option trong wizard .60 Hình 18. Chọn đối tượng COM .61 Hình 19. Sử dụng trong gia đình 78 Hình 20. Sử dụng trong văn phòng 80 Hình 21.Giao diện chính của plug-in .82 Hình 22. Chọn danh sách 82 Hình 23. Ví dụ nội dung trong danh sách english keyword. 83 Hình 24.Insert phần tử .84 Hình 25. Edit phần tử sẽ Insert 84 Hình 26. Hoàn tất Insert .84 Hình 27. Chọn phần tử cần edit trong danh sách chặn .85 Hình 28.Edit phần tử. .86 Hình 29.Hoàn tất edit. 87 Hình 30. Chọn phần tử để delete .88 Lê Nguyễn Minh Tuấn Page 8 of 93 Đặng Thanh Vi Mssv: 0112468 Mssv:0112455 Luận văn tốt nghiệp Mạng máy tính GVHD: ThS Đỗ Hoàng Cường TÓM TẮT LUẬN VĂN Thông tin chung về đề tài: Tên đề tài: GVHD: Sinh viên thực hiện: 1. MSSV: Họ và tên: 2. MSSV: Họ và tên: Tóm tắt nội dung luận văn: Một số từ khóa chính liên quan đến nội dung đề tài: Lĩnh vực áp dụng: Lê Nguyễn Minh Tuấn Page 9 of 93 Đặng Thanh Vi Mssv: 0112468 Mssv:0112455 Luận văn tốt nghiệp Mạng máy tính GVHD: ThS Đỗ Hoàng Cường Các thuật toán, phương pháp, quy trình chính được nghiên cứu, ứng dụng trong đề tài Các công cụ, công nghệ chính được nghiên cứu, ứng dụng trong đề tài Xác nhận của GVHD Lê Nguyễn Minh Tuấn Page 10 of 93 Đặng Thanh Vi Mssv: 0112468 Mssv:0112455 [...]... toán: + Chắc chắn bỏ qua các trang web không sử dụng các URL keyword phổ biến + Có thể có một số rất ít các trang web không đồi trụy có chứa một URL keyword nào đó và bị xem là xấu 3.2.2 Phương pháp đánh giá website dựa trên nội dung website Nội dung của một trang web là phần thông tin hiển thị trên trình duyệt khi người dùng Internet truy cập trang web đó Vì nội dung của một trang web có thể được xem là... thiện thêm khả năng chặn web xấu dựa trên URL 3.2.1.2.1 Định nghĩa URL keyword: URL keyword trong ngữ cảnh này là chuỗi con nằm trong một địa chỉ URL mà các website có URL chứa chuỗi này luôn hoặc thường xuyên là trang web xấu Ví dụ: Các website sau đây đều là các trang web sex: www.sexviet.com www.sexocean.com www.sex700.com www.sexygirls.com và đều chứa keyword là sex Hoặc các trang web sex sau đây:... máy tính Lý do để bổ sung thuật toán này vào là vì đa số các trang web khiêu dâm đều muốn thu hút sự chú ý của người dùng Internet bằng cách dùng các từ khiêu dâm,gợi dục để đặt tên cho website của mình Và thuật toán này đưa ra chủ yếu là ngăn chặn các trang web khiêu dâm 3.2.1.2.2 Nội dung thuật toán Thuật toán đánh giá dựa trên URL keyword được mô tả như sau: B1 Người dùng truy cập Internet thông... Nhìn chung , các phần mềm này hoạt động khá tốt, tuy nhiên xét trên góc độ nhu cầu quản lý thông tin không chỉ có ở gia đình , mà còn có ở văn phòng , thì các phần mềm này còn một số chức năng chưa hỗ trợ: + administrator(quản trị) muốn các máy tính trong phạm vi quản lý phải sử dụng chương trình chặn web xấu, và danh sách các trang web xấu cũng như các từ khóa bị cấm trong trang web được các máy tính... Bố mẹ cài đặt phần mềm vào máy tính của con cái để kiểm soát việc truy cập Internet của con + Bổ sung thêm 2 tính năng hỗ trợ trong mạng LAN như đã nêu trên Các phần mềm ngăn chặn không phải là giải pháp triệt để để ngăn chặn các trang web xấu Mục đích của các phần mềm này là khuyến khích người dùng truy cập những thông tin có ích trên Internet và tránh các thông tin không lành mạnh Lê Nguyễn Minh Tuấn... dạng thế nào là trang web xấu( Phương pháp, thuật toán chính) • Viết plug-in cho Internet Explorer (Các kỹ thuật lập trình và cài đặt thực tế) và sẽ được đề cập tương ứng với phần Phương pháp, thuật toán chính và Các kỹ thuật lập trình và cài đặt thực tế Ở đây chúng ta phải làm rõ khái niệm thế nào là một trang web xấu Gần đây , chúng ta quan tâm rất nhiều đến cái gọi là trang web xấu Mọi người... trang web gán = 0 B3 Duyệt qua trang web B4 Nếu tìm thấy keyword, cộng trọng số của keyword đó vào trọng số của trang web B5 Nếu trọng số của trang web >= trọng số qui định trước ► trang web xấu ►Block trang web ►Đưa URL của trang web vào database Ngược lại, ►là trang web thông thường, trả về cho trình duyệt Lê Nguyễn Minh Tuấn Mssv: 0112468 Page 34 of 93 Đặng Thanh Vi Mssv:0112455 GVHD: ThS Đỗ Hoàng... toán đánh giá dựa trên số điểm của văn bản 7/19/2005 Trình duyệt load trang web Duyệt qua trang web Database chứa danh sách keyword bị cấm Nếu tìm thấy keyword, tăng trọng số của trang web Còn keyword Hết keyword Nếu trọng số < ngưỡng Nếu trọng số >= ngưỡng Trang web thông thường Trang web xấu Trả về cho trình duyệt Block trang web, đưa URL vào database Lê Nguyễn Minh Tuấn Mssv: 0112468 Page 35 of 93... Hy Lạp, người ta vẫn có thể quay phim sex một cách công khai miễn là nộp thuế đủ cho chính phủ) .Các site này hoạt động có tổ chức rõ ràng và dưới sự kiểm soát của chính quyền nước sở tại Như vậy , các website này chưa hẳn đã là xấu theo khía cạnh pháp lý Vậy căn cứ vào đâu để chúng ta phân biệt đâu là một trang web xấu , đâu là một trang web “không xấu ? Căn cứ vào truyền thống văn hóa của người... việc lọc trang web xấu trên trình duyệt Internet là một hướng tiếp cận còn mới Trên thế giới đã có các phần mềm để ngăn chặn các trang web xấu như Child Control (download bản dùng thử miễn phí – free trial version - ở www.download.com) … Ở Việt Nam hiện nay cũng có một số phần mềm tương tự như Depraved Web Killer của tác giả Vũ Lương Bằng (chung kết cuộc thi Trí Tuệ Việt Nam 2004) Depraved Web Killer . THÔNG LÊ NGUYỄN MINH TUẤN – ĐẶNG THANH VI XÂY DỰNG PLUGIN CHO INTERNET EXPLORER ĐỂ CHẶN CÁC TRANG WEB XẤU KHÓA LUẬN CỬ NHÂN TIN HỌC NIÊN KHÓA 2001. MINH TUẤN - 0112468 ĐẶNG THANH VI - 0112455 XÂY DỰNG PLUGIN CHO INTERNET EXPLORER ĐỂ CHẶN CÁC TRANG WEB XẤU KHÓA LUẬN CỬ NHÂN TIN HỌC GIÁO VIÊN HƯỚNG

Ngày đăng: 23/11/2012, 08:14

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan