Nghiên cứu phương pháp phát hiện thay đổi nội dung bảng kết quả của trang tin xổ số kiến thiết (Luận văn thạc sĩ)

66 69 0
Nghiên cứu phương pháp phát hiện thay đổi nội dung bảng kết quả của trang tin xổ số kiến thiết (Luận văn thạc sĩ)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nghiên cứu phương pháp phát hiện thay đổi nội dung bảng kết quả của trang tin xổ số kiến thiết (Luận văn thạc sĩ)Nghiên cứu phương pháp phát hiện thay đổi nội dung bảng kết quả của trang tin xổ số kiến thiết (Luận văn thạc sĩ)Nghiên cứu phương pháp phát hiện thay đổi nội dung bảng kết quả của trang tin xổ số kiến thiết (Luận văn thạc sĩ)Nghiên cứu phương pháp phát hiện thay đổi nội dung bảng kết quả của trang tin xổ số kiến thiết (Luận văn thạc sĩ)Nghiên cứu phương pháp phát hiện thay đổi nội dung bảng kết quả của trang tin xổ số kiến thiết (Luận văn thạc sĩ)Nghiên cứu phương pháp phát hiện thay đổi nội dung bảng kết quả của trang tin xổ số kiến thiết (Luận văn thạc sĩ)Nghiên cứu phương pháp phát hiện thay đổi nội dung bảng kết quả của trang tin xổ số kiến thiết (Luận văn thạc sĩ)Nghiên cứu phương pháp phát hiện thay đổi nội dung bảng kết quả của trang tin xổ số kiến thiết (Luận văn thạc sĩ)Nghiên cứu phương pháp phát hiện thay đổi nội dung bảng kết quả của trang tin xổ số kiến thiết (Luận văn thạc sĩ)Nghiên cứu phương pháp phát hiện thay đổi nội dung bảng kết quả của trang tin xổ số kiến thiết (Luận văn thạc sĩ)Nghiên cứu phương pháp phát hiện thay đổi nội dung bảng kết quả của trang tin xổ số kiến thiết (Luận văn thạc sĩ)Nghiên cứu phương pháp phát hiện thay đổi nội dung bảng kết quả của trang tin xổ số kiến thiết (Luận văn thạc sĩ)

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - VONGSAVANH VANPHATH NGHIÊN CỨU PHƯƠNG PHÁP PHÁT HIỆN THAY ĐỔI NỘI DUNG BẢNG KẾT QUẢ CỦA TRANG TIN XỔ SỐ KIẾN THIẾT LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) HÀ NỘI – NĂM 2020 HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THƠNG - VONGSAVANH VANPHATH NGHIÊN CỨU PHƯƠNG PHÁP PHÁT HIỆN THAY ĐỔI NỘI DUNG BẢNG KẾT QUẢ CỦA TRANG TIN XỔ SỐ KIẾN THIẾT Chuyên ngành : HỆ THỐNG THÔNG TIN Mã số : 8.48.01.04 LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) Người hướng dẫn khoa học: PGS.TSKH HOÀNG ĐĂNG HẢI HÀ NỘI – NĂM 2020 LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu riêng tơi hướng dẫn PGS.TSKH Hoàng Đăng Hải Các số liệu, kết nêu luận văn trung thực chưa công bố cơng trình khác Tác giả luận văn VONGSAVANH VANPHATH LỜI CẢM ƠN Học viên xin chân thành cảm ơn thầy cô Khoa Đào tạo Sau Đại học, Học viện Cơng nghệ Bưu Viễn thơng tạo điều kiện thuận lợi cho học viên trình học tập nghiên cứu Học viên xin chân thành cảm ơn PGS.TSKH Hoàng Đăng Hải người trực tiếp tận tình hướng dẫn học viên hồn thành luận văn Học viên xin chân thành cảm ơn bạn bè sát cánh giúp học viên có kết ngày hơm Đề tài nghiên cứu luận văn có nội dung bao phủ rộng Tuy nhiên, thời gian nghiên cứu hạn hẹp Vì vậy, luận văn có thiếu sót Học viên mong nhận đóng góp ý kiến thầy cô bạn Xin chân thành cảm ơn! Tác giả luận văn VONGSAVANH VANPHATH MỤC LỤC LỜI CAM ĐOAN I LỜI CẢM ƠN II DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT V DANH MỤC HÌNH VẼ VII DANH MỤC BẢNG BIỂU .VIII MỞ ĐẦU CHƯƠNG TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU 1.1 Vấn đề an tồn thơng tin: cần nêu mối nguy cơ, tác động đến trang thông tin điện tử nói chung 1.2 Các hình thức cơng mạng phổ biến .6 1.2.1 Tấn công phần mềm độc hại (Malware attack) 1.2.2 Tấn công giả mạo (Phishing attack) 1.2.3 Tấn công trung gian (Man-in-the-middle attack) 1.2.4 Tấn công từ chối dịch vụ (DoS DDoS) 1.2.5 Tấn công sở liệu (SQL injection) 1.2.6 Khai thác lỗ hổng Zero-day (Zero day attack) 1.2.7 Các loại khác .7 1.3 Vấn đề bảo đảm an tồn trang TTĐT nói chung 1.4 Nguy thay đổi, giả mạo nội dung trang TTĐT nói chung 12 1.5 Các mơ hình, phương pháp, kỹ thuật liên quan đến thu thập thơng tin, trích chọn liệu .14 1.5.1 Web Crawler 16 1.5.2 Web Scraper 17 1.5.3 Phân biệt Web Crawling Web Scraping .19 1.6 Một số thuật toán kiểm tra phát thay đổi nội dung trang TTĐT .19 1.6.1 Hàm băm 19 1.6.2 Thuật toán đối sánh chuỗi 22 1.6.3 Dấu vân tay tài liệu (Document Fingerprint) 23 1.6.4 Thuật toán Rabin Fingerprint 23 1.6.5 Thuật toán Rabin Fingerprint cải tiến .25 1.6.6 Thuật tốn tìm khác hai văn "An O(ND) Difference Algorithm" 26 1.6.7 Thuật tốn tìm khác hai hình ảnh 27 1.7 Kết luận chương 28 CHƯƠNG NGHIÊN CỨU PHƯƠNG PHÁP KIỂM TRA PHÁT HIỆN THAY ĐỔI NỘI DUNG TRANG TIN XỔ SỐ 29 2.1 Khái quát kiến trúc chung, chế hoạt động trang TTĐT 29 2.2 Mơ hình tổng qt cho phương pháp kiểm tra phát thay đổi nội dung bảng kết trang tin xổ số .31 2.3 Phân tích, đánh giá số công cụ thu thập thông tin Chọn công cụ thu thập thông tin (dự kiến dùng công cụ Scrapy) .33 2.3.1 Hệ thống thu thập liệu Mercator 33 2.3.2 Hệ thống thu thập liệu từ Twitter- TwitterEcho 34 2.3.3 Công cụ HTTrack 34 2.3.4 Công cụ Scrapy: 35 2.4 So sánh thay đổi nội dung mã nguồn web 36 2.5 Chuyển đổi Trang web thành hình ảnh .38 2.6 So sánh thay đổi nội dung hình ảnh trang web 39 2.7 Quản lý thời gian thực .39 2.8 Lưu liệu 40 2.9 Kết luận chương 40 CHƯƠNG CÀI ĐẶT VÀ THỬ NGHIỆM 42 3.1 Cơ sở chọn trang tin kết xổ số? 42 3.2 Cài đặt công cụ thu thập thông tin 42 3.3 Phương pháp thu thập thông tin từ trang TTĐT kết xổ số 43 3.4 Xây dựng kịch thử nghiệm 53 3.5 Kết thử nghiệm thu thập nội dung thông tin, ghi thông tin, kiểm tra phát thay đổi nội dung trang tin kết xổ số 53 3.6 Phân tích, đánh giá kết thử nghiệm 54 3.7 Kết luận chương 55 KẾT LUẬN 56 TÀI LIỆU THAM KHẢO .57 DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT STT Từ viết tắt API ATTT CNTT&TT CSRF DHTML DOM FTP HTML HTTP ID 10 IP 11 LCS 12 LDAP 13 MD5 Tiếng Anh Tiếng Việt Application Programming Giao diện lập trình ứng dụng Interface Information An tồn thơng tin security Information and Communication Cơng nghệ thơng tin truyền thông Technology Kĩ thuật công cách sử dụng Cross Site quyền chứng thực người sử Request Forgery dụng website khác Dynamic Ngôn ngữ đánh dấu Siêu văn Hypertext Markup động Language Document Object Mơ hình đối tượng tài liệu Model HTML File Transfer Giao thức chuyển đổi file qua lại Protocol trình duyệt web server Hypertext Markup Ngôn ngữ đánh dấu Siêu văn Language HyperText Giao thức truyền tải siêu văn Transfer Protocol Nhận dạng, nhận diện nhận Identification biết Internet Protocol Giao thức Internet Là việc thực thuật toán chia Longest common để trị để giải tốn tìm subsequence chuỗi chung dài Lightweight Là giao thức phát triển Directory Access chuẩn X500, chuẩn cho dịch Protocol vụ thư mục chạy tảng OSI Thuật tốn mã hóa theo chuẩn RFC Message-Digest 1321 để tạo chuỗi 128 bit từ algorithm chuỗi liệu 14 MIME 15 MITM 16 OS 17 PDA 18 SEO 19 SHA-1 20 SMS 21 SQL 22 23 SSO Trang TTĐT 24 URL 25 WML 26 XHTML 27 XSS Multipurpose Internet Mail Extensions Man-in-themiddle attack Operating System Persional Digital Assistant Search Engine Optimization Secure Hash Algorithm-1 Shortest Middle Snake Structured Query Language Single sign-on Portal Là tiêu chuẩn Internet định dạng cho thư điện tử Tấn công xen Hệ điều hành Thiết bị trợ giúp kỹ thuật số cá nhân Tối ưu hóa cơng cụ tìm kiếm Thuật giải băm an toàn, trả lại kết dài 160 bit Phương pháp tìm đường ngắn Ngơn ngữ truy vấn liệu Đăng nhập lần Trang thông tin điện tử Đường dẫn hay địa dùng để tham Uniform Resource chiếu đến tài nguyên mạng Locator Internet Ngôn ngữ đánh dấu kế thừa từ Wireless Markup HTML, nhiên WML dựa Language XML, chặt chẽ HTML Extensible Ngơn ngữ Đánh dấu Siêu văn HyperText Mở rộng Markup Language CrossSite- Là kỹ thuật cơng code injection Scripting phía client DANH MỤC HÌNH VẼ Hình1.1: Màn hình trang TTĐT bị công 13 Hình 1.2 Hình minh họa trang TTĐT mà Social Listening nhận diện comment dòng liệu .15 Hình 1.3 Dịng thời gian thể thời điểm thu thập trang 16 Hình 1.4 Sơ đồ hoạt động web crawler đơn giản 17 Hình 1.5 Sơ đồ Merkel-Damgard 21 Hình 1.6 Mơ tả thuật tốn Rabin Fingerprint .25 Hình 1.7 Minh hoạ cải tiến giải thuật 26 Hình 2.1 Mơ hình kiến trúc Portal 29 Hình 2.2 Biểu đồ trình tự kiểm tra trang TTĐT 31 Hình 2.3 Biểu đồ trình tự so sánh nội dung 31 Hình 2.4 Các thành phần Mercator .33 Hình 2.5 Các thành phần cơng cụ Scrapy 35 Hình 3.1 Màn hình trang chủ trang xổ số kiến thiết .44 Hình 3.2 Kết xổ số miền Nam ngày 5/02/2020 .44 Hình 3.3 Kết sau chạy Scrapy 51 DANH MỤC BẢNG BIỂU Bảng 3-1 Kết thử nghiệm lần .53 Bảng 3-2 Kết thử nghiệm lần .54 Bảng 3-3 Kết thử nghiệm lần .54 42 - - - Scrapy.cfg: file config project scrapy Settings.py: file chứa settings cho spiders Middlewares.py: file chứa spider middlewares, framework hook vào scrapy processing Items.py: file chứa cấu trúc item mà bạn tách liệu Nói đơn giản khung, sau lấy liệu từ spiders, đặt liệu vào xử lý Pipelines.py: sau đặt liệu vào cho items.py, xử lý function process_items pipeline Có thể save vào database, trả item Folder spiders: nơi tạo file spider để chạy liệu 3.3 Phương pháp thu thập thông tin từ trang TTĐT kết xổ số Khi muốn lấy liệu site đó, điều quan trọng phân tích cấu trúc trang TTĐT Những liệu site ta cần lấy, có link site hỗ trợ lấy liệu dễ dàng Bây phân tích site http://xskt.com.vn Kết xổ số chia làm miền, lấy miền nam làm ví dụ, làm tương tự cho miền cịn lại Khi vào site, kéo xuống thấy "Kết sổ xố toàn quốc" Tại click vào miền nam 43 Hình 3.13 Màn hình trang chủ trang xổ số kiến thiết Browser đưa xuống phần "KQXS Miền Nam" Ở mục có link dẫn đến mục kết sổ xố: "KQXS Miền Nam" đưa đến trang chứa kết toàn miền nam, "Ngày 05/02" đưa đến trang chứa kết theo ngày, "Thứ Tư" đưa đến kết sổ xố ngày thứ tư Để dễ dàng lấy liệu từ tất ngày ngày, tháng năm chọn link từ "Ngày 05/02" lấy tiếp link từ "Ngày 05-02-2020" Hình 3.14 Kết xổ số miền Nam ngày 5/02/2020 44 Link có dạng https://xskt.com.vn/ket-qua-xo-so-theo-ngay/mien-namxsmn/5-2-2020.html Coding Bây quay lại phần coding, mở file items.py lên chỉnh sửa sau: # -*- coding: utf-8 -*# Define here the models for your scraped items # # See documentation in: # http://doc.scrapy.org/en/latest/topics/items.html import scrapy class XsktItem(scrapy.Item): # define the fields for your item here like: # name = scrapy.Field() xs_info = scrapy.Field() xs_data = scrapy.Field() Tạo item cho xskt xs_info xs_data xs_info dùng lưu trữ thứ ngày tháng bảng xổ số, xs_data dùng lưu trữ kết xổ số tỉnh miền nam Mở file settings.py lên bạn thêm FEED_FORMAT cuối file FEED_FORMAT = 'json' FEED_FORMAT cho phép định dạng liệu xuất theo dạng nào, xuất dạng json ví dụ Tiếp theo tạo file xosokienthiet.py folder xskt/xskt/spiders import scrapy import calendar import datetime from scrapy.spiders import CrawlSpider from items import XsktItem #1 def get_total_date_month(year, month): #2 now = datetime.datetime.now() 45 total_date = calendar.monthrange(year, month)[1] if year == now.year and month == now.month and now.day < total_date: return now.day return total_date Import XsktItem vào spider để chuẩn bị đổ liệu lấy vào item Function get_total_date_month tính tốn xem có ngày tháng đưa vào Nếu năm tháng lấy tới ngày Tiếp tục ta tạo class SoxokienthietSpider để lấy liệu từ site xskt.com.vn class SoxokienthietSpider(CrawlSpider): name = 'xosokienthiet' allowed_domains = ['xskt.com.vn'] #1 start_urls = [] month_to_scrap = year_to_scrap = 2020 total_date = get_total_date_month(year_to_scrap, month_to_scrap) for i in range(1, total_date): start_urls.append('http://xskt.com.vn/ket-qua-xo-so-theo-ngay/miennam-xsmn/' '{0}-{1}-{2}.html'.format(i, month_to_scrap, year_to_scrap)) #2 def parse(self, response): #3 xs_item = XsktItem() tmp_data = {} data_resp = scrapy.Selector(response) xs_item['xs_info'] = [ # Thứ 46 data_resp.xpath("//table[@id='MN0']/tr/th[1]/a/text()").extract_first( ), # Ngày tháng data_resp.xpath("//table[@id='MN0']/tr/th[1]/text()").extract_first() ] #4 for i in range(2, 5): # Các tỉnh bảng xổ số tmp_location = data_resp.xpath("//table[@id='MN0']/tr/th[{0}]/a/text()".format(i)).extract_first() tmp_data[tmp_location] = {} for j in range(2, 11): # Cột giải từ giải đến giải đặc biệt tmp_giai = data_resp.xpath("//table[@id='MN0']/tr[{0}]/td[1]/text()".format(j)).extract_first() # Các số trúng thưởng cột theo tỉnh tmp_number = data_resp.xpath("//table[@id='MN0']/tr[{0}]/td[{1}]//text()".format(j, i)).extract() tmp_data[tmp_location][tmp_giai] = ", ".join(tmp_number) xs_item['xs_data'] = tmp_data #5 yield xs_item #6 Scrapy cho phép quản lý link theo domain để lấy liệu, domain allowed_domain scrapy bỏ qua Lấy số ngày từ function get_total_date_month sau đưa vào vịng lặp for Đưa giá trị ngày, tháng, năm vào để tạo list cho scrapy chạy lấy liệu vào link (http://xskt.com.vn/ket-qua-xo-so-theo-ngay/mien-namxsmn/01-6-2018.html) phân tích lúc trước Parse function kế thừa từ class CrawlSpider Function parse respone lấy link danh sách Đưa thứ ngày tháng phân tích từ xpath vào xs_info extract_first() trả trực tiếp giá trị string 47 Tương tự cho xs_data, đưa số giải vào Yield tương tự return, điểm khác biệt lưu lại liệu yield, sau kết thúc trả tồn liệu mà chương trình chạy Cần lưu ý yield không lưu memory, mà tạo dùng trực tiếp Code file xosokienthiet.py sau: import scrapy import calendar import datetime from scrapy.spiders import CrawlSpider from items import XsktItem def get_total_date_month(year, month): now = datetime.datetime.now() total_date = calendar.monthrange(year, month)[1] if year == now.year and month == now.month and now.day < total_date: return now.day return total_date class SoxokienthietSpider(CrawlSpider): name = 'xosokienthiet' allowed_domains = ['xskt.com.vn'] start_urls = [] month_to_scrap = year_to_scrap = 2020 total_date = get_total_date_month(year_to_scrap, month_to_scrap) for i in range(1, total_date): 48 start_urls.append('http://xskt.com.vn/ket-qua-xo-so-theo-ngay/miennam-xsmn/' '{0}-{1}-{2}.html'.format(i, month_to_scrap, year_to_scrap)) def parse(self, response): xs_item = XsktItem() tmp_data = {} data_resp = scrapy.Selector(response) xs_item['xs_info'] = [ # Thứ data_resp.xpath("//table[@id='MN0']/tr/th[1]/a/text()").extract_first( ), # Ngày tháng data_resp.xpath("//table[@id='MN0']/tr/th[1]/text()").extract_first(), self.year_to_scrap ] for i in range(2, 5): # Các tỉnh bảng xổ số tmp_location = data_resp.xpath("//table[@id='MN0']/tr/th[{0}]/a/text()".format(i)).extract_first() tmp_data[tmp_location] = {} for j in range(2, 11): # Cột giải từ giải đến giải đặc biệt tmp_giai = data_resp.xpath("//table[@id='MN0']/tr[{0}]/td[1]/text()".format(j)).extract_first() # Các số trúng thưởng cột theo tỉnh tmp_number = data_resp.xpath("//table[@id='MN0']/tr[{0}]/td[{1}]//text()".format(j, i)).extract() tmp_data[tmp_location][tmp_giai] = ", ".join(tmp_number) xs_item['xs_data'] = tmp_data 49 yield xs_item Đoạn code viết lấy toàn kết xổ số miền nam tháng 1/2020 Có thể chạy thử export file json sau/ scrapy crawl xosokienthiet -o items.json Nếu muốn lưu kết vào database, phải kích hoạt pipeline Sẽ dùng sqlite3 ví dụ Mở file settings.py vào tìm ITEM_PIPELINE uncomment ITEM_PIPELINES = { 'xskt.pipelines.XsktPipeline': 300, } Bây mở file pipelines.py chỉnh sửa sau: # -*- coding: utf-8 -*# Define your item pipelines here # # Don't forget to add your pipeline to the ITEM_PIPELINES setting # See: http://doc.scrapy.org/en/latest/topics/item-pipeline.html from sqlite3 import dbapi2 as sqlite class XsktPipeline(object): def init (self): self.connection = sqlite.connect('./xs_database.db') self.cursor = self.connection.cursor() self.cursor.execute('CREATE TABLE IF NOT EXISTS kq_xs ' '(id INTEGER PRIMARY KEY, xs_thu VARCHAR(80),' 'xs_ngay_thang VARCHAR(80), xs_nam VARCHAR(80), xs_data TEXT)') def process_item(self, item, spider): self.cursor.execute("select * from kq_xs where xs_thu=? and xs_ngay_thang=? and xs_nam=?", (item['xs_info'][0], item['xs_info'][1], item['xs_info'][2])) 50 result = self.cursor.fetchone() if not result: self.cursor.execute( "insert into kq_xs (xs_thu, xs_ngay_thang, xs_nam, xs_data) values (?, ?, ?, ?)", (item['xs_info'][0], item['xs_info'][1], item['xs_info'][2], str(item['xs_data']))) self.connection.commit() return item Sau chạy command: scrapy crawl xosokienthiet Kết sau chạy scrapy: Hình 3.15 Kết sau chạy Scrapy  Phân tích site để lấy xpath Đầu tiên cần vào site lấy liệu https://xskt.com.vn/ket-qua-xo-so-theongay/mien-nam-xsmn/5-2-2020.html 51 Để lấy thứ ta cần biết table chứa bảng số có class hay id khác biệt không, dùng Inspector (nhấn F12 click phải lên Thứ 4) để xem 52 Theo hình table có Id class để khai thác Nhưng class dễ bị trùng với element khác, nên sử dụng id Hãy ghi lại MN0 Tiếp theo ta xem tới "Thứ 4", ta thấy "Thứ 4" nằm table (id = MN0) > tr > th[1] > a (text) th[1] định th table data_resp.xpath("//table[@id='MN0']/tr/th[1]/a/text()").extract_first() Tương tự cho ngày tháng table (id = MN0) > tr > th[1] (text) data_resp.xpath("//table[@id='MN0']/tr/th[1]/text()").extract_first() Các element khác làm tương tự 3.4 Xây dựng kịch thử nghiệm Kịch bản: Chạy chương trình giờ, giờ, ngày với thời gian kiểm tra 10 phút/lần, vùng kiểm tra vùng chứa nội dung chính, có lưu liệu mã nguồn, ảnh chụp trang TTĐT với trang TTĐT: http://xskt.com.vn 3.5 Kết thử nghiệm thu thập nội dung thông tin, ghi thông tin, kiểm tra phát thay đổi nội dung trang tin kết xổ số Lần 1, chạy từ 19h00 đến 20h05 ngày 15/2/2020 Bảng 3-1 Kết thử nghiệm lần STT Website Số lần KT Số lần phát Tình trạng bất 53 xskt.com.vn thay đổi thườn g Không Lần 2, chạy từ 14h00 đến 19h05 ngày 16/02/2018 Bảng 3-2 Kết thử nghiệm lần STT Website Số lần KT xskt.com.vn 31 Số lần phát thay đổi Tình trạng bất thườn g Không Lần 3, chạy ngày từ 19h00 ngày 17/02/2020 đến 19h05 ngày 18/02/2020 Bảng 3-3 Kết thử nghiệm lần STT Website Số lần KT xskt.com.vn 145 Số lần phát thay đổi Tình trạng bất thườn g Khơng 3.6 Phân tích, đánh giá kết thử nghiệm Hệ thống chạy ổn định, không bị lỗi, cảnh báo xác âm phát thay đổi, gửi cảnh báo email cho học viên có thay đổi, mức độ chiếm nhớ RAM ổn định, không tăng hệ thống chạy lâu dài, dung lượng lưu trữ liệu kiểm tra trang TTĐT ổ cứng trung bình 200KB/lần kiểm tra (gồm ảnh chụp, liệu lưu database) Nếu tiến độ kiểm tra 10 phút/lần ngày trang TTĐT lưu liệu tốn 30MB dung lượng 3.7 Kết luận chương 54 Sau hoàn thành demo đạt kết sau: Phát tất thay đổi xảy website Gửi cảnh báo email cho quản trị viên có thay đổi Giao diện ứng dụng thuận tiện Dễ dàng cho quản trị viên kiểm tra phát vị trí cần khắc phục có cố Tốc độ chương trình tương đối ổn định 55 KẾT LUẬN  Các kết đạt được: Nghiên cứu giải thuật sử dụng để phát thay đổi nội dung website, giúp tăng cường khả giám sát, phát cảnh báo, nhằm hỗ trợ cho người quản trị phản ứng nhanh trường hợp trang TTĐT bị cơng Nắm rõ nguy ATTT trang TTĐT, đặc biệt thay đổi nội dung Từ nghiên cứu phương pháp thu thập thông tin, phương pháp kiểm tra tính tồn vẹn thơng tin để phân tích, thử nghiệm, kiểm tra phát thay đổi nội dung trang TTĐT kết xổ số  Hướng phát triển: Tìm hiểu thêm cơng đại, có nguy gây tổn thương trang TTĐT, tìm cách khắc phục nhằm đảm bảo tính an tồn trang TTĐT Tiếp tục nghiên cứu phân tích công cụ Scrapy công cụ thu thập thông tin khác nhằm phát điểm yếu khác để khắc phục 56 TÀI LIỆU THAM KHẢO Tiếng việt [1] Phan Đình Diệu (2002)- Lý thuyết mật mã an tồn thơng tin –– NXB Đại Học Quốc Gia Hà Nội 2002 [2] Phạm Huy Điển, Hà Huy Khoái (2003)- Mã hóa thơng tin - Cơ sở Tốn học & ứng dụng, Nhà xuất Đại học Quốc gia Hà nội [3] Hà Huy Khối (1997), Nhập mơn số học thuật toán, Nhà xuất Khoa học [4] Nguyễn Ngọc Tuấn, Hồng Phúc (2005)- Công nghệ bảo mật World Wide WebNhà xuất Thống kê [5] Nguyễn Đình Vinh (2005)- Những vấn đề an tồn thơng tin (Tập 1, tập 2)- Học viện kỹ thuật mật mã [6] Pfleege (2004)- An tồn tính tốn (bản dịch)- Học viện kỹ thuật mật mã Tiếng Anh [7] A Menezes, P van Oorschot S Vanstone (1996) - Handbook of Applied Cryptography, Fifth Edition- CRC Press [8] Douglas Stinson (2007)- Cryptography: Theory and Practice Boca Raton FLCRC Press [9] Nik Goots, Boris Izotov, Alex Moldovyan and Nik Moldovyan (2003)“Modern CryptographyProtect Your Data with Fast Block Ciphers”- A-LIST Publishing [10] William Stallings (2003)- Cryptography and Network Security: Principles and Practice Third Edition- Pearson Education ... thay đổi nội dung bảng kết trang tin xổ số - Phương pháp thu thập thông tin từ trang TTĐT Cụ thể cho trang TTĐT kết xổ số - Cách thức lập bảng liệu kết trang tin xổ số - Phân tích, đánh giá số. .. cách thay đổi thơng tin Ví dụ giả mạo kết trang tin kết xổ số gây tác hại lớn Do vậy, việc nghiên cứu phương pháp phát thay đổi nội dung trang thông tin điện tử, cụ thể cho trang TTĐT kết xổ số. .. VONGSAVANH VANPHATH NGHIÊN CỨU PHƯƠNG PHÁP PHÁT HIỆN THAY ĐỔI NỘI DUNG BẢNG KẾT QUẢ CỦA TRANG TIN XỔ SỐ KIẾN THIẾT Chuyên ngành : HỆ THỐNG THÔNG TIN Mã số : 8.48.01.04 LUẬN VĂN THẠC SĨ KỸ THUẬT

Ngày đăng: 30/07/2020, 20:17

Từ khóa liên quan

Mục lục

  • LỜI CAM ĐOAN

  • LỜI CẢM ƠN

  • DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT

  • DANH MỤC HÌNH VẼ

  • DANH MỤC BẢNG BIỂU

  • MỞ ĐẦU

  • CHƯƠNG 1. TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU.

    • 1.1. Vấn đề an toàn thông tin: cần nêu các mối nguy cơ, tác động đến trang thông tin điện tử nói chung

    • 1.2. Các hình thức tấn công mạng phổ biến

      • 1.2.1. Tấn công bằng phần mềm độc hại (Malware attack)

      • 1.2.2. Tấn công giả mạo (Phishing attack)

      • 1.2.3. Tấn công trung gian (Man-in-the-middle attack)

      • 1.2.4. Tấn công từ chối dịch vụ (DoS và DDoS)

      • 1.2.5. Tấn công cơ sở dữ liệu (SQL injection)

      • 1.2.6. Khai thác lỗ hổng Zero-day (Zero day attack)

      • 1.2.7. Các loại khác

      • 1.3. Vấn đề bảo đảm an toàn trang TTĐT nói chung

      • 1.4. Nguy cơ thay đổi, giả mạo nội dung trang TTĐT nói chung.

      • 1.5. Các mô hình, phương pháp, kỹ thuật liên quan đến thu thập thông tin, trích chọn dữ liệu.

        • 1.5.1. Web Crawler

        • 1.5.2. Web Scraper

        • 1.5.3. Phân biệt Web Crawling và Web Scraping

        • 1.6. Một số thuật toán kiểm tra phát hiện thay đổi nội dung trang TTĐT

          • 1.6.1. Hàm băm

            • 1.6.1.1. Giới thiệu hàm băm

Tài liệu cùng người dùng

Tài liệu liên quan