Nghiên cứu thuật toán mã hóa DNA và ứng dụng

67 634 1
Nghiên cứu thuật toán  mã hóa DNA và ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

MỞ ĐẦU 1. Lý do chọn đề tài Ngày nay, với sự xuất hiện của máy tính, các tài liệu văn bản giấy tờ và các thông tin quan trọng đều được lưu trữ, xử lí trên máy tính và chúng được truyền đi trên một môi trường mặc định là không an toàn. Đồng thời dữ liệu trên toàn thế giới ngày càng tăng với một khối lượng lớn và người ta ước tí nh rằng đến một ngày không xa sẽ không còn ổ cứng nào có thể lưu trữ hết thông tin dữ liệu [5][9]. Do đó, yêu cầu cần có một cơ chế, giải pháp để lưu trữ, bảo vệ sự an toàn và bí mật của các thông tin nhạy cảm, quan trọng càng trở nên cấp thiết. Dữ liệu của mọi mỗi người dùng có thể khác nhau từ các tập tin văn bản đến các chương trình máy tính hoặc các dữ liệu rất quan trọng như tài khoản trong ngân hàng, bí mật quốc gia. Tùy theo tầm quan trọng của tài liệu mà người dùng lựa chọn các phương pháp khác nhau. Trong đó, đảm bảo tính bảo mật nội dung của tập tin là cần thiết. Vì vậy, các tập tin sau khi tạo cần được mã hóa nhằm tăng tính bảo mật và độ an toàn của dữ liệu. Mã hóa được xem là mức bảo vệ tối ưu nhất đối với dữ liệu giúp thông tin không bị tiết lộ và nâng cao độ an toàn trong các giao dịch truyền tải thông tin. Mật mã học – Cryptography – là ngành khoa học nghiên cứu về việc giấu thông tin. Cụ thể hơn, mật mã học là ngành học nghiên cứu về những cách chuyển đổi thông tin từ dạng “Có thể hiểu rõ” (bản rõ) thành dạng “không thể hiểu được” (bản mã) và ngược lại. Mật mã học giúp đảm bảo tính bí mật của thông tin – thông tin chỉ tiết lộ cho những ai được phép; tính toàn vẹn – thông tin không thể bị thay đổi mà không phát hiện; tính xác thực – người gửi hoặc người nhận có thể chứng minh đúng họ; đảm bảo tính không chối bỏ, tức là người gửi hoặc người nhận không thể chối bỏ việc đã gửi hoặc nhận thông tin. Trên thực tế đã có rất nhiều phương pháp mã hóa và các thuật toán tương ứng với mỗi phương pháp được ứng dụng để mã hóa thông tin như phương pháp mã hóa đối xứng với các thuật toán Data Encryption Standard – DES, Triple DES, Advaced Encryption Standard – AES; Phương pháp mã hóa bất đối xứng với khóa công khai gồm các thuật toán nổi tiếng: Diffle – Hellman, RSA… Xuất phát từ cơ sở phân tích trên, tôi chọn đề tài “ Nghiên cứu thuật toán mã hóa DNA và ứng dụng”. Đây là phương pháp mã hóa hoàn toàn mới và đảm bảo sự an toàn cho dữ liệu. 2. Mục đính nghiên cứu Đề tài nhằm nghiên cứu những vấn đề sau: Tìm hiểu về các thuật toán mã hóa. Tìm hiểu về cấu trúc của DNA Nghiên cứu một số thuật toán mã hóa trên DNA Nghiên cứu một số ứng dụng dựa trên thuật toán Phân tích, đánh giá và mô phỏng một thuật toán mã hóa DNA. 3. Đối tượng nghiên cứu Cấu trúc của DNA. Các thuật toán mã hóa trên DNA và ứng dụng 4. Phương pháp nghiên cứu Phương pháp nghiên cứu lý thuyết: Tham khảo các nguồn tài liệu từ các luận văn thạc sĩ, luận án tiến sĩ, các bài báo, tạp chí trong và ngoài nước… Mô hình thực nghiệm: Trên cơ sở tìm hiểu và nghiên cứu lý thuyết thuật toán mã hóa trên DNA lập trình mô phỏng đưa ra kết quả.

B GIO DC V O TO I HC HU TRNG I HC KHOA HC PHM NGC HI Nghiên cứu thuật toán mã hóa DNA ứng dụng CHUYấN NGNH: KHOA HC MY TNH M S: 60.48.01.01 LUN VN THC S KHOA HC MY TNH Hu, 2015 MC LC Li cam oan Li cm n Mc lc Danh mc ch vit tt Danh mc hỡnh v Danh mc bng M U 1 Lý chn ti Mc ớnh nghiờn cu i tng nghiờn cu Phng phỏp nghiờn cu Cu trỳc ca lun Chng TNG QUAN V M HểA THễNG TIN 1.1 Gii thiu v mó húa thụng tin 1.1.1 Khỏi Nim: 1.1.2 Vai trũ ca mó húa thụng tin 1.1.3 Cỏc thnh phn ca h mó húa 1.1.4 Mc tiờu v nguyờn tc chung ca an ton bo mt thụng tin 1.1.5 Tiờu chun ỏnh giỏ h mó húa 1.2 Mt s phng phỏp mó húa 1.2.1 Phng phỏp mó hoỏ c in 1.2.2 Mó húa i xng 11 1.2.3 Mó húa bt i xng 17 1.2.4 Mó húa hm bm 20 1.3 Mt s ng dng ca mó húa thng mi in t 22 1.3.1 Xỏc thc ngi dựng s dng giao thc SSL 23 1.3.2 ng dng mó húa ch ký in t 24 1.4 Tiu kt chng 26 Chng MT S THUT TON M HểA TRấN DNA 27 2.1 Cu trỳc ca DNA 27 2.1.1 Cu to húa hc : 27 2.1.2 Cu to khụng gian ca DNA 28 2.1.3 Tớnh cht ca DNA 29 2.1.4 Chc nng ca DNA 30 2.2 Thut toỏn mó húa DNA da trờn d liu nh phõn 30 2.2.1 í tng ca thut toỏn 30 2.2.2 Thut toỏn 32 2.2.3 Vn v an ninh 38 2.3 Thut toỏn YAEA 39 2.3.1 C s lý lun v ý tng thut toỏn 39 2.3.2 Thut toỏn 40 2.3.3 Phõn tớch An ninh cỏc thut toỏn 43 2.3.4 Kim tra bo mt ca thut toỏn 44 2.4 Tiu kt chng 46 Chng CI T CHNG TRèNH 47 3.1 Ci t thut toỏn 47 3.2 Kt qu thc nghim: 54 3.3 Tiu kt chng 58 KT LUN V HNG PHT TRIN 59 TI LIU THAM KHO 60 DANH MC CH VIT TT A: Aờnin DNA: Axit ờụxiribonucleic AES: Advaced Encryption Standard C: Cytosine CA: Cetificate Authority DES: Data Encryption Standard G: Guanine MD5: Message-Digest T: Thymine DANH MC HèNH V S TấN HèNH V TRANG 1.1 Mụ hỡnh mó húa 1.2 Hỡnh vuụng Vigenere 10 1.3 Cu to mt vũng ca DES 12 1.4 Qỳa trỡnh sinh khúa DES 13 1.5 Biu din dóy 64bit thnh thnh phn L v R 14 1.6 Qui trỡnh phỏt sinh dóy LiRi t dóy Li-1Ri-1v khúa Ki 15 1.7 S thut toỏn mó húa Data Encryption Standard 16 1.8 S thut toỏn mó húa RSA 19 1.9 S thut toỏn gii mó RSA 20 1.10 Mụ hỡnh mt vũng 22 2.1 Cu to húa hc ca DNA 28 2.2 Cu to khụng gian ca DNA 29 2.3 Thut toỏn mó húa da trờn d liu nh phõn 33 2.4 Thut toỏn gii mó da trờn d liu nh phõn 36 2.5 S thut toỏn YAEA thc hin mt vũng lp 42 2.6 S kớ t xut hin bn rừ chui DNA 44 2.7 H s tng quan Pearson 45 DANH MC BNG S TấN BNG TRANG 3.1 Mó húa kớ t v mó nh phõn thnh nucleotic 48 3.2 Chuyn i cỏc kớ t v trỡnh t DNA mi 51 3.3 Mó húa cỏc kớ t a v v trớ trờn trỡnh t DNA tham kho 53 M U Lý chn ti Ngy nay, vi s xut hin ca mỏy tớnh, cỏc ti liu bn giy t v cỏc thụng tin quan trng u c lu tr, x lớ trờn mỏy tớnh v chỳng c truyn i trờn mt mụi trng mc nh l khụng an ton ng thi d liu trờn ton th gii ngy cng tng vi mt lng ln v ngi ta c tớnh rng n mt ngy khụng xa s khụng cũn cng no cú th lu tr ht thụng tin d liu [5][9] Do ú, yờu cu cn cú mt c ch, gii phỏp lu tr, bo v s an ton v mt ca cỏc thụng tin nhy cm, quan trng cng tr nờn cp thit D liu ca mi mi ngi dựng cú th khỏc t cỏc tin bn n cỏc chng trỡnh mỏy tớnh hoc cỏc d liu rt quan trng nh ti khon ngõn hng, mt quc gia Tựy theo tm quan trng ca ti liu m ngi dựng la chn cỏc phng phỏp khỏc Trong ú, m bo tớnh bo mt ni dung ca tin l cn thit Vỡ vy, cỏc tin sau to cn c mó húa nhm tng tớnh bo mt v an ton ca d liu Mó húa c xem l mc bo v ti u nht i vi d liu giỳp thụng tin khụng b tit l v nõng cao an ton cỏc giao dch truyn ti thụng tin Mt mó hc Cryptography l ngnh khoa hc nghiờn cu v vic giu thụng tin C th hn, mt mó hc l ngnh hc nghiờn cu v nhng cỏch chuyn i thụng tin t dng Cú th hiu rừ (bn rừ) thnh dng khụng th hiu c (bn mó) v ngc li Mt mó hc giỳp m bo tớnh mt ca thụng tin thụng tin ch tit l cho nhng c phộp; tớnh ton thụng tin khụng th b thay i m khụng phỏt hin; tớnh xỏc thc ngi gi hoc ngi nhn cú th chng minh ỳng h; m bo tớnh khụng chi b, tc l ngi gi hoc ngi nhn khụng th chi b vic ó gi hoc nhn thụng tin Trờn thc t ó cú rt nhiu phng phỏp mó húa v cỏc thut toỏn tng ng vi mi phng phỏp c ng dng mó húa thụng tin nh phng phỏp mó húa i xng vi cỏc thut toỏn Data Encryption Standard DES, Triple DES, Advaced Encryption Standard AES; Phng phỏp mó húa bt i xng vi khúa cụng khai gm cỏc thut toỏn ni ting: Diffle Hellman, RSA Xut phỏt t c s phõn tớch trờn, tụi chn ti Nghiờn cu thut toỏn mó húa DNA v ng dng õy l phng phỏp mó húa hon ton mi v m bo s an ton cho d liu Mc ớnh nghiờn cu ti nhm nghiờn cu nhng sau: Tỡm hiu v cỏc thut toỏn mó húa Tỡm hiu v cu trỳc ca DNA Nghiờn cu mt s thut toỏn mó húa trờn DNA Nghiờn cu mt s ng dng da trờn thut toỏn Phõn tớch, ỏnh giỏ v mụ phng mt thut toỏn mó húa DNA i tng nghiờn cu Cu trỳc ca DNA Cỏc thut toỏn mó húa trờn DNA v ng dng Phng phỏp nghiờn cu Phng phỏp nghiờn cu lý thuyt: Tham kho cỏc ngun ti liu t cỏc lun thc s, lun ỏn tin s, cỏc bi bỏo, v ngoi nc Mụ hỡnh thc nghim: Trờn c s tỡm hiu v nghiờn cu lý thuyt thut toỏn mó húa trờn DNA lp trỡnh mụ phng a kt qu Cu trỳc ca lun Cu trỳc lun gm: Phn m u: Nờu c lớ chn ti ny, mc ớch ca vic nghiờn cu, phng phỏp nghiờn cu v i tng nghiờn cu Phn ni dung: Gm cú chng Chng ca lun trỡnh by khỏi nim v mó húa thụng tin, a khỏi quỏt c mụ hỡnh mó húa v cỏc thnh phn ca mó húa Nờu lờn c ba mc tiờu ca bo mt thụng tin Tỡm hiu mt s thut toỏn mó húa t c in n hin i Nờu c mt s ng dng ca mó húa thng mi in t Chng ca lun trỡnh by khỏi quỏt cu trỳc sinh hc ca DNA, tớnh cht ca DNA v chc nng c bn ca DNA Tỡm hiu hai thut toỏn mó húa da trờn cu trỳc ca DNA l mó húa da trờn d liu nh phõn v thut toỏn YAEA Chng ca lun tỏc gi ci t c thut toỏn mó húa DNA trờn d liu nh phõn ng thi thc hin chng trỡnh a mt s vớ d cho quỏ trỡnh mó húa v gii mó Phn kt lun: Nờu kt lun v a hng phỏt trin tip theo cho lun sau ny Chng TNG QUAN V M HểA THễNG TIN 1.1 Gii thiu v mó húa thụng tin 1.1.1 Khỏi Nim Mó húa thụng tin l chuyn i thụng tin t dng rừ (dng c c) sang dng mó (dng khụng th c c) v ngc li Nhm mc ớch ngn chn nguy c truy cp thụng tin truyn i trờn mng mt cỏch bt hp phỏp Thụng tin s c truyn i trờn mng di dng mó v khụng th c c vi bt k c tỡnh mun ly thụng tin ú [2] Khi chỳng ta cú nhu cu trao i thụng tin, thỡ Internet l mụi trng khụng an ton, y ri ro v nguy him, khụng cú gỡ m bo rng thụng tin m chỳng ta truyn i khụng b c trm trờn ng truyn Vỡ vy mó húa l bin phỏp giỳp ta bo v chớnh mỡnh cng nh thụng tin m ta gi i ngoi mó húa cũn m bo tớnh ton ca d liu[4][8][9] 1.1.2 Vai trũ ca mó húa thụng tin Cỏc h mó húa phi thc hin c cỏc vai trũ sau: - Che du c ni dung ca bn rừ (PlainText) m bo cho ch ngi ch hp phỏp ca thụng tin mi cú quyn truy cp thụng tin, hay núi cỏch khỏc l chng truy cp khụng ỳng quyn hn - To cỏc yu t xỏc thc thụng tin, m bo thụng tin lu hnh trờn h thng n ngi nhn hp phỏp xỏc thc - T chc cỏc s ch ký in t, m bo khụng cú hin tng gi mo, mo danh gi thụng tin trờn mng u im ln nht ca cỏc h mó húa l cú th ỏnh giỏ c phc ca tớnh toỏn m k ch phi gii quyt bi toỏn cú th ly c thụng tin ca 47 Chng CI T CHNG TRèNH Trong chng ny tỏc gi thc hin vit chng trỡnh cho thut toỏn mó húa DNA trờn d liu nh phõn 3.1 Ci t thut toỏn Thut toỏn mó húa DNA trờn d liu nh phõn c chia lm giai on: mó húa v gii mó Chng trỡnh ci dt c vit theo ngụn ng lp trỡnh Pascal cng chia lm hai chng trỡnh thc hin mó húa v gii mó Chng trỡnh mó húa ca thut toỏn c chia lm giai on theo yờu cu ca thut toỏn Quỏ trỡnh u tiờn nhp d liu u vo l bn cn mó húa c x lý trờn d liu STRING Vn bn mó ny ln lt chuyn v bn mó ASCII di dng mó nh phõn Function Doi(A:char):String; Var St,st1:string; K,i:byte; Begin K:=ord(a); St:=''; While k>0 Begin If k mod =0 then St:='0'+St Else St:='1' + St; k:=k div 2; End; Giai on bin i chui nh phõn tng ng thnh ATCG vi (A= 00, T= 01, C= 10, G= 11) õy l giai on chuyn v thnh phn tng ng ca DNA Mó code nh sau: 48 Procedure ATCG(St:string;Var ST1:string); Var K,i:byte; Begin k:=Length(St);i:=0; st1:=''; While I[...]... phương pháp mã hóa bất đối xứng đảm bảo tính bí mật hơn Một điều quan trọng của phương pháp mã hóa này là cặp khóa Public Key và Private Key phải tương đồng nhau Có nghĩa là chỉ có khóa bí mật trong cùng một cặp khóa mới có thể giải mã được dữ liệu đã mã hóa bởi khóa công khai tương ứng Thuật toán mã hóa bất đối xứng nổi tiếng và được sử dụng nhiều nhất hiện nay là RSA Thuật toán mã hóa RSA Thuật toán được... đồ thuật toán mã hóa Data Encryption Standard (DES) 17 1.2.3 Mã hóa bất đối xứng Mã hóa bất đối xứng là mô hình mã hóa hai chiều sử dụng một cặp khóa là khóa công khai (Public Key) và khóa bí mật (Private Key) Trong đó khóa công khai có thể được công bố rộng rải Thông thường thông tin được người gửi sử dụng khóa công khai để mã hóa và gửi đi Người nhận thông tin sẽ dùng khóa bí mật để giải mã Khóa... toán là quá lâu thì thuật toán đó tạm thời được coi là an toàn Nếu lượng dữ liệu cần thiết để phá vỡ một thuật toán quá lớn so với lượng dữ liệu đã được mã hoá thì thuật toán đó tạm thời được coi là an toàn * Độ phức tạp tính toán Khi đánh giá hệ mã hóa phải chú ý đến tốc độ mã hóa và giải mã Hệ mã hóa tốt thì thời gian mã hóa và giải mã nhanh Một hệ mã hóa phụ thuộc vào khóa, khóa này được truyền... phát triển Từ các phương pháp mã hóa cổ điển như hệ mã CEASAR, VIGENERE đến các thuật toán mã hóa đối xứng như DES, mã hóa bất đối xứng như RSA, MD5… các thuật toán hiện nay đều đang được sử dụng và phát triển bởi vì chúng đáp ứng được yêu cầu của người sử dụng về độ an toàn bảo mật cao 27 Chương 2 MỘT SỐ THUẬT TOÁN MÃ HÓA TRÊN DNA 2.1 Cấu trúc của DNA 2.1.1 Cấu tạo hóa học DNA (phân tử đêôxiribônuclêic... độ dài d thì sẽ có 26 d khóa hợp lệ Vì vậy chỉ cần với giá trị d nhỏ thì phương pháp thám mã vét cạn cũng đòi hỏi khá nhiều thời gian 1.2.2 Mã hóa đối xứng Mã hóa đối xứng hay mã hóa chia sẽ khóa là mô hình mã hóa hai chiều, có nghĩa là tiến trình mã hóa và giải mã từ khóa lập mã có thể suy ra khóa giải mã Khóa này được chuyển giao bí mật giữa hai đối tượng tham gia giao tiếp Khóa này có thể được cấu... Mỗi khóa là những số cố định sử dụng trong quá trình mã hóa và giải mã Khóa công khai được công bố rộng rãi cho mọi người và được 18 dùng để mã hóa Những thông tin được mã hóa bằng khóa công khai chỉ có thể được giải mã bằng khóa bí mật tương ứng Nói cách khác, mọi người đều có thể mã hóa nhưng chỉ có người biết khóa cá nhân (bí mật) mới có thể giải mã được Ta có thể mô phỏng trực quan một hệ mật mã. .. cấu hình trong phần mềm hoặc được mã hóa trong phần cứng Mã hóa đối xứng thực hiện nhanh nhưng có thể gặp rủi ro nếu khóa bị đánh cắp Một số thuật toán mã hóa đối xứng nổi tiếng như: DES, AES, RC2, RC4, RC5, RC6… 1.2.2.1 Thuật toán mã hóa DES Khoảng những năm 1970, tiến sĩ Horst Feistel đã đặt nền móng đầu tiên cho chuẩn mã hóa DES với phương pháp mã hóa Feistel Cipher Vào năm 1976 Cơ quan bảo mật quốc... thay thế trên thì sẽ nhận được bản rõ ban đầu Mã hóa cổ điển có hai phương pháp nổi bật là: Mã hóa thay thế và mã hóa hoán vị Các hệ mã hóa thường được sử dụng trong lịch sử là: Hệ mã hóa Ceasar, Vigenere, Hill… 1.2.1.1 Hệ mã hóa CEASAR Hệ mã hóa CEASAR là một ví dụ điển hình cho hệ mã hóa thay thế Nó làm việc trong bảng chữ cái tiếng Anh 26 ký tự Ceasar sử dụng các số nguyên thay cho các ký tự, đánh... Các thuật toán trao đổi khoá như KEA, RSA được sử dụng để 2 bên client và server xác lập khoá đối xứng mà họ sẽ sử dụng trong suốt phiên giao dịch SSL Và thuật toán được sử dụng phổ biến là RSA 1.3.2 Ứng dụng mã hóa trong chữ ký điện tử Chữ kí điện tử được tạo ra và kiểm tra bằng mật mã, đó là một phương pháp thuộc lĩnh vực toán học, nó chuyển toàn bộ thông tin thành một dạng khó có thể nhận dạng và. .. thuần là mã hóa và giải mã thông tin mà còn bao gồm nhiều vấn đề khác nhau cần được nghiên cứu và giải quyết: chứng thực nguồn gốc nội dung thông tin (kỹ thuật chữ ký điện tử), chứng nhận tính xác thực về người sở hữu mã khóa (chứng nhận khóa công cộng), các quy trình giúp trao đổi thông tin và thực hiện giao dịch điện tử an toàn trên mạng Những kết quả nghiên cứu về mật mã cũng đã được đưa vào trong các ... cứu số ứng dụng dựa thuật toán Phân tích, đánh giá mô thuật toán mã hóa DNA Đối tượng nghiên cứu Cấu trúc DNA Các thuật toán mã hóa DNA ứng dụng Phương pháp nghiên cứu Phương pháp nghiên cứu lý... mã hóa hoàn toàn đảm bảo an toàn cho liệu Mục đính nghiên cứu Đề tài nhằm nghiên cứu vấn đề sau: Tìm hiểu thuật toán mã hóa Tìm hiểu cấu trúc DNA Nghiên cứu số thuật toán mã hóa DNA Nghiên cứu. .. đến thuật toán mã hóa đối xứng DES, mã hóa bất đối xứng RSA, MD5… thuật toán sử dụng phát triển chúng đáp ứng yêu cầu người sử dụng độ an toàn bảo mật cao 27 Chương MỘT SỐ THUẬT TOÁN MÃ HÓA

Ngày đăng: 15/12/2015, 12:16

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan