BÁO CÁO TIỂU LUẬN MẬT MÃ VÀ AN TOÀN DỮ LIỆU Chữ ký số trên âm thanh số

Thông tin tài liệu

BÁO CÁO TIỂU LUẬN MẬT MÃ VÀ AN TOÀN DỮ LIỆU Chữ ký số trên âm thanh số Trong những năm gần đây, mạng internet phát triển mạnh cùng với việc chia sẻ thông tin, lan truyền tập tin âm thanh trên mạng. Nhưng môi trường mạng internet là môi trường hỗn hợp của nhiều mạng, nhiều loại thông tin. Do vậy, vấn đề bản quyền thông tin, xác định nguồn của thông tin, cụ thể ở đây là âm thanh số là một điều mới mẻ và chưa được triển khai rộng rãi ở Việt Nam.

1 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ  BÁO CÁO TIỂU LUẬN MẬT MÃ VÀ AN TOÀN DỮ LIỆU Đề tài : Chữ ký số trên âm thanh số Giảng viên hướng dẫn : PGS.TS. Trịnh Nhật Tiến Sinh viên thực hiện : Bùi Trung Hiếu HÀ NỘI 5 – 2014 Mục lục Mục lục 2 GIỚI THIỆU 2 TÀI LIỆU THAM KHẢO 33 GIỚI THIỆU Trong những năm gần đây, mạng internet phát triển mạnh cùng với việc chia sẻ thông tin, lan truyền tập tin âm thanh trên mạng. Nhưng môi trường mạng internet là môi trường hỗn hợp của nhiều mạng, nhiều loại thông tin. Do vậy, vấn đề bản quyền thông tin, xác định nguồn của thông tin, cụ thể ở đây là âm thanh số là một điều mới mẻ và chưa được triển khai rộng rãi ở Việt Nam. Chữ ký điện tử còn khá mới, chỉ được triển khai ở một số ít các doanh nghiệp tư, cơ quan hải quan, cơ quan thuế của Chính phủ, mới chỉ được áp dụng trên tập tin văn bản, tập tin ảnh số. Trong tiểu luận này, tôi tập trung trình bày những kiến thức cơ bản nhất về đặc trưng dữ liệu âm thanh, hàm băm, chữ ký số và ứng dụng chữ ký số trên âm thanh số. Mặt dù đã hết sức cố gắng, nhưng do thời gian có hạn, cùng sự hạn chế của bản thân nên đề tài còn nhiều thiếu sót. Rất mong nhận được ý kiến đóng góp của thầy cô và các bạn. 2 I. ĐẶC TRƯNG CỦA DỮ LIỆU ÂM THANH Âm thanh số (digital audio) là kết quả của quá trình biến đổi từ sóng âm thanh thành tín hiệu số. Sóng âm thanh là các sóng cơ học có dạng hình sin tuần hoàn liên tục (analog), trong khi “âm thanh số” chỉ là những xung điện từ rời rạc (digital). Do đó, bằng những “mẩu” rời rạc, âm thanh số chỉ có thể mô phỏng một cách gần giống nhất với âm thanh thực tế mà thôi. Việc mô phỏng đó được đặc trưng bởi các thông số sau: - Bit Rate: Là thông số thu gọn, đại diện cơ bản cho các thuộc tính trên, Bit Rate có đơn vị Kbps (Kilobits per second) – dung lượng (tính theo bit) của âm thanh số trên một giây. Với Bit rate, ta có thể xác định nhanh chóng dung lượng cũng như phần nào chất lượng của bản âm thanh. Một phút nhạc 128 Kbps có dung lượng khoảng 1Mb và bản nhạc 320 Kbps thì chắc chắn sẽ hay hơn bản nhạc 128 Kbps. - Sample: Là một bộ phận của âm thanh analog được mã hóa thành dạng số. Sample có thể dùng để chỉ một điểm đơn lẻ trong stream âm thanh số (là đơn vị nhỏ nhất của dữ liệu dùng để biểu diễn một tín hiệu âm thanh tại một khoảng thời gian nhất định). Một âm thanh hoàn chỉnh hay toàn bộ một stream âm thanh số được cấu tạo từ việc kết hợp những sample riêng biệt (một chuỗi sample) cũng có thể được coi là một sample. - Sample Rate: Là số sample (tạm dịch là mẫu) trong một khoảng thời gian nhất định (thường là 1 giây) của âm thanh kỹ thuật số, quyết định trực tiếp tới chất lượng âm thanh. Khi một tập tin âm thanh số được ghi lại, nó phải được convert vào một chuỗi những mẫu (series of sample) mà bản thân chúng có thể lưu lại được trên bộ nhớ, trên các thiết bị lưu trữ kỹ thuật số. 3 Sample rate sẽ thông báo cho ta biết trong tập tin âm thanh có bao nhiêu mẫu được ghi lại trong một giây. Đơn vị của sample rate là Hz. Ví dụ dễ hiểu, một tập tin âm thanh được ghi ở sample rate 44100 sẽ cần đến 44100 mẫu/giây để lưu giữ âm thanh trong một chuỗi mẫu. Sample rate càng cao, chất lượng của chuỗi mẫu càng tốt và càng ít xảy ra hiện tượng gọi là aliasing (là hiện tượng xuất hiện những tần số âm thanh không mong muốn sinh ra bởi việc thiếu hụt thông tin từ sample rate). Mỗi mẫu sẽ cần một lượng bit nhất định để lưu trữ gọi là sample size, và ta có thể tính toán dung lượng cần thiết cho một sample. Ví dụ: với âm thanh 16 bit, ta cần sử dụng 16 bit hay 2 byte cho một mẫu (8 bit = 1 byte). Như vậy 1 giây âm thanh với sample rate 44100/16 bit mono (một kênh âm thanh) sẽ có độ lớn là 44100x2 = 88200 byte. Nếu cũng với các thông số như vậy nhưng thay vì mono, ta sử dụng stereo (2 kênh âm thanh), dung lượng sẽ phải nhân đôi và trở thành 176400 byte. Đây là lý do vì sao âm thanh vòm (5.1) hay các loại âm thanh sử dụng nhiều kênh khác (6.1, 7.1, …) lớn hơn rất nhiều so với âm thanh stereo hay mono mặc dù chúng cũng được nén ở cùng chất lượng. - BitDepth: Để lưu lại dưới dạng số, mỗi mẫu được biểu diễn bằng một lượng bit dữ liệu nhất định, gọi là Bit Depth. Các bản nhạc hiện nay thường có Bit Depth là 16 bits, 24 bits… Bit Depth càng lớn âm thanh càng sắc nét, trung thực nên nó còn được gọi là Resolution (độ nét). - Kênh âm thanh (Channel): Bằng các thuật toán, tín hiệu số sẽ được tách ra thành nhiều kênh sao cho khi nghe bằng hệ thống loa thích hợp sẽ có cảm giác như khi đang nghe nhạc trong không gian thực tế. 4 - Âm thanh Lossy, lossless và uncompressed Âm thanh uncompressed là loại âm thanh không áp dụng bất kỳ một phương pháp nén nào. Được sử dụng dưới định dạng WAV hay PCM. Âm thanh lossless là loại âm thanh sử dụng phương pháp loại bỏ những dữ liệu không liên quan tồn tại trong file gốc để thu được một file nhỏ hơn nhưng vẫn giữ được chất lượng như ban đầu. Âm thanh xử lý lossless sẽ có bit rate thấp hơn so với âm thanh chưa nén. Âm thanh lossless được sử dụng rộng rãi và phát triển thành những định dạng quen thuộc như AC3, AAC, DTS, MPEG-1/2/3, Vorbis, Real Audio… Âm thanh lossy là loại âm thanh thu được khi sử dụng những phần mềm encode âm thanh phổ biến hiện nay để chuyển đổi các định dạng âm thanh. Đây là loại âm thanh bị giảm chất lượng vì quá trình lossy encode sẽ không giữ nguyên những phần cần thiết trong file âm thanh gốc. Lấy ví dụ, khi encode từ WAV sang MP3, bạn đã thực hiện phương pháp lossy encode cho file âm thanh WAV chưa nén của mình, và file MP3 thu được đã bị giảm chất lượng so với file gốc, nó là âm thanh lossy. Mọi chuyện thậm chí còn tồi tệ hơn với việc encode file MP3 lossy đó thành OGG (có thể là định dạng khác), file OGG thu được đã bị quá trình encode lossy giảm chất lượng tới 2 lần. - Các dạng bit rate CBR/ABR/VBR CBR-Constant bit rate: nghĩa là bit rate của stream là một hằng số và không thay đổi tại bất kỳ điểm nào của stream. ABR-Average bit rate: nghĩa là stream có thể sử dụng bit rate thay đổi cho mỗi frame, nhưng bit rate trung bình của toàn bộ stream là cố định. VBR-Variable bit rate: nghĩa là stream có thể sử dụng bit rate thay đổi cho mỗi frame và tùy biến để đạt được bit rate cần thiết cho mỗi frame, vì vậy bit rate trung bình không thể xác định trước khi encode hay tính toán cụ thể. - Âm thanh Stereo, joint stereo, và dual channel Dual channel tích hợp bởi 2 kênh mono, nghĩa là mỗi kênh sẽ được encode với một nửa của toàn bộ bit rate. Stereo tích hợp bởi 2 kênh âm thanh độc lập với nhau. Bit rate cung cấp giữa 2 kênh âm thanh thay đổi phù hợp với lượng thông tin được chứa trong mỗi kênh. 5 Joint stereo cũng tích hợp 2 kênh âm thanh nhưng có một bước tiến xa hơn vì có thể sử dụng được những mẫu chung thường xuất hiện ở cả 2 kênh. Do đó độ nén sẽ tốt hơn so với stereo bình thường. II. XỬ LÝ TÍN HIỆU SỐ 2.1. Đại cương về tín hiệu và nhiễu a) Khái niệm tín hiệu Tín hiệu là sự biên thiên của biên độ theo thời gian. Biên độ có thể là điện áp, dòng điện, công suất… nhưng thường được hiểu là điện áp. Các yếu tố trong tín hiệu mà chúng ta thường nhắc tới là biên độ và thời gian. Ví dụ: Xét sóng của tín hiệu x = sin (2*pi*100*t). b) Khái niệm nhiễu Nhiễu là tín hiệu do chính bản thân mạch điện từ và môi trường truyền thông phát sinh ra. Giảm nhiễu hoặc khử nhiễu là thao tác chính trong xử lý tín hiệu số. Nhiễu trắng là nhiễu có độ lớn như nhau ở mọi tần số (trên lý thuyết), trong thực tế chúng ta chỉ xét trong phạm vị giới hạn băng tần khá rộng hay nói đúng hơn nhiễu trắng là tín hiệu có mật độ công suất phổ (PSD) cố định ở mọi băng tần. 6 Có hai loại phân bổ xác suất của nhiễu thường nhắc tới là nhiễu phân bố đều và nhiễu Gauss. + Phân bố đều là phân bố có hàm mật độ PDF f(x) không đổi trong khoảng biến thiên của biến số x, có giá trị kỳ vọng là µ=0. + Phân bố Gauss là phân bố chuẩn. Dạng nhiễu phổ biến nhất trong thực tế là nhiễu trắng có phân bổ Gauss. c) Phân loại tín hiệu Tùy theo từng tiêu chuẩn mà có nhiều cách phân loại khác nhau: + Dạng sóng: tín hiệu sin, vuông, tác giác, xung… + Tần số: hạ tần, cao tần (HF), âm tần (AF), siêu cao tần (VHF)… + Sự liên tục: tín hiệu liên tục, tín hiệu rời rạc. + Tính xác định: tín hiệu xác định, tín hiệu ngẫu nhiên. 2.2. Phân tích Fourier a) Biến đổi Fourier rời rạc (DFT) 7 Tín hiệu tuần hoàn rất ít gặp trong thực tế, trong khi đó tín hiệu không tuần hoàn và có số mẫu giới hạn lại thường xảy ra. Đối với các tín hiệu này lại không phù hợp với phép biển đổi Fourier rời rạc theo thời gian. Do đó đối với tín hiệu không tuần hoàn có độ dài hữu hạn N, người ta thường xem nó như là tín hiệu tuần hoàn ở chu kỳ N, theo định nghĩa Fourier rời rạc của tín hiệu ta có: Với k = 0,1,…,N-1. Đây là phép biến đổi Fourier thuận, ký hiệu DFT. X K được gọi là hệ số phổ. Ngược lại, tín hiệu tổng hợp từ các hệ số phổ là: Với n = 0, 1, …, N-1. Đây là phép biển đổi Fourier ngược, ký hiệu là IDFT. b) Biến đổi Fourier nhanh (FFT) Biểu thức DFT và IDFT chỉ thực hiện trên các phép nhân và phép cộng nhưng vì có quá nhiều phép toán nên cần nhiều thời gian xử lý. Tuy nhiên một lợi điểm là trong DFT và IDFT có hàm mũ, sin, cosin dẫn tới nhiều trùng lặp trong các phép tính. FFT là thuật toán để tính nhanh DFT và IDFT. Vì có nhiều thuật toán FFT nên có nhiều tên gọi khác nhau. Xét biểu thức DFT Vậy phần thực, phần ảo, biên độ và pha lần lượt là 8 c) Ứng dụng * Phân tích phổ - rò rỉ phổ Phân tích phổ số là phân ly tín hiệu số thành các thành phần tần số. Đây là một kỹ thuật rất hữu ích trong khoa học công nghệ. Chúng ta nên phân biệt phân tích phổ và lọc, phân tích phổ đơn giản là phân tích, kiểm nghiệm tín hiệu chứ không lọc. Đối tượng của phân tích phổ là các tín hiệu trong tư nhiên như là: tiếng nói, tín hiệu địa chất, tín hiệu sinh học, dữ liệu thị trường. Phân tích phổ còn được áp dụng cho việc khảo sát các hệ thống như hệ thống lọc. Lọc tín hiệu ra khỏi miền nhiễu dùng DFT và FFT là cách hiệu quả để phát hiện tín hiệu chìm trong nền nhiễu. Ví dụ: một tín hiệu sóng vuông bị chìm trong nhiễu, bề ngoài chúng ta rất khó xác định được chúng. Qua FFT, năng lượng tín hiệu sẽ tập trung ở một số phổ vạch, còn nhiễu thì trải rộng, nhờ đó chúng ta có thể phát hiện ra tín hiệu. * Đáp ứng của sổ Biến đổi Fourier là phương pháp cơ bản để thiết kế các lọc phổ phi đệ quy. Gọi G(Ω) là đáp ứng tần số được yêu cầu và H(Ω): xung của hệ thống. Đối với G(Ω) đáp ứng xung được cho bởi biểu thức Fourier như sau: Xem mạch lọc là thông thấp lý tưởng tức là G(Ω) = 1 khi - Ω C < Ω < Ω C , ngược lại thì G(Ω) = 0. * Độn không Đây là thao tác thực hiện chèn bít 0 vào các thành phần trống của tín hiệu sau khi thực hiện lọc qua cửa sổ. 9 * Nhân chập nhanh Giúp thực hiện nhanh các thao tác tính toán nhân chập trên tín hiệu. * Đáp ứng xung Lưu ý: Đáp ứng xung của hệ thống H là tín hiệu ra h(t), tín hiệu vào là một xung lực đơn vị ∂(t). Vì xung lực ở t=0 nên đáp ứng xung cũng bắt đâu ở t=0. Đáp ứng xung: 2.3. Lý thuyết trải phổ a) Định nghĩa trải phổ Trải phổ là kỹ thuật truyền tín hiệu, được sử dụng rộng rãi trong truyền thông. Trong đó năng lượng của tín hiệu được “trải” trên một băng thông rộng hơn nhiều lần lượng băng thông cần thiết tối thiểu nhờ sử dụng mã giả ngẫu nhiên, mã này độc lập với tín hiệu thông tin. Bên nhận thông tin sẽ tiến hành “giải trải” bằng cách đồng bộ hóa mã giả ngẫu nhiên. Có 4 kiểu trải phổ: • Trải phổ trực tiếp • Nhẩy tần • Nhẩy thời gian • Hệ lai b) Đặc điểm của trải phổ 10 [...]... minh ra chữ ký số để chứng thực một “tài liệu số Đó chính là “bản mã của xâu bít tài liệu Người ta tạo ra chữ ký số (chữ ký điện tử) trên “tài liệu số giống như tạo ra “bản mã của tài liệu với “khóa lập mã Như vậy ký số trên “tài liệu số là ký trên từng bít tài liệu Kẻ gian khó thể giả mạo chữ ký số nếu không biết “khóa lập mã Để kiểm tra một chữ ký số thuộc về một “tài liệu số , người... giải mã - Việc ký số vào x tương ứng với việc mã hóa” tài liệu x - Kiểm thử chữ ký chính là việc giải mã chữ ký , để kiểm tra xem tài liệu đã giải mã có đúng là tài liệu trước khi ký không Thuật toán và khóa kiểm thử chữ ký là công khai, ai cũng có thể kiểm thử chữ ký được - Chữ ký RSA thuộc loại chữ ký khôi phục thông điệp b) Chữ ký Elgamal * Sơ đồ - Tạo cặp khóa (bí mật, công khai) – a,b Chọn số. .. thi chữ ký trên x cũng sẽ dài, như vậy tốn thời gian ký , tốn bộ nhớ lưu giữ chữ ký , tốn thời gian truyền chữ ký trên mạng Người ta dùng hàm băm h để tạo đại diện bản tin z = h(x), nó có độ dài ngắn (ví dụ 128 bit) Sau đó ký trên z, như vậy chữ ký trên z sẽ nhỏ hơn rất nhiều so với chữ ký trên bản tin gốc x + Hàm băm dùng để xác định tính toàn vẹn dữ liệu/ + Hàm băm dùng để bảo mật một số dữ liệu. .. (one-time) trên 1 tài liệu Ví dụ: Chữ ký một lần Lamport c) Phân loại chữ ký theo ứng dụng đặc trưng Chữ ký “mù” (Blind Signature) Chữ ký “nhóm” (Group Signature) 20 Chữ ký “bội” (Multy Signature) Chữ ký “mù nhóm” (Blind Group Signature) Chữ ký “mù bội” (Blind Multy Signature) 4.3 Một số loại chữ ký số a) Chữ ký RSA * Sơ đồ - Tạo cặp khóa (bí mật, công khai) – a,b Chọn bí mật số nguyên tố lớn p, q,... số * Vấn đề 1: Ký số thực hiện trên từng bit tài liệu, nên độ dài của chữ ký số ít nhất cũng bằng độ dài của tài liệu Một số chữ ký trên bản tin có kích thước gấp đôi bản tin gốc Ví dụ khi dùng sơ đồ chữ ký DSS để ký vào bản tin có kích thước 160 bit, thì chữ ký số này sẽ có kích thước 320 bit Trong khi đó trên thực tế, ta cần phải ký vào các bản tin có kích thước rất lớn, ví dụ vài chục MegaByte... chữ ký số a) Phân loại chữ ký theo đặc trưng kiểm tra chữ ký * Chữ ký có thể khôi phục thông điệp Là loại chữ ký, người nhận có thể khôi phục lại được thông điệp đã được ký bởi chữ ký này” Ví dụ: Chữ ký RSA là chữ ký có thể khôi phục thông điệp * Chữ ký không thể khôi phục thông điệp Là loại chữ ký, người nhận không thể khôi phục được thông điệp gốc Ví dụ: Chữ ký Elgamal là chữ ký không khôi phục được... di động (Mobile), miễn là kết nối được vào mạng Đỡ tổn hao thời gian, sức lực và chi phí… Ký số thực hiện trên từng bít tài liệu, nên độ dài của chữ ký số ít nhất cũng bằng độ dài tài liệu Do đó thay vì ký trên tài liệu dài, người ta thường dùng “hàm băm” để tạo “đại diện” cho tài liệu, sau đó mới ký số lên “đại diện” này b) Sơ đồ chữ ký số Sơ đồ chữ ký là bộ 5 (P, A, K, S, V), trong đó: P... loại chữ ký theo mức an toàn * Chữ ký “không thể phủ nhận” Nhằm tránh việc nhân bản chữ ký để sử dụng nhiều lần, tốt nhất là người gửi tham gia trực tiếp vào việc kiểm thử chữ ký Điều đó được thực hiện bằng một giao thức kiểm thử, dưới dạng một giao thức mời hỏi và trả lời Ví dụ: Chữ ký không phủ định (Chaum – van Antverpen) * Chữ ký “một lần” Để đảm bảo an toàn, “khóa ký chỉ dùng 1 lần (one-time) trên. .. “Sơ đồ chữ ký số Ở đây khóa bí mật a dùng làm khóa ký , khóa công khai b dùng làm khóa kiểm tra chữ ký Ngước lại với việc mã hóa, dùng khóa công khai b để lập mã, dùng khóa bí mật a để giải mã Điều này là hoàn toàn tự nhiên, vì ký cần giữ bí mật nên phải dùng khóa bí mật a để ký Còn chữ ký là công khai cho mọi người biết, nên họ dùng khóa công khai b để kiểm tra 4.2 Phân loại chữ ký số a)... là cải biên của sơ đồ chữ ký Elgamal, và được chấp nhận là chuẩn vào năm 1994 để dùng trong một số lĩnh vực giao dịch ở Mỹ Thông thường tài liệu số được mã hóa và giải mã 1 lần Nhưng chữ ký lại liên quan đến pháp luật, chữ ký có thể phải kiểm thử sau nhiều năm đã ký Do đó chữ ký phải được bảo vệ cẩn thận Như vậy số nguyên tố p phải đủ lớn (chẳng hạn dài cỡ 512 bit) để đảm bảo an toàn, nhiều người đề . 2.4835GHz, 5.725-5.85 GHz. 2.4. Chu i giả ngẫu nhiên (PN – Pseudo Noise) Các tín hiệu trải phổ băng thông rộng tựa tạp âm được tao ra bằng các chu i giả ngẫu nhiên. Các chu i này phải được tạo ra. các quan sát bình thường. Chu i m có độ dài cực đại 2 m được xem là chu i giả ngẫu nhiên quan trọng nhất được tạo thành thông qua ghi dịch nối tiếp và các cổng XOR. Chu i này được xác định bằng. thanh nhưng có một bước tiến xa hơn vì có thể sử dụng được những mẫu chung thường xuất hiện ở cả 2 kênh. Do đó độ nén sẽ tốt hơn so với stereo bình thường. II. XỬ LÝ TÍN HIỆU SỐ 2.1. Đại cương về

Ngày đăng: 18/10/2014, 18:17

Xem thêm: BÁO CÁO TIỂU LUẬN MẬT MÃ VÀ AN TOÀN DỮ LIỆU Chữ ký số trên âm thanh số, BÁO CÁO TIỂU LUẬN MẬT MÃ VÀ AN TOÀN DỮ LIỆU Chữ ký số trên âm thanh số

BÁO CÁO TIỂU LUẬN MẬT MÃ VÀ AN TOÀN DỮ LIỆU Chữ ký số trên âm thanh số

Thông tin tài liệu

Từ khóa liên quan

Mục lục

Mục lục

GIỚI THIỆU

TÀI LIỆU THAM KHẢO

Tài liệu cùng người dùng

Tài liệu liên quan