Tìm hiểu, nghiên cứu và ứng dụng một số thuật toán nén tiếng nói

3 412 1
Tìm hiểu, nghiên cứu và ứng dụng một số thuật toán nén tiếng nói

Đang tải... (xem toàn văn)

Thông tin tài liệu

Tìm hiểu, nghiên cứu và ứng dụng một số thuật toán nén tiếng nói Nguyễn Như Hiền Trường Đại học Công nghệ. Đại học Quốc gia Hà Nội Luận văn ThS. Công nghệ Thông tin : 60 48 05 Người hướng dẫn : GS. TS. Nguyễn Văn Xuất Năm bảo vệ: 2013 61 tr . Abstract.Trình bày những vấn đề lý thuyết làm cơ sở cho các chương sau như nén dữ liệu, Zero Crossing, phép biến đổi Cosine, phép biến đổi Wavelet Haar, hệ số tương quan Peason. Trình bày cơ sở lý thuyết về âm thanh, tiếng nói và nhận dạng tiếng nói. Trình bày các phương pháp số hóa âm thanh, tiếng nói. Xây dựng ứng dụng để nhận dạng tiếng Việt, trình bày cách lấy đặc trưng tiếng nói, kỹ thuật nén các đặc trưng và thử áp dụng cho bài toán nhận dạng tiếng nói các từ đơn tiếng Việt. Keywords.Hệ thống thông tin; Nhận dạng tiếng nói; Âm thanh số; Thuật toán nén tiếng nói Content. Tiếng nói là một phương tiện trao đổi thông tin tiện ích vốn có của còn người. Ước mơ về những “máy nói”, “máy hiểu tiếng nói” đã không chỉ xuất hiện từ những câu truyện khoa học viễn tưởng xa xưa mà còn là động lực thôi thúc của nhiều chuyên gia nghiên cứu trên thế giới. Hiện nay, nhiều thành tựu tiên tiến đã được đưa vào ứng dụng trong cuộc sống. Tuy vậy, việc có được một “máy nói” mang tính tự nhiên (về giọng điệu, phát âm, …) cũng như một “máy hiểu tiếng nói” thực sự cho đến nay vẫn còn xa với mong muốn và yêu cầu thực tế của con người. Cùng với xu thế phát triển của khoa học công nghệ ngày càng thúc đẩy việc hoàn thiện hơn nữa công nghệ để có thể đạt được mục tiêu của con người về lĩnh vực xử lý tiếng nói. Chính vì thế, việc nắm bắt được các kỹ thuật cơ bản cũng như các công nghệ tiên tiến cho việc xử lý tiếng nói là thực sự cần thiết cho việc xây dựng các ứng dụng xử lý tiếng nói. Với mục đích đó, luận văn đã tập trung vào việc tìm hiểu, nghiên cứu và tìm kiếm các đặc trưng của tiếng nói phục vụ cho việc nhận dạng.Trên cơ sở các kết quả nghiên cứu luận văn xây dựng ứng dụng để kiểm tra, đánh giá các đặc trưng.Với mục đích trên, không làm giảm ý nghĩa của nội dung nghiên cứu, luận văn đã chọn tiếng Việt để thử nghiệm. Luận văn gồm các chương sau: Chương 1: Cơ sở toán học của luận văn Chương này trình bày những vấn đề lý thuyết làm cơ sở cho các chương saunhư nén dữ liệu, Zero Crossing, phép biến đổi Cosine, phép biến đổi Wavelet Haar, hệ số tương quan Peason Chương 2: Âm thanh, tiếng nói và nhận dạng tiếng nói Chương này trình bày cơ sở lý thuyết về âm thanh, tiếng nói và nhận dạng tiếng nói. Chương 3: Số hóa âm thanh Chương này trình bày các phương pháp số hóa âm thanh, tiếng nói. Chương 4: Xây dựng ứng dụng để nhận dạng tiếng Việt Chương này trình bày cách lấy đặc trưng tiếng nói, kỹ thuật nén các đặc trưng và thử áp dụng cho bài toán nhận dạng tiếng nói các từ đơn tiếng Việt. TÀI LIỆU THAM KHẢO Tiếng Việt 1. Nguyễn Quang Hoan (2006), Xử lý ảnh, Học viện Công nghệ Bưu chính Viễn thông, tr.99-103. 2. Nguyễn Thị Thanh Hà (2009), Watermarking dùng Wavelets đối với ảnh số, Luận văn thạc sĩ ngành Vật lý vô tuyến và Điện tử hướng kỹ thuật, Đại học Khoa học Tự nhiên, Đại học Quốc gia Thành phố Hồ Chí Minh, tr.38-44. 3. Nguyễn Văn Xuất (2006), Mutilmedia, (Cấu trúc file wave), Học viện Kỹ thuật quân sự. 4. Trần Anh Tuấn(6/2012),Sử dụng điểm cắt zero để nén và giải nén dữ liệu âm thanh, tạp chí khoa học Đại học Cần Thơ, tr.36-39. Tiếng Anh 5. HarmanpreetKaur, RamanpreetKaur (July-August 2012), “Speech compression and decompression using DCT and DWT”, International Journal Computer Technology &Applications,Vol (3), Issue (4), pp.1501- 1503. 6. M.V.Patil, Apoorva Gupta, Ankita Varma, Shikhar Salil (2013), “Audio and Speech Compression Using DCT and DWT Techniques”,International Journal of Innovative Research in Science, Engineering and Technology,Vol.(2), Issue (5), pp.1715-1718. 7. Musawir Ali, An Introduction to Wavelets and the Haar Transform,(http://www.cs.ucf.edu/~mali/haar/) School of Electrical Engineering and Computer Science. 8. O. Rioul and M. Vetterli (Oct. 1991), “Wavelets and Signal Processing”, IEEE Signal Process, Mag, Vol (8), pp.14-38. 9. David Salomon (2004), Data Compression The Complete Reference,Springer, New York. 10. Scott Wilson (Jan 20, 2003), WAVE PCM soundfile format, (https://ccrma.stanford.edu/courses/422/projects/WaveFormat/)Stanford University. . pháp số hóa âm thanh, tiếng nói. Xây dựng ứng dụng để nhận dạng tiếng Việt, trình bày cách lấy đặc trưng tiếng nói, kỹ thuật nén các đặc trưng và thử áp dụng cho bài toán nhận dạng tiếng nói. Tìm hiểu, nghiên cứu và ứng dụng một số thuật toán nén tiếng nói Nguyễn Như Hiền Trường Đại học Công nghệ. Đại học. luận văn đã tập trung vào việc tìm hiểu, nghiên cứu và tìm kiếm các đặc trưng của tiếng nói phục vụ cho việc nhận dạng.Trên cơ sở các kết quả nghiên cứu luận văn xây dựng ứng dụng để kiểm tra,

Ngày đăng: 25/08/2015, 12:19

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan