luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng

68 261 0
luận văn thạc sĩ tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN THÙY DƯƠNG TÌM KIẾM ÂM NHẠC TRÊN CƠ SỞ NỘI DUNG VÀ ỨNG DỤNG LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2012 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn i MỤC LỤC Trang MỤC LỤC i LỜI CẢM ƠN ii DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT iii MỞ ĐẦU 1 CHƢƠNG I 4 TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU ÂM THANH 4 1.1. Cơ sở dữ liệu đa phƣơng tiện 4 1.1.1. Một số khái niệm cơ bản 4 1.1.2. Hệ thống quản trị cơ sở dữ liệu đa phƣơng tiện (MMDBMS) 5 1.1.3. Truy tìm thông tin 7 1.2. Quá trình chung thiết kế cơ sở dữ liệu âm thanh. 7 1.2.1. Giới thiệu chung về cơ sở dữ liệu âm thanh. 7 1.2.2. Mô hình tổng quát của dữ liệu âm thanh 8 1.2.3. Quá trình chung để phát triển một cơ sở dữ liệu âm thanh 14 CHƢƠNG 2 15 KỸ THUẬT TÌM KIẾM TRONG CƠ SỞ DỮ LIỆU ÂM NHẠC 15 2.1. Kỹ thuật phân loại âm thanh thành âm nhạc, tiếng nói, tiếng động. 16 2.1.1. Âm thanh 16 2.1.2. Đặc trƣng chính của âm thanh 22 2.1.3. Phân lớp âm thanh. 39 2.2. Một số thuật toán trích chọn đặc trƣng âm nhạc. 45 2.2.1. Đặc trƣng của âm nhạc 45 2.2.2. Một số lớp âm nhạc 45 2.2.3. Chỉ số hóa và truy tìm âm nhạc. 49 CHƢƠNG 3. 53 ỨNG DỤNG KỸ THUẬT TÌM KIẾM ÂM NHẠC TRONG GIẢNG DẠY 53 3.1. Cài đặt thử nghiệm hệ thống tìm kiếm âm nhạc 53 3.2. Mô hình hệ thống 54 3.3. Các tham số thực nghiệm 54 3.4. Một số chức năng của chƣơng trình 55 3.5. Kết quả thực nghiệm 56 KẾT LUẬN 57 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ii LỜI CẢM ƠN Để hoàn thành chƣơng trình cao học và viết luận văn này, tôi đã nhận đƣợc sự hƣớng dẫn, giúp đỡ và góp ý nhiệt tình của quý thầy cô trƣờng Đại học Công nghệ thông tin - Truyền thông, Đại học Thái Nguyên. Trƣớc hết, tôi xin chân thành cảm ơn đến quí thầy cô trƣờng Đại học Công nghệ thông tin - Truyền thông, đặc biệt là những thầy cô đã tận tình dạy bảo cho tôi suốt thời gian học tập tại trƣờng. Tôi xin gửi lời biết ơn sâu sắc đến thầy giáo PGS.TS. Đặng Văn Đức ngƣời đã dành rất nhiều thời gian, tâm huyết và sự tận tình giúp đỡ, hƣớng dẫn cho tôi trong suốt quá trình nghiên cứu và giúp tôi hoàn thành luận văn này. Nhân đây, tôi xin chân thành cảm ơn Ban Giám hiệu trƣờng Cao đẳng Văn hóa nghệ thuật Việt Bắc cùng đồng nghiệp trong Phòng Đào tạo & nghiên cứu khoa học đã tạo rất nhiều điều kiện để tôi học tập và hoàn thành tốt khóa học. Đồng thời, tôi cũng xin cảm ơn quí anh, chị và ban lãnh đạo khoa Âm nhạc, phòng thu thanh của trƣờng cao đẳng Văn hóa nghệ thuật Việt Bắc… đã tạo điều kiện cho tôi điều tra khảo sát để có dữ liệu viết luận văn. Mặc dù tôi đã có nhiều cố gắng hoàn thiện luận văn bằng tất cả sự nhiệt tình và năng lực của mình, tuy nhiên không thể tránh khỏi những thiếu sót, rất mong nhận đƣợc những đóng góp quí báu của quí thầy cô và các bạn. Thái Nguyên, ngày tháng năm 2012 Học viên Nguyễn Thùy Dƣơng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn iii DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT Stt Ký hiệu Tên đầy đủ Ý nghĩa 1 ADC Analog - to – Digital Conversion Chuyển đổi tƣơng tự số hóa 2 ASR Automatic Speech Recognition Tự động nhận dạng tiếng nói 3 API Application Programming Interface Giao diện lập trình ứng dụng 4 DAC Digital – to – Analog Conversion Chuyển đổi số hóa tƣơng tự 5 DBMS DataBase Management System Hệ quản trị cơ sở dữ liệu 6 DCT Discrete Cosine Transform Biến đổi cosin rời rạc 7 DFT Discrete Fourier Transform Biến đổi Fourier rời rạc 8 HMM Hidden Markov Model Mô hình Markov ẩn 9 HZCRR High Zero- Crossing Rate Ratio Tỷ lệ tốc độ vƣợt qua 0 cao 10 IDFT Inverse Discrete Fourier Transform Biến đổi Fourier liên tục 11 IR Information Retrieval Truy tìm thông tin 12 MARS Multimedia Analysis and Retrieval System Hệ thống chỉ mục và phân tích đa phƣơng tiện 13 MIDI Musical Instrument Digital Interface Giao diện số cho nhạc cụ 14 MIRS Multimedia Indexing and Retrieval System Hệ thống chỉ mục và truy tìm thông tin đa phƣơng tiện Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn iv 15 MMDBMS MultiMedia DataBase Management System Hệ quản trị cơ sở dữ liệu đa phƣơng tiện 16 ORDBMS Open relation DataBase Management System Hệ quản trị cơ sở dữ quan hệ - mở rộng 17 SR Silence Ratio Tỷ lệ câm 18 SNR Signal-to-noise ratio Tỷ lệ nhiễu tín hiệu 19 STFT Short Time Fourier Transform Biến đổi Fourier thời gian ngắn 20 ZCR Zero Crossing Rate Tốc độ vƣợt qua 0 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 1 MỞ ĐẦU Nghị quyết Trung ƣơng II khoá VIII đã đặt ra phƣơng châm chiến lƣợc cho ngành giáo dục là phải: "Đổi mới phƣơng pháp giáo dục đào tạo, khắc phục lối truyền thụ một chiều, rèn luyện nếp tƣ duy sáng tạo của ngƣời học, từng bƣớc áp dụng phƣơng pháp tiên tiến và phƣơng tiện hiện đại vào quá trình dạy học". Ứng dụng công nghệ thông tin vào dạy học đang dần dần đƣợc thực hiện ngày càng nhiều trên bục giảng. Việc thiết kế giáo án và giảng dạy trên máy tính bằng những đoạn phim minh hoạ với hình ảnh, âm thanh sống động, bài giảng sẽ thực sự gây sự chú ý và tạo hứng thú học tập cho học sinh-sinh viên. Trong điều kiện hiện nay tài liệu dạy âm nhạc bằng sự hỗ trợ của CNTT ở nƣớc ta còn nhiều hạn chế, việc tìm ra các giải pháp ứng dụng phần mềm CNTT vào dạy học âm nhạc là yêu cầu cần thiết nhằm góp phần đổi mới phƣơng pháp dạy học cho bộ môn này. Ứng dụng CNTT trong dạy học Âm nhạc ở các trƣờng Đại học – cao đẳng và các trƣờng phổ thông là việc làm tất yếu, giúp cho giảng viên, giáo viên âm nhạc chủ động có những bài soạn mang tính hiện đại và tạo ra đƣợc những tài liệu học tập, tham khảo phong phú cho sinh viên mang tính trực quan sinh động, tạo đƣợc hứng thú học tập cho học sinh. Trên thị trƣờng hiện nay có rất nhiều phần mềm dùng để soạn nhạc, hoà âm, phối khí thu âm, xử lý, biên tập âm thanh, v.v… Các phần mềm đều có lĩnh vực ứng dụng nhất định có tính chuyên biệt khá rõ nét nhƣng nhìn chung khi sử dụng đều có đặc điểm tƣơng đối giống nhau nên việc sử dụng cũng khá dễ dàng. Việc lựa chọn sử dụng cần phải đáp ứng yêu cầu sau: - Lựa chọn những phần mềm đáp ứng nội dung bài dạy, tiết dạy. - Có kỹ năng sử dụng và khai thác phần mềm. - Dễ phổ cập, phù hợp với điều kiện kỹ thuật của địa phƣơng. Ngày nay, việc chia sẻ các bài hát bản nhạc trên internet đã trở nên phổ biến. Thực tế đó cũng mở ra một nhu cầu truy cập vào những thƣ viện âm thanh khổng lồ. Nhu cầu đó đòi hỏi một công nghệ tìm kiếm hiệu quả để tổ chức, sắp xếp, truy tìm Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 2 các nội dung âm thanh, cũng nhƣ có thể xử lý hàng trăm tỷ trang web hỗn độn trên mạng và các thiết bị lƣu trữ trên các máy tính cá nhân. Hiện nay, một số hãng tìm kiếm khổng lồ trên mạng nhƣ Yahoo, Google hay You Tube đang triển khai các hoạt động nghiên cứu theo cách tìm kiếm theo nội dung thay vì từ khóa. Ngƣời dùng chỉ cần gõ những từ hoặc cụm từ liên quan đến bài hát và Yahoo sẽ liệt kê một danh sách các file âm thanh, cho phép khách hàng nghe trực tuyến. Công cụ tìm kiếm âm nhạc này hoạt động dựa trên khả năng đọc nội dung đƣợc nhúng trong tệp âm thanh, còn đƣợc gọi là metadata, để phân loại kết quả tìm kiếm. Trong những năm qua ở Việt Nam, các công cụ tìm kiếm dữ liệu đa phƣơng tiện, trong đó các công cụ tìm kiếm và nhận dạng dữ liệu âm thanh đã dần đƣợc chú ý. Ví dụ, phòng nhận dạng và công nghệ tri thức- Viện công nghệ thông tin đã giới thiệu một số sản phẩm phần mềm có ý nghĩa thực tế rất cao nhƣ: tổng hợp và xử lý ngôn ngữ tiếng Việt, nghiên cứu và tiếp cận các kỹ thuật mới của công nghệ tổng hợp và nhận dạng tiếng nói trên thế giới để áp dụng trong hoàn cảnh Việt nam và âm thanh tiếng Việt, nghiên cứu các phƣơng pháp xử lý tín hiệu số và tín hiệu tiếng nói, các phƣơng pháp tìm đặc trƣng âm thanh. Các sản phẩm nêu trên đã đáp ứng đƣợc phần nào nhu cầu tìm kiếm và nhận dạng dữ liệu âm thanh. Tuy nhiên, các công trình nghiên cứu về tìm kiếm âm thanh theo nội dung vẫn còn hiếm hoặc chƣa tƣơng xứng với tầm quan trọng của nó trong hiện tại và tƣơng lai. Đặc biệt sử dụng các phần mềm này cho công việc giảng dạy âm nhạc tại các trƣờng còn chƣa đáp ứng đƣợc nhu cầu thực tế, thay vì phấn trắng bảng đen truyền thống, giáo viên chỉ click chuột, vài giây sau trên màn hình hiện ra ngay nội dung, âm thanh của bản nhạc. Ứng dụng công nghệ thông tin trong dạy học âm nhạc đang dần dần đƣợc thực hiện ngày càng nhiều trên bục giảng các trƣờng đào tạo nghệ thuật. Nhạc sĩ Hoàng Lân nhận xét rằng từ trƣớc đến nay, bộ môn âm nhạc ”dạy chay” nhiều, ít lôi cuốn đƣợc học sinh. Nếu việc ứng dụng CNTT vào trong dạy học đƣợc thực hiện có hiệu quả trong các trƣờng, sẽ dẫn đến sự thay đổi lớn lao về PPDH nhằm cung cấp Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 3 những tƣ liệu âm nhạc một cách khoa học, phong phú, toàn diện mà còn tác động tích cực đến thẫm mỹ, đến tƣ duy nhận thức của học sinh… Mặt khác, việc hiểu biết sâu sắc về âm thanh cũng nhƣ các khái niệm, thuật toán liên quan sẽ giúp ta ứng dụng và xây dựng các hệ thống tìm kiếm âm thanh phù hợp, hiệu quả hơn. Xuất phát từ những vấn đề nêu trên, luận văn đã tập trung nghiên cứu về vấn đề "Tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng". Cấu trúc của luận văn nhƣ sau: Chƣơng 1: Tổng quan về cơ sở dữ liệu âm thanh Chƣơng 2: Kỹ thuật tìm kiếm cơ sở dữ liệu âm thanh Chƣơng 3: Ứng dụng kỹ thuật tìm kiếm âm nhạc trong giảng dạy Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 4 CHƢƠNG I TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU ÂM THANH Ngày nay, với sự phát triển vƣợt bậc của khoa học kỹ thuật, sự bùng nổ của dữ liệu đặc biệt là dữ liệu media, nhu cầu thƣởng thức âm nhạc của con ngƣời ngày càng phong phú, đa dạng dẫn đến một nhu cầu rất thực tế đó là nhu cầu tìm kiếm thông tin về âm nhạc. Hầu hết các hệ thống tìm kiếm âm nhạc hiện tại đều dựa trên chỉ mục. Cơ sở dữ liệu dựa trên chỉ mục bộc lộ nhiều nhƣợc điểm nhƣ: tìm kiếm thông tin không chính xác, không tìm đƣợc dữ liệu khi ngƣời dùng không nhớ chính xác thông tin đầu vào, hay chỉ nhớ đƣợc giai điệu, nội dung bài hát. Tìm kiếm âm nhạc theo nội dung là một lĩnh vực nghiên cứu mới và đƣợc nhiều nhà nghiên cứu quan tâm. Hiện có một số phƣơng thức đã đƣợc áp dụng tìm kiếm âm nhạc theo nội dung. Ghias, Logan, Chamberlin và Smith đã đƣa ra phƣơng thức tƣơng tự và sử dụng đầu vào nhƣ một truy vấn. Trong thí nghiệm vào năm 2001, M.Goto đã thu đƣợc kết quả tốt khi các nhà nghiên cứu tiến hành một cuộc thử nghiệm tính toán ƣớc lƣợng MAP sử dụng thuật toán EM. Tuy nhiên, theo kết quả nghiên cứu của Beth Logan thì các phƣơng pháp tìm kiếm âm nhạc theo nội dung hiện nay vẫn chƣa đảm bảo đƣợc cả độ chính xác và thời gian tính toán, đặc biệt khi tìm kiếm giai điệu của các bản nhạc 1.1. Cơ sở dữ liệu đa phƣơng tiện. 1.1.1. Một số khái niệm cơ bản  Loại media và Multimedia Media Media (tiếng Latin: medius – means, intermediary) là đề cập đến các loại thông tin hay loại trình diễn thông tin nhƣ dữ liệu văn bản, ảnh, âm thanh và video. Phân loại media: Có nhiều cách phân loại, nhƣng cách chung nhất là phân loại trên cơ sở khuôn mẫu (format) vật lý hay các quan hệ media với thời gian. Tài Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 5 liệu này phân lớp media dựa trên cơ sở là chúng có chiều thời gian hay không. Qui định này dẫn tới hai lớp media: static và dynamic.  Static media: Không có chiều thời gian, nôi dung và ý nghĩa của chúng không phụ thuộc vào thời gian trình diễn. Media tĩnh bao gồm dữ liệu văn bản, đồ họa.  Dynamic media: Có chiều thời gian, ý nghĩa và độ chính xác của chúng phụ thuộc vào tốc độ trình diễn. Dynamic media bao gồm annimation, video, audio. Media động phụ thuộc chặt chẽ vào tốc độ trình diễn. Thí dụ để cảm nhận chuyển động trơn tru, video phải đƣợc trình chiếu với tốc độ 25 frame/sec (hay 30 frame/sec phụ thuộc vào loại hệ thống video). Tƣơng tự, khi ta play tiếng nói, âm nhạc, chúng chỉ đƣợc cảm nhận tự nhiên khi đạt đƣợc tốc độ nhất định, nếu không chúng làm giảm chất lƣợng và ý nghĩa âm thanh. Vì các media này phải đƣợc trình diễn liên tục và ở tốc độ cố định cho nên chúng còn đƣợc gọi là media liên tục. Hay còn gọi chúng là media đẳng thời (isochronous media) vì quan hệ giữa các đơn vị media và thời gian là cố định. Multimedia Khái niệm multimedia (tiếng Latin: multus- numerous) đề cập đến tập hợp các kiểu media sử dụng chung, trong đó ít nhất có một kiểu media không phải là văn bản (nói cách khác là ít nhất có một media trong đó là ảnh, audio hay video). Trong tài liệu này sử dụng multimedia nhƣ tính từ: thông tin đa phƣơng tiện, dữ liệu đa phƣơng tiện, hệ thống đa phƣơng tiện, truyền thông đa phƣơng tiện, ứng dụng đa phƣơng tiện, Dữ liệu đa phƣơng tiện đề cập đến đại diện các kiểu media khác nhau mà máy tính có thể đọc đƣợc. Thông tin đa phƣơng tiện đề cập đến thông tin kiểu media truyền đạt. Đôi khi khái niệm dữ liệu đa phƣơng tiện và thông tin đa phƣơng tiện sử dụng thay thế cho nhau. Multimedia hay media item (hay còn gọi object) là thực thể tự trị trong hệ thống chỉ mục và truy tìm thông tin đa phƣơng tiện (MIRS – Multimedia Indexing and Retrieval System) mà nó có thể đƣợc truy vấn, tìm kiếm và trình diễn. 1.1.2. Hệ thống quản trị cơ sở dữ liệu đa phƣơng tiện (MMDBMS) Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn [...]... thanh dựa trên cơ sở tiêu đề và tên tệp Do tên tệp và mô tả văn bản là không đầy đủ và chủ quan cho nên việc tìm ra đoạn âm thanh thỏa mãn ngƣời sử dụng là rất khó khăn Thêm nữa, kỹ thuật truy tìm này không hỗ trợ câu truy vấn nhƣ tìm đoạn âm thanh tƣơng tự đoạn đang nghe” Để giải quyết vấn đề này, các kỹ thuật truy tìm âm thanh trên cơ sở nội dung là cần thiết Truy tìm âm thanh trên cơ sở nội dung đơn... trúc chỉ mục Thiết kế các giải thuật tìm kiếm hiệu quả Trên đây là toàn bộ nội dung phần tổng quan về cơ sở dữ liệu âm thanh Để tìm hiểu kỹ hơn về dữ liệu âm thanh, chúng ta đi tìm hiểu các kỹ thuật tìm kiếm trong cơ sở dữ liệu âm thanh Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 15 CHƢƠNG 2 KỸ THUẬT TÌM KIẾM TRONG CƠ SỞ DỮ LIỆU ÂM NHẠC Audio số đƣợc biểu diễn nhƣ trình... giản nhất sử dụng so sánh mẫu với mẫu giữa câu truy vấn và đoạn âm thanh lƣu trữ Cách tiệm cận tổng quát của truy tìm và chỉ số hóa âm thanh trên cơ sở nội dung:  Âm thanh đƣợc phân lớp thành vài loại chung nhƣ âm thanh tiếng nói, âm nhạc và nhiễu  Các loại âm thanh khác nhau đƣợc xử lý và chỉ mục theo các cách khác nhau Thí dụ, nếu âm thanh là tiếng nói, nhận dạng tiếng nói đƣợc áp dụng và tiếng nói... cũng đƣợc sử dụng lại ở đây Phần lớn CSDL âm thanh đang tồn tại sử dụng lƣợc đồ chỉ số hoá trên cơ sở metadata Nội dung âm thanh trên cơ sở tín hiệu Sử dụng metadata là tin cậy và đƣợc khuyến cáo khi có cách tạo ra metadata Thí dụ, nếu ta tạo ra CSDL âm thanh của đài phát thanh hay ghi âm nhạc, thì hầu nhƣ không có vấn đề khi tạo ra metadata Tuy nhiên, trong ứng dụng khác, nhƣ cảnh sát nghe trộm điện... tiếng nói đƣợc chỉ mục trên cơ sở từ nhận dạng đƣợc  Truy vấn các đoạn âm thanh là phân lớp tƣơng tự, xử lý và chỉ số hóa  Các đoạn âm thanh đƣợc truy tìm trên cơ sở tính tƣơng đồng giữa chỉ mục truy vấn và chỉ mục âm thanh trong CSDL Bƣớc phân lớp âm thanh là quan trọng Trƣớc hết, loại âm thanh khác nhau đòi hỏi xử lý khác nhau và các kỹ thuật chỉ mục khác nhau Thứ hai, loại âm thanh khác nhau có... 1.1.3 Truy tìm thông tin Truy tìm thông tin- Information Retrieval (IR) là kỹ thuật tìm kiếm thông tin đƣợc lƣu trữ trên máy tính Đối với dữ liệu đa phƣơng tiện, việc truy tìm thông tin hiệu quả là dựa trên tìm kiếm tƣơng tự Hệ thống lƣu trữ một tập các đối tƣợng đa phƣơng tiện trong cơ sở dữ liệu Ngƣời dùng đƣa ra các truy vấn, và hệ thống tìm ra các đối tƣợng tƣơng tự truy vấn trong cơ sở dữ liệu... nói và âm nhạc Có thể thấy rằng trọng tâm HZCRR của giọng nói phân bổ trong khoảng 0,15; trong khi HZCRR của âm nhạc là dƣới 0,1 Hình 2.7 minh họa mức biến đổi HZCRR của tín hiệu giọng nói (a) và tín hiệu âm nhạc (b)  Tỷ lệ câm (Silence Ratio- SR) Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 26 Tỷ lệ câm (SR) cho biết kích thƣớc của đoạn âm thanh câm Khi phát âm thì... trình truy tìm Phân lớp âm thanh dựa trên một số đặc trƣng khách quan và chủ quan 2.1 Kỹ thuật phân loại âm thanh thành âm nhạc, tiếng nói, tiếng động 2.1.1 Âm thanh  Tính chất cơ bản của tín hiệu âm thanh Khi tần số dao động của không khí đạt mức từ 20 đến 20000 Hz thì tai ngƣời có thể nghe thấy âm thanh Tham số khác đƣợc sử dụng để đo âm thanh là biên độ Biên độ biến đổi làm âm thanh êm nhẹ hay ầm... giữa các âm tiết) trong khi âm nhạc không có cấu trúc này Do đó, sự biến thiên ZCR của tín hiệu giọng nói thƣờng lớn hơn so với tín hiệu âm nhạc, x em hình minh họa dƣới đây Hình 2.6 minh họa ZCR của nhạc và ZCR của giọng nói ZCR đƣợc sử dụng phổ biến trong các giải thuật để phân lớp giọng nói và âm nhạc Một nghiên cứu của LieLu, Hong-Jang Zhang và Hao Jiang [4] mới đây đã Số hóa bởi Trung tâm Học liệu... màu, kết cấu ) 1.2 Quá trình chung thiết kế cơ sở dữ liệu âm thanh 1.2.1 Giới thiệu chung về cơ sở dữ liệu âm thanh Các tín hiệu âm thanh là loại hàm phân tích liên tục Chúng ta sẽ khảo sát việc nén dữ liệu âm thanh thành biểu diễn rời rạc và chỉ số hoá nội dung của chúng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 8 Các dữ liệu âm thanh thông thƣờng là dạng sóng liên . " ;Tìm kiếm âm nhạc trên cơ sở nội dung và ứng dụng& quot;. Cấu trúc của luận văn nhƣ sau: Chƣơng 1: Tổng quan về cơ sở dữ liệu âm thanh Chƣơng 2: Kỹ thuật tìm kiếm cơ sở dữ liệu âm thanh. điệu, nội dung bài hát. Tìm kiếm âm nhạc theo nội dung là một lĩnh vực nghiên cứu mới và đƣợc nhiều nhà nghiên cứu quan tâm. Hiện có một số phƣơng thức đã đƣợc áp dụng tìm kiếm âm nhạc theo nội. thanh trên cơ sở nội dung đơn giản nhất sử dụng so sánh mẫu với mẫu giữa câu truy vấn và đoạn âm thanh lƣu trữ. Cách tiệm cận tổng quát của truy tìm và chỉ số hóa âm thanh trên cơ sở nội dung:

Ngày đăng: 03/10/2014, 23:10

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan