Khoá luận tốt nghiệp áp dụng thuật toán k nearest neighbor để phân loại nhạc theo thể loại

50 1.1K 5
Khoá luận tốt nghiệp áp dụng thuật toán k nearest neighbor để phân loại nhạc theo thể loại

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC sư PHẠM HÀ NỘI • • • • KHOA CÔNG NGHỆ THÔNG TIN NGUYỄN LAN HƯƠNG ÁP DỤNG THUẬT TOÁN K - NEAREST NEIGHBOR ĐẺ PHÂN LOẠI NHẠC THEO THẺ LOẠI • •• KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC • ••• Chuyên ngành: Khoa học máy tính TRƯỜNG ĐẠI HỌC sư PHẠM HÀ NỘI • • • • KHOA CÔNG NGHỆ THÔNG TIN NGUYỄN LAN HƯƠNG HÀ NỘI 2015 ÀP DỤNG THUẬT TOAN K - NEAREST NEIGHBOR ĐẺ PHÂN LOẠI NHẠC THEO THẺ LOẠI • •• KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC • ••• Chuyên ngành: Khoa học máy tính Người hướng dẫn khoa học PGS. TS. BÙI THẾ HỒNG Lời em xin chân thành cảm ơn hướng dẫn tận tình thầy giáo PGS. TS. BÙI THẾ HỒNG trực tiếp hướng dẫn bảo tận tình cho em hoàn thành khóa luận này. Em xin chân thành cảm ơn thầy , cô giáo khoa Công nghệ Thông tin, thầy cô giáo trường giảng dạy giúp đỡ em năm học vừa qua . Chinh thầy, cô giáo xây dựng cho chúng em kiến thức tảng kiến thức chuyên môn để em có HÀ NỘI 2015 thể hoàn thành khóa luận tốt nghiệp chuẩn bị cho công việc sau này. Cuối em xin bày tỏ lòng biết ơn tói gia đình bạn bè giúp đỡ động viên em nhiều suốt trình học tập để em thực tốt khóa luận này. Do kiến thức thòi gian hạn chế nên khóa luận không tránh khỏi thiếu sót. Kính mong nhận đóng góp ý kiến thầy cô bạn để khóa luận hoàn thiện hơn. Hà Nội, tháng 05 năm 2015 Sinh viên Nguyễn Lan Hương Tên em là: NGUYỄN LAN HƯƠNG Sinh viên lớp : K37 - CNTT, khoa Công nghệ Thông tin , trường Đại học sư phạm Hà Nội 2. Em xin cam đoan: 1. Đề tài: “Áp dụng thuật toán K - Nearest Neighbor để phân loại nhạc theo thể loại” nghiên cứu riêng em , hướng dẫn thầy giáo PGS. TS. Bùi Thế Hồng. HÀ NỘI 2015 2. Khóa luận hoàn toàn không chép tác giả khác. Nếu sai em xin hoàn toàn chịu trách nhiệm. Hà Nội, tháng 05 năm 2014 Người cam đoan Nguyễn Lan Hương HÀ NỘI 2015 MỤC LỤC DANH MỤC HÌNH • Mở đầu 1. Lí chon đề tài Trong năm gần đây, với bùng nổ công nghệ thông tin định dạng nén đời, làm cho việc sở hữu nhạc trở nên dễ dàng hết. Kéo theo gia tăng nhu cầu sưu tập nhạc số cá nhân hay tổ chức. Như biết, vói số lượng lớn nhạc sưu tầm việc sưu tầm nhạc tiến hành từ nhiều nguồn, vói nhiều nguồn chất lượng âm khác nhau, thông tin nhạc tải có mức độ xác khác nhau, nên việc phân loại nhạc dựa vào thông tin lưu giữ tập tin lưu trữ gặp nhiều hạn chế. Thay dựa vào thông tin có sẵn, người sưu tầm nghe lại tự phân loại chúng, nhiên với số lượng lớn nhạc việc làm không khả thi. Điều làm nảy sinh nhu cầu tự động phân loại nhạc hệ thống lưu trữ âm nhạc. Các hệ thống tự động phân loại nhạc cần thiết, hỗ trợ thay ngưòi việc phân loại nhạc, truy tìm thông tin nhạc internet, . Bên cạnh đó, việc phân loại nhạc tự động cung cấp sở khoa học cho việc phân tích dựa nội dung tín hiệu âm nhạc. Chính lý trên, cộng vói kiến thức tìm hiểu từ môn Trí tuệ nhân tạo, em chọn đề tài "Áp dụng thuật toán K-Nearest Neighbor để phân loại nhạc theo thể loại" làm đề tài khóa luận. 2. Mục đích nghiên cứu Dựa vào thuật toán K-nearest neighbor để phân loại nhạc theo thể loại. 3. Nhiệm vụ nghiên cứu + Thu thập đặc trưng thể loại nhạc. + Xác định khoảng cách vetor đặc trưng tín hiệu cần phân loại với vetor đặc trưng láng giềng gần nó. Từ xác định thể loại nhạc dựa vào thể loại nhạc vetor gần nhất. + Xây dựng chương trình đánh giá kết phân loại. 4. Đối tượng nghiên cứu Nghiên cứu với 10 thể loại nhạc: Blues, Classical, Country, Disco, Hiphop, Jazz, Metal, Pop, Regguage, Rock. 5. Phạm vỉ nghiên cứu Các đặc trưng chung riêng 10 thể loại nhạc chọn nghiên cứu. 6. Ý nghĩa kha học ý nghĩa thực tiễn đề tài Phân loại nhạc tự động sở khoa học cho việc phân tích tín hiệu audio. Việc sử dụng thuật toán K - Nearest Neighbor để phân loại nhạc theo thể loại, rút ngắn thòi gian thực mang lại kết xác cao. Các hệ thống phân loại nhạc tự động cần thiết, hỗ trợ thay người việc sưu tập nhạc, truy tìm thông tin internet, . Bên cạnh đó, cung cấp đặc trưng quan trọng tín hiệu audio phục vụ cho hệ thống truy tìm thông tin, thích tự động tập tin nhạc, nhận dạng giọng nói phục vụ điều tra, . 7. Phương pháp nghiên cứu + Phương pháp nghiên cứu lí luận: Nghiên cứu qua việc đọc sách, báo tài liệu liên quan nhằm xây dựng sở lý thuyết đề tài biện pháp cần thiết để giải vấn đề đề tài. + Phương pháp thực nghiệm: Thông qua quan sát thực tế, yêu cầu sở, lý luận nghiên cứu kết đạt qua phương pháp trên. + Phương pháp chuyên gia: Tham khảo ý kiến chuyên gia để thiết kế chương trình phù họp với yêu cầu thực tiễn. Nội dung xử lý nhanh đáp ứng yêu cầu ngày cao người sử dụng 8. Cấu trúc khóa luận Ngoài phần mở đầu, kết luận phương hướng phát triển cấu trúc khóa luận gồm có chương sau: Chương 1: Cơ sở lí thuyết. Chương 2: Thuật toán K- Nearest Neighbor để phân loại nhạc theo thể loại. Chương 3: Xây dựng ứng dụng phân loại nhạc theo thể loại. CHƯƠNG 1. Cơ SỞ LÝ THUYẾT 1.1. Lịch sử hệ thống xử lí âm Trước Pythagoras, âm nhạc xem khái niệm thần bí. Những chứng khảo cổ học cho thấy nhiều nhạc cụ có từ 35.000 năm trước. Tuy nhiên, không lòi giải thích đưa cho câu hỏi có âm hài hòa hay đối chọi nhau. Vào khoảng năm 500 TCN, ông tìm mối quan hệ mật thiết toán học âm nhạc, đưa hệ thống nốt nhạc bắt tai hài hòa đứng chung với nhau, gọi thang âm (scale). Dù trải qua trình lịch sử lâu dài, thang âm Pythagoras cho sát với thang âm sử dụng ngày “đô rê mi fa son la si đô”. Phát Pythagoras đặt móng cho lịch sử âm nhạc mà nó, có lẽ có Beethoven, Mozart hay âm nhạc đại. Sự khởi đầu nhạc điện tử vào năm 1948, người Pháp tên Pierre Schaeffer sản xuất mẫu nhạc đầu tiên, gọi musique concrete - tổ họp âm tò môi trường xung quanh âm vô giai điệu. Mẩu nhạc sản phẩm công nghệ, tạo truyền bá phương tiện điện tò. Schaeffer tiếp tục nghiên cứu làm việc với nhà soạn nhạc Karlheinz Stockhausen phòng thu Cologne, Paris. Cologne trở thành phòng nghiên cứu nhạc điện tử tiếng với việc sản xuất thiết bị synthesizer (tạm dịch: nhạc cụ tổng hợp) đặt tiền đề cho nhạc cụ điện tử đại sau này. Các nhạc cụ tổng hợp tiếp tục sử dụng ban nhạc Rock, tò trở nên phần thiết yếu cho việc sản xuất thể loại nhạc hip-hop dance. Không có nhạc cụ điện tử thủ thuật sản xuất âm nhạc hầu hết hát phối ngày khác. Bản thu âm thuộc Thomas Alva Edison ông chế tạo máy thu âm vào năm 1877, câu nói ghi âm lịch sử “Mary had a little lamb”. Những cải tiến hoàn thiện sau phải kể đến máy hát rẻ tiền đĩa cao su Emile Berliner, đánh dấu cột mốc cho công nghiệp âm nhạc đại. Sau đó, Berliner vói kỹ sư Eldridge Johnson thành lập nên công ty Victor Talking Machine, đưa máy hát thâm nhập vào thị trường hãng thu âm RCA Victor tiếng. Xử lí âm định nghĩa nguồn gốc sử dụng giói học thuật để đến vấn đề liên quan đến kĩ thuật tính toán dựa vào cấu tạo âm nhạc. Nó bao hàm lí thuyết ứng dụng hay kĩ thuật tồn âm nhạc tổng hợp âm thanh, xử lí tín hiệu số, thiết kế âm thanh, truyền âm tính, độ vang . Phạm vi tính toán âm nhạc tính nguồn gốc nhạc điện tử (nhạc số), thử nhiệm ban đầu sáng tạo vói nhạc dụng cụ điện tử kỉ 20. Gần vói phát triển của máy tính cá nhân phát triển phòng thu nhà, tính toán âm nhạc đôi lúc sử dụng để đến thứ âm tạo nhờ sử dụng kĩ thuật tính toán. Máy tính chơi nhạc CSIRAC, thiết kế xây dựng Trevor Pearcey Maston Beard. Nhà toán học Geoff Hill lập trình CSIRAC để chơi nhạc điệu thông dụng đầu thập kỉ năm 1950. Trong lần công bố vào năm 1951 chơi nhạc Colonel Bogey March, đáng tiếc thu biết đến. Tuy nhiên, CSIRAC chơi theo chuẩn từ trước mở rộng để hiểu âm nhạc hay cấu tạo nhạc mà học. Máy nhạc máy tính sơ khai đặc trưng chạy thòi gian thực. Chương trình cần chạy vài giờ, vài ngày với máy tính hàng triệu dola để tạo vài phút nhạc. Việc John Chowning làm nên sóng FM từ năm 1960 đến năm 1970 đời chip điện tử, mở cánh cửa xử lý thòi gian thực cho nhạc máy tính. Đầu năm1990, hiệu suất vi xử lý tiến tói mức tạo âm nhạc máy tính thời gian thực việc sử dụng chương trình với thuật toán khả thi. Truy vấn thông tin nhạc (Music Information Retrieval - MIR) nhánh nhỏ xử lý âm thanh, MIR liên quan đến việc quản lý thư viện nhạc số, bao gồm nhiều vấn đề nhỏ như: + Phân loại, mô hình hóa âm nhạc + Phương pháp hình thức lưu trữ âm nhạc + Phần mềm truy vấn thông tin âm nhạc + Giao diện tương tác ngưòi máy tính + Cho máy tính “cảm thụ” âm nhạc + Phân tích tái lại tri thức + Lưu trữ âm nhạc, thư viện nhạc kĩ thuật số Ý tưởng ban đầu kĩ thuật truy vấn thông tin âm nhạc xuất vào năm 1966. Tuy nhiên vấn đề thực tìm hiểu tỉ mỉ gần bùng nổ sở thích sưu tầm âm nhạc qua mạng với hình thức nhạc điện tử, thứ phát triển nhanh định dạng nhạc nén đời MP3, dịch vụ chia sẻ âm nhạc Napster đòi. Một thể loại nhạc tập đặc trưng chung mà người nghe phân biệt với loại nhạc khác từ nhạc khác nhau. Những đặc trưng kể là: độ cao thấp nốt nhạc (pitch), âm sắc (timbre), nhịp (rhythm) nhạc đặc trưng liên quan đến bố cục nhạc(music texture). Một thách thức phân loại thể loại nhạc tự động tìm yếu tố đó. Trong khóa luận sử dụng bố cục âm sắc để phân loại thể loại nhạc, Các tín hiệu audio phân loại cách tự động thuộc ứong thể loạỉ sau: classical, Rock, Jazz, Pop, Blues, country, disco, hip hop, metal. Reggae. Thử nghiệm với 10 thể loại nhạc này, thể loại classical, rock, jazz, pop. Tín hiệu Audio Hình 3.1 Sơ đồ xác định tín hiệu nhạc từ tín hiệu radio. 3.2. Thuật toán 3.2.1. Trích rút đặc trung Để xác định thể loại nhạc, cần xác định đặc trưng chứng cho máy tính phân biệt khác loại nhạc. Chương giới thiệu số phương pháp việc rút trích đặc trưng tập tín nhạc đề cập đặc trưng thường sử dụng phân tích nhạc. Rút trích đặc trưng trình xử lý tính toán để đưa đặc trưng cần thiết cho việc phân loại nhạc. Ngoài ra, việc chọn lọc đặc trưng từ liệu đầu vào làm giảm số chiều làm tăng hiệu mặt thời gian nhận dạng. Trong báo “Musical Genre Classification of Audio Signals” George Tzanetakis Pery Cook, nhóm tác giả sử dụng ba tập đặc trung sau: 37 Hình 3.2 Sơ đồ vector đặc trưng từ tín hiệu nhạc + Các đặc trưng liên quan đến bố cục âm sắc (Timbrai Texture Features). + Các đặc trưng liên quan đến nhịp nhạc (Rhythmic Content Features). + Các đặc trưng liên quan đến độ cao thấp nốt nhạc (Pitch Content Features). Tuy nhiên, hạn chế trình độ thời gian, em sử dụng đặc trưng bố cục âm sắc cho việc phân loại nhạc. 3.2.2. Các đặc trung liên quan đến bố cục âm sắc (Tửnbraỉ Texture Features) Quá trình xác định đặc trưng bố cục âm sắc mô tả sơ đồ sau: chia thank cửa Sũ ! . Tữi hiệu Tỉnh dậetnm dôi với lllỗí cưa so Tinh IIUÜE bình. phuonE sá 11101 cưa 50 i FFT tren ỉmỏi cửa sỏ Hình 3.3 Sơ đồ xác định đặc trưng liên quan đến bố cục âm sắc Các đặc trưng liên quan đến bố cục âm sắc xác định dựa STFT tính cửa sổ. Sau đặc trưng dùng để biểu diễn bố cục âm sắc. Spectral Centroid Spectral Centrhid định nghĩa đo lường phân bố lượng phổ biên độ thực STFT tín hiệu. Trong Mt[n] biên độ biến đổi Fourier cửa sổ t ứng với tần số n. Centroid độ đo trạng thái phổ phổ. Các giá trị Centroid cao tương ứng với phổ có độ sáng chói chứa nhiều tần số cao. Spectral Rolloff Spectral Rolloff định nghĩa tần số R t cho có khoảng 85% phân bố lượng tập trung. ZỈL1Aft[n] = . * H = M t M (3.2) Rolloff độ đo trạng thái phổ. Nó cho biết lượng tín hiệu tập trung tần số thấp. Spectral Flux Spectral Flux định nghĩa bình phương hiệu biên độ chuẩn phân bố phổ Ft = lĩí=ĂNt[n\-Nt_1[n\y Trong Nt[n] Nt_i[n] biên độ chuẩn thực (3.3) biến đổi Fourier cửa sổ t í-1 trước đó. (3.4) Spectral Rolloff độ đo thay đổi phổ biên độ cục bộ. Time Domain Zero Crossings Time Domain Zero Crossings độ đo độ ồn tín hiệu. Nó xuất mẫu kề tín hiệu số khác dấu. Nó tính công thức: sign (x[n] = Trong đó: Zt = jS?=il«07i OM) - sign (x[n - 1])| c*[n] = (3.5) , _ (1 x[n] > sign r ;“ x[n] tín hiệu toàn miền thòi gian cửa sổ t Đặc trưng Low Energy Low Energy độ đo tỷ lệ phần trăm cửa sổ phân tích lượng RMS thấp lượng RMS trung bình cửa sổ phân tích. Root-Mean-Square (RMS) xác định công thức: (3.6) RMS độ đo độ to âm cửa sổ Mel-Frequency Cepstral Coefficients (MFCC) Các hệ số MFC xác định dựa STFT. Đầu tiên, tín hiệu nhạc thực FFT sau qua lọc băng tần (Mel-Scale Filters), kết chuyển qua log số 10, cuối qua phép biến đổi cosin ròi rạc để đưa đặc trưng âm nhạc (tương tự quan thính giác người). Tín hiệu chia nhỏ thành cửa sổ tín hiệu thành phần, sau áp dụng bước sau để tính hệ số MFC. + Bước 1: Thực FFT tín hiệu thành phần. + Bước 2: Kết xác định bước đưa qua loạt băng tần, lọc xây dựng cách dùng 13 lọc tuyến tính ( khoảng cách tần số trung tâm 133.33 KHz) theo sau 27bộ lọc phi tuyến (mỗi tần số trung tâm cách hệ số nhân 1.0711703). + Bước 3: Kết bước biến đổi sang log số 10. + Bước 4: Thực biến đổi cosin ròi rạc kết bước 3. Kết ta vector đặc trưng gồm 13 hệ số. 13 hệ số dùng nhận dạng giọng nói. Tuy nhiên, chọn hệ số MFC đủ cho việc phân loại nhạc. Vector đặc trưng bổ cục âm sắc Vector đặc trưng bố cục âm sắc bao gồm đặc trưng: Trung bình phương sai Spectral Centroid, Spectral Rolloff, Spectral Flux, ZeroCrossing, LowEnergy, trung bình phương sai MFCC đầu tiên. Có kết vector đặc trưng 19 chiều. 3.2.3. Cân hệ số đặc trưng liên quan đến bố cục âm sắc Việc rút trích đặc trưng trình bày phần đưa hệ số thể đặc trưng bố cục âm sắc. Tuy nhiên, có vấn đề hệ số chưa đưa kích thước chuẩn. Chính cần đề xuất cách để đưa hệ số kích thước chuẩn. Chuẩn hóa hệ số phương pháp sau. Chỉ xét đến số 19 đặc trưng, hệ số lại làm tương tự. Đưa miền giá trị đặc trưng dạng tương đồng (ở cụ thể từ [0, 1000]). Giả sử ta có dãy hệ số 19 đặc trưng, chuỗi Xi x Xn,. Việc chuẩn hóa tính theo sau: 1000 a = ———----------TĨỈCLX ^ Xị -> 71 ^ (3.7) k aXị Gọi a hệ số chuẩn hóa cho đặc trưng với tập mẫu huấn luyện tương ứng. Vói i = , . . . n, n số vector đặc trưng mẫu huấn luyện. Với hi vọng độ đa dạng tập dùng để học đủ để chứa giá trị lớn đặc trưng có lớn không lớn. Vì áp dụng công thức cho đặc trưng đưa vào để phân loại sau này. Với lần thêm sở liệu để đọc, tiến hành thực lại hàm tìm a. Vector đặc trưng tập tin nhạc cần phân loại, nhân giá trị đặc trưng với hệ số chuẩn hóa (a) tương ứng. 3.2.4. Khoảng cách hai mẫu Tất mẫu xem điểm biểu diễn không gian R n. Khoảng cách mẫu láng giềng so vói mẫu cần kiểm tra d(k,x) xác định dựa khoảng cách ơ-clit (k mẫu láng giềng, X mẫu cần kiểm tra). Xác xuất mẫu kiểm tra X thuộc thể loại Cị xác định sau: (3.8) wk = ỉ (k, X) Trong đó: + u tập hợp gồm k mẫu láng giềng gần X nhất, k mẫu láng giềng gần X (k G U). + kc thể loại k d(k,x) khoảng cách ơ-clit từ k đến X . + Cị thể loại thứ ỉ, i = 1,71 (hệ thống có n=4 thể loại n=10 thể loại). Mẩu cần kiểm tra X gán nhãn thể loại Cị p(Cj |j£) lớn nhất. Xác định khoảng cách ơ-clit Có nhiều cách xác định tính đồng dạng vector đặc trưng. Thuật toán KNN thường dựa việc xác định khoảng cách vector đặc trưng không gian Rn. Khoảng cách sử dụng khoảng cách Minkowski: d p ( x i t X j ) = PJa=1(|xíjm - x j m \ Ỵ = \\xi - X j \ \ p (3.9) Thông thường người ta dùng khoảng cách ơ-clit để xác định khoảng cách đối tượng không gian R n . Khoảng cách ơ-clit trường hợp đặc biệt khoảng cách Minkowski vói p=2. d (* Ể ,X ; ) = yZm=i(| 4m - Xj,m l) =\\xi - xj Il ( ЗЛ0 ) Trong đó, Xị Xj mẫu xét (i^ j), d số chiều vector đặc trưng. Đối vói hệ thống phân loại nhạc theo thể loại, sử dụng vector đặc trưng 19 chiều, công thức d=30. 3.2.5. Huấn luyện nhận dạng Trong giai đoạn huấn luyện nhận dạng, rút trích đặc trưng tập tin nhạc lưu trữ lại đặc trưng đó. Việc lưu giữ có ích. Vì trình nhận dạng, không thực bước trên, phải tốn chi phí toán cho việc phải rút trích đặc trưng tập tin nhạc mẫu. Nếu ta rút trích đặc trưng lưu xuống đĩa giai đoạn nhận dạng, giảm lượng chi phí toán lớn. Trong giai đoạn nhận dạng, sử dụng К-nearest neighbor để nhận dạng xem tập tin nhạc đầu vào thuộc thể loại nhạc nào. Phương pháp K-nearest neighbor em trình bày chương 2. Sử dụng k=l, . . . ,10 cho việc phân loại tập tin nhạc khoảng cách ơ-clit để xác định khoảng cách hai mẫu. 3.3. Xây dựng chương trình Tên kho mẫu: GTZAn Genre Collection Sổ thể loai nhac: 10 • • • Blues • Classical • Country • Disco • Hiphop • Jazz • Metal • Pop • Regguage • Rock Ngôn ngữ thực hiện: c Số đặc trưng sử dụng: 19 Tên đặc trưng Sô đặc trưng Spectral Centroid Rolloff Flux ZeroCrossing LowEnergy MFCC 10 Thử nghiệm vói 10 thể loại Kết 1: Tỷ lệ xác không dùng chuẩn hóa độ đo (tính theo %). Kết 2: Tỷ lệ xác dùng chuẩn hóa độ đo (tính theo %) K Kết Kết 22 46 22 46 26 49 24 51 24 50 25 51 22 49 23 50 25 48 10 25 47 Hình 3.4 Kết thử nghiệm vói 10 thể loại --------------------------------------------------------------------------------1 ♦ Hét ' —^h-Kếtquảĩ Hình 3.5 Biểu đồ tương quan độ xác phân loại 10 thể loại Hình ảnh chương trình thực nghiệm F:\jak\TTWT^Husie ClustB‘\snd|>cck^|HÌ:HusicalClaỉỉỉkatian\s№\sndpc('k\.-\Di!bug\pijHiHÌe3tta! 4 0.32 0.60 0.B7 0.8» 0.48 B .25 a.35 C5.ẽ? 632.70 e.00B?ĩ?0i 52.00 0.B7 H.21 r.9.80 B.68 135 0.32 125.08 0.00099783 0.22 .31 8.64 9.63 9.79 0.39 fi C.78 1Ố3.7G 0.00036754 ã.20 0-59 E3.B0 80.00 0.23 0.5-4 Sl.ee 00.00 .22 0JŨÚ 9.75 9.75 0.2? 0.13 0.53 G3.15 1130.92 0.00367463 46.00 77.00 0.57 0.92 0.56 0.39 0.45 0.77 0.57 Gi.10 40.23 0.09092007 4Ễ.90 69.00 .8& 1.0? 9.55 9.1? 0.4? 0.69 0.51 53.41 112.90 B. 00123154 4&.B0 69.90 ãẻ.ĩ? 0.52 74.61 145.80 0.90053542 48.Bồ 104.00 0.68 é.se 0.36 B.3S 9.38 B.63 414.46 0.00636644 46.00 101.00 B.E9 0.08 0.04 0.04 0.12 e.12 0.B5 0.B5 0.4Đ 0.12 9.24 9.24 0.27 3.27 Ữ.2Ẻ Ữ.2Ẻ 0.B7 57. 58 -59.11 1.31 1.44 0.21 0.20 0.35 0.23 G0 .Ga -57.38 1.1? 1.31 0.40 0.21 0.G4 0.3? 0.33 0.070.49 0.35 G0.G8 -59.00 1.1? 0.?5 1.13 0.40 0.55 0.33 0.3? 0.43 0.G4 0.73 0.?e 0.07 B 0.0B 0.33 -0.34 0.12 0.49 0.44 9.41 -62.42 i.24 0.60 0.57 0.01 9.28 60.04 0.87 0.21 0.Ế0 0.25 9.85 3.6 Trích xuất giá trị đặc trưng 0.28 B.iB 0.35 B.iB 0.35 0.23 0.5? 0.23 0.5? -0.04 0.54 -0.04 0.54 0.36 -0.01 7Ĩ.00-591.44 .S3 i . 3 0.36 -0.01 0.4Đ 0.23 0.43 0.08 59. 11 -60.65 0.57 e.«9ẽ . 5 0.21 0.369.G0 0.5? a.cv U.4J 0.08 0.73 0.28 0.08 0.73 0.28 0.40 0.48 -0.18 0.51 -0.00 e.3' 0.42 -0.18 0.51 -0.00 0.28 B.E9 0.08 0.12 s J Vb.ill lO^V.bS U.UU07U JbV bi!.fcJkJ ltíb.títí -bl.b4 tí.ìH -0.13 0.76 0.7? 0.Ĩ& ã.11 3.62 0.75 6.33 -61 .41 0.61 r.6.66 212.58 0.00077829 -40.00 102! 06 -61.41 0.61 R . Ễ . S Ẽ.79 0.S0 0.30 0.3S a.E4 0.3& -61 .78 0.42 fi 6.88 139.23 0.00(376782 41.ee 101.06 -61.78 e.37 .19 0.49 1.48 0.83 0.90 0.43 0.05 -63a.4? 6.54 r.e.95 429.64 0.900« 99 Ễ £1.00 03.00 -63.19 1.48 -61 .19 1.10 VI Cl.u tì gr ũ »r a R 7ẼỈ54 _446.5iẸ.9005080ẸẸ4700 ii|;00 -61.19 1.10 62 .48 0.55 0.22 e.58 0.94 e.?2 0.3C 9.22 B.5& 03.42 211.29 ẽ.00e3C033 í 5.00 13-4.06 G2.43 a.55 -62 .45 1.08 0.29 6.53 ẽ.TO 0.Ũ3 0.46 9.23 0.33 73.22 151.20 0.90044711 54.B0 lãé.BB -62.45 1.08 59. S3 1.33 13 Hình '■■ lù*flinặ iÌAtA o Fi.ni.5h lo-ad d-atfl ĩ u*t *vrrtíivrùfiaũ± AJpJiA ' !> f lnUÍi jet Eiinc ]n*anonE slph« ' > lii* lúCiẽkí-ùhãũ* *Jp]i* ọ rinLiH synchronous d*ta o f iniĩh Lo-ad d-st í_> use iynthl-onau* *Jp]l* -1 c !>■ iaa riing ddt ii o finish 5imcfrrcnoự5 d*ta b > - : BLUIET • ITFJ’ONJJ rịy* S CNUNTRJL Í3) (TFRONJ ) ĨÍPE < 2> ! COUNTRY R T VP* ỈÍ TTFJIS C Ĩ (WRON?) , B LUR* ! CONNTRY TYPE < 7> . TLUE-S- - |J LI.IEĨ TIPI TW= Ĩ ÍCA^RTCT > Ĩ CF HINILRY ; ị CỬUNTRV TJPE R L i T^JIB JAZZ < 0> - CL^ISS IC-* TYPE < 1> : CLASSICAL TJ£I - T VPE ; BLUTS TJILIB < 4> Ỉ C USSĨ CA I ' CLASSICAL Z ICOI’-HBET Í TYPE 5L ÍCOR KÍCT?1 TỈÍ« C TYPE C ICAJ'TBELI < 8> i CLASSICAL z CLITSSICRT ] C= T^PE * CLASSICAL CCWL'VCT ? TỈÍ* CI D U L IL R Y TỈĨẺ «1 - COUNTRY < WRONG } TJHI* < 1. Í^RRTEC ? TJFPE T 1. > > TIPE > CGORN IET : > TIFLI* < 1. C TIT]IN C L D R S I C «! < CORRECT > TJFLW TJPE ÍỈPẼ TJJJI* TJJPE Í i27> 29> < 3H > I RUCK : COU RITPY ■ CIFILIITRY S CDUHTRỊL ; CAUITTPY CDUHTRÝ ■ CAIINT^Ý Ỉ CO -UNITRÝ : ILIITII Ỉ HIPHOP TNI* - HỈPHOP IWI*ONGI TVIIE ; CAŨNTRY TJIPE < 3? > Ĩ COUNTRY Ị ']' I. Í’ Í TJIJIE ■ DĨÃCN ■ DIXCA ■ IIIPLIAP TYJW TJJJIE < 4I > - R|I?CT> T VPE < - L 2> : III|ILIAP TJPE < 43> Ỉ DIẼC-A : W 98I A E < «> - R»T ÁI , TYPE TAPE TVJ IE TYPE Ỉ HIPHAP : IIL|ITID|J T^JJS < 49> - TVJ IE < & 0> : COUNTRV ; pii|i Ty p e < S7) r c o un t ry E y Ty p e < 58 > £ j fl 22 < 59 - C O U i l C I' J Í C u r re c t > Ty p e ly p c < fi l > s n el a . i roc h Ty p e < 86 > re g t rae < Vl №n 3( > Ty p e < B7) C O U n t l' Lj {U ru n g f J < B8> h i p lw p : > > > o o Ty p e d i sc o Ty p e Ty p e Ty p e Ty p e Ty p e Ty p e Ty p e Ty p e Ty p e d i sc o IV I » < ?0 > blues Ty p e Ty p e < 1> < 92 ? i - oc J t r oc k Ty p e < 93 > p oc k o Ty p e < 4> m e ta l •:> Ty p e < 95 > i - oc l i í > Ty p e Ty p e < 9V) n tc k r oc k Ty p e < 98 > Ty p e < 99 > í > P e r c e n t ' c or r e c t í S l . w c o un t ry : c o un t ry L dl Hình 3.8 Phân loại nhạc với 10 thể loại (2) KẾT LUÃN VÀ HƯỚNG PHÁT TRIỂN Việc phân loại nhạc theo thể loại thực chủ yếu dựa vào tập đặc trưng rút trích từ tín hiệu audio: + Tập đặc trưng : đặc trưng liên quan đến bố cục âm sắc. + Tập đặc trưng 2: đặc trưng liên quan đến nhịp nhạc. + Tập đặc trưng 3: đặc trưng liên quan đến độ cao thấp nốt nhạc. Trong khóa luận tốt nghiệp này, em sử dụng đến tập đặc trưng 1, 19 đặc trưng liên quan đến bố cục âm sắc. Tuy nhiên, em sử dụng bước cân hệ số để đưa hệ số kích thước chuẩn, điều làm cho việc phân loại cao so với chưa cân hệ số. So với việc sử dụng hết tập đặc trưng tín hiệu audio, việc phân loại cho kết thấp hơn, tương đối xác, chấp nhận được. Han chế - - Hệ thống hỗ trợ định dạng WAV, AU. - Hệ thống hỗ trợ trích xuất 30 giây nhạc Hiện số lượng nhạc tiến hành huấn luyện thử nghiệm code tĩnh source. Hướng phát triển - - Tăng cường huấn luyện để nâng cao độ xác . - Xây dựng giao diện nhằm dễ sử dụng Hệ thống hỗ trợ nhiều tập tin nhạc khác như: Mp3, WMA, OGG, FLAC . - Hệ thống hỗ trợ đầy đủ tập tin nhạc có độ dài thòi gian khác nhau. - Thiết kế với hệ thống phân loại khác như: Support vector Machine, mạng Neu-ron, Bayes, . - Nghiên cứu để sử dụng Wavelet để rút trích đặc trưng nhịp nhạc, cao độ nhạc để tăng cường độ xác. [...]... chn s lỏng ging gn nht vi nú Núi cỏch khỏc chỳng ta mun bit liu Query Point s c phõn vo lp (+) hay lp (-) 4 + 2 -Nearest 5- is a puls neighbor is unknown 1- Nearestneighboroutcome outcome Nearest neighbor outcome is a minus + Hỡnh 2.1 Phng phỏp phõp loi k nearest neighbor Thy rng: 1 - Nearest neighbor: Kt qu l + (Query Point c xp vo lp du +) 2 - Nearest neighbors: khụng xỏc nh lp cho Query Point vỡ s... (khụng cú lp no cú s i tng nhiu han lp kia) 5 - Nearest neighbors: Kt qu l - (Query Point c xp vo lp du - vỡ trong 5 lỏng ging gn nht vi nú thỡ cú 3 i tng thuc lp - nhiu hn lp + ch cú 2 i tng) 3 0 2.4 Phõn lp K - Nearest Neighbor Phõn lp K - Nearest Neighbor l kiu m rng ca phõn lp 1 - Nearst Neighbor da trờn khong cỏch Nú lu tr tt c cỏc mu ó hun luyn trc 3 1 Sau ú, nú xỏc nh khong cỏch gia mu cn kim... toỏn phõn lp k - Nearest Neghbor K- Nearest Neighbors algorithm (K- NN) c s dng rt ph bin trong lnh vc Data Mining K- NN l phng phỏp phõn lp cỏc i tng da 2 8 vo khong cỏch gn nht gia i tng cn xp lp (Query point) v tt c cỏc i tng trong Training Data Mt i tng c phõn lp da vo K lỏng ging ca nú K l s nguyờn dng c xỏc nh trc khi thc hin thut toỏn Ngũi ta thng dựng khong cỏch Euclidean tớnh khong cỏch gia... phn t khớ khỏc gn nú Kt qu l ta thu c cỏc súng õm truyn theo mi hng, trong ú hng thng l hng súng õm mnh nht Cỏc súng õm ny c duy trỡ liờn tc trong khi thanh qun cũn rung Khi súng õm n tai, nú b mng nh cn li Kt qu l ng nng ca cỏc phn t khớ phớa trc mng nh c truyn cho mng nh lm nú dao ng Vỡ mng nh c kt ni vúi cỏc dõy thn kinh t nóo nờn dao ng ca mng nh s phỏt sinh ra cỏc xung thn kinh Cỏc xung thn kinh... giỏm sỏt, hc khụng giỏm sỏt cú khụng gian u vo ch bao gm Xi, trong khi ú thụng tin v cỏc nhón khụng c bit trc Lỳc ny, quỏ trỡnh hc l khỏm phỏ ra cu trỳc n dúi d liu u vo Vớ d, mt ngũi bỏn hng Online mun phõn cm khỏch hng da trờn lch s mua hng, cn chn tt c cỏc khỏch hng cú tim nng v sau ú khỏm phỏ nhúm khỏch hng ny v s tng ng v s thớch Trỏi ngc vi phõn lp, phõn cm khụng h bit trc, nú s a khỏch hng thuc... nhng quyt nh ti u ỏp ng mt s kin xy ra trong thc t hoc d bỏo tỡnh hung tng lai ú chớnh l nhim v ca khai phỏ d liu (Data mining) Chỳng ta cú th hỡnh dung vic khỏm phỏ tri thc ging nh khai thỏc mt m khoỏng sn, trong m cú nhiu kim loi trn ln nh vng, ng, chỡ Nhim v ca khai thỏc mt m khoỏng sn l phi loi b tp cht tỏch 2 5 riờng cỏc kim loi trong m, c bit l cỏc kim loi quý Khỏm phỏ tri thc trong c s d... cỏc phn t khớ Núi cỏch khỏc, õm thanh l kt qu m ta cm nhn c ca s lan truyn súng trong khụng gian ca cỏc phn t khớ, m ta gi l súng õm Núi nh vy cú ngh l õm thanh ch lan truyn trong mụi trng yt cht Khụng cú súng õm trong chõn khụng Cỏc kt qu thc nghim cho thy súng õm l súng dc, tc l cỏc phn tũ khớ dao ng nh lũ xo (phng chuyn ng trựng vi phng truyn súng) ằ Hỡnh 1.1 S truyn chuyn ng ca cỏc phn t khớ Hỡnh... liu (Data mining): xỏc nh nhim v khai thỏc d liu v la chn k thut khai thỏc d liu Kt qu cho ta mt ngun tri thc thụ + ỏnh giỏ (Evaluation): da trờn mt s tiờu chớ tin hnh kim tra v lc ngun tri thc thu c + Trin khai (Deployment) Quỏ trỡnh khai thỏc tri thc khụng ch l mt quỏ trỡnh tun t t bc u tiờn n bc cui cựng m l mt quỏ trỡnh lp v cú quay tr li cỏc bc ó qua Cỏc phng phỏp khai phỏ d liu: + Phõn loi (Classification):... toỏn K- NN c mụ t nh sau: 1 Xỏc nh giỏ tr tham s K (s lỏng ging gn nht) 2 Tớnh khong cỏch gia i tng cn phõn lp (Query Point) vi tt c cỏc i tng trong training data (thng s dng khong cỏch Euclidean) 3 Sp xp khong cỏch theo th t tng dn v xỏc nh K lỏng ging gn nht vi Query Point 4 Ly tt c cỏc lp ca K lỏng ging gn nht ó xỏc nh 5 Da vo phn ln lp ca lỏng ging gn nht xỏc nh lp cho Query Point hiu K- NN c... vi tt c cỏc mu ó c hun luyn m chn ra K mu hun luyn gn vúi mu kim tra nht, gi l phõn lp K - Nearst Neighbor Kt qu ca vic phõn loi l nhón ca mu hun luyn cn xỏc nh nhón s l nhón ca loi no xut hin nhiu nht trong K mu gn mu cn xỏc nh nhón Thut toỏn phõn lp nh sau: Input: Mu X cn xỏc nh nhón Output: Nhón ca X 1 Cho mu X cn phõn lp 2 Gi X 1, X 2 , xkl k mu t trong kho mu hun luyn gn X nht 3 Xỏc nh nhón .  NGUYỄN LAN HƯƠNG ÁP DỤNG THUẬT TOÁN K - NEAREST NEIGHBOR ĐẺ PHÂN LOẠI NHẠC THEO THẺ LOẠI   KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC  • • • Chuyên ngành: Khoa học máy tính  . NỘI - 2015 ÀP DỤNG THUẬT TOAN K - NEAREST NEIGHBOR ĐẺ PHÂN LOẠI NHẠC THEO THẺ LOẠI   KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC  • • • Chuyên ngành: Khoa học máy tính Người hướng dẫn khoa học PGS. TS B({EA#!@8#/%76!c#(j•:fff K hh:fg K :fgf K o:fff K xx:fgˆ K xx:hff K xp:gf K x•:fff K gf:fff K gf:xff K ••:ff K Šˆ:fff„: h g 3#(h:g58N#Ha6%1 (3#(3#(h:g!@8#/v!( [K &w!/58X%'45v!([ %*

Ngày đăng: 24/09/2015, 09:20

Từ khóa liên quan

Mục lục

  • ÁP DỤNG THUẬT TOÁN K - NEAREST NEIGHBOR ĐẺ PHÂN LOẠI NHẠC THEO THẺ LOẠI

    • KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC

    • ÀP DỤNG THUẬT TOAN K - NEAREST NEIGHBOR ĐẺ PHÂN LOẠI NHẠC THEO THẺ LOẠI

      • KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC

      • Mở đầu

        • 1. Lí do chon đề tài

        • 2. Mục đích nghiên cứu

        • 3. Nhiệm vụ nghiên cứu

        • 4. Đối tượng nghiên cứu

        • 5. Phạm vỉ nghiên cứu

        • 6. Ý nghĩa kha học và ý nghĩa thực tiễn của đề tài

        • 7. Phương pháp nghiên cứu

        • 8. Cấu trúc khóa luận

        • 1.2. Âm thanh và sổ hóa âm thanh

        • 1.2.1. Âm thanh

        • Đô to của âm

        • 1.2.3. Sổ hóa âm thanh

        • 1.3. Tổng quan về âm nhạc

        • 1.3.1. Nốt nhac

          • 1.4. Các phương pháp phân loại nhạc

          • X(f) = í^x(t)e~j2nft dt (1.2)

          • CHƯƠNG 2. THUÃT TOÁN K - NEAREST NEIGHBOR ĐẺ PHÂN LOAI NHAC THEO THẺ LOAI

            • 2.3. Mô tả thuật toán phân lớp k - Nearest Neỉghbor

            • Thuât toán K-NN đươc mô tả như sau:

            • Để hiểu K-NN được dùng để phân lóp thế nào ta xem minh họa dưới đây:

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan