Mô hình gan và ứng dụng tạo mẫu ấn phẩm trò chơi thiếu nhi

76 0 0
Mô hình gan và ứng dụng tạo mẫu ấn phẩm trò chơi thiếu nhi

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Trang 1 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUY NHƠN LÊ NHƯ THƯƠNG MÔ HÌNH GAN VÀ ỨNG DỤNG TẠO MẪU ẤN PHẨM TRÒ CHƠI THIẾU NHI ĐỀ ÁN THẠC SĨ KHOA HỌC MÁY TÍNH Trang 2 BỘ GIÁO DỤC VÀ Đ

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUY NHƠN LÊ NHƯ THƯƠNG MÔ HÌNH GAN VÀ ỨNG DỤNG TẠO MẪU ẤN PHẨM TRÒ CHƠI THIẾU NHI ĐỀ ÁN THẠC SĨ KHOA HỌC MÁY TÍNH Bình Định – Năm 2023 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUY NHƠN LÊ NHƯ THƯƠNG MÔ HÌNH GAN VÀ ỨNG DỤNG TẠO MẪU ẤN PHẨM TRÒ CHƠI THIẾU NHI Ngành: KHOA HỌC MÁY TÍNH Mã số: 8480101 Người hướng dẫn: TS LÊ XUÂN VINH i LỜI CAM ĐOAN Tôi là học viên cao học khóa 24B, chuyên ngành khoa học máy tính trường Đại học Quy Nhơn, xin cam đoan rằng đề tài “Mô hình Gan và ứng dụng tạo mẫu ấn phẩm trò chơi thiếu nhi” là công trình nghiên cứu tự thực hiện dưới sự hướng dẫn của giảng viên TS Lê Xuân Vinh Tất cả nội dung, kết quả nghiên cứu trong đề tài đều là trung thực và chính xác Các thông tin, số liệu và kết quả nghiên cứu được trích dẫn, tham khảo đều được ghi rõ nguồn gốc và có sự đồng ý của tác giả Các công trình nghiên cứu, bài báo, sách, và nguồn trích dẫn khác đều được kính trọng và ghi công đầy đủ trong phần tài liệu tham khảo Tôi xin chịu trách nhiệm trước pháp luật về tính xác thực và trung thực của công trình nghiên cứu của mình, và sẵn sàng nhận mọi hình thức kỷ luật nếu phát hiện có bất kỳ sự gian lận nào trong công trình này Tác giả luận văn Lê Như Thương ii LỜI CẢM ƠN Trước hết, tôi muốn bày tỏ lòng biết ơn sâu sắc và chân thành nhất đến TS Lê Xuân Vinh, người đã hướng dẫn, hỗ trợ, và chia sẻ kiến thức quý báu cho tôi trong quá trình thực hiện đề tài “Mô hình Gan và ứng dụng tạo mẫu ấn phẩm trò chơi thiếu nhi” Lời cảm ơn chân thành cũng được gửi đến các thầy cô giáo là giảng viên trường Đại học Quy Nhơn và các bạn bè đồng nghiệp, những người đã không ngừng giúp đỡ, chia sẻ kinh nghiệm và kiến thức, tạo điều kiện thuận lợi nhất để tôi có thể hoàn thành đề án này Tôi cũng muốn gửi lời cảm ơn đến gia đình, bạn bè và những người thân yêu khác, đã luôn ủng hộ, động viên tinh thần và tạo điều kiện tốt nhất về mọi mặt để tôi có thể tập trung vào công việc nghiên cứu của mình Cuối cùng, tôi xin bày tỏ lòng kính trọng và biết ơn đến các tác giả của những tài liệu, sách, bài báo khoa học mà tôi đã tham khảo trong quá trình nghiên cứu để hoàn thiện đề tài này Tất cả đã góp phần lớn vào việc hoàn thành đề tài, giúp tôi rút ra được nhiều kiến thức và kinh nghiệm quý giá Chân thành cảm ơn! iii MỤC LỤC Trang LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC CÁC HÌNH vi MỞ ĐẦU 1 1 Lý do chọn đề tài .1 2 Tổng quan tình hình nghiên cứu đề tài 2 4 Đối tượng và phạm vi nghiên cứu .4 4.1 Đối tượng nghiên cứu 4 4.2 Phạm vi nghiên cứu .4 5 Nội dung nghiên cứu 4 6 Phương pháp nghiên cứu 4 Chương 1 KIẾN THỨC CƠ SỞ CỦA HỌC MÁY VÀ HỌC SÂU 5 1.1 Giới thiệu 5 1.1.1 Khái niệm 5 1.1.2 Ứng dụng của học máy 5 1.1.3 Phân loại các phương pháp học máy .6 1.1.4 Các bước tiến hành trong bài toán học máy 7 1.2 Mạng Nơron (Neural) 9 1.2.1 Khái niệm 9 1.2.2 Mô hình mạng nơron nhân tạo .11 1.2.3 Quy tắc delta 12 1.2.4 Thuật toán lan truyền ngược 15 1.3 Học sâu (Deep Learning) 19 1.3.1 Giới thiệu về Deep Learning 19 1.3.2 Cấu trúc mạng CNN .20 1.4 Kết luận chương 1 34 Chương 2 MÔ HÌNH GAN 35 2.1 Giới thiệu chung về GAN .35 2.2 Kiến trúc của GAN 36 2.2.1 Generator 38 iv 2.2.2 Discriminator 39 2.3 Hàm mất mát 39 2.4 Quá trình huấn luyện GAN .41 2.5 Mô hình Deep Convolutional GAN (DC GAN) .42 2.5.1 Cấu trúc mạng 42 2.5.2 Hàm mất mát của DC GAN 47 2.5.3 Một số vấn đề lưu ý khi xây dựng mô hình và train DC GAN 47 2.6 Kết luận chương 2 47 Chương 3 ỨNG DỤNG GAN TẠO MẪU ẢNH TRÒ CHƠI .48 THIẾU NHI .48 3.1 Giới thiệu và phân tích bài toán 48 3.2 Xây dựng chương trình thử nghiệm 49 3.2.1 Tập dữ liệu .49 3.2.2 Chuẩn bị môi trường và thư viện .49 3.2.3 Xây dựng mô hình discriminator và generator 52 3.2.4 Huấn luyện mô hình discriminator và generator 54 3.2.5 Huấn luyện mô hình DCGAN 56 3.3 Kiểm tra và đánh giá kết quả 57 3.4 Kết luận chương 3 65 KẾT LUẬN .66 DANH MỤC TÀI LIỆU THAM KHẢO 67 QUYẾT ĐỊNH GIAO TÊN ĐỀ TÀI ĐẾ ÁN THẠC SĨ (BẢN SAO) v DANH MỤC CÁC CHỮ VIẾT TẮT AI Artificial Intelligence ANN Artificial Neural Network CNN Convolutional Neural Network DL Deep Learning GAN Generative Adversarial Networks ML Machine Learning vi DANH MỤC CÁC HÌNH Trang Hình 1.1: Cấu trúc mạng CNN 20 Hình 1.2: Ma trận đầu vào/ra 21 Hình 1.3: Filter phát hiện cạnh 22 Hình 1.4: Feature map trên không gian ảnh 22 Hình 1.5: Zero Padding 24 Hình 1.6: Avarage Pooling và Max Pooling 25 Hình 1.7: Nguồn: Andrew Ng Machine Learning course (Coursera) 28 Hình 1.8: Nguồn: Andrew Ng Machine Learning course (Coursera) 29 Hình 1.9: Bias và variance 30 Hình 1.10: Nguồn: Srivastava, Nitish, et al “Dropout: a simple way to prevent neural networks from overfitting”, JMLR 2014 32 Hình 2.1: Mô hình Generator và Discriminator 36 Hình 2.2: Kiến trúc mạng GAN 36 Hình 2.3: Sơ đồ kiến trúc của generator 38 Hình 2.4: Sơ đồ kiến trúc của Discriminator 39 Hình 2.5: Generator của DCGAN với các lớp tích chập phân đoạn 43 Hình 2.6: Discriminator DCGAN với lớp tích chập có bước 44 Hình 2.7: Một ví dụ về phép tính tích chập 44 Hình 2.8: Một ví dụ về tích chập phân đoạn 46 Hình 3.1: Ảnh sinh ra từ generator ở epchos thứ 10 58 Hình 3.2: Ảnh sinh ra từ generator ở epchos thứ 100 58 Hình 3.3: Ảnh sinh ra từ generator ở epchos thứ 500 59 Hình 3.4: Ảnh sinh ra từ generator ở epchos thứ 1000 59 Hình 3.5: Ảnh thật 60 Hình 3.6: Ảnh giả 60 Hình 3.7: Biểu đồ mất mát của bộ sinh (generator) và bộ phân biệt discriminator 61 Hình 3.8: Biểu đồ Score của Real và Fake 61 1 MỞ ĐẦU 1 Lý do chọn đề tài Ngày nay, thế giới chúng ta đang chứng kiến về tốc độ lan tỏa của công nghệ 4.0 rất mạnh mẽ Trong đó, phải nói tới lĩnh vực được xã hội quan tâm chính là AI (trí tuệ nhân tạo) Mơ ước làm cho máy tính có trí thông minh giống con người đã có từ lâu Trí tuệ nhân tạo đang đi vào cuộc sống của mỗi con người, của mỗi quốc gia Trí tuệ nhân tạo có thể biến những điều tưởng chừng như không thực hiện được thành hiện thực Chẳng hạn như những robot hoạt động trong lĩnh vực quân sự, những căn nhà thông minh,… Trong những năm gần đây, khả năng tính toán của máy tính đã được nâng cao đáng kể và việc thu thập lượng dữ liệu khổng lồ trở nên dễ dàng hơn Kết quả là, Machine Learning đã phát triển một cách đáng kể và mở ra một lĩnh vực mới được biết đến với tên gọi là Deep Learning (DL) Nhờ vào học sâu này, trí tuệ nhân tạo đã được mở rộng và tiến bộ Học sâu được áp dụng rộng rãi trong các vấn đề thực tế của học máy và đã mở rộng phạm vi tổng thể của trí tuệ nhân tạo Học sâu đã thay đổi cách thức con người làm việc bằng cách cho phép các thiết bị máy móc có khả năng hoạt động giống hoặc gần giống con người Ví dụ như ô tô không người lái, chăm sóc sức khoẻ chất lượng cao hơn và đề xuất phim hay hơn, Tất cả điều này chỉ có thể trở thành hiện thực trong thời đại hiện tại nhờ vào các kỹ thuật của học sâu Một trong những kỹ thuật đang được nghiên cứu và ứng dụng rộng rãi vào đời sống thực tế chính là mô hình Generative Adversarial Networks (GAN) Mô hình GAN được sử dụng để tạo ra rất nhiều sản phẩm hay, ví dụ làm cho máy tính có thể sáng tác nhạc, vẽ tranh, sáng tạo trong lĩnh vực nghệ thuật - điều mà bạn nghĩ chỉ có con người mới có thể làm được 2 Trò chơi điện tử là một lĩnh vực phát triển mạnh mẽ, đặc biệt là trò chơi thiếu nhi Việc tạo ra những trò chơi có hình ảnh sinh động, đa dạng sẽ giúp thu hút sự chú ý của trẻ em và người chơi, có những trải nghiệm tuyệt vời khi chơi và đồng thời cũng giúp cho các nhà phát triển trò chơi có thêm công cụ để tạo ra các trò chơi hấp dẫn và độc đáo Thay vì chúng ta hay thuê các họa sĩ để vẽ, tạo ra những mẫu ảnh của các trò chơi thiếu nhi, chúng ta có thể sử dụng mô hình GAN để sinh ra những mẫu ảnh trò chơi từ mẫu các họa sĩ vẽ mà không vi phạm bản quyền cũng như việc làm này giúp cho quá trình sản xuất trò chơi trở nên nhanh chóng, tiết kiệm được chi phí rất lớn Chính vì vậy, tôi chọn tìm hiểu về: “Mô hình Gan và ứng dụng tạo mẫu ấn phẩm trò chơi thiếu nhi” làm đề tài nghiên cứu 2 Tổng quan tình hình nghiên cứu đề tài Ian Goodfellow và đồng nghiệp của mình đã giới thiệu về GAN qua một báo cáo khoa học vào năm 2014 [2] Trong khoảng thời gian này, đa số mọi người tập trung vào chức năng sinh dữ liệu của GAN Sau đó, vì những ứng dụng hữu ích tuyệt vời của GAN, do đó GAN được khai thác nhiều hơn Những kết quả nghiên cứu tiêu biểu: Alec Radford [3] giới thiệu vềhọc đại diện không giám sát với các mạng đối thủ tạo ra tích chập sâu được gọi là DCGAN đã minh họa cách huấn luyện các GAN ổn định trên quy mô lớn Họ đã trình diễn các mô hình để tạo ra các ví dụ mới về phòng ngủ Tero Karras [4], đã nghiên cứu về sự phát triển tiến bộ của GAN để cải thiện chất lượng, độ ổn định và sự thay đổi chứng minh việc tạo ra các bức ảnh thực tế hợp lý về khuôn mặt người Trên thực tế, chúng trông rất thật đến mức có thể gọi kết quả là đáng chú ý Do đó, kết quả nhận được rất nhiều sự chú ý của giới truyền thông Các thế hệ khuôn mặt được đào tạo dựa trên các ví dụ về người nổi tiếng, nghĩa là có các yếu tố của những người nổi tiếng hiện có trong các khuôn mặt được tạo, khiến chúng có vẻ quen thuộc nhưng không hoàn toàn

Ngày đăng: 25/03/2024, 14:47

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan