Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

한국어 노래 음성 합성을 위한 웹 서비스 개발 및 연구Korean Singing-Voice Synthesis Web Services

Other Titles
Korean Singing-Voice Synthesis Web Services
Authors
박지은김지희
Issue Date
Jan-2022
Publisher
한국정보기술학회
Keywords
text to speech; singing voice synthesis; glow-tts; hifi-gan; mlp-singer; web service; .
Citation
한국정보기술학회논문지, v.20, no.1, pp 181 - 189
Pages
9
Indexed
KCI
Journal Title
한국정보기술학회논문지
Volume
20
Number
1
Start Page
181
End Page
189
URI
https://scholarworks.dongguk.edu/handle/sw.dongguk/3730
DOI
10.14801/jkiit.2022.20.1.181
ISSN
1598-8619
2093-7571
Abstract
최근 영상 컨텐츠 제작이 활발해지며 영상의 자막을 원하는 목소리로 설명하는 더빙, 나레이션 뿐만 아니라 커버 송 제작과 같은 음성 합성에 대한 요구가 많아졌다. 본 논문에서는 다양한 종류의 서비스를 다양한 음성 옵션에서 경험할 수 있는 플랫폼 제작을 제시하였다. 현재 개념 증명 단계로 Glow-TTS(Generative Flow for Text-to-Speech), HIFI-GAN(Generative Adversarial Networks for efficient and High Fidelity speech synthesis)을 이용하여 MLP-Singer(Parallel Korean Singing Voice Synthesis)와 HIFI-GAN을 이용하여 노래 음성 합성 기능을 제작하였다. 그리고 도커 컨테이너 상에서 프론트엔드, 백엔드, 웹서버를 구축하였다. 해당 서비스는 웹 사이트 형태로 제공되며 요청이 들어오면 음성 합성 결과를 출력하고 음성 파일 다운로드를 통해 사용할 수 있게 제공된다. 본 연구에서는 음성 합성 플랫폼을 제작하기 위한 전체적인 시스템 구조와 구현 방법 제시 및 구현된 시스템의 성능 평가를 통해 구현 가능함을 보였으며, 추가적으로 보완하여 서비스 할 수 있는 방법을 제공한다.
Files in This Item
There are no files associated with this item.
Appears in
Collections
College of Advanced Convergence Engineering > Department of Computer Science and Artificial Intelligence > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Kim, Ji Hie photo

Kim, Ji Hie
College of Advanced Convergence Engineering (Department of Computer Science and Artificial Intelligence)
Read more

Altmetrics

Total Views & Downloads

BROWSE