Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

한국어 챗봇 데이터에 최적화 된 임베딩 성능 비교 프로그램

Full metadata record
DC Field Value Language
dc.contributor.author이영섭-
dc.contributor.author강도영-
dc.date.accessioned2025-09-09T09:01:00Z-
dc.date.available2025-09-09T09:01:00Z-
dc.identifier.urihttps://scholarworks.dongguk.edu/handle/sw.dongguk/60754-
dc.description.abstract- 자연어 처리에서 가장 중요한 것은 사람이 쓰는 자연어를 기계가 이해할 수 있는 숫자의 나열인 벡터로 바꾸는 임베딩 작업으로, 품질 좋은 임베딩을 쓸수록 모형의 정확도 및 학습 속도가 올라간다. 그러나, 교착어인 한국어 특성상 띄어쓰기를 지키지 않아도, 단어의 위치를 바꾸어도 의미전달이 가능하기 때문에 한국어 자연어 처리가 어려워 대중화 되어 있지 않다. 그렇기 때문에 한국어 데이터에 최적화 된 임베딩을 찾고자 하였다. - 일반적으로 공개되어 있는 한국어 데이터는 거의 없지만 한글로 챗봇을 만들어 볼 수 있게 송영숙 님이 번역 및 제공해주신 <Chatbot_data_for_Korean v1.0> 데이터 셋을 이용하였고, 이는 질문과 대답의 쌍으로 이루어진 챗봇 데이터이다. 제작한 프로그램 순서는 챗봇 데이터 전처리 -> 토큰화 -> 임베딩 -> 성능 비교 순이다.-
dc.title한국어 챗봇 데이터에 최적화 된 임베딩 성능 비교 프로그램-
dc.title.alternativeEmbedding performance comparison program optimized for Korean chatbot data-
dc.typePatent-
dc.publisher.location대한민국-
dc.contributor.assignee동국대학교산학협력단-
dc.date.application2021-07-23-
dc.date.registration2021-07-23-
dc.type.iprs소프트웨어-
dc.identifier.patentRegistrationNumberC-2021-029917-
dc.identifier.patentApplicationNumber없음-
Files in This Item
There are no files associated with this item.
Appears in
Collections
College of Natural Science > Department of Statistics > 4. Patents

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Lee, Yung Seop photo

Lee, Yung Seop
College of Natural Science (Department of Statistics)
Read more

Altmetrics

Total Views & Downloads

BROWSE