Cited 0 time in
텍스트 마이닝에 의한 문학 작품 분류
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.author | 정원일 | - |
| dc.contributor.author | 방승희 | - |
| dc.contributor.author | 박명관 | - |
| dc.date.accessioned | 2023-04-27T19:40:39Z | - |
| dc.date.available | 2023-04-27T19:40:39Z | - |
| dc.date.issued | 2021-01 | - |
| dc.identifier.issn | 1975-1621 | - |
| dc.identifier.issn | 2092-0873 | - |
| dc.identifier.uri | https://scholarworks.dongguk.edu/handle/sw.dongguk/5483 | - |
| dc.description.abstract | 본 연구는 빅데이터(Big Data) 중 하나인 구텐베르그 프로젝트(Project Gutenberg)에 등록되어 있는 문학작품들을 수집해서 텍스트 마이닝 기법에 의한 계량적 텍스트 분석(quantitative text analysis)을 활용하여 문학작품을 분류하는 방법을 소개하는 데에 목적을 두고 있다. 수집된 작품들을 프로그래밍 언어 R을 이용하여 전처리 과정을 한 후, 작품 내의 쳅터(chapter) 간 코사인 유사도와 서로 다른 작품의 쳅터 간 코사인 유사도에 의한 분류를 진행하였다. 동일한 소설 내의 쳅터들 간의 코사인 유사도는 상대적으로 높게 나타나지만 서로 다른 작품의 쳅터들 사이의 코사인 유사도는 대체로 낮은 결과를 보였다. 또한 기계학습(machine learning)의 방법 중 비지도 학습(unsupervised learning)의 군집(clustering) 분석에서 의미적 거리에 의하여 작품 내의 쳅터들의 강한 응집력으로 작품들이 분류되었고, 지도 학습(supervised learning)의 분류(classification) 분석에서도 작품들 간의 분류에서 높은 정확도를 보였다. 또한, 본 연구에서는 아동소설이 쳅터 간에 코사인 유사도 값이 크고 의미적 거리가 작아서 읽기 쉬운 작품으로 분류될 수 있다는 것을 확인하였다. 따라서, 텍스트 마이닝 기법에 의한 계량적 텍스트 분석은 질적 텍스트 분석을 수행하는데에 밑거름이 될 것으로 본다. | - |
| dc.format.extent | 27 | - |
| dc.language | 한국어 | - |
| dc.language.iso | KOR | - |
| dc.publisher | 동국대학교 동서사상연구소 | - |
| dc.title | 텍스트 마이닝에 의한 문학 작품 분류 | - |
| dc.title.alternative | Classification of Literary Works(Novels) Using Text Mining | - |
| dc.type | Article | - |
| dc.publisher.location | 대한민국 | - |
| dc.identifier.doi | 10.33639/ptc.2021..35.016 | - |
| dc.identifier.bibliographicCitation | 철학∙사상∙문화, no.35, pp 381 - 407 | - |
| dc.citation.title | 철학∙사상∙문화 | - |
| dc.citation.number | 35 | - |
| dc.citation.startPage | 381 | - |
| dc.citation.endPage | 407 | - |
| dc.identifier.kciid | ART002681557 | - |
| dc.description.isOpenAccess | N | - |
| dc.description.journalRegisteredClass | kci | - |
| dc.subject.keywordAuthor | text mining | - |
| dc.subject.keywordAuthor | classification | - |
| dc.subject.keywordAuthor | clustering | - |
| dc.subject.keywordAuthor | cosain similarity | - |
| dc.subject.keywordAuthor | children’s novel | - |
| dc.subject.keywordAuthor | 텍스트 마이닝 | - |
| dc.subject.keywordAuthor | 분류분석 | - |
| dc.subject.keywordAuthor | 코사인 유사도 | - |
| dc.subject.keywordAuthor | 군집분석 | - |
| dc.subject.keywordAuthor | 아동소설 | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
30, Pildong-ro 1-gil, Jung-gu, Seoul, 04620, Republic of Korea+82-2-2260-3114
Copyright(c) 2023 DONGGUK UNIVERSITY. ALL RIGHTS RESERVED.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.
