Cited 0 time in
프롬프트 엔지니어링과 파인튜닝을 활용한 대규모 언어 모델 기반 한국어 혐오 표현 다중 레이블 분류 연구
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.author | 이순형 | - |
| dc.contributor.author | 김형진 | - |
| dc.contributor.author | 윤상혁 | - |
| dc.date.accessioned | 2025-10-19T17:30:57Z | - |
| dc.date.available | 2025-10-19T17:30:57Z | - |
| dc.date.issued | 2025-09 | - |
| dc.identifier.issn | 2288-4866 | - |
| dc.identifier.issn | 2288-4882 | - |
| dc.identifier.uri | https://scholarworks.dongguk.edu/handle/sw.dongguk/61837 | - |
| dc.description.abstract | 온라인 공간에서 혐오 표현 확산은 현대 사회가 직면한 심각한 사회 및 문화적 문제로, 빠른 전파 속도와 경제적 이해 관계의 결합에 따라 지속적으로 재생산 및 확산되는 경향을 보인다. 그러나 기존 혐오 표현 탐지 연구는 전통적 기계학습 기반의 키워드 필터링 또는 영어 데이터셋 중심의 딥러닝 모델에 의존함으로써, 한국어 환경에서의 정밀 탐지 성능이 저 하되고 세부 유형별 분류에 한계가 존재하였다. 이에 본 연구는 한국어 혐오 표현의 복잡한 문맥과 의미적 함의를 정교하 게 반영하기 위해 대규모 언어모델(Large Language Model) 기반 다중 레이블 분류 체계를 제안한다. 구체적으로, 공개 데 이터셋인 Kor_Unsmile을 Chain-of-Thought(CoT) 프롬프트 구조에 맞추어 재구성한 후 이를 활용하여 대형 언어모델을 파인튜닝하였다. 모델 개발 단계에서는 CoT 프롬프트 엔지니어링과 Low-Rank Adaptation(LoRA) 파인튜닝을 결합한 LlamaGuard-3-8B 모델을 설계하였으며, 체계적인 하이퍼파라미터 최적화 과정을 통해 성능을 극대화하였다. 성능 평가 결과, 제안 모델은 Macro F1 0.8623, Micro F1 0.8817을 기록하여 GPT-4.0 및 KoELECTRA 대비 우수한 성능을 보였으 며, 인간 평가자와의 일치도 분석에서도 90.1%의 높은 일치율을 기록해 실제 적용 가능성을 입증하였다. 본 연구는 온라 인 플랫폼에서 한국어 혐오 표현을 다중 레이블로 정밀 분류할 수 있는 실용적 모델을 제시함과 동시에, 디자인 사이언스 방법론을 적용하여 대규모 언어 모델 기반 분류 모델의 체계적 개발 절차를 구체적으로 제시하였다는 점에서 학문적, 실 무적 의의를 가진다. | - |
| dc.format.extent | 22 | - |
| dc.language | 한국어 | - |
| dc.language.iso | KOR | - |
| dc.publisher | 한국지능정보시스템학회 | - |
| dc.title | 프롬프트 엔지니어링과 파인튜닝을 활용한 대규모 언어 모델 기반 한국어 혐오 표현 다중 레이블 분류 연구 | - |
| dc.title.alternative | Multi-Label Classification of Korean Hate Speech Leveraging LLMs with Prompt Engineering and Fine-Tuning | - |
| dc.type | Article | - |
| dc.publisher.location | 대한민국 | - |
| dc.identifier.doi | 10.13088/jiis.2025.31.3.227 | - |
| dc.identifier.bibliographicCitation | 지능정보연구, v.31, no.3, pp 227 - 248 | - |
| dc.citation.title | 지능정보연구 | - |
| dc.citation.volume | 31 | - |
| dc.citation.number | 3 | - |
| dc.citation.startPage | 227 | - |
| dc.citation.endPage | 248 | - |
| dc.type.docType | Y | - |
| dc.identifier.kciid | ART003249790 | - |
| dc.description.isOpenAccess | N | - |
| dc.description.journalRegisteredClass | kci | - |
| dc.subject.keywordAuthor | 혐오 표현 | - |
| dc.subject.keywordAuthor | 대규모 언어 모델 | - |
| dc.subject.keywordAuthor | 프롬프트 엔지니어링 | - |
| dc.subject.keywordAuthor | 파인튜닝 | - |
| dc.subject.keywordAuthor | 디자인 사이언스 방법론 | - |
| dc.subject.keywordAuthor | hate speech | - |
| dc.subject.keywordAuthor | large language model | - |
| dc.subject.keywordAuthor | prompt engineering | - |
| dc.subject.keywordAuthor | fine-tuning | - |
| dc.subject.keywordAuthor | design science methodology | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
30, Pildong-ro 1-gil, Jung-gu, Seoul, 04620, Republic of Korea+82-2-2260-3114
Copyright(c) 2023 DONGGUK UNIVERSITY. ALL RIGHTS RESERVED.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.
