SLLM을 활용한 RAG기술 기반의 교육기관 문서 질의응답 기법 활용 방안Small Language Model–Based RAG for Document Question Answering in Education
- Other Titles
- Small Language Model–Based RAG for Document Question Answering in Education
- Authors
- 이현우; 김경재; 이영섭
- Issue Date
- Sep-2025
- Publisher
- 한국지능정보시스템학회
- Keywords
- SLLM; RAG; 챗봇; 문서 질의응답 시스템; SLLM; RAG; Chatbot; Document Question Answering
- Citation
- 지능정보연구, v.31, no.3, pp 211 - 225
- Pages
- 15
- Indexed
- KCI
- Journal Title
- 지능정보연구
- Volume
- 31
- Number
- 3
- Start Page
- 211
- End Page
- 225
- URI
- https://scholarworks.dongguk.edu/handle/sw.dongguk/61800
- DOI
- 10.13088/jiis.2025.31.3.211
- ISSN
- 2288-4866
2288-4882
- Abstract
- 최근 대규모 언어모델(Large Language Model, LLM)은 자연어 처리의 비약적인 발전으로 다양한 교육 현장에서 활용 되고 있다. 특히 검색 증강 생성(Retrieval-Augmented Generation, RAG) 기술은 대규모 언어모델이 보유하지 않은 최신 정보나 특정 도메인 지식을 외부 문서에서 실시간으로 검색하여 활용함으로써, 더욱 정확하고 신뢰할 수 있는 답변을 생 성할 수 있게 한다. 그러나 대규모 언어모델을 직접 사용하는 방식은 높은 비용 부담과 개인정보보호 문제로 인해 교육기 관에서 활용하는데 제약이 따른다. 또한 교육기관의 문서들은 입시 모집요강이나 학사제도 안내서처럼 도메인에 특화 되 어 있으며, 복잡한 표나 이미지가 포함된 구조화된 정보가 풍부하다는 특징이 있다. 기존 일반적인 대규모 언어모델 기반 챗봇은 몇 가지 한계를 가진다. 첫째, 전형일정이나 모집단위와 같이 셀이 병합되고 복잡한 표 형태로 정리된 정보를 정확 하게 추출하는 능력이 미흡하다. 둘째, 장・절・ 하위 절로 구성된 긴 문서에서 필요한 단락만 정확히 찾아내지 못하는 단점 이 있다. 또한 매 질의마다 수백 또는 수천개의 토큰을 재처리해 비용이 많이 발생하는 한계를 가진다. 이러한 문제점을 해결하기 위해 본 연구에서는 소규모 언어모델(Small Language Model, SLLM)과 RAG를 결합한 방법을 제안한다. 섹션 기반 문서 파싱 기법을 통해 문서를 체계적으로 분석하고, 복잡한 표 형태의 데이터를 소규모 언어모델이 정확하게 처리 할 수 있는 방법을 제시함으로써, 유료모델에 대한 경제적, 기술적 대안을 마련하고자 한다
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - Dongguk Business School > Department of Management Information System > 1. Journal Articles
- College of Natural Science > Department of Statistics > 1. Journal Articles

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.