설명중심의 통계모형과 예측중심의 기계학습의 비교Comparison of Explanation-centered Statistical Model and Prediction-centered Machine Learning
- Other Titles
- Comparison of Explanation-centered Statistical Model and Prediction-centered Machine Learning
- Authors
- 구소희; 맹세호; 박수진; 조영일
- Issue Date
- Apr-2021
- Publisher
- 인문사회 21
- Keywords
- Big Data; Machine Learning; Random Forest; Overfitting; HRM; 빅데이터; 기계학습; 랜덤포레스트; 과적합; 인적자원관리
- Citation
- 인문사회 21, v.12, no.2, pp 245 - 260
- Pages
- 16
- Indexed
- KCI
- Journal Title
- 인문사회 21
- Volume
- 12
- Number
- 2
- Start Page
- 245
- End Page
- 260
- URI
- https://scholarworks.dongguk.edu/handle/sw.dongguk/5092
- ISSN
- 2951-049X
- Abstract
- 본 논문은 ‘대졸자 직업 이동 경로조사’ 데이터를 사용하여 설명중심의 통계모형인 로지스틱 회귀분석과 예측중심의 기계학습 중 랜덤 포레스트 분석 결과를 비교하였다. 로지스틱 회귀분석은 사례수가 커짐에 따라 1종 오류와 검증력이 과도하게 높아져 예측력에서 문제가 나타났다. 반면에 랜덤 포레스트는 설명중심 통계모형보다 예측력이 높게 나타났지만 이론적 배경 없이 모든 예측변수가 분석에 포함되어 결과에 대한 해석이 모호하거나 고용정책기본법에 위반되는, 즉 공정성에 어긋나는 변수가 분석에 사용되었다. 따라서 빅데이터 분석 시 연구 목적에 알맞게 변수를 정리하고 데이터를 클리닝 하는 과정을 거쳐야 한다. 본 논문은 과적합이 발생하지 않도록 주의하고 변수추출이나 유사변수를 사용하여 인적자원관리 장면에서 예측력을 높임과 동시에 불평등을 해소할 수 있는 분석 방법을 탐색할 수 있는 방향을 제시하였다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - College of Police and Criminal Justice > Department of Police Administration > 1. Journal Articles

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.