투영 조합을 통한 빅데이터 앙상블 모형
Ensemble model through mixed projections useful for big data analytics
Citations

WEB OF SCIENCE

0
Citations

SCOPUS

0

초록

이 논문에서는 빅데이터 분석 분야에서 유용하게 사용할 수 있는 새로운 분류 앙상블 방법인 mixed projection forest (MPF)를 제안하였다. 앙상블 내 개별 분류기를 학습할 때, MPF는 주성분 분석(PCA)과 정준 선형 판별 분석(CDA) 등의 데이터 투영 기법의 조합에 의한 회전 행렬을 활용한다. 이를 통해 경사 초평면을 사용함으로써 각 분류기의 정확성을 향상시킨다. 또한 변수 집합의 랜덤 분할을 이용해 다양한 회전 행렬을 도출하여 개별 분류기들의 다양성을 증대시킨다. 이러한 접근 방식은 궁극적으로 분류 성능을 향상시켜 정밀도가 필요한 빅데이터 분석에 매우 효과적이다. 이 논문에서는 실제 및 가상의 30개 데이터셋을 사용하여 MPF와 전통적인 분류 앙상블 모형의 성능을 비교하였다. 결과적으로, MPF는 분류 성능 및 분류기의 다양성 측면에서 우수한 경쟁력을 가진다는 것을 확인할 수 있었다.

키워드

분류앙상블rotation forestcanonical forestrandom rotation ensembleclassificationensemblerotation forestcanonical forestrandom rotation ensemble
제목
투영 조합을 통한 빅데이터 앙상블 모형
제목 (타언어)
Ensemble model through mixed projections useful for big data analytics
저자
박혜준김현중이영섭
DOI
10.5351/KJAS.2024.37.5.691
발행일
2024-10
유형
Article
저널명
응용통계연구
37
5
페이지
691 ~ 702