상세 보기
투영 조합을 통한 빅데이터 앙상블 모형
Ensemble model through mixed projections useful for big data analytics
- 박혜준;
- 김현중;
- 이영섭
Citations
WEB OF SCIENCE
0Citations
SCOPUS
0초록
이 논문에서는 빅데이터 분석 분야에서 유용하게 사용할 수 있는 새로운 분류 앙상블 방법인 mixed projection forest (MPF)를 제안하였다. 앙상블 내 개별 분류기를 학습할 때, MPF는 주성분 분석(PCA)과 정준 선형 판별 분석(CDA) 등의 데이터 투영 기법의 조합에 의한 회전 행렬을 활용한다. 이를 통해 경사 초평면을 사용함으로써 각 분류기의 정확성을 향상시킨다. 또한 변수 집합의 랜덤 분할을 이용해 다양한 회전 행렬을 도출하여 개별 분류기들의 다양성을 증대시킨다. 이러한 접근 방식은 궁극적으로 분류 성능을 향상시켜 정밀도가 필요한 빅데이터 분석에 매우 효과적이다. 이 논문에서는 실제 및 가상의 30개 데이터셋을 사용하여 MPF와 전통적인 분류 앙상블 모형의 성능을 비교하였다. 결과적으로, MPF는 분류 성능 및 분류기의 다양성 측면에서 우수한 경쟁력을 가진다는 것을 확인할 수 있었다.
키워드
분류; 앙상블; rotation forest; canonical forest; random rotation ensemble; classification; ensemble; rotation forest; canonical forest; random rotation ensemble
- 제목
- 투영 조합을 통한 빅데이터 앙상블 모형
- 제목 (타언어)
- Ensemble model through mixed projections useful for big data analytics
- 저자
- 박혜준; 김현중; 이영섭
- 발행일
- 2024-10
- 유형
- Article
- 저널명
- 응용통계연구
- 권
- 37
- 호
- 5
- 페이지
- 691 ~ 702