투영 조합을 통한 빅데이터 앙상블 모형Ensemble model through mixed projections useful for big data analytics
- Other Titles
- Ensemble model through mixed projections useful for big data analytics
- Authors
- 박혜준; 김현중; 이영섭
- Issue Date
- Oct-2024
- Publisher
- 한국통계학회
- Keywords
- 분류; 앙상블; rotation forest; canonical forest; random rotation ensemble; classification; ensemble; rotation forest; canonical forest; random rotation ensemble
- Citation
- 응용통계연구, v.37, no.5, pp 691 - 702
- Pages
- 12
- Indexed
- ESCI
KCI
- Journal Title
- 응용통계연구
- Volume
- 37
- Number
- 5
- Start Page
- 691
- End Page
- 702
- URI
- https://scholarworks.dongguk.edu/handle/sw.dongguk/56263
- DOI
- 10.5351/KJAS.2024.37.5.691
- ISSN
- 1225-066X
2383-5818
- Abstract
- 이 논문에서는 빅데이터 분석 분야에서 유용하게 사용할 수 있는 새로운 분류 앙상블 방법인 mixed projection forest (MPF)를 제안하였다.
앙상블 내 개별 분류기를 학습할 때, MPF는 주성분 분석(PCA)과 정준 선형 판별 분석(CDA) 등의 데이터 투영 기법의 조합에 의한 회전 행렬을 활용한다. 이를 통해 경사 초평면을 사용함으로써 각 분류기의 정확성을 향상시킨다.
또한 변수 집합의 랜덤 분할을 이용해 다양한 회전 행렬을 도출하여 개별 분류기들의 다양성을 증대시킨다.
이러한 접근 방식은 궁극적으로 분류 성능을 향상시켜 정밀도가 필요한 빅데이터 분석에 매우 효과적이다.
이 논문에서는 실제 및 가상의 30개 데이터셋을 사용하여 MPF와 전통적인 분류 앙상블 모형의 성능을 비교하였다. 결과적으로, MPF는 분류 성능 및 분류기의 다양성 측면에서 우수한 경쟁력을 가진다는 것을 확인할 수 있었다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - College of Natural Science > Department of Statistics > 1. Journal Articles

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.