2021/02/08 - [논문통계 및 통계공부] - 데이터 사이언스 스쿨 소개
커널 서포트 벡터머신의 모델의 장점에 대해서 설명해준 책입니다.
이 분야는 GLM이라기 보다는 판별분석의 업그레이드 버전이라고 보시면 될것 같습니다.
다변량분석에서 배우는 LDA, QDA는 다변량 정규분포의 성질의 응용이라고 볼 수 있습니다.
그러나, LDA같은 경우에는 경계값에서 한 선으로 잘라지지 않는 경계선을 잘 구분해내지 못합니다.
그래서 서포트백터머신은 차원을 높여서 초평면으로 경계를 잡아내는 방법이라고 학부 때 배웠던 기억이 납니다.
m차원의 경계면(초평면)을 찾아내는 방법인것이지요.
커널을 이용한 서포트 백터머신에 대해서 그렇게 설명을 해주셨던 것 같은데, 저는 잘 써보지 못했습니다.
분류 성능은 좋지만, 과적합 위험도 있으며, 모형의 설명이 어려운 것은 단점입니다.
데이터사이언스 쪽으로 갈 수록 통계적으로 설명이 어려운 모형들이 많이 튀어나옵니다.
그리고, 엄청난 컴퓨팅 파워를 통해 모형의 안정성을 따지는 방법론들이 있어서 이를 보완하는 모양새입니다.
그렇다면, 모형의 안정성을 따지는 방법(컴퓨터 코드를 통해서)에 대해서 알아야지 이런 모형들을 잘 다룰 수 있겠죠.
저는 그런 것들에 대해서 실습도 안해봤고해서 항상 어려움을 느끼는 부분입니다.
기회가 있고, 반복적으로 일에 적용하게 된다면 마음잡고 할탠데, 그럴 동기부여는 잘 되지 않는 것 같아요.
훗날 파이썬보다 더 편한 프로그래밍 툴이 나온다면..(모형의 안정성을 자동으로 따져주는 인공지능 프로그래밍 정도?)
그 때는 이런저런 방법론들을 마음껏 만들고 실험해보면 재미있을 것 같습니다.
마치 아이언맨처럼 말이죠
'논문통계 및 통계공부' 카테고리의 다른 글
(분석에 필요한 기술) 스케일링 하기, 다중공선성 다루기 (0) | 2021.02.08 |
---|---|
데이터 사이언스 스쿨 소개 (0) | 2021.02.08 |
로지스틱 회귀분석의 모수 추정 (0) | 2021.02.08 |
논문통계 공부방법(로지스틱 회귀분석, 생존분석) (0) | 2021.02.07 |