논문통계 및 통계공부

커널 서포트 백터 머신(걸쳐저 있는 부분의 분류기능 향상)

하트 뿅뿅 2021. 2. 8. 22:10
반응형

2021/02/08 - [논문통계 및 통계공부] - 데이터 사이언스 스쿨 소개

 

데이터 사이언스 스쿨 소개

2021/02/07 - [논문통계 및 통계공부] - 논문통계 공부방법(로지스틱 회귀분석, 생존분석) 논문통계 공부방법(로지스틱 회귀분석, 생존분석) 안녕하세요 슬기로운 직장생활 블로그 운영자입니다^^

wise-working.tistory.com

 

datascienceschool.net/03%20machine%20learning/13.03%20%EC%BB%A4%EB%84%90%20%EC%84%9C%ED%8F%AC%ED%8A%B8%20%EB%B2%A1%ED%84%B0%20%EB%A8%B8%EC%8B%A0.html

 

커널 서포트 벡터 머신 — 데이터 사이언스 스쿨

커널 사용의 장점 커널을 사용하면 베이시스 함수를 하나씩 정의하는 수고를 덜 수 있을뿐더러 변환과 내적에 들어가는 계산량이 줄어든다. 예를 들어, 다음과 같은 기저함수의 경우 \[ \phi(x_i) =

datascienceschool.net

커널 서포트 벡터머신의 모델의 장점에 대해서 설명해준 책입니다.

 

이 분야는  GLM이라기 보다는 판별분석의 업그레이드 버전이라고 보시면 될것 같습니다.

 

다변량분석에서 배우는 LDA, QDA는 다변량 정규분포의 성질의 응용이라고 볼 수 있습니다.

 

그러나, LDA같은 경우에는 경계값에서 한 선으로 잘라지지 않는 경계선을 잘 구분해내지 못합니다.

 

그래서 서포트백터머신은 차원을 높여서 초평면으로 경계를 잡아내는 방법이라고 학부 때 배웠던 기억이 납니다.

 

m차원의 경계면(초평면)을 찾아내는 방법인것이지요.


커널을 이용한 서포트 백터머신에 대해서 그렇게 설명을 해주셨던 것 같은데, 저는 잘 써보지 못했습니다.

 

분류 성능은 좋지만, 과적합 위험도 있으며, 모형의 설명이 어려운 것은 단점입니다.

 

데이터사이언스 쪽으로 갈 수록 통계적으로 설명이 어려운 모형들이 많이 튀어나옵니다.

 

그리고, 엄청난 컴퓨팅 파워를 통해 모형의 안정성을 따지는 방법론들이 있어서 이를 보완하는 모양새입니다.

 

그렇다면, 모형의 안정성을 따지는 방법(컴퓨터 코드를 통해서)에 대해서 알아야지 이런 모형들을 잘 다룰 수 있겠죠.

 

저는 그런 것들에 대해서 실습도 안해봤고해서 항상 어려움을 느끼는 부분입니다.

 

기회가 있고, 반복적으로 일에 적용하게 된다면 마음잡고 할탠데, 그럴 동기부여는 잘 되지 않는 것 같아요.

 

훗날 파이썬보다 더 편한 프로그래밍 툴이 나온다면..(모형의 안정성을 자동으로 따져주는 인공지능 프로그래밍 정도?)

 

그 때는 이런저런 방법론들을 마음껏 만들고 실험해보면 재미있을 것 같습니다.

 

마치 아이언맨처럼 말이죠

반응형