Colab/머신러닝

01. 기초 이론

HicKee 2023. 2. 27. 16:01
데이터 분석
시장 트랜드를 가장 빠르게 살펴볼수있는 방법
사람들이 많이 검색하는 키워드, 대화나 문장속에 담겨진 의견 등
분야별 제품의 수요, 고객들의 행동 패턴 등도 데이터분석으로 가능
웹사이트, IOT, CRM, 소셜매체 통해 테이터 수집
 

 

통계 기법

소수에서 다수를 추정
소수의 집단을 통해 추정한 표본 평균으로부터,
실제 다수의 집단이 어느정도의 오차 범위로 나타날 것인지 신뢰구간을 이용하여 계산

데이터의 양이 방대하고 복잡도가 높아서 사람이 직접 데이터를 분석하기가 까다로울 때, 
이를 효과적으로 분석하여 타겟을 추정하는 목적으로 머신러닝이 필요

시장과 고객의 반응을 예측해보는 것에 머신러닝이 활용

지도 학습 (Supervised Learning)

데이터로 부터 하나의 함수를 유추하기위한 기계학습기법

원시 데이터 -> 학습 -> 알고리즘

지도 학습의 특징

명시적인 정답이 주어진 상황에서 기계를 학습 시키기 위해 데이터와 레이블을 사용
사람이 목표값에 개입하므로 정확도가 높으나 시간이 오래걸리고 필요 데이터량이 많음
 

지도 학습의 기법

● 분류

이진 분류    – 두 가지 중 하나로 분류하는 기법
  고양이가 “맞다” or “아니다”로 분류

다중 분류    – 여러 종류 중 하나로 분류하는 기법
  동물 중 “고양이”로 분류

 회귀

독립변수 기반 분석    
    – 독립변수(입력값)의 개수에 따른 분석
    – 단순/다중 회귀분석

종속변수 기반 분석    
    – 종속변수(독립변수에 의한 효과)의 개수에 따른 분석
    – 일변량/다변량 회귀분석
 

지도학습 알고리즘

 인공신경망 측면

CNN    – 이미지 기반 특징 추출, 차원 축소를 통한 인식, 예측
       – Convolution / Pooling Layer, Feature Map, Sub Sampling

RNN    – 현재와 과거 데이터 고려 순차 데이터 처리 순환 신경망
       – Input / Output / Hidden Layer, Time Unfolding, BPTT, LSTM

 벡터 기반 측면

SVM    – 데이터를 두 클래스 분류 위해 Margin 최대 결정직선 탐색
       – Support Vector, Margin, 초평면, 결정 직선, 커널 함수

회귀분석(Regression)    – 변수 집합에서 독립/종속변수 간 상관관계를 함수로 표현
                        – 독립/종속 변수, 회귀 계수, 최소 자승법, 회귀 방정식
 

 지도 학습과 비지도 학습 비교

지도 학습 - 정답이 있을때

비지도 학습 - 정답이 없을때

 

 

강화 학습 (Reinforcement learning)

 
 

군집, 분류