데이터 수학/이론

벡터 (vector)

HicKee 2023. 2. 17. 16:24

스칼라 (상수)

하나의 숫자만으로 이루어진 데이터 
  -> 대부분 실수 (꽃 한송이의 꽃잎길이 측정 -> 숫자)
실수 집합 R 의 원소

x ∈ R

 

벡터 (1차원으로 간주)

여러개의 숫자가 특정한 순서대로 모여있는 것
숫자의 순서를 유지하는 것이 중요 이런 데이터의 묶음을 선형대수에서는 벡터라고함 
복수의 가로줄 행(row)를 가지고 하나의 세로줄 열(column)을 가지는 형태

하나의 백터를 이루는 데이터의 개수가 n개 이면 이 벡터를 n차원 벡터

 

 

입력데이터로 사용되면 특징 벡터 (feature vector)
길이가 1인 벡터를 단위 벡터

 

벡터의 곱셈

벡터의 내적 
  -> 벡터의 크기를 구하거나 두 벡터 사이의 거리를 측정하는 데 이용
  1. 두 벡터의 길이가 같아야한다
  2. 앞 벡터가 행 뒤의 벡터가 열벡터 여야한다

내적의 결과

스칼라 값
 

가중합

벡터의 내적은 가중합을 구할때 쓰임
각각 수 에 어떤 가중치 값을 곱한후 이 곱셈결과를 다시 합한것

가중평균

가중합의 가중치값을 전체 가중치 값의 합으로 나눔 
  -> 대학 성적 계산등에 사용     
 

유사도

두 벡터가 닮은 정도를 정량적으로 나타낸 값 
(비슷한 경우 유사도가 커지고 비슷하지 않은 경우 유사도가 작아진다)
-> 이때 벡터는 변수 정보
 
유클리드 거리 (euclidean distance) -> 인공지능
-> 최단거리 
-> 점과 점, 기울기와 데이터의 거리

실제거리라는 의미에 가장 부합하는 측정법 
  -> 두 데이터가 연관성이 높으면 가깝고 연관성이 낮으면 멀다고 판단하는 기준이 된다고 생각하면 이해하기 쉬움 
  두 벡터간의 직선거리를 측정하는 것
 

manhattan distance (맨하탄 거리) -> 영상처리 등등

-> 이미지 CNN (Convolutional Neural Network) 
정사각형 나뉜곳에서 두점사이의 거리를 측정
두 벡터의 cartesian coordinate의 차의 절대값