스칼라 (상수)
하나의 숫자만으로 이루어진 데이터
-> 대부분 실수 (꽃 한송이의 꽃잎길이 측정 -> 숫자)
실수 집합 R 의 원소
x ∈ R
벡터 (1차원으로 간주)
여러개의 숫자가 특정한 순서대로 모여있는 것
숫자의 순서를 유지하는 것이 중요 이런 데이터의 묶음을 선형대수에서는 벡터라고함
복수의 가로줄 행(row)를 가지고 하나의 세로줄 열(column)을 가지는 형태
하나의 백터를 이루는 데이터의 개수가 n개 이면 이 벡터를 n차원 벡터
입력데이터로 사용되면 특징 벡터 (feature vector)
길이가 1인 벡터를 단위 벡터
벡터의 곱셈
벡터의 내적
-> 벡터의 크기를 구하거나 두 벡터 사이의 거리를 측정하는 데 이용
1. 두 벡터의 길이가 같아야한다
2. 앞 벡터가 행 뒤의 벡터가 열벡터 여야한다
내적의 결과
스칼라 값
가중합
벡터의 내적은 가중합을 구할때 쓰임
각각 수 에 어떤 가중치 값을 곱한후 이 곱셈결과를 다시 합한것
가중평균
가중합의 가중치값을 전체 가중치 값의 합으로 나눔
-> 대학 성적 계산등에 사용
유사도
두 벡터가 닮은 정도를 정량적으로 나타낸 값
(비슷한 경우 유사도가 커지고 비슷하지 않은 경우 유사도가 작아진다)
-> 이때 벡터는 변수 정보
유클리드 거리 (euclidean distance) -> 인공지능
-> 최단거리
-> 점과 점, 기울기와 데이터의 거리
실제거리라는 의미에 가장 부합하는 측정법
-> 두 데이터가 연관성이 높으면 가깝고 연관성이 낮으면 멀다고 판단하는 기준이 된다고 생각하면 이해하기 쉬움
두 벡터간의 직선거리를 측정하는 것
manhattan distance (맨하탄 거리) -> 영상처리 등등
-> 이미지 CNN (Convolutional Neural Network)
정사각형 나뉜곳에서 두점사이의 거리를 측정
두 벡터의 cartesian coordinate의 차의 절대값
'데이터 수학 > 이론' 카테고리의 다른 글
표본 (sample), 확률(probability) (0) | 2023.02.20 |
---|---|
선형 회귀 분석 (Linear Regression Analysis) (0) | 2023.02.20 |
엔트로피 (entropy) (0) | 2023.02.20 |
정밀도(Precision), 재현율(Recall), 정확도(Accuracy) (0) | 2023.02.20 |
통계적 가설검정 (statistical hypothesis test) (0) | 2023.02.17 |