전체보기 226

벡터 (vector)

스칼라 (상수) 하나의 숫자만으로 이루어진 데이터 -> 대부분 실수 (꽃 한송이의 꽃잎길이 측정 -> 숫자) 실수 집합 R 의 원소 x ∈ R 벡터 (1차원으로 간주) 여러개의 숫자가 특정한 순서대로 모여있는 것 숫자의 순서를 유지하는 것이 중요 이런 데이터의 묶음을 선형대수에서는 벡터라고함 복수의 가로줄 행(row)를 가지고 하나의 세로줄 열(column)을 가지는 형태 하나의 백터를 이루는 데이터의 개수가 n개 이면 이 벡터를 n차원 벡터 입력데이터로 사용되면 특징 벡터 (feature vector) 길이가 1인 벡터를 단위 벡터 벡터의 곱셈 벡터의 내적 -> 벡터의 크기를 구하거나 두 벡터 사이의 거리를 측정하는 데 이용 1. 두 벡터의 길이가 같아야한다 2. 앞 벡터가 행 뒤의 벡터가 열벡터 여야..

통계적 가설검정 (statistical hypothesis test)

통계적 가설검정 표본을 이용한 분석결과의 의미를 해석하고자 통계적 추론을 사용 표본에서 미지의 모수에 대한 특성을 추정하고 가설을 검증하는 도구로 통계 머신러닝이란 결국 학습과정을 거쳐 가설이 참일 확률 혹은 기각될 확률을 높이는 과정 모집단의 실제 관측값이 어느정도 일것이라는 가설에 근거 표본정보를 사용하여 가설의 합당성여부를 판정하는 과정 귀무 가설 입증하고자 하는 가설 표현은 “~와 차이가 없다”, “~의 효과는 없다”, “~와 같다”가 되어야 함 자연적으로 발생할 확률이 높은 쪽을 선택 대립 가설 “다르다”, “~와 차이가 있다”, “~의 효과는 있다”, “~와 다르다”가 됨 자연적으로 발생할 확률이 낮은 쪽을 선택 오류 1종 오류 ( 더 심각한것 ) ‘귀무 가설이 참인데도 귀무 가설을 기각하는 ..

02. 셀레니움 selenium 01

# 데이터 수집 - 데이터 (웹) 크롤링, 스크랩핑 # 시스템을 구축 -> 데이터 수집 -> 전처리 # 정형, 반정형, 비정형 ( 3가지로 구분 ) # 정형 - 엑셀, DB, CSV # 반정형 - html, xml, json # 비정형 - 소리(음성), 이미지, 영상 등등 ( 실생활에서의 아날로그 데이터들 ) # selenium import time from selenium import webdriver # 크롬 -> 도움말 -> 크롬 정보 -> 버전 확인 109.0.5414.75 # 버전업이 되면서 크롬 드라이버 설치를 안해도 된다 from selenium.webdriver.common.by import By """ browser = webdriver.Chrome() # 브라우저 정보를 얻음 brows..

01. 뷰티풀 수프 BeautifulSoup 02

import requests as requests from bs4 import BeautifulSoup import re http protocol(네트워크 규약) request(클라이언트) -> response(서버) 네이버 뉴스 속보 URL = 'https://news.naver.com/main/list.nhn' res = requests.get(URL, headers={'User-Agent':'Mozilla/5.0'}) html = res.text soup = BeautifulSoup(html, 'html.parser') print(soup) for i in soup.select('span[class=lede]'): print(i.text.strip()) URL = 'https://news.naver..

01. 뷰티풀 수프 BeautifulSoup 01

BeautifulSoup HTML 파싱 파이썬 라이브러리 bs4 라이브러리 설치 필요 from bs4 import BeautifulSoup import re import urllib.request 사용법 1 with open('example.html', 'r', encoding="UTF-8") as fp: soup = BeautifulSoup(fp, 'html.parser') # html 파싱한다라는 의미 -> 전부다 가져옴 print(soup) 사용법 2 url = 'http://movie.daum.net/magazine/new' with urllib.request.urlopen(url) as res: html = res.read() soup = BeautifulSoup(html, 'html.parse..

11. package 패키지

# 패키지 1 # 1개의 파일만 존재 # 패키지 폴더안에 __init__ 빈 파이썬 파일이 필요 from mypackage import Package_01_Calculate res = Package_01_Calculate.plus(10, 20) print('패키지 덧셈 : ', res) from mypackage import Package_01_Calculate as ca res = ca.plus(10, 20) print('패키지 덧셈 : ', res) # 패키지 2 # 여러개의 파일만 존재 # 패키지 폴더안에 __init__ 파일 안에 __all__ = ['Package_01_Calculate','Module1','Module2','Module3','Module4'] 필요 # __all__ = [파이선..

Python/Python Basic 2023.02.09

10. 모듈화 Module

Main # 모듈화 1 # 패키지 -> 연관성이 있는 파일들의 모음 # 모듈 -> 연관성이 있는 함수의 모음 # 모듈보다 패키지가 큰 개념이다 # 동일한 폴더 내에 존재해야한다 # 전부 가져오기 import Module_01_Calculate res = Module_01_Calculate.plus(10, 20) print('더하기 결과 : ', res) # 한가지만 가져오기 from Module_01_Calculate import minus print('빼기 결과 : ', minus(100, 50)) # 이런식으로도 가능 from Module_01_Calculate import minus, multi print('빼기 결과 : ', minus(100, 50)) print('곱하기 결과 : ', multi..

Python/Python Basic 2023.02.07

04. Class 05

학생 클래스 class Student: def __init__(self, name, age, gender, addr): self.__name = name self.__age = age self.__gender = gender self.__addr = addr def std_info(self): print('이름 : ', self.__name, end='\n') print('나이 : ', self.__age, end='\n') print('성별 : ', self.__gender, end='\n') print('주소 : ', self.__addr, end='\n') if __name__ == '__main__': name = ['홍길동', '김길동', '박길동', '이길동', '최길동'] age = [20,..