본문 바로가기

Programming/Python7

머신러닝을 위한 파이썬 선형회귀 기본 이론 부스트코스의 "머신러닝을 위한 파이썬" 강좌 필기 내용 https://www.boostcourse.org/ai222/lecture/24508?isDesc=false 선형회귀 머신러닝의 학습 방법들 - Gradient descent based learning - Probability theory based learning - information theroy based learning - Distance similality based learning 선형회귀와 로지스틱회귀는 첫번째 방법인 gradient descent 를 사용한다. Gradient descent 경사하강법 = 모델 = 수학식 변수를 넣고 방정식을 푼다 y = ax + b a와 b의 파라미터를 알아내는 것 빨간색 선과의 차이를 더한 값들이 .. 2022. 10. 15.
파이썬 넘파이 numpy 기초 문법 부스트코스의 "머신러닝을 위한 파이썬" 강좌 필기 내용 https://www.boostcourse.org/ai222/lecture/24071?isDesc=false 파이썬은 인터프리터 언어라서 성능이 많이 느리다. 그걸 개선하려면 적절한 패키지를 잘 사용해야함. Numpy 없이 텐서플로우를 사용하면 많이 막힐 수 있다. Numpy - numerical Python - 고성능 과학 계산용 패키지 - Matrix와 Vector와 같은 Array 연산의 사실상 표준 - 한글로 넘파이로 통칭, 넘피, 늄파이라고 불리기도 함 - 일반 리스트에 비해 빠르고 메모리 효율적임 : for문이나 list comprehension을 쓰지 않고 array 처리를 할 수 있음 - 선형 대수와 관련된 기능 - C와 CPP와 좋은.. 2022. 10. 14.
파이썬 저장 경로 아주 쉽게 확인하는 법 터미널에서 아래 명령 입력 python -m site 2022. 10. 14.
파이썬 내장 모듈로만 벡터 연산 실습 부스트코스의 "머신러닝을 위한 파이썬" 강좌 필기 내용 https://www.boostcourse.org/ai222/lecture/253409/?isDesc=false 텍스트 마이닝 실습 코드로 문서의 유사도를 측정하는 모듈 작성 import os ''' 로직 : 문자 => 벡터와 숫자로 표현 방식은 원핫인코딩 / bag of words => 각각의 단어별로 인덱스를 부여해서 한 문장의 단어 개수를 표현할 수 있다 벡터화된 문자들의 유사도를 거리로 측정할 수 있다 유사도 측정에는 유클리드 거리, 코사인 유사도 측정 => 코사인 유사도가 더 많이 쓰이고 적중률이 높음 프로세스 : - 파일을 불러오기 - 파일 읽어서 단어 사전 만들기 - 단어별로 index 만들기 - 만들어진 인덱스로 문별로 bag of w.. 2022. 10. 14.
파이썬으로 간단한 행렬 연산 / 선형대수 부스트코스의 "머신러닝을 위한 파이썬" 강좌 필기 내용 https://www.boostcourse.org/ai222/lecture/253408/?isDesc=false ## 벡터의 계산 ''' # [2,2] + [2,3] + [3,5] = [7,10]를 계산할 때 # 이런 코드는 쓰면 안 됨 = 파이썬 답지 못하고 아름답지 않음 u = [2,2] v = [2,3] z = [3,5] result=[] for i in range(len(u)): result.append([u[i] + v[i] + z[i]]) print(result) ''' from re import X u = [2,2] v = [2,3] z = [3,5] result = [sum(t) for t in zip(u,v,z)] # zip을 사용해.. 2022. 10. 14.