본문 바로가기
728x90

정리7

내 장점은 뭘까? 야옹이 작가님은 유재석과의 인터뷰에서 다음과 같은 말을 했다. "매주가 마감의 연속으로 힘들지만, 지금 하는 일이 너무 즐거워요" 그래서 나에게 되물었다. 나는 지금 내가 하고 있는 일이 즐거운가? 딱히 재미없지도, 재미있지도 않다. 정확하게는 대부분 재미없고, 아주 가끔 재미있다. 그럼 내가 뭘 할 때 재미있어하는가? 잘 모르겠다. 아직까지 뭔가를 하면서 진심으로 재밌다고 느껴본 적이 없다. 그럼 내가 잘하는 일은 무엇인가? 확실히 되게 못하는 건 안다. 그림 그리는 것. 영어 말하기를 딱히 잘하지 못한다. 그렇다고 수학, 과학분야를 그렇게 잘하는 것도 아니다. 노래 부르는 것도 그렇게 잘하지는 못한다. 요리도 하긴 하지만 그렇게 잘하는 건 아니다. 질문을 바꿔보자. 그러면 그나마 잘한다고 생각하는 건.. 2021. 8. 3.
np.random.seed(0) 쉽게 보자 생성된 난수를 시드에 저장하여 시드가 바뀌지 않을 경우 값을 유지 시드의 숫자가 변하지 않으면 계속 같은 값을 반환함 - np.random.seed(0) - np.random.randn(100, 2) array([[ 1.62434536, -0.61175641], [-0.52817175, -1.07296862], [ 0.86540763, -2.3015387 ], [ 1.74481176, -0.7612069 ], [ 0.3190391 , -0.24937038], ... - np.random.randn(100, 2) array([[ 1.62434536, -0.61175641], [-0.52817175, -1.07296862], [ 0.86540763, -2.3015387 ], [ 1.74481176.. 2020. 12. 29.
5. 분류(Classification)_1 권철민 저, '파이썬 머신러닝 완벽 가이드', 2019.02.28 내 맘대로 요약 공부 중(문제시 비공개 및 삭제) 최초 작성일 2020.12.10 5.1 분류(Classification)의 개요 - 지도학습은 레이블(Label)이라는 명시적인 정답이 있는 데이터로 학습하는 머신러닝 방식 - 지도학습의 대표적인 유형, 분류(Classification) - 분류는 학습 데이터의 피처(특징)와 레이블(정답)을 머신러닝 알고리즘으로 학습하여 모델을 생성하고, 미지의 값이 주어졌을 때 미지의 레이블 값을 예측하는 것 - 대표적인 분류 알고리즘 1. 베이즈(Bayes) 통계와 생성 모델에 기반한 나이브 베이즈(Naive Bayes) 2. 독립변수와 종속변수의 선형 관계성에 기반한 로지스틱 회귀(Logistic R.. 2020. 12. 10.
4. 평가(분류 평가) 권철민 저, '파이썬 머신러닝 완벽 가이드', 2019.02.28 내 맘대로 요약 공부 중(문제시 비공개 및 삭제) 최초 작성일 2020.11.29 4.1 머신러닝 모델의 예측 성능 평가란? - 머신러닝은 데이터 가공/변환, 모델 학습/예측, 평가(Evaluation) 프로세스로 구성 - 성능 평가 지표(Evaluation Metric)는 일반적으로 분류, 회귀에 따라 나뉨 - 분류에 대한 평가 - 회귀에 대한 평가는(5장에서 다룸) - 분류의 성능 평가 지표(이진분류, 멀티분류) 정확도(Accuracy) 오차행렬(Confusion Matrix) 정밀도(Precision) 재현율(Recall) F1 스코어 ROC AUC 4.2 정확도(Accuracy) - 실제 데이터와 예측 데이터가 얼마나 같은지 판단하.. 2020. 11. 29.
3. Scikit-learn(사이킷런) 권철민 저, '파이썬 머신러닝 완벽 가이드', 2019.02.28 내 맘대로 요약 공부 중(문제시 비공개 및 삭제) 최초 작성일 2020.10.24 3.1 Scikit-learn(사이킷런) 이란? - 파이썬에서 머신러닝을 위한 가장 쉽고 효율적인 라이브러리 - 오랜 기간 개발되어 라이브러리의 성숙도가 높고 매우 많은 환경에서 사용 중 - 현재는 Tensorflow, Keras 등이 대세 - Anaconda 설치 시 기본 라이브러리에 포함되어 있음 - pip install scikit-learn 3.2 기본예제(붓꽃 품종 예측) - 분류(Classification)는 지도학습(Supervised Learning) 방법 중 하나 - 학습데이터로 모델을 학습시킨 후 별도의 테스트데이터로 검증 및 분류 - sk.. 2020. 10. 24.
2. Pandas 권철민 저, '파이썬 머신러닝 완벽 가이드', 2019.02.28 내 맘대로 요약 공부 중(문제시 비공개 및 삭제) 최초 작성일 2020.09.12 2.1 Pandas란? - 파이썬에서 2차원 데이터를 효율적으로 가공 및 처리할 수 있게 지원하는 패키지 - 행(Row) x 열(Column)로 구성. 엑셀의 시트와 닮아있다고 생각하면 된다. - 핵심 객체는 DataFrame으로, DataFrame은 Column이 여러 개인 데이터 혹은 여러 개의 Series로 이루어진 데이터 - Series는 Column이 한 개인 데이터 - import pandas as pd 2.2 데이터 불러오기 - read_table() vs read_csv() - 기본 필드 구분 문자가 read_table()은 탭('\t'), r.. 2020. 9. 12.
1. Numpy 권철민 저, '파이썬 머신러닝 완벽 가이드', 2019.02.28 내 맘대로 요약 공부 중(문제시 비공개 및 삭제) 최초 작성일 2020.09.08 1.1 Numpy란? - 파이썬에서 선형대수 기반의 프로그램을 쉽게 만들 수 있도록 지원하는 패키지 - C/C++과 같은 저수준 언어 기반의 호환 API를 제공하여 기존 C/C++ 기반의 타 프로그램과의 연동 가능 - numpy의 기본 데이터 타입은 ndarray - import numpy as np 1.2 ndarray 만들기 - np.array(), 파이썬의 리스트를 받아 ndarray로 변환하는 기능 - ndarray는 행과 열의 수를 튜플(Tuple)로 가진다. - .shape으로 크기, .dim으로 차원 수 확인 가능 - 연산은 같은 데이터 타입만 .. 2020. 9. 8.
반응형