본문 바로가기
728x90

코딩/Machine Learning23

4. 평가(분류 평가) 권철민 저, '파이썬 머신러닝 완벽 가이드', 2019.02.28 내 맘대로 요약 공부 중(문제시 비공개 및 삭제) 최초 작성일 2020.11.29 4.1 머신러닝 모델의 예측 성능 평가란? - 머신러닝은 데이터 가공/변환, 모델 학습/예측, 평가(Evaluation) 프로세스로 구성 - 성능 평가 지표(Evaluation Metric)는 일반적으로 분류, 회귀에 따라 나뉨 - 분류에 대한 평가 - 회귀에 대한 평가는(5장에서 다룸) - 분류의 성능 평가 지표(이진분류, 멀티분류) 정확도(Accuracy) 오차행렬(Confusion Matrix) 정밀도(Precision) 재현율(Recall) F1 스코어 ROC AUC 4.2 정확도(Accuracy) - 실제 데이터와 예측 데이터가 얼마나 같은지 판단하.. 2020. 11. 29.
3. Scikit-learn(사이킷런) 권철민 저, '파이썬 머신러닝 완벽 가이드', 2019.02.28 내 맘대로 요약 공부 중(문제시 비공개 및 삭제) 최초 작성일 2020.10.24 3.1 Scikit-learn(사이킷런) 이란? - 파이썬에서 머신러닝을 위한 가장 쉽고 효율적인 라이브러리 - 오랜 기간 개발되어 라이브러리의 성숙도가 높고 매우 많은 환경에서 사용 중 - 현재는 Tensorflow, Keras 등이 대세 - Anaconda 설치 시 기본 라이브러리에 포함되어 있음 - pip install scikit-learn 3.2 기본예제(붓꽃 품종 예측) - 분류(Classification)는 지도학습(Supervised Learning) 방법 중 하나 - 학습데이터로 모델을 학습시킨 후 별도의 테스트데이터로 검증 및 분류 - sk.. 2020. 10. 24.
2. Pandas 권철민 저, '파이썬 머신러닝 완벽 가이드', 2019.02.28 내 맘대로 요약 공부 중(문제시 비공개 및 삭제) 최초 작성일 2020.09.12 2.1 Pandas란? - 파이썬에서 2차원 데이터를 효율적으로 가공 및 처리할 수 있게 지원하는 패키지 - 행(Row) x 열(Column)로 구성. 엑셀의 시트와 닮아있다고 생각하면 된다. - 핵심 객체는 DataFrame으로, DataFrame은 Column이 여러 개인 데이터 혹은 여러 개의 Series로 이루어진 데이터 - Series는 Column이 한 개인 데이터 - import pandas as pd 2.2 데이터 불러오기 - read_table() vs read_csv() - 기본 필드 구분 문자가 read_table()은 탭('\t'), r.. 2020. 9. 12.
1. Numpy 권철민 저, '파이썬 머신러닝 완벽 가이드', 2019.02.28 내 맘대로 요약 공부 중(문제시 비공개 및 삭제) 최초 작성일 2020.09.08 1.1 Numpy란? - 파이썬에서 선형대수 기반의 프로그램을 쉽게 만들 수 있도록 지원하는 패키지 - C/C++과 같은 저수준 언어 기반의 호환 API를 제공하여 기존 C/C++ 기반의 타 프로그램과의 연동 가능 - numpy의 기본 데이터 타입은 ndarray - import numpy as np 1.2 ndarray 만들기 - np.array(), 파이썬의 리스트를 받아 ndarray로 변환하는 기능 - ndarray는 행과 열의 수를 튜플(Tuple)로 가진다. - .shape으로 크기, .dim으로 차원 수 확인 가능 - 연산은 같은 데이터 타입만 .. 2020. 9. 8.
Anaconda3로 Tensorflow-gpu 설치하기 컴퓨터를 업그레이드 하였다. Intel i5-6600K → AMD 3900X GTX 1060 → RTX 2080 Ti 운영체제: Windows10 x64(정품) 머신러닝용 컴퓨터로 세팅하기 위한 가장 첫걸음! Tensorflow-gpu를 설치하는 것이다. 오류가 나지 않도록 설치하는것이 포인트! 1. 아나콘다3 설치 https://www.anaconda.com/distribution/ Anaconda Python/R Distribution - Free Download Anaconda Distribution is the world's most popular Python data science platform. Download the free version to access over 1500 data sci.. 2020. 3. 29.
반응형