Machine Learning/Basic 22

[2-1] 훈련 세트와 테스트 세트

이 포스팅은 혼자 공부하는 머신러닝 + 딥러닝 책을 공부하고 정리한 것 입니다. 훈련 세트와 테스트 세트 시험에서 연습 문제와 시험 문제가 달라야 올바르게 학생의 능력을 평가할 수 있듯이 머신러닝 알고리즘의 성능을 제대로 평가하려면 훈련 데이터와 평가에 사용할 데이터가 각각 달라야 한다. 이렇게 하는 가장 간단한 방법은 평가를 위해 또 다른 데이터를 준비하거나 이미 준비된 데이터 중에서 일부를 뗴어 내어 활용하는 것이다. 일반적으로 후자의 경우가 많다. 평가에 사용하는 데이터를 테스트 세트(test set), 훈련에 사용되는 데이터를 훈련세트(train set) 라고 한다. 먼저 도미와 빙어의 데이터를 합쳐 하나의 파이썬 리스트로 준비한다. fish_length = [25.4, 26.3, 26.5, 29..

[1] 머신러닝 맛보기 - 마켓과 머신러닝

이 포스팅은 혼자 공부하는 머신러닝 + 딥러닝 책을 공부하고 정리한 것 입니다. 마켓에서 팔기 시작한 생선은 도미, 곤들매기, 농어, 강꼬치고기, 로치, 빙어, 송어이다. 이 생선들은 물류 센터에 많이 준비되어 있다. 이 생선들을 프로그램으로 분류한다고 가정해 보자. 어떻게 프로그램을 만들어야 할까? 1. 도미 데이터 준비하기 머신러닝은 누구도 알려주지 않는 기준을 찾아서 일을 한다. 다시 말해 누가 말해주지 않아도 머신러닝은 '30~40cm 길이의 생선은 도미이다 라는 기준을 찾는다. 머신 러닝은 어떻게 이런 기준을 스스로 찾을 수 있을까? 35마리의 도미를 준비했다. 저울로 잰 도미의 길이(cm)와 무게(g)를 파이썬 리스트로 만들면 다음과 같다 bream_length = [25.4, 26.3, 26..