Machine Learning/Advanced (hands on machine learning) 32

2. 머신러닝 프로젝트 - 큰 그림 그리기

진행할 주요 단계는 다음과 같다. 성능 측정 지표 선택 회귀 문제의 전형적인 성능 지표는 평균제곱근 오차(root mean square error (RMSE)) 이다. RMSE가 일반적으로 회귀 문제에 선호되는 성능 측정 방법이지만 경우에 따라 다른 함수를 사용할 수도 있다. 예를 들어 이상치로 보이는 구역이 많다고 가정하다. 이런 경우에는 평균 절대 오차(mean absolute error)를 사용한다. RMSE 와 MAE 모두 예측값의 벡타와 타깃값의 벡터 사이의 거리를 재는 방법이다. 거리 측정에는 여러가지 방법 (또는 노름norm)이 가능하다.

1. 한눈에 보는 머신러닝

1. 머신러닝이란? 머신러닝은 데이터로부터 학습할 수 있는 시스템을 만드는 것이다. 학습이란 어떤 작업에서 주어진 성능 지표가 더 나아지는 것을 의미한다. 2. 레이블된 훈련 세트란? 각 샘플에 대해 원하는 정답(레이블)을 담고 있는 훈련 세트이다. 3. 가장 널리 사용되는 지도 학습 작업 두 가지 회귀, 분류 4. 보편적인 비지도 학습 작업 네 가지 군집, 시각화, 차원 축소, 연관 규칙 학습 5. 사전 정보가 없는 여러 지형에서 로봇을 걸어가게 하려면 어떤 종류의 머신러닝 알고리즘을 사용할까? 알려지지 않은 지형을 탐험하는 로봇을 학습시키는 가장 좋은 방법은 강화학습이다. 6. 고객을 여러 그룹으로 분할하려면 어떤 알고리즘을 사용해야 할까? 만약 그룹을 어떻게 정의할지 모른다면 비슷한 고객끼리 군집으..