import pandas as pd
info함수로 각 변수의 데이터 타입 확인
- 타입 변경은 astype함수를 사용
숫자형(Numerical Type) 데이터
- 연속성을 띄는 숫자로 이루어진 데이터
- 예) Age, Fare 등
범주형(Categorical Type) 데이터
- 연속적이지 않은 값(대부분의 경우 숫자를 제외한 나머지 값)을 갖는 데이터를 의미
- 예) Name, Sex, Ticket, Cabin, Embarked
- 어떤 경우, 숫자형 타입이라 할지라도 개념적으로 범주형으로 처리해야할 경우가 있음
- 예) Pclass
숫자 데이터와 범주형 데이터화
Age 변수 변환하기
- 변환 로직을 함수로 만든 후, apply함수로 적용
'python > pandas' 카테고리의 다른 글
DataFrame group by 이해 (groupby,gorups,grouping) (0) | 2021.03.30 |
---|---|
범주형 데이터 전처리 하기(one-hot encoding) (.get_dumies) (0) | 2021.03.30 |
DataFrame NaN 데이터 처리 (0) | 2021.03.30 |
DataFrame column간 상관관계 계산 (0) | 2021.03.30 |
DataFrame에 column을 추가, 삭제 (0) | 2021.03.30 |