python/pandas
숫자형 데이터와 범주형 데이터 (apply, astype)
jwjwvison
2021. 3. 30. 21:51
import pandas as pd
info함수로 각 변수의 데이터 타입 확인
- 타입 변경은 astype함수를 사용
숫자형(Numerical Type) 데이터
- 연속성을 띄는 숫자로 이루어진 데이터
- 예) Age, Fare 등
범주형(Categorical Type) 데이터
- 연속적이지 않은 값(대부분의 경우 숫자를 제외한 나머지 값)을 갖는 데이터를 의미
- 예) Name, Sex, Ticket, Cabin, Embarked
- 어떤 경우, 숫자형 타입이라 할지라도 개념적으로 범주형으로 처리해야할 경우가 있음
- 예) Pclass
숫자 데이터와 범주형 데이터화
Age 변수 변환하기
- 변환 로직을 함수로 만든 후, apply함수로 적용