python/pandas

숫자형 데이터와 범주형 데이터 (apply, astype)

jwjwvison 2021. 3. 30. 21:51
import pandas as pd

 

   info함수로 각 변수의 데이터 타입 확인

  • 타입 변경은 astype함수를 사용

 

   숫자형(Numerical Type) 데이터

  • 연속성을 띄는 숫자로 이루어진 데이터
    • 예) Age, Fare 등

 

   범주형(Categorical Type) 데이터

  •   연속적이지 않은 값(대부분의 경우 숫자를 제외한 나머지 값)을 갖는 데이터를 의미
    • 예) Name, Sex, Ticket, Cabin, Embarked
  • 어떤 경우, 숫자형 타입이라 할지라도 개념적으로 범주형으로 처리해야할 경우가 있음
    •  예) Pclass

 

   숫자 데이터와 범주형 데이터화

 

   Age 변수 변환하기

  • 변환 로직을 함수로 만든 후, apply함수로 적용