import pandas as pd import numpy as np # data 출처: https://www.kaggle.com/hesh97/titanicdataset-traincsv/data df = pd.read_csv('./train.csv') group by 아래의 세 단계를 적용하여 데이터를 그룹화(groupping) 데이터 분할 operation 적용 데이터 병합 GroupBy group 속성 각 그룹과 그룹에 속한 index를 dict 형태로 표현 grouping 함수 그룹 데이터에 적용 가능한 통계 함수(NaN은 제외하여 연산) count - 데이터 개수 sum - 데이터의 합 mean, std, var - 평균, 표준편차, 분산 min, max - 최소, 최대값 성별에 따른 생존율 구해..