python 37

Series 함수 활용하여 데이터 분석하기

import numpy as np import pandas as pd Series size, shape, unique, count, value_counts 함수 size: 개수 반환 shape: 튜플형태로 shape 반환 unique: 유일한 값만 ndarray로 반환 count: NaN을 제외한 개수를 반환 mean: NaN을 제외한 평균 value_counts: NaN을 제외하고 각 값들의 빈도를 반환 ndarray에 NaN이 있으면 평균을 계산하면 NaN이 나오는데 Series는 그렇지 않다 index를 활용하여 멀티플한 값에 접근 head, tail 함수 head: 상위 n개 출력 기본 5개 tail: 하위 n개 출력 기본 5개

python/pandas 2021.03.29

Pandas Series 데이터 생성하기

import numpy as np import pandas as pd Series pandas의 기본 객체 중 하나 numpy의 ndarray를 기반으로 인덱싱 기능을 추가하여 1차원 배열을 나타냄 index를 지정하지 않을 시, 기본적으로 ndarray와 같이 0-based인덱스 생성, 지정할 경우 명시적으로 지정된 index를 사용 같은 타입의 0개 이상의 데이터를 가질 수 있음 data로만 생성하기 index는 기본적으로 0부터 자동적으로 생성 data, index함께 명시하기 data, index, data type 함께 명시하기 인덱스 활용하기 1. 인덱스를 통한 데이터 접근 2. 인덱스를 통한 데이터 업데이트 3. 인덱스 재사용하기

python/pandas 2021.03.29

matplotlib 모듈을 이용하여 그래프 표현하기

import numpy as np import matplotlib.pyplot as plt %matplotlib inline # 그래프가 주피터 안에서 그려진다는 의미 그래프 데이터 생성 그래프 출력하기 plot함수 (선 그래프), scatter(점 그래프), hist(히스토그램) 등 사용 함수의 parameter 혹은 plt의 다른 함수로 그래프 형태 및 설정을 변경하능 기본적으로 x,y에 해당하는 값이 필요 그래프에 주석 추가 x,y 축 및 타이틀 grid 추가 x,y 축 범위 지정 plot 함수 parameters 그래프 형태에 대한 제어 가능 plot함수 도큐먼트 pyplot — Matplotlib 2.0.2 documentation Parameters:X : array_like, shape (n..

python/numpy 2021.03.29

Boolean indexing

Boolean indexing ndarray 인덱싱 시, bool 리스트를 전달하여 True인 경우만 필터링 브로드캐스팅을 활용하여 ndarray로 부터 bool list 얻기 예) 짝수인 경우만 찾아보기 bool 리스트를 인덱스로 전달 다중조건 사용하기 파이썬 논리 연산자인 and, or, not 키워드 사용 불가 & - AND | - OR 예제) 2019년 7월 서울 평균기온 데이터 평균기온이 25도를 넘는 날수는? 평균기온이 25를 넘는 날의 평균 기온은?

python/numpy 2021.03.29

Broadcasting의 이해

import numpy as np 브로드캐스팅 Shape이 같은 두 ndarray에 대한 연산은 각 원소별로 진행 연산되는 두 ndarray가 다른 Shape을 갖는 경우 브로드캐스팅(Shape을 맞춤) 후 진행 브로드캐스팅 Rule 차원에서 부터 비교하여 Shape이 같거나, 차원 중 값이 1인 것이 존재하면 가능 Shape이 같은 경우의 연산 Sclar(상수)와의 연산 Shape이 다른 경우 연산 뒷차원 부터 계산한다 ex) (4,3) + (1,3) 이면 (1,3)의 3이 (4,3)의 3과 같으므로 broadcasting 가능하다 그러나 (4,3) 과 (1,4)는 뒤 행렬의 4와 앞 행렬의 3이 다름으로 broadcasting이 불가능 하다

python/numpy 2021.03.29

axis를 파라미터로 갖는 함수 이해하기

import numpy as np axis 이해하기 몇몇 함수에는 axis keyword 파라미터가 존재 axis값이 없는 경우에는 전체 데이터에 대해 적용 axis값이 있는 경우에는, 해당 axis를 따라서 연산 적용 axis를 파라미터로 갖는 함수를 이용하기 거의 대부분의 연산 함수들이 axis 파라미터를 사용 이 경우, 해당 값이 주어졌을 때, 해당 axis를 따라서 연산이 적용 따라서 결과는 해당 axis가 제외된 나머지 차원의 데이터만 남게 됨 예) np.sum , np.mean, np.any 등등 1차원 데이터에 적용하기 행렬에 적용하기 3차원 텐서에 적용하기 axis의 값이 튜플일 경우 해당 튜플에 명시된 모든 axis에 대해서 연산

python/numpy 2021.03.28