무향향수

Python 프로그래밍 & 라이브러리 2 본문

kt aivle

Python 프로그래밍 & 라이브러리 2

튼튼한장 2024. 2. 23. 17:00

 

분석을 위한 데이터 구조(자료형)

Numpy: 수치 연산

pandas: 비즈니스 데이터 표현

 

 

 

분석할 수 있는 정보의 종류 2가지

- 숫자, 범주

 


Reshape

a = np.array([[1, 2, 3],
              [4, 5, 6]])
              
b = a.reshape(3, 2)
# 또는
b = np.reshape(a, (3, 2))

a.reshape(3, 2)

또는 

np.reshape(a, (3, 2)) 

형태로 변환할 수 있다.

 

 


Reshape에서 -1 

a.reshape(3, -1)
a.reshape(-1 ,3)

-1을 작성하면 데이터에 맞게 자동으로 생성

열자리에 있으면, 행에 맞게

행자리에 있으면, 열에 맞게

 

 


가장 큰(작은) 값의 인덱스 반환 np.argmax, np.argmin

np.argmax(a)

np.argmax(a, axis = 0) # 행 방향 최대값 인덱스

np.argmax(a, axis = 1) # 열 방향 최대값 인덱스

문법: np.argmax(array, axis = 0)

 

axis = 0 ➡️ 행 방향 최대값 인덱스

axis = 1 ➡️ 열 방향 최대값 인덱스

 


예시

a가

[[1, 5, 7],

[2, 3, 8]]

형태일 때

 

각각

[1, 0, 1]

[2, 2]가 답이 된다.

 

 


데이터 프레임 정보 확인

info: 인덱스, 열, 값 개수, 데이터 형식 정보 등 확인

describe: 기초 통계 정보 확인

 

데이터 프레임의 열을 작성할 때,

예) df['age']

df[['name', 'age']]

=> 대괄호를 두 개 작성하는 것이 아니라 대괄호 안에 리스트를 작성하는 것이라고 보면 된다!! 

 

 

isin()

isin([값1, 값2, ... 값n])

값1 또는 값2 또는 값n인 데이터만 조회한다.

⚠️isin(리스트) 값들을 리스트 형태로 입력해야 한다.⚠️

 

 


agg() 집계함수

agg()를 사용하여 다양한 연산의 값을 한 번에 구한다.

air.groupby('Month')[['Ozone', 'Wind', 'Temp']].agg(['max', 'min', 'mean', 'std'])

Month를 기준으로 그룹을 묶은 Ozone, Wind, Temp 데이터들의 최대, 최소, 평균, 표준편차 값을 한 번에 구한다.

'kt aivle' 카테고리의 다른 글

시계열  (1) 2024.02.26
데이터 처리  (1) 2024.02.26
1주차 Python 프로그래밍 & 라이브러리  (0) 2024.02.22
데이터 조작 이해와 실무_데이터 변경  (0) 2024.02.04
데이터 조작 이해와 실무_데이터 선택  (1) 2024.02.04