kt aivle

[Python] 데이터프레임 결합

튼튼한장 2024. 6. 2. 19:50

pd.concat()

매핑 기준: 인덱스(행), 칼럼이름(열)

pd.concat([df1, df2], axis=0, join='inner')
# df1, df2를 열을 기준으로 결합
# inner => 동일한 열이 존재하는 경우만 결합
# outer => 동일한 열 여부와 관계 없이 결합

 

pd.merge()

매핑 기준: 특정 칼럼(key)의 값 기준으로 결합

데이터베이스 테이블 조인과 같음

pd.merge(df1, df2, how='inner', on='A')
# 열 A를 기준으로 df1과 df2를 inner join한다.

 

 

pivot

집계 후 데이터프레임 구조를 변형해서 조회하는데 종종 사용된다.

df2 = df.pivot(index = 'Category', columns='Date', values='Qty')
# 인덱스는 Category, 열은 Date, 값은 Qty로 데이터프레임 구성을 변경한다.