일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 정처기 실기
- 정처기
- 데이터과학
- 데이터분석
- ai 전문가 과정
- numpy
- AIVLE
- 코딩
- 파이썬
- AI 윤리
- 모각코
- 클래스
- dictionary
- list
- pandas
- Python
- 인공지능
- Ai
- AI학습
- git
- Java
- 데이터
- 백준
- KT AIVLE
- KT
- 코딩테스트
- 알고리즘
- github
- LG Aimers
- 자바
Archives
- Today
- Total
무향향수
Python 프로그래밍 & 라이브러리 2 본문
분석을 위한 데이터 구조(자료형)
Numpy: 수치 연산
pandas: 비즈니스 데이터 표현
분석할 수 있는 정보의 종류 2가지
- 숫자, 범주
Reshape
a = np.array([[1, 2, 3],
[4, 5, 6]])
b = a.reshape(3, 2)
# 또는
b = np.reshape(a, (3, 2))
a.reshape(3, 2)
또는
np.reshape(a, (3, 2))
형태로 변환할 수 있다.
Reshape에서 -1
a.reshape(3, -1)
a.reshape(-1 ,3)
-1을 작성하면 데이터에 맞게 자동으로 생성
열자리에 있으면, 행에 맞게
행자리에 있으면, 열에 맞게
가장 큰(작은) 값의 인덱스 반환 np.argmax, np.argmin
np.argmax(a)
np.argmax(a, axis = 0) # 행 방향 최대값 인덱스
np.argmax(a, axis = 1) # 열 방향 최대값 인덱스
문법: np.argmax(array, axis = 0)
axis = 0 ➡️ 행 방향 최대값 인덱스
axis = 1 ➡️ 열 방향 최대값 인덱스
예시
a가
[[1, 5, 7],
[2, 3, 8]]
형태일 때
각각
[1, 0, 1]
[2, 2]가 답이 된다.
데이터 프레임 정보 확인
info: 인덱스, 열, 값 개수, 데이터 형식 정보 등 확인
describe: 기초 통계 정보 확인
데이터 프레임의 열을 작성할 때,
예) df['age']
df[['name', 'age']]
=> 대괄호를 두 개 작성하는 것이 아니라 대괄호 안에 리스트를 작성하는 것이라고 보면 된다!!
isin()
isin([값1, 값2, ... 값n])
값1 또는 값2 또는 값n인 데이터만 조회한다.
⚠️isin(리스트) 값들을 리스트 형태로 입력해야 한다.⚠️
agg() 집계함수
agg()를 사용하여 다양한 연산의 값을 한 번에 구한다.
air.groupby('Month')[['Ozone', 'Wind', 'Temp']].agg(['max', 'min', 'mean', 'std'])
Month를 기준으로 그룹을 묶은 Ozone, Wind, Temp 데이터들의 최대, 최소, 평균, 표준편차 값을 한 번에 구한다.
'kt aivle' 카테고리의 다른 글
시계열 (1) | 2024.02.26 |
---|---|
데이터 처리 (1) | 2024.02.26 |
1주차 Python 프로그래밍 & 라이브러리 (0) | 2024.02.22 |
데이터 조작 이해와 실무_데이터 변경 (0) | 2024.02.04 |
데이터 조작 이해와 실무_데이터 선택 (1) | 2024.02.04 |