일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- github
- KT AIVLE
- 데이터과학
- 코딩테스트
- 정처기
- 데이터
- 코딩
- 데이터분석
- dictionary
- list
- Java
- Python
- AIVLE
- 자바
- 파이썬
- 모각코
- numpy
- 정처기 실기
- AI학습
- 클래스
- 백준
- KT
- 인공지능
- git
- ai 전문가 과정
- LG Aimers
- 알고리즘
- AI 윤리
- pandas
- Ai
- Today
- Total
목록numpy (7)
무향향수
shift() 시계열 데이터에서만 쓸 수 있다. 시간의 흐름 전후로 정보를 이동한다. temp['Amt_lag'] = temp['Amt'].shift() # default = 1 temp['Amt_lab'] = temp['Amt'].shift(-1) # 1행 앞 당기기 rolling() min_period() min_periods값에 최소 데이터 수를 입력하면 된다. temp['Amt_MA7_2'] = temp['Amt'].rolling(7, min_periods = 1).mean() 첫번째 값부터 계산하기 때문에 앞에 값이 없는 경우 자신의 값을 그대로 작성 두번째는 첫번째, 두번째 값, 세번째는 첫번쨰, 두번째, 세번째 값 ... 이렇게 앞에 값이 없어도 있는 값을 더하여 계산한다.
분석을 위한 기본구조: 2차원 x: feature y: target, label 데이터 전처리에는 두 가지 단계가 있다. 1. 데이터 구조 만들기 (행과 열 형태로) 2. 모델링을 위한 전처리 (머신러닝, 딥러닝) np.where(조건, 참, 거짓) data['JobSat2'] = np.where(data['JobSat'] 1, Female -> 0 data['Gen'] = data['Gen'].map({'Male': 1, 'Female': 0}) 열 삭제 삭제할 때는 항상 조심해야한다. 잘못 되었을 때 되돌리기 위한 준비가 필요해! 그래서 복사본을 항상 제작해두자 data2 = data.copy(..
분석을 위한 데이터 구조(자료형) Numpy: 수치 연산 pandas: 비즈니스 데이터 표현 분석할 수 있는 정보의 종류 2가지 - 숫자, 범주 Reshape a = np.array([[1, 2, 3], [4, 5, 6]]) b = a.reshape(3, 2) # 또는 b = np.reshape(a, (3, 2)) a.reshape(3, 2) 또는 np.reshape(a, (3, 2)) 형태로 변환할 수 있다. Reshape에서 -1 a.reshape(3, -1) a.reshape(-1 ,3) -1을 작성하면 데이터에 맞게 자동으로 생성 열자리에 있으면, 행에 맞게 행자리에 있으면, 열에 맞게 가장 큰(작은) 값의 인덱스 반환 np.argmax, np.argmin np.argmax(a) np.argmax..
목차 다차원 배열 vs Dataframe Numpy 라이브러리 Numpy 배열 다차원 배열 vs Dataframe 다차원 배열 Dataframe 활용 예시 딥러닝 Input 데이터 (3차원 이상의 배열) 통계 분석 / 머신러닝 구현 방식 Numpy 라이브러리 Pandas 라이브러 Numpy 라이브러리 설치 방법: conda install numpy 장점! 1. 고속 연산 파이썬 리스트에 비해 빠른 속도와 좋은 메모리 효율 선형대수 연산이 가능 쉬운 데이터 배열 처리(반복문 필요 없음) 2. 쉽고 빠른 배열 변환 예) 3차원에서 2차원으로 변환 3. 다양한 함수 제공 축(axis)에 따른 집계 연산 가능 배열의 형태 조건이 맞으면 다른 배열과 연결 가능 손쉬운 랜덤 샘플링 가능 Numpy 배열 Numpy가..

목차☃️ 1. random (rand(), randint(), randn()) 2. 몬테카를로 분석 (random 활용하기) 더보기 학습 이유 데이터 분석을 할 때 랜덤 숫자를 자주 사용한다는 사실을 알고 랜덤하게 숫자를 발생시키는 numpy기능인 random에 미리 공부해야겠다 생각하여 블로그에 정리하게 되었다. ☃️ 1. random 데이터 분석시 랜덤하게 발생하는 숫자를 자주 사용한다. numpy 라이브러리에 구현되어 있으며 np.random.rand() & np.random.randint() & np.random.randn() 이렇게 세가지가 있다. rand() rand() : 0과 1사이 균등분포의 random 수(실수) import numpy as np np.random.rand(3) # ar..

목차 🌝 Matplotlib 더보기 학습 이유 파이썬 데이터 분석에 필수적으로 사용되는 matplotlib에 대해 학습하여 데이터 분석한 결과를 쉽게 시각화하기 위하여 학습하게 되었다. 🌝 1. Matplotlib matplotlib는 파이썬 시각화 라이브러리이다. 우선 그래프 생성에 사용되는 numpy와 matplotlib라이브러리를 불러온다. import numpy as np import matplotlib.pyploy as plt # 랜덤한 숫자를 배열로 생성하기 위하여 넘파이 라이브러리를 불러온다. # 데이터를 시각화하기 위하여 matplotlib 라이브러리를 불러온다. matplotlib를 사용하여 시각화한 그래프가 화면에 나타날 수 있도록 %matplotlib inline명령어를 사용해준다. ..
목차 🐢 Numpy Numpy의 이해 Numpy 배열 생성 더보기 학습 이유 파이썬을 이용한 데이터 분석에 대해 학습하면서 numpy 라이브러리를 사용한 실습 예제들이 자주 출제되어 numpy가 무엇인지 정확하게 알고 뒷부분을 학습하는 것이 좋을 것 같다는 생각이 들었기 때문이다. 🐢 1. Numpy 파이썬은 초보자도 사용하기 쉬운 좋은 프로그래밍 언어이지만, 대규모 수치 연산을 할 때 느려진다는 단점이 있다, 이를 보완하기 위해 Numpy 즉, Numerical Python을 사용한다. numpy는 C언어로 구현되어 연산 속도가 빠르고 다양한 함수와 배열 연산 기능을 사용할 수 있다. 🐢 2. Numpy의 이해 Numpy는 빠르고 효율적인 배열 연산을 지원하고, 선행대수, 통계, 난수 생성 등 다양한 ..