목록Python (39)
무향향수
숫자로 요약하기: 정보의 대푯값최빈값(mode)자료 중에서 가장 빈번한 값# 판다스의 mode 메서드 이용하기titanic['Pclass]'.mode() 숫자형 변수 시각화하기 - Density Plot (KDE plot)히스토그램의 단점구간(bin)의 너비에 따라 모양이 달라진다.plt.hist(titanic.Fare, bins=5)plt.show() plt.hist(titanic.Fare, bins=30)plt.show() 히스토그램은 구간(bin)의 너비를 어떻게 잡는지에 따라 전혀 다른 모양이 될 수 있음밀도함수 그래프는 막대의 너비를 가정하지 않고 모든 점에서 데이터 밀도의 추정하는 커널 밀도 추정(Kernel Density Estimation) 방식을 사용하여 이러한 단점을 해결sns.k..
기본 코드 구조import matplotlib.pyplot as pltplt.plot(data['Temp']) # 기본 라인차트를 그려줍니다.plt.show() # 그래프를 화면에 출력해줍니다. x와 y값 지정하기1차원: list, numpy array, series 등을 각각 x와 y로 지정해서 사용2차원: dictionary, dataframe로부터 x와 y를 가져와서 사용 가능# 타입 1plt.plot(data['Date'], data['Temp'])plt.show()# 타입 2plt.plot('Date', 'Temp', data=data)plt.xticks(rotation=50) # x축 글씨를 50도 회전하여 겹치지 않게 만든다.plt.show() x축, y축 이름, 타이틀 붙이기plt.p..
API란?예를 들어,손님이 점원에게 주문을 하면점원은 요리사에게 주문을 전달하고요리사는 요리를 만들어서 점원에게 전달합니다.점원은 요리를 손님에게 가져다 줍니다.여기서 점원이 API 입니다. API클라이언트 프로그램에게 요청을 받아 서버로 전달, 서버는 요청을 처리한 후 결과 데이터를 API에 전달,API는 다시 데이터를 클라이언트로 전달한다. API 사용방법RequestAPI 주소 + API keyRequest 형식: 요청 양식Response 형식: 결과 양식
CRISP-DMBusiness UnderstandingData UnderstandingData PreparationModelingEvaluationDeployment 🍰 Business Understanding - 가설 수립문제를 정의하고 요인을 파악하기 위해 가설을 수립한다.과학 연구에서는 기존 연구 결과로 이어져 내려오는 정설을 귀무가설이라고 부르고기존의 입장을 넘어서기 위한 새로운 연구 가설을 대립가설이라고 부릅니다.여기서 우리가 수립하는 가설을 대립가설로 부르기도 합니다. 가설수립 절차1. 해결해야할 문제가 무엇인가? (목표, 관심사, y)2. y를 설명하기 위한 요인을 찾아라 (x)3. 가설의 구조를 정의하라. x → y 🍰 Data Understanding데이터 원본 식별 및 취득(초기) ..
시계열 데이터란행과 행에 시간의 순서(흐름)가 있고행과 행의 시간 간격이 동일한 데이터 날짜 요소 추출 dt# df의 Date열의 날짜를 원하는 대로 추출df['Date'].dt.year # 연도df['Date'].dt.month # 월df['Date'].dt.day # 일df['Date'].dt.weekday # 요일df['Date'].dt.day_name() # 요일 이름df['Date'].dt.isocalendar().week # 누적 주차 시간에 따른 흐름 추출하기: Time Lag.shift()시계열 데이터에서 시간의 흐름 전후로 정보를 이동시킬 때 사용df['Amt_lag'] = temp['Amt'].shift() # default = 1# 전날 매출액을 추가한다.df['Amt_lag2'] =..
pd.concat()매핑 기준: 인덱스(행), 칼럼이름(열)pd.concat([df1, df2], axis=0, join='inner')# df1, df2를 열을 기준으로 결합# inner => 동일한 열이 존재하는 경우만 결합# outer => 동일한 열 여부와 관계 없이 결합 pd.merge()매핑 기준: 특정 칼럼(key)의 값 기준으로 결합데이터베이스 테이블 조인과 같음pd.merge(df1, df2, how='inner', on='A')# 열 A를 기준으로 df1과 df2를 inner join한다. pivot집계 후 데이터프레임 구조를 변형해서 조회하는데 종종 사용된다.df2 = df.pivot(index = 'Category', columns='Date', values='Qty')# 인덱스는..
🍓열 이름 변경columns 속성 변경: 모든 열 이름 변경tip.columns = ['total_bill', 'tip', 'day', 'time', 'size']# 모든 열의 이름을 한 번에 변경한다. rename() 메소드 사용: 지정한 열 이름 변경tip.rename(columns={'total_bill_amount':'total_bill', 'male_female':'sex', 'smoke_yes_no':'smoker', 'week_name':'day', 'dinner_lunch':'time'}, inplace=True)# 지정한 열의 이름을 변경한다. 🍓 열 추가없는 열을 변경하면..
range함수순차 증가값(등차행렬)으로 리스트 생성시 1부터 11까지 2씩 증가하는 값으로 리스트 생성하기range(1, 12, 2) # range(1, 12, 2)list(range(1, 12, 2)) # [1, 3, 5, 7, 9, 11] append리스트에 값을 추가하는 두 가지 방법a = [1, 2, 3, 4, 5]a.append(6) # [1, 2, 3, 4, 5, 6]a = [1, 2, 3, 4, 5]a = a + [6] # [1, 2, 3, 4, 5, 6] del & remove인덱스로 조회해서 삭제하거나 해당 값을 삭제하기 # 연습 문제: 해당 리스트에서 2번째 수(30)을 삭제하세요a = [10, 20, 30, 40, 50]del a[2] # [10, 20, 40, 50]a = [1..
이미지 삽입 링크 삽입[링크에 대한 설명](링크) 이미지와 링크 모드 []()형식으로 작성한다.이미지는 맨 처음에 !를 붙여주어야 한다.각각에 대한 설명은 이미지나 링크가 제대로 나오지 않거나 오류가 발생했을 때 띄어주는 텍스트로 사용된다.
코드셀을 python 파일로 저장, 불러오기 파일을 생성 & 내용을 작성# filename.py라는 파일에 아래에 적힌 함수를 작성해준다.# 해당 파일이 이미 존재하는 경우 덮어쓴다.%%writefile filename.pyprint("Hello") 파일 실행%run filename.py 파일의 코드 불러오기 & 실행# 코드를 실행하면 해당 파일의 코드를 가져오고, 실행한다.%load filename.py 한 곳에 작성하기%%writefile filename.py # 파일 생성 및 코드 작성print('Hello')%run filename.py # 파일 실행%load filename.py # 파일 코드 불러오기 & 실행
