일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- AIVLE
- numpy
- 데이터분석
- 코딩
- 백준
- ai 전문가 과정
- git
- AI학습
- KT
- 클래스
- Ai
- list
- KT AIVLE
- 자바
- dictionary
- 모각코
- Java
- AI 윤리
- 인공지능
- LG Aimers
- 알고리즘
- 데이터과학
- 정처기 실기
- github
- 정처기
- 데이터
- 코딩테스트
- 파이썬
- Python
- pandas
- Today
- Total
목록분류 전체보기 (96)
무향향수
처음 레포지토리를 등록할 때git config --global user.email git이메일git config --global user.name git유저이름 git의 특정 레포지토리에 연결하고 pull & push 하는 방법# 로컬 깃 저장소 생성# 명령어 입력 후 main 또는 master 표시가 나오면 잘 생성 된 것이다.git init # 저장소 origin에 내가 생성한 레포지토리의 저장소 주소를 연결한 것이다.git remote add origin 레포지토리주소# origin에 내 원격 저장소가 연결 되었는지 확인하기# 연결되어 있지 않으면 아무것도 나오지 않는다.git remote -v# main 브랜치로 이동해준다. git branch -M main# 원격 저장소의 마지막 커밋을 로컬 저..
df.dtypes데이터프레임의 데이터 타입을 출력한다.df.dtypes # 해당 데이터프레임에 저장된 데이터 타입을 출력한다. df.astype() 데이터프레임의 데이터 타입을 변경한다.df['Distance'] = df['Distance'].astype('float')# Distance 열의 데이터 타입을 float로 변경한다. select_dtypes(include, exclude)특정 타입에 해당하는 행과 열의 값을 가져올 때 사용한다.df.select_dtypes(include='object') # object 타입인 열의 데이터를 출력df.select_dtypes(include='object').columns # object 타입인 열의 이름을 출력df.select_dtypes(exclude='..
2024.06.13졸업프로젝트 창의 축전 이후 머신러닝 코드를 수정하였다.멘토링 이후 머신러닝의 효과를 확인하기 위해, 단순히 1주전 데이터를 이용하는 것보다 머신러닝 예측 정확도가 더 높은지 확인해 보았다. 아직 기본 모델을 사용하고 있기 때문에 정확도에 큰 차이는 없었다.그래도 많이 차이날 것이라고 생각했는데 별 차이가 없어서 충격이었다. 그래서 충전소별로 모델을 사용하는 것이 아니라 모든 충전소를 하나의 데이터 프레임으로 합친다음 하나의 데이터 프레임을 학습시켜서 모델을 만들고 해당 모델로 각 충전소의 수요를 예측하기로 하였다. 졸업 프로젝트를 위해 데이터 분석을 하면서, kt aivle school이나 dacon, kaggle 등 다양한 곳에서 데이터를 접할 때에는 시각화 및 분석에 용이하도록 데..
import warningswarnings.filterwarnings('ignore') 경고 제거를 원할 때 위의 코드를 작성 및 실행하기

범주형 변수 숫자로 요약하기범주별 빈도수titanic['Embarked'].value_counts() 범주별 비율titanic['Embarked'].value_counts(normalize=True) 시각화sns.countplot(x = 'Embarked', data = titanic)plt.grid()plt.show() pit chart범주별 비율을 비교할 때 파이차트를 사용plt.pie(값, labels=범주이름, autopct = '%.2f%%')temp = titanic['Pclass'].value_counts()plt.pie(temp.values, label = temp.index, autopct = '%.2f%%')plt.show() 각도와 방향 조정startangle = 90: 90도 ..

숫자로 요약하기: 정보의 대푯값최빈값(mode)자료 중에서 가장 빈번한 값# 판다스의 mode 메서드 이용하기titanic['Pclass]'.mode() 숫자형 변수 시각화하기 - Density Plot (KDE plot)히스토그램의 단점구간(bin)의 너비에 따라 모양이 달라진다.plt.hist(titanic.Fare, bins=5)plt.show() plt.hist(titanic.Fare, bins=30)plt.show() 히스토그램은 구간(bin)의 너비를 어떻게 잡는지에 따라 전혀 다른 모양이 될 수 있음밀도함수 그래프는 막대의 너비를 가정하지 않고 모든 점에서 데이터 밀도의 추정하는 커널 밀도 추정(Kernel Density Estimation) 방식을 사용하여 이러한 단점을 해결sns.k..

기본 코드 구조import matplotlib.pyplot as pltplt.plot(data['Temp']) # 기본 라인차트를 그려줍니다.plt.show() # 그래프를 화면에 출력해줍니다. x와 y값 지정하기1차원: list, numpy array, series 등을 각각 x와 y로 지정해서 사용2차원: dictionary, dataframe로부터 x와 y를 가져와서 사용 가능# 타입 1plt.plot(data['Date'], data['Temp'])plt.show()# 타입 2plt.plot('Date', 'Temp', data=data)plt.xticks(rotation=50) # x축 글씨를 50도 회전하여 겹치지 않게 만든다.plt.show() x축, y축 이름, 타이틀 붙이기plt.p..

LangChainLangChain은 대규모 언어 모델(LLM)을 활용하여 체인을 구성한다.이 체인을 통해, 복잡한 작업을 자동화하고 쉽게 수행할 수 있도록 돕는 라이브러리. LLM with RAG1. 사용자 질문을 받는다.2. 준비된 정보 DB에서 답변에 필요한 문서를 검색한다.3. 필요한 문서를 포함한 프롬프트를 생성한다.4. LLM이 답변을 생성한다. 준비된 정보 DBVector DB, 대규모 텍스트 데이터 및 임베딩 벡터를 저장하고 검색하는데 사용LLM with RAG 절차 다시 살펴보기1. 사용자 질문을 받는다.- 임베딩: 벡터로 변환(질문 벡터)2. 준비된 정보 DB에서 답변에 필요한 문서를 검색한다.- [질문 벡터]와 DB내 저장된 [문서 벡터]와 유사도 계산- 가장 유사도가 높은 문서 n개..

API란?예를 들어,손님이 점원에게 주문을 하면점원은 요리사에게 주문을 전달하고요리사는 요리를 만들어서 점원에게 전달합니다.점원은 요리를 손님에게 가져다 줍니다.여기서 점원이 API 입니다. API클라이언트 프로그램에게 요청을 받아 서버로 전달, 서버는 요청을 처리한 후 결과 데이터를 API에 전달,API는 다시 데이터를 클라이언트로 전달한다. API 사용방법RequestAPI 주소 + API keyRequest 형식: 요청 양식Response 형식: 결과 양식

CRISP-DMBusiness UnderstandingData UnderstandingData PreparationModelingEvaluationDeployment 🍰 Business Understanding - 가설 수립문제를 정의하고 요인을 파악하기 위해 가설을 수립한다.과학 연구에서는 기존 연구 결과로 이어져 내려오는 정설을 귀무가설이라고 부르고기존의 입장을 넘어서기 위한 새로운 연구 가설을 대립가설이라고 부릅니다.여기서 우리가 수립하는 가설을 대립가설로 부르기도 합니다. 가설수립 절차1. 해결해야할 문제가 무엇인가? (목표, 관심사, y)2. y를 설명하기 위한 요인을 찾아라 (x)3. 가설의 구조를 정의하라. x → y 🍰 Data Understanding데이터 원본 식별 및 취득(초기) ..