일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 클래스
- 알고리즘
- 모각코
- Java
- KT
- KT AIVLE
- Ai
- 데이터분석
- 데이터과학
- AI 윤리
- 인공지능
- 코딩테스트
- AIVLE
- Python
- 파이썬
- list
- pandas
- dictionary
- 정처기
- 코딩
- 백준
- 데이터
- github
- 정처기 실기
- numpy
- ai 전문가 과정
- AI학습
- 자바
- git
- LG Aimers
- Today
- Total
목록KT AIVLE (8)
무향향수
아동 음성 데이터로 STT를 진행할 때 주의사항1. 정확도 개선을 위한 데이터 증강2. 음성 시작 전 공백의 편차가 크기 때문에 음성 데이터를 기반으로 음성의 공백을 제거한다. 음성 데이터의 앞뒤 공백을 잘라내고 0.5초씩 묵음을 삽입하여 데이터를 규격화 한다. 3. 음성속도를 0.8~1.2배속 무작위로 변경하여 추가한다. 4. 한정된 자원을 사용해 모델의 성능을 개선하기 위해 최적의 변환 범위 등 변환 조건을 찾는 것이 중요하다. 5. 아동 데이터만 학습했을 때보다 성인 데이터와 아동 데이터를 같이 학습한 경우 아동 데이터만 학습했을 때보다 성능이 개선되었다. 그러나 성인 데이터의 양의 과도하게 많은 경우 오히려 성능이 떨어지는 모습을 확인할 수 있었다. 6. 예) 연구결과 아동데이어 50,000개, ..
Speech to Text 구현하기(사실 모든 티스토리 유튜브 등 사이트를 활용해서 뭐가 맞는지 잘못되었는지 정확히는 알 수 없다..ㅎㅎ) 1. Python 설치참고한 유튜브에서는 3.10.10 사용을 권장하였지만 아나콘다를 삭제 후 재설치하였더니 제대로 작동하였다. 2. CUDA 및 PyTorch 설치Pytorch: https://pytorch.org/get-started/locally/ Start LocallyStart Locallypytorch.org CUDA: https://developer.nvidia.com/cuda-toolkit-archive CUDA Toolkit ArchivePrevious releases of the CUDA Toolkit, GPU Computing SDK, docume..
처음 레포지토리를 등록할 때git config --global user.email git이메일git config --global user.name git유저이름 git의 특정 레포지토리에 연결하고 pull & push 하는 방법# 로컬 깃 저장소 생성# 명령어 입력 후 main 또는 master 표시가 나오면 잘 생성 된 것이다.git init # 저장소 origin에 내가 생성한 레포지토리의 저장소 주소를 연결한 것이다.git remote add origin 레포지토리주소# origin에 내 원격 저장소가 연결 되었는지 확인하기# 연결되어 있지 않으면 아무것도 나오지 않는다.git remote -v# main 브랜치로 이동해준다. git branch -M main# 원격 저장소의 마지막 커밋을 로컬 저..

더보기 공부 계기 4/11 팀프로젝트 전 딥러닝에 대한 기초지식과 코드 작성 능력이 부족하다고 생각되어 이전에 배운 딥러닝 코드와 AI_딥러닝.pdf 파일을 공부하고 있었다. 그러던 와중에 활성화 함수에 대한 내용이 나왔는데 자료에는 설명이 부족하고 이해하기도 어려워서 혼자 공부하게 되었다. 활성화 함수 가중치를 계산한 노드를 다음층에 넘겨줄 때 비선형적으로 변경해주는 함수 활성화 함수를 사용하는 이유 1. 활성화 함수가 없으면 그냥 가중치를 곱해서 계산하는 것과 별 차이가 없어서 성능이 좋지 않다. 2. 활성화 함수로 비선형성을 표현해주기 위해 사용한다. 비선형적이지 않고 선형적으로만 표현하는 경우 값을 단순하게 예측하여 더 정확한 값을 예측할 수 없게 된다. 그러므로 활성화 함수는 딥러닝에서 필수적이..
목차 CRUD CRUD 예제 DataFrame 인덱스 Open API를 이용한 데이터 수집 JSON JSON to DataFrame CRUD Create, Read, Update, Delete 데이터의 생성, 조회, 수정, 삭제를 일컫는 말 ➡️ 데이터 분석을 위해 Pandas로 데이터를 조작할 때, Dataframe을 목적에 맞게 변경하여 다루는 것이 중요 CRUD 예제 컬럼과 레코드 생성, 갱신 제거 DataFrame 인덱스 인덱스의 존재는 Dataframe의 가장 큰 특징 중 하나 loc인덱서를 이용하면 원하는 데이터 조회 가능 df.set_index('열이름') 으로 설정하면 기존의 인덱스는 column에 들어가고 입력한 열이 index가 된다. Open API를 이용한 데이터 수집 Open AP..
목차 다차원 배열 vs Dataframe Numpy 라이브러리 Numpy 배열 다차원 배열 vs Dataframe 다차원 배열 Dataframe 활용 예시 딥러닝 Input 데이터 (3차원 이상의 배열) 통계 분석 / 머신러닝 구현 방식 Numpy 라이브러리 Pandas 라이브러 Numpy 라이브러리 설치 방법: conda install numpy 장점! 1. 고속 연산 파이썬 리스트에 비해 빠른 속도와 좋은 메모리 효율 선형대수 연산이 가능 쉬운 데이터 배열 처리(반복문 필요 없음) 2. 쉽고 빠른 배열 변환 예) 3차원에서 2차원으로 변환 3. 다양한 함수 제공 축(axis)에 따른 집계 연산 가능 배열의 형태 조건이 맞으면 다른 배열과 연결 가능 손쉬운 랜덤 샘플링 가능 Numpy 배열 Numpy가..
목차 Anaconda Jupyter notebook 가상 환경(Virtual Environment) Anaconda 데이터처리/분석을 위해 여러 패키지를 포함한 배포판 Open Source, User-friendly, Trusted 예) jupyter, TensorFlow, pandas, Numpy, pytorch 분석 환경에 쓰이는 도구, 분석 패키지, 딥러닝 프레임 워크도 포함 및 관리 Jupyter notebook 대화형 인터프리터로 웹 브라우저 기반 파이썬 개발 환경 Step-by-Step, Get quick results, Lecture material 가상 환경(Virtual Environment) 독립적인 작업환경에서 패키지 및 버전 관리 호환성 ➡️ 기본 환경에서 여러 패키지를 설치 및 업..
목차 Data Science Data Science 발전 배경 6V 데이터 분석 환경 변화 Data Scientist 정의 주요 업무 영역 상세 분석 프로세스 Data Science 과학적, 논리적 사고와 기술력을 융합해 다양한 형태의 데이터로부터 지식과 인사이트를 도출하는 과정 ➡️데이터로부터 새로운 지식을 도출하도록 수학/통계/컴퓨터과학 등의 기술력과 논리성이 유구 Data Science 발전 배경 Big Data 발전으로 인한 데이터 과학의 진보 및 필요성 등장 대용량&다양한 형태의 데이터를 활용한 새로운 가치 창출 6V Technology, Hardware, Infra 관점 Volume(크기): 방대한 양의 대용량 데이터 Velocity(속도): 일반 처리 및 실시간 처리 Variety(다양성):..