무향향수

데이터 조작 이해와 실무_데이터 변경 본문

kt aivle

데이터 조작 이해와 실무_데이터 변경

튼튼한장 2024. 2. 4. 17:01

목차

CRUD

CRUD 예제

DataFrame 인덱스

Open API를 이용한 데이터 수집

JSON

JSON to DataFrame

 


CRUD

Create, Read, Update, Delete

데이터의 생성, 조회, 수정, 삭제를 일컫는 말

➡️ 데이터 분석을 위해 Pandas로 데이터를 조작할 때, Dataframe을 목적에 맞게 변경하여 다루는 것이 중요

 

CRUD 예제

컬럼과 레코드 생성,  갱신 제거

 

DataFrame 인덱스

인덱스의 존재는 Dataframe의 가장 큰 특징 중 하나

loc인덱서를 이용하면 원하는 데이터 조회 가능

df.set_index('열이름') 으로 설정하면 기존의 인덱스는 column에 들어가고 입력한 열이 index가 된다.

 

Open API를 이용한 데이터 수집

Open API는 누구나 접근하여 사용할 수 있음

특정 서비스를 제공하는 업체가 자신들의 서비스에 접근할 수 있도록 방법을 공개한 것

데이터 호출이 가능

공공데이터포털: https://www.data.go.kr/

영화진흥위원회: https://www.kofic.or.kr/kofic/business/main/main.do

 

영화진흥위원회 홈페이지입니다.(2)

웹매거진 한국영화 영화산업계 주요 이슈를 취재, 분석하여 영화업, 영화정책 연구 분야 종사자에게 제공하는 월간지입니다. 한국영화연감 영화진흥위원회가 매년 발간하는, 한국영화 산업 현

www.kofic.or.kr

 

다양한 데이터에 손쉽게 접근 및 이용이 가능하다.

key값을 받아 사용한다.

활용도가 높고 실무에서 사용할 수 있으므로 알아두는 것이 좋다.

가장 인기 있는 파일 형식은 JSON

 

JSON

JavaScript Object Notation의 축약어로

데이터 전송 및 저장 시 많이 사용하는 개방형 표준 포맷

"키-값 쌍"으로 이루어졌으며, 파이썬의 딕셔너리 자료 구조롸 흡사하게 생긴 것이 특징

대부분의 프로그래밍 언어에서 JSON을 다룰 수 있는 다양한 라이브러리를 제공한다.

 

JSON to DataFrame

JSON ➡️  dict ➡️ DataFrame

Open API에서 JSON유형을 불러온다.

원하는 응답 필드의 정보를 dictionary 형태로 변환시켜준다.

key값은 column명, value는 column 값으로 치환한다.

dictionary을 pandas를 DataFrame으로 손쉽게 변경할 수 있다.