[Python] Pandas- 날짜 데이터 처리 1
먼저 날짜 데이터 처리를 알아보기에 앞서 pandas 모듈을 import 하자.
모든 데이터 정보를 처리하기 위해서는 데이터에 대한 정보를 알아야 하는데
이는 head, info, shape 등을 가지고 알아낼 수 있다.
head를 활용하여 column과 row에는 각각 어떤 항목이 있는지, 그 항목에 해당되는 데이터는 어떤 것이 있는지 확인이 가능하다.
info를 활용하여 각 column 별로 데이터 정보를 파악할 수 있다.
shpae를 활용하여 객체의 축에 대한 정보를 알아낼 수 있다.
describe를 활용해서는 객체의 다음과 같은 정보를 알 수 있다.
이제 날짜에 해당하는 column을 출력하고 데이터 타입을 살펴보면 object이다.
날짜 데이터로 바꿔주기 위해 to_datetime을 이용하여 데이터 타입을 datetime으로 바꿔준다.
이것을 다시 새로운 컬럼에 저장해주고 dt.year 함수를 이용하면 날짜에 해당되는 해 정보를 출력해준다.
'연도' 컬럼에 날짜 데이터의 연도 정보를 넣어주자.
pivot_table을 활용하여 다음과 같은 피봇 테이블을 만들 수 있다.
이때 data에는 피봇 테이블을 만들고자 하는 객체 데이터를 적어준다.
index에는 row에 그룹화돼서 보여주고 싶은 컬럼을 선택해준다.
values에는 column에 보여주고 싶은 데이터의 컬럼을 선택해준다.
aggfunc에는 처리된 데이터를 어떻게 보여줄지를 선택할 수 있다. (ex: sum, count)
다음에 해당되는 컬럼을 새롭게 만들어주자.
index에는 월별로 그룹화된 것을 row 형태로 보여주었고
values에는 출고수량을, aggfunc에는 sum을 선택해 피봇 테이블의 컬럼에는 출고수량을 합산된 데이터를
피봇 테이블 형태로 만들어준다.
#해당 카테고리에 작성되는 글은 모두 유튜브 데이터 스테이션님의 강의를 참고하여 쓰는 글입니다.