Jupyter Computer/Pandas

[Python] Pandas- 날짜 데이터 처리 1

ㅇㄴㅇㄴㅇㄴㅁ 2022. 5. 6. 23:47

먼저 날짜 데이터 처리를 알아보기에 앞서 pandas 모듈을 import 하자.

모든 데이터 정보를 처리하기 위해서는 데이터에 대한 정보를 알아야 하는데

이는 head, info, shape 등을 가지고 알아낼 수 있다.

head를 활용하여 column과 row에는 각각 어떤 항목이 있는지, 그 항목에 해당되는 데이터는 어떤 것이 있는지 확인이 가능하다.

info를 활용하여 각 column 별로 데이터 정보를 파악할 수 있다.

shpae를 활용하여 객체의 축에 대한 정보를 알아낼 수 있다.

 

 

 

describe를 활용해서는 객체의 다음과 같은 정보를 알 수 있다.

 

 

이제 날짜에 해당하는 column을 출력하고 데이터 타입을 살펴보면 object이다.

 

 

날짜 데이터로 바꿔주기 위해 to_datetime을 이용하여 데이터 타입을 datetime으로 바꿔준다.

 

 

이것을 다시 새로운 컬럼에 저장해주고 dt.year 함수를 이용하면 날짜에 해당되는 해 정보를 출력해준다.

 

 

 

 

 

 

 

'연도' 컬럼에 날짜 데이터의 연도 정보를 넣어주자.

 

 

 

pivot_table을 활용하여 다음과 같은 피봇 테이블을 만들 수 있다.

이때 data에는 피봇 테이블을 만들고자 하는 객체 데이터를 적어준다.

index에는 row에 그룹화돼서 보여주고 싶은 컬럼을 선택해준다.

values에는 column에 보여주고 싶은 데이터의 컬럼을 선택해준다.

aggfunc에는 처리된 데이터를 어떻게 보여줄지를 선택할 수 있다. (ex: sum, count)

 

 

 

 

 

 

다음에 해당되는 컬럼을 새롭게 만들어주자. 

 

 

 

 

 

 

index에는 월별로 그룹화된 것을 row 형태로 보여주었고

values에는 출고수량을, aggfunc에는 sum을 선택해 피봇 테이블의 컬럼에는 출고수량을 합산된 데이터를 

피봇 테이블 형태로 만들어준다.

 

 

#해당 카테고리에 작성되는 글은 모두 유튜브 데이터 스테이션님의 강의를 참고하여 쓰는 글입니다.