Jupyter Computer/Pandas
[Python] Pandas - 날짜 데이터2
ㅇㄴㅇㄴㅇㄴㅁ
2022. 5. 7. 00:02
날짜 데이터 1에 이어 판다스 모듈을 import 해주고
날짜 데이터를 알아보기에 앞서
다음과 같이 데이터 정보를 알아보자.
날짜 데이터1과는 다르게 날짜 컬럼에 하이픈이 없다.
이것을 to_datetime으로 날짜 데이터로 변경하려 하면 오류가 발생한다.
이를 해결해주기 위해 새로운 함수를 정의하여 적용시켜주자.
to_datetime과 apply를 활용하여 새로운 컬럼을 만들어 주었다.
df2를 확인해보면 다음과 같다.
새로운 컬럼 배송시간은 배송완료일 데이터에서 배송시작일 데이터를 뺀 것으로 정의할 수 있다.
예를 들어 주문일 데이터에서 날짜 정보만 출력하고 싶다고 하자.
주문일 데이터를 날짜 데이터로 바꿔주고 싶은데 데이터 타입을 보니 정수형 자료이다.
날짜 정보를 출력해주기 위해 인덱싱을 사용하려 했지만 typeError이 발생하였다.
이는 날짜 정보가 정수형 자료이기 때문이다.
그래서 다음과 같은 함수를 활용하여 해당 데이터를 문자열로 바꾸어주고 인덱싱을 활용하여 날짜 데이터로 변경이 가능하다.
#해당 카테고리에 작성되는 글은 모두 유튜브 데이터 스테이션님의 강의를 참고하여 쓰는 글입니다.