Jupyter Computer (34) 썸네일형 리스트형 [Python] Pandas - 날짜 데이터2 날짜 데이터 1에 이어 판다스 모듈을 import 해주고 날짜 데이터를 알아보기에 앞서 다음과 같이 데이터 정보를 알아보자. 날짜 데이터1과는 다르게 날짜 컬럼에 하이픈이 없다. 이것을 to_datetime으로 날짜 데이터로 변경하려 하면 오류가 발생한다. 이를 해결해주기 위해 새로운 함수를 정의하여 적용시켜주자. to_datetime과 apply를 활용하여 새로운 컬럼을 만들어 주었다. df2를 확인해보면 다음과 같다. 새로운 컬럼 배송시간은 배송완료일 데이터에서 배송시작일 데이터를 뺀 것으로 정의할 수 있다. 예를 들어 주문일 데이터에서 날짜 정보만 출력하고 싶다고 하자. 주문일 데이터를 날짜 데이터로 바꿔주고 싶은데 데이터 타입을 보니 정수형 자료이다. 날짜 정보를 출력해주기 위해 인덱싱을 사용하려.. [Python] Pandas- 날짜 데이터 처리 1 먼저 날짜 데이터 처리를 알아보기에 앞서 pandas 모듈을 import 하자. 모든 데이터 정보를 처리하기 위해서는 데이터에 대한 정보를 알아야 하는데 이는 head, info, shape 등을 가지고 알아낼 수 있다. head를 활용하여 column과 row에는 각각 어떤 항목이 있는지, 그 항목에 해당되는 데이터는 어떤 것이 있는지 확인이 가능하다. info를 활용하여 각 column 별로 데이터 정보를 파악할 수 있다. shpae를 활용하여 객체의 축에 대한 정보를 알아낼 수 있다. describe를 활용해서는 객체의 다음과 같은 정보를 알 수 있다. 이제 날짜에 해당하는 column을 출력하고 데이터 타입을 살펴보면 object이다. 날짜 데이터로 바꿔주기 위해 to_datetime을 이용하여 .. [Python] 17. Matplotlib - Quiz 1. 영화 데이터를 활용하여 x 축은 영화, y축은 평점인 막대그래프를 만드시오. plt.bar에 x축에 해당하는 데이터와 y축에 해당하는 데이터를 넣어 막대그래프를 만들어 주었다. 2. 앞에서 만든 막대 그래프에 제시된 세부 사항을 적용하시오. 제목: 국내 top8 영화 평점 정보 x축 label: 영화(90도 회전) y축 label: 평점 x축의 각도는 xticks를 활용하여 설정해줄 수 있고 xlabel과 ylabel을 활용하여 각 축에 이름을 설정해준 것을 알 수 있다. 3. 개봉 연도별 평점 변화 추이를 꺾은선 그래프로 그리시오 먼저 개봉 연도별로 그룹화해준 뒤 그룹화한 데이터의 평균을 구해준다. 해당 그래프의 x축에는 그룹화한 데이터의 index를, y축에는 그룹화한 데이터의 평점의 평균 데이.. [Python] 16. Matplotlib - 여러그래프 편의상 Pandas에서 저장했던 score 엑셀 파일을 활용하자. 1. 여러 그래프 넣기 다음은 subplots를 활용하여 2X2에 해당하는 plot들을 생성하였다. fig는 여러 그래프 전체에 대한 정보를 가지고 있다 생각하면 편하다. axs는 각각의 그래프에 관한 정보를 가지고 있다 생각하면 편하다. 예를들어 axs[1,1]은 4번째에 해당하는 그래프이다. 그리고 suptitle을 활용해 그래프의 title을 설정해 주었다. 2. 여러그래프 활용 이제 각각의 그래프를 설정해 보자. 앞과 비슷한 방법을 활용해 2X2 plot들을 생성하고 이 때 크기를 (15,10)으로 설정하자. 첫 번째 그래프(0,0)는 막대그래프(bar)이며 x축은 이름, y축에는 국어에 대한 정보를 넣는다. 그리고 legend를 .. [Python] 15. Matplotlib - 산점도 그래프 편의상 Pandas에 활용된 score 엑셀 파일을 사용한다. 추가로 학년 column을 추가하고 각각의 데이터를 넣어준다. 1. scatter scatter을 활용하여 x축에는 영어점수, y축에는 수학 점수를 점으로 찍어준다. 그리고 xlable과 ylabel을 사용하여 각 축에 이름을 붙여준다. 2. size numpy 모듈을 사용하기 위해 numpy 모듈을 import 하자. random.rand(n) : 0~1 사이의 숫자를 랜덤으로 n개 뽑는다. s를 활용하여 각 산점도 그래프의 점의 크기를 랜덤으로 설정해 주었다. 3. color 다음은 sizes에 학년에 따른 데이터를 저장하였다.(1학년: 500, 2학년: 1000, 3학년: 1500) scatter 안에 cmap과 c를 활용한다. cmap.. [Python] 14. Matplotlib - 원 그래프 (심화) 1. colors 다음은 colors 리스트를 추가하고 colors 리스트에 해당하는 색으로 그래프를 그려준 것을 알 수 있다. 2. wedgeprops 다음은 wedgeprops를 활용하여 원 그래프를 도넛 모양의 그래프로 만들어 준 것을 볼 수 있다. 이때 wedgeprops를 딕셔너리 형태로 쓴 것 을 알 수 있고 width는 굵기를 설정해준다. 다음은 wedgeprops 딕셔너리에 edgecolor과 linewidth를 추가하여 테두리 색, 테두리 굵기를 설정해 준 것을 알 수 있다. 3. autopct 다음은 함수 custom_autopct(pct)를 생성한다. 이때 pct값이 10이상이면 pct값을 출력하게 된다. 다음은 함수를 format을 사용하여 출력해주는 방법이다. - 파이썬의 출력문 .. [Python] 13. Matplotlib - 원 그래프 (기본) 1. 원 그래프(pie) pie 안에 들어가는 values의 각 요소들의 합이 꼭 100이 될 필요가 없다. values의 데이터 들을 비율로 원 그래프에 표시해 줄 것이다. labels는 각 values에 해당하는 데이터에 순서대로 이름을 붙여준다고 생각하면 된다. 다음 원 그래프는 values의 값들을 모두 1로 저장하여 똑같은 비율만큼 원 그래프에 표시된 것을 알 수 있고, pie안에 autopct를 활용하여 values에 해당하는 비율을 원 그래프 안에 표시해준 것이다. '%.1f'는 소수점 아래 첫 째 자리까지 나타낸다. 만약 %까지 붙이고 싶으면 '%.1f%%'로 사용하면 된다. 위에서 사용된 startangle은 해당 그래프가 시작하는 각도라고 이해하면 된다. (좌표계를 생각하면 이해가 편하.. [Python] 12. Matplotlib - 다중 막대그래프 편의상 저장되어 있는 score 엑셀 파일을 사용한다. 다중 막대그래프를 배우기에 앞서 numpy 모듈 중 arrange 함수를 간단하게 알아보고 시작하자. 먼저 numpy 모듈을 import 하고 np에 이 모듈을 저장한다. np.arrange(n)은 0부터 n-1까지 숫자들로 리스트를 만들어준다. 추가로 shape에 대해도 알아보자. shape는 해당 데이터의 row와 column의 정보를 나타내 준다. 1. 다중 막대그래프 다음은 shape를 통해서 row 개수를 N 변수에 저장한다. 그리고 index 변수에 0부터 N-1(row-1)까지의 숫자를 리스트 형태로 만들어준다. w = 0.25로 저장하고 plt.bar을 활용하여 (x, y)에 대응하는 숫자와 데이터들을 그래프에 넣어준다. 즉, inde.. 이전 1 2 3 4 5 다음