본문 바로가기

Jupyter Computer/Pandas

[Python] 2. Pandas - DataFrame

- DataFrame

DataFrame: 2차원 데이터(serires들의 모음)

다음과 같이 data라는 변수에 위의 데이터를 저장한다.

 

- DataFrame 객체 생성

 

pandas 모듈을 import 하고 pandas 모듈에 있는 DataFrame 함수를 사용하면 다음과 같은 표가 작성된다.

 

- 데이터 접근

만약 '이름'이라는 column에 대해 접근하고 싶으면 df['이름']을 입력하면 된다.

 

 

만약 '이름', '키'와 같이 두 개 이상의 column에 대해 접근하고 싶다면 접근하고 싶은 column들을 리스트로 감싼 것을 df에 넣어주면 된다. 만약 접근하고 싶은 column의 순서를 바꾸고 싶으면 column 리스트 내에서 순서를 바꿔주면 된다.

- DataFrame 객체 생성(index 지정)

만약 DataFrame에 index를 정해주고 싶으면 다음과 같이 입력하면 된다.

원래 0, 1, 2, 3 ... 7이라고 입력되었던 index가 1번, 2번, 3번, 4번... 8번이라고 바뀐 것을 알 수 있다.

 

data의 개수만큼 index를 지정해줘야지 그것보다 index 개수가 적거나 많으면 오류가 난다.

 

- DataFrame 객체 생성(column 지정)

data 중에서 원하는 column만 선택하거나 순서 변경이 가능하다.

column을 지정하는 경우는 column이 많을 경우에 특정한 column에만 접근하고 싶을 때 유용하다.

위와 같이 '이름', '학교', '키'에 접근을 했을 때이다.

만약 순서를 바꾸고 싶다면 columns의 리스트의 순서를 바꿔주면 된다.