본문 바로가기

Jupyter Computer/Pandas

[Python] 9. Pandas - 데이터 선택 (조건)

편의상 4. 파일 저장 및 열기에서 저장했던 파일을 가져다 쓴다.

 

 

다음은 '키' column에 대해 185보다 크거나 같은 데이터에 대해 True , 그렇지 않은 데이터에 False를 부여해 출력한다.

 

 

다음은 '키' column가 185 이상이면 True 그렇지 않으면 False 값을 filt에 부여하고

filt에 의해 True라고 부여된 index의 데이터들을 나타낸 것이다.

 

다음은 filt대신 -filt를 넣어 filt를 역으로 적용시킨 것이다.

 

 

다음은 loc와 함께하여 작성한 코드이다.

키가 185이상인 index들의 수학 데이터를 출력한 것이다

 

 

다음은 &(그리고)를 사용하여 키가 185 이상이면서 학교는 북산고인 데이터를 출력한 것이다.

 

 

- str 함수

startswith('~'): ~로 시작하는 것을 찾는다. 

다음은 '이름' column에 대해 '송'으로 시작하는 index를 filt에 저장하고

그 데이터를 출력한 것이다.

 

 

contains('~'): ~를 포함하는 것을 찾는다.

다음은 '이름' column에 대해 '태'를 포함하는 index를 filt에 저장하고

그 데이터를 출력한 것이다.

 

inin(~): 데이터가 ~인 것을 찾는다.

langs 리스트에 'Python', 'Java'를 저장하고 'SW특기' 중에서 langs 리스트 요소인 데이터들의 index를 filt에 저장하고

해당 index의 데이터를 출력한다.

 

 

str. lower: 소문자로 바꾸어 생각한다.

 langs에 'python', 'java' 를 저장하고 'SW특기'들을 소문자로 변경한 뒤 그 데이터가 langs 데이터에 포함된 index를 filt에 저장한다.

해당 index를 출력한 결과이다.

 

 

 

NaN데이터 처리

앞의 방법과 비슷하게 contains를 사용해주는데 

'SW특기'에는 NaN데이터가 있어 이를 처리해 주지 않으면 NaN 데이터는 filt에 True라고 저장된다.

na = False를 괄호 안에 넣어주면 NaN의 값에 대해 False라고 부여된다.