언어/Python

[pandas] : 판다스 전처리 할때 도움될만한 코드들

쟈누이 2020. 6. 11. 11:05
반응형

간만에 파이썬으로 데이터 분석을 하니 

많은 것들을 까먹었다...

몇 가지 남겨두어야 겠다.

 

1. 특정 컬럼의 value 들을 파악할때 (value 의 갯수들)

df['규모구분'].value_counts()

 

2. loc 를 통해 columns 의 특정 값을 바꿀 때

df.loc[df['규모구분'] == '전용면적 60㎡이하''규모구분'] = 1

3. type을 바꿀 때

df['분양가격'] = df['분양가격'].astype('int')

--> astype 의 경우에는 특정 컬럼에 이상한 값들이 잇으면 안 바뀌는 경우가 많이 있기 때문에

     replace 로 바꾸어서 없애주거나 fillna 로 값을 채워주고 type 를 바꾸는 것이 좋다.

 

참고 링크

https://www.it-swarm.dev/ko/python/pandas-valuecounts-%EC%97%90%EC%84%9C-%EA%B0%92-%EC%B6%94%EC%B6%9C/824294971/

 

python — Pandas value_counts ()에서 값 추출

먼저 sort 열에서 dataframe ~ count을 (를) 정렬하지 않은 경우 maxmin을 (를)해야합니다. 귀하의 게시물에서 이미 올바른 순서로되어 있지만 sort입니다. dataframe.sort_index(by='count', ascending=[False]) col count 0

www.it-swarm.dev

 

 

반응형