개발 Tools/파이썬_Pandas & Numpy

pandas 중복값 찾아보기 ( nunique(), unique(), value_counts() )

전컴반 2021. 4. 14. 11:02
반응형

안녕하세요

이번에는 중복 값을 찾아보겠습니다!

 

각각의 컬럼에 중복되는 애들이 몇 개 인지 궁금하다면 nunique() 를 사용합니다

 

 

"상권업종 대/중 분류명" 에서는 각각 1개 5개의 이름을 가진 애들로 나눠진다는 의미입니다. 만약 하나로 통일 돼 있는 애들이라면 어떻게 할까요? 그렇다면 "상권업종대분류명" 처럼 1로 나옵니다

 

그럼 저 카테고리에 해당하는 애들의 이름은 어떻게 알까요?? n 을 뺀 unique() 를 사용합니다

 

 

각각의 해당하는 중복값의 이름을 알려줍니다. 대분류명은 하나라 의미가 없으니 중분류명으로 계속 알아보겠습니다

 

그럼 이번에는 저런 애들이 몇 개가 있는지 궁금합니다. 이걸 알려주는 함수가 있습니다. 자주 쓰이는 친구입니다.

value_counts() 라는 숫자를 세주는 함수입니다

 

 

이렇게 하면 몇개를 가지고 있는지 알 수 있습니다. 범주를 분류하기에 좋은 거 같습니다

 

마지막으로 비율로 표시해주는 조건이 있는 걸 소개하고 마무리하겠습니다. value_counts() 안에 normalize=True 를 해주면 됩니다

 

 

이렇게 하면 비율로 나타내 줍니다. 위의 숫자와 비슷하네요!

 

다음에는 원하는 값을 추출해보겠습니다!

감사합니다

반응형