Codelog

[pandas] pandas.DataFrame.count / .value_count / .nunique 본문

Python

[pandas] pandas.DataFrame.count / .value_count / .nunique

minzeros 2021. 9. 29. 16:11

pandas.DataFrame.count

DataFrame.count(axis=0level=Nonenumeric_only=False)

→ DataFrame.count() or Series.count() 형태로 사용하고, column별 행의 개수를 카운트해준다.

 


pandas.DataFrame.value_counts

DataFrame.value_counts(subset=Nonenormalize=Falsesort=Trueascending=Falsedropna=True)

→ 데이터프레임에서 각 value마다의 개수를 카운트해준다.

 

1. normalize

→ True일 때 상대비율을 구하고, False일 때 개수를 구한다.

 

2. sort

→ True일 때 카운트한 개수를 기준으로 정렬하고(내림차순), False일 때 유일한 값(데이터프레임의 실제값)을 기준으로 정렬한다.

 

3. ascending

→  True이면 오름차순 정렬, False이면 내림차순 정렬

 

4. dropna

→ True이면 NaN 무시, False이면 NaN 포함

 


pandas.DataFrame.nunique

DataFrame.nunique(axis=0, dropna=True)

→ 데이터프레임에서 unique한 value의 개수를 카운트해준다. 즉, 중복된 값은 제외하고 개수를 카운트한다.

 

ㅇ dropna

→ dropna 값이 True 인 경우, NaN 값은 무시하고 카운트한다. NaN값까지 카운트하려면 dropna=False로 설정해야한다.