Codelog
[pandas] pandas.DataFrame.count / .value_count / .nunique 본문
pandas.DataFrame.count
DataFrame.count(axis=0, level=None, numeric_only=False)
→ DataFrame.count() or Series.count() 형태로 사용하고, column별 행의 개수를 카운트해준다.
pandas.DataFrame.value_counts
DataFrame.value_counts(subset=None, normalize=False, sort=True, ascending=False, dropna=True)
→ 데이터프레임에서 각 value마다의 개수를 카운트해준다.
1. normalize
→ True일 때 상대비율을 구하고, False일 때 개수를 구한다.
2. sort
→ True일 때 카운트한 개수를 기준으로 정렬하고(내림차순), False일 때 유일한 값(데이터프레임의 실제값)을 기준으로 정렬한다.
3. ascending
→ True이면 오름차순 정렬, False이면 내림차순 정렬
4. dropna
→ True이면 NaN 무시, False이면 NaN 포함
pandas.DataFrame.nunique
DataFrame.nunique(axis=0, dropna=True)
→ 데이터프레임에서 unique한 value의 개수를 카운트해준다. 즉, 중복된 값은 제외하고 개수를 카운트한다.
ㅇ dropna
→ dropna 값이 True 인 경우, NaN 값은 무시하고 카운트한다. NaN값까지 카운트하려면 dropna=False로 설정해야한다.
'Python' 카테고리의 다른 글
[python] SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape 에러 해결 방법 (with VScode) (0) | 2021.10.06 |
---|---|
[pandas] pandas.crosstab (0) | 2021.09.29 |
[pandas] pandas.rename (0) | 2021.09.29 |
[pandas] pandas.read_excel (0) | 2021.09.29 |
[Pandas] pandas.read_csv (0) | 2021.09.29 |