Python

[Pandas] pandas.read_csv

minzeros 2021. 9. 29. 16:04

pandas.read_csv()

pandas.read_csv('path/filename.csv', sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, skipfooter=0, nrows=None, na_values=None, keep_default_na=True, na_filter=True, skip_blank_lines=True, quotechar='"', quoting=0, doublequote=True, escapechar=None, encoding=None, error_bad_lines=True, warn_bad_lines=True, delim_whitespace=False)

 

1. filepath_or_buffer 

→ read해올 '파일명' or '파일 경로'를 지정

 

2. sep 

→ 파일을 read해올 때 사용할 구분자를 지정 (defualt ',')

 

3. header

→ 열 이름으로 사용할 행 번호를 지정

   기본적으로 첫번째 행을 header(열이름)로 지정하기 때문에 header가 없을 경우, header=None 옵션을 줘야한다.

 

4. names

→ [사용할 열 이름 목록]으로 컬럼명을 지정

 

5. nrow

→ read해올 때 처음부터 n번째 행까지만 읽어온다.

 

6. skiprows

→ read해올 때 제외하고 싶은 행 지정, n+1번째부터 읽어온다.

pd.read_csv(data, skiprow=5) # 첫번째 행부터 5개를 제외하고 6번째 행부터 데이터를 읽어온다.
pd.read_csv(data, skiprow=[0,3,4] # 지정한 행을 제외한 나머지 행만 읽어온다.

 

7. skipfooter

→ read해올 때 뒤에서 n개의 행이 생략된 채로 읽어온다.

 

8. index_col

→ 인덱스 번호 or 컬럼명을 지정하여 특정 열을 데이터프레임의 index로 지정

pd.read_csv(data, index_col=1)
pd.read_csv(data, index_col='분기')

 

9. usecols

→ 데이터프레임 전체 컬럼 중 사용할 컬럼의 인덱스 or 이름을 지정

 

10. encoding

→ read해올 때 UTF에 사용할 인코딩 ('utf-8' or 'cp949')