[Pandas] pandas.read_csv
pandas.read_csv()
pandas.read_csv('path/filename.csv', sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, skipfooter=0, nrows=None, na_values=None, keep_default_na=True, na_filter=True, skip_blank_lines=True, quotechar='"', quoting=0, doublequote=True, escapechar=None, encoding=None, error_bad_lines=True, warn_bad_lines=True, delim_whitespace=False)
1. filepath_or_buffer
→ read해올 '파일명' or '파일 경로'를 지정
2. sep
→ 파일을 read해올 때 사용할 구분자를 지정 (defualt ',')
3. header
→ 열 이름으로 사용할 행 번호를 지정
기본적으로 첫번째 행을 header(열이름)로 지정하기 때문에 header가 없을 경우, header=None 옵션을 줘야한다.
4. names
→ [사용할 열 이름 목록]으로 컬럼명을 지정
5. nrow
→ read해올 때 처음부터 n번째 행까지만 읽어온다.
6. skiprows
→ read해올 때 제외하고 싶은 행 지정, n+1번째부터 읽어온다.
pd.read_csv(data, skiprow=5) # 첫번째 행부터 5개를 제외하고 6번째 행부터 데이터를 읽어온다.
pd.read_csv(data, skiprow=[0,3,4] # 지정한 행을 제외한 나머지 행만 읽어온다.
7. skipfooter
→ read해올 때 뒤에서 n개의 행이 생략된 채로 읽어온다.
8. index_col
→ 인덱스 번호 or 컬럼명을 지정하여 특정 열을 데이터프레임의 index로 지정
pd.read_csv(data, index_col=1)
pd.read_csv(data, index_col='분기')
9. usecols
→ 데이터프레임 전체 컬럼 중 사용할 컬럼의 인덱스 or 이름을 지정
10. encoding
→ read해올 때 UTF에 사용할 인코딩 ('utf-8' or 'cp949')