도구들/R,파이썬

[파이썬] 파일 읽을때 인코딩 에러 'cp949' codec can't decode byte 0x80 in position 7: illegal multibyte sequence

cactus 2022. 7. 26. 17:42

파이썬에서 txt, csv 등 읽어들이려고 할 때 아래와 같은 에러가 발생했다.

 

 'cp949' codec can't decode byte 0x80 in position 7: illegal multibyte sequence


먼저번의 이 에러와 마찬가지로 한글 인코딩 과정에서 발생한 에러로 보인다.

https://ryuhyun.tistory.com/74

 

[파이썬] 판다스 csv 불러올때 인코딩 에러('utf-8' codec can't decode )

csv 파일을 파이썬 판다스로 불러오려고 아래와 같이 입력하였다. df=pd.read_csv('경로/파일명.csv') df 그랬더니 아래와 같이 에러 메시지가 출력되었다. UnicodeDecodeError: 'utf-8' codec can't decode byte..

ryuhyun.tistory.com

 

하지만 이번에는 utf-8 이 아니라 cp949 가 메시지에 나타났으므로,

인코딩 옵션을 'utf-8' 로 추가해 본다.

*한글 인코딩 유형에는 cp949, utf-8, euc-kr 이 대표적이다.

 

실행하려던 코드는 파일을 읽으려고 했던 것으로,

open() 으로 불러오려고 했다. 찾아보니 read() 를 비롯해 읽어들이는 과정에서 공통적으로 발생할 수 있는 에러이다.

불러오려는 변수 옆에 인코딩 옵션 encoding='UTF-8' 을 추가한다.

open(file,encoding='UTF-8')

'r' 로 읽기 옵션으로 불러올 때도 마찬가지로 옵션을 옆에다 적어주면 된다.

open(file,'r',encoding='UTF-8')

한글 인코딩으로 UTF-8 옵션을 추가한 뒤 에러 없이 성공적으로 출력되었다.

반응형