반응형

Unicode 2

[Pythron Error] UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 5: invalid continuation byte

에러 발생 이유 모든 바이트가 아스키 문자가 될수는 없다. 또 모든 바이트 시퀀스가 utf-8 문자가 될 수 있는 것은 아니기에 이진 시퀀스를 텍스트로 변환할 때 맞는 문자열로 변환할 수 없다면, UnicodeDecodeError 가 발생한다. 해결 방법 utf-8 이 아닌 다른 디코드 코덱을 사용할 것을 추천한다 octets = b'Montr\xe9al' print(octets.decode('cp1252')) print(octets.decode('iso8859_7')) print(octets.decode('koi8_r')) --------------------------------- b'Montr\xe9al' Montréal Montrιal MontrИal 위의 디코딩 코덱이 아니더라도 많이 사용되는 ..

[Python Error] 'charmap' codec can't encode character '\xe3' in position 1: character maps to <undefined>

에러 발생 이유 대부분의 비 UTF 코덱은 유니코드 문자의 일부만 처리할 수 있으나, 텍스트를 바이트로 변활할 때 문자가 인코딩에 정의되어 있지 않다면, 인코딩 메서드나 함수의 errors 인수에 별도의 처리기를 지정하지 않는 한 UnicodeEncodeError 가 발생한다. Traceback (most recent call last): File "C:/Users/Desktop/practice.py", line 7, in print(city.encode('cp437')) File "C:\Users\lib\encodings\cp437.py", line 12, in encode return codecs.charmap_encode(input,errors,encoding_map) UnicodeEncodeErr..

반응형