반응형

파이썬 38

[Python] Library - pprint

1. 라이브러리 정의 임의의 파이썬 데이터 구조를 인터프리터의 입력으로 사용할 수 있는 형태로 《예쁘게 인쇄》할 수 있는 기능을 제공하다. 그리고 포맷된 구조에 기본 파이썬 형이 아닌 객체가 포함되면, 표현은 로드되지 않을 수 있으며, 파일, 소켓 또는 클래스와 같은 객체뿐만 아니라 파이썬 리터럴로 표현할 수 없는 다른 많은 객체가 포함된 경우 가능하다 자세한 사항은 아래 링크 참고할 것 2. 참고 링크 https://docs.python.org/ko/3/library/pprint.html pprint — 예쁜 데이터 인쇄기 — Python 3.10.1 문서 pprint — 예쁜 데이터 인쇄기 소스 코드: Lib/pprint.py pprint 모듈은 임의의 파이썬 데이터 구조를 인터프리터의 입력으로 사용..

언어/Python 2022.01.13

[Python] Library - dateutil.parser

1. 라이브러리 정의 This module offers a generic date/time string parser which is able to parse most known formats to represent a date and/or time. 해당 모듈은 일반적인 날짜/시간 포멧으로 파싱이 가능한 날짜/시간 스트링 파서를 제공합니다. 2. 라이브러리 Functinos parser.parse(parserinfo=None, **kwargs)[source] Parse a string in one of the supported formats, using the parserinfo parameters. Parameters: timestr – A string containing a date/time stam..

언어/Python 2022.01.13

[Python Error] Excel does not support datetimes with timezones. Please ensure that datetimes are timezone unaware before writing to Excel.

1. 에러 발생 원인 크롤링 후 날짜 데이터를 엑셀의 형태로 저장하려했으나 엑셀에서 지원하는 형식이 아니어서 위 에러가 발생함 2. 해결 방법 df['date'] = old_dates df['date'] = df['date'].apply(lambda a: pd.to_datetime(a).date()) # .date() removes timezone 스텍오버 플로우에 있는 방법을 사용하여 apply 에 lambda 함수를 사용하여 date 컬럼의 타입을 변경함 3. 참고링크 https://stackoverflow.com/questions/61802080/excelwriter-valueerror-excel-does-not-support-datetime-with-timezone-when-savin ExcelW..

[ Python Error] “getaddrinfo failed”

1. 에러 개요 아래의 이미지와 같이 에러가 발생했었다. 해당 에러는 socket 라이브러리를 사용할 때, 내가 연결하고자 하는 ip 주소 및 링크하고 파이썬 스크립트에 작성한 링크 및 ip 주소하고 매칭이 안될 때 나타나는 에러이다. 2. 해결 방법 난 로컬에 존재하는 elasticsearch 에 데이터 셋을 만드는 것이 목표였기 때문에 url 을 localhost 로 수정을 해주고 나니 정상 동작 했었다. 아마 해당 에러가 발생한다면 처음에는 내가 링크 주소를 잘 입력했나 확인을 해보아야 될 것 같다. 대부분의 에러가 오타에서 발생하기 때문이다. 3. 참고 링크 https://stackoverflow.com/questions/7334199/getaddrinfo-failed-what-does-that-..

1-2. 반복하는 알고리즘

어떤 조건이 성립하는 동안 반복해서 처리하는 것을 반복구조라고 한다. 1. while 문 while 은 실행 전에 반복을 계속할 것인지 판단 이런 구조를 사전 판단 반복 구조 라고한다. print('1 부터 n 까지 정수의 합을 구합니다') n = int(input('n 값을 입력하세요 : ')) sum = 0 i = 1 while i b: a, b = b, a # --> 특정 조건을 가지고 값을 정렬한다 sum = 0 for i in range(a, b+1): sum += i print(f'{a}부터 {b} 까지 정수의 합은 {sum} 입니다') 3-1. 두 값 교환하기 a와 b를 교환할 때 사용한 단일 대입문 a, b = b, a 의 방법이 1차적으로 존재한다. a, b = b, a

[Python] MongoDB 파이썬으로 read( ) 하기

MongoDB 를 파이썬으로 불러오는 방법은 의외로 간단하다. 1. PYTHON 으로 클라이언트를 IMPORT 한다 # 라이브러리 임포트 from pymongo import MongoClient # 클라이언트를 통해 MONGO DB 연결 client = MongoClient("mongodb://localhost:27017/") 2. 그 다음 불러올 DB 이름을 CLIENT 에 적는다 # DB 접근 db = client['tm_events'] # db 이름 문자열로 할당 # DB 내 테이블에 접근 # Mongo 에서 테이블은 collection 이라고 불린다 collection = db['events'] # collection 내의 데이터 확인 doc = collection.find() 3. 그 이후 데이..

언어/Python 2021.03.25

[ 정규식 ] 트윗의 해시 태크, 링크 제거하기

1. 방법 정규식을 통해서 완벽하게 제거하는 방법은 없지만, 최대한 많이 제거할 수 있는 방법은 아래와 같다. 아래의 정규식을 사용하면 많은 해시태그 및 링크를 제거할 수 있다. re.sub("(@[A-Za-z0-9]+)|([^0-9A-Za-z \t])|(\w+:\/\/\S+)"," ",x).split() 정상적으로 실행되면 아래와 같이 된다. 2. 참고 링크 pythonq.com/so/python/363065 python - 정규식을 사용하여 트윗의 해시 태그, @user, 링크를 제거하는 방법 - IT 툴 넷 python - 정규식을 사용하여 트윗의 해시 태그, @user, 링크를 제거하는 방법 출처 python regex twitter Python을 사용하여 트윗을 사전 처리해야합니다. 이제 트윗의..

정규식 2021.03.22

[Python] \xa0 제거하는 법

1. 에러 원인 non-breaking space 로 Latin1, chr(160) 인코딩 형에서 나타나는 것 같다 2. 해결 방법 space 로 치환을 해주어야 한다. 코드는 아래대로 치면 된다 string = string.replace(u'\xa0', u' ') 나의 경우에는 위 방법으로 해결했지만, 아래 링크는 다양한 방법이 있으니, 나중에 해결이 안될 경우 참고해야겠다. 3. 참고링크 stackoverflow.com/questions/10993612/how-to-remove-xa0-from-string-in-python How to remove \xa0 from string in Python? I am currently using Beautiful Soup to parse an HTML file ..

카테고리 없음 2021.03.19

[Python Error] TypeError: expected string or bytes-like object

1. 에러 원인 정규식을 사용했을 때 타입(type)이 맞지 않으면 해당 에러 발생 2. 해결방법 올바른 형태로 형변환을 해준다. 나의 경우에는 str 을 넣어야 되는데 list 를 계속 넣어주고 있어서 에러가 발생.. words = re.sub('[-=+,#/\?:^$.@*\"※~&%ㆍ!』\\‘|\(\)\[\]\`\'…》]', '', str(texts)) 3. 참고 링크 soraji.github.io/python/2019/07/21/rex/ [python] 파이썬 TypeError: expected string or bytes-like object TypeError: expected string or bytes-like object soraji.github.io

[Pythron Error] UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 5: invalid continuation byte

에러 발생 이유 모든 바이트가 아스키 문자가 될수는 없다. 또 모든 바이트 시퀀스가 utf-8 문자가 될 수 있는 것은 아니기에 이진 시퀀스를 텍스트로 변환할 때 맞는 문자열로 변환할 수 없다면, UnicodeDecodeError 가 발생한다. 해결 방법 utf-8 이 아닌 다른 디코드 코덱을 사용할 것을 추천한다 octets = b'Montr\xe9al' print(octets.decode('cp1252')) print(octets.decode('iso8859_7')) print(octets.decode('koi8_r')) --------------------------------- b'Montr\xe9al' Montréal Montrιal MontrИal 위의 디코딩 코덱이 아니더라도 많이 사용되는 ..

반응형