반응형
텍스트에 추가되어 있는 특수문자를 제거할때 사용하는 정규식
아래 내용을 추후 참고해서 작성할 것
import re
def cleanText(datas):
#텍스트에 포함되어 있는 특수 문자 제거
texts = re.sub('[-=+,#/\?:^$.@*\"※~&%ㆍ!』\\‘|\(\)\[\]\<\>`\'…》]', '', datas)
return texts
text_data = cleanText(text_data)
반응형
'정규식' 카테고리의 다른 글
[ 정규식 ] 트윗의 해시 태크, 링크 제거하기 (0) | 2021.03.22 |
---|---|
[ 정규식 ] 괄호 안에 문자, 문장 제거하기 (0) | 2021.03.18 |
[ 정규식 ] emoji 이모티콘 제거하기 (0) | 2021.03.18 |