[Python Study] 파이썬 모듈
·
언어/Python
여러 프로그램에서 썼던 편리한 함수를 각 프로그램에 정의를 복사하지 않고도 사용하고 싶을 수도 있다. 이런 것을 지원하기 위해, 파이썬은 정의들을 파일에 넣고 스크립트나 인터프리터의 대화형 모드에서 사용할 수 있는 방법을 제공합니다. 그런 파일을 모듈 이라고 부름 모듈로부터 정의들이 다른 모듈이나 메인 모듈로 임포트 될 수 있음 1. 파이썬 스트링 관련 모듈 2. 데이터 타입 관련 모듈 3. 수학 함수 및 기타 숫자 모듈 4. 인터넷 데이터 처리 모듈 5. 마크업 및 파일 형식 관련 모듈 5. 압축, 보관 및 자료보존 처리 함수형 모듈 6. 운영체제 및 런타임 관련 모듈 자세한 내용은 추후 아래 링크를 통해 스터디 진행할것 https://docs.python.org/ko/3/tutorial/module..
[Python] python 에서 parquet 타입을 열려고 할때
·
언어/Python
1. 원인 - 파이썬에서 parquet 파일을 열려고 시도 - import parquet 를 하려는데 모듈이 없음 - 리눅스에서 pip3 install parquet 하려는데 gcc 가 없어서 설치를 못한다는 에러가 뜸 2. 해결 방법 - 이전부터 pyarrow 를 통해서 parquet 타입을 열 수 있도록 만들었음.. pip3 install pyarrow --- from pyarrow import parquet
[Python] deque 란?
·
언어/Python
1. 정의 큐의 앞, 뒤에서 삽입, 삭제가 가능한 큐 double - ended - queue 의 줄임말 사용법과 deque 에 사용하는 변수들은 아래 링크 참고 https://velog.io/@nayoon-kim/%ED%8C%8C%EC%9D%B4%EC%8D%AC-deque [파이썬] deque 파이썬을 이용해서 BFS를 풀면 주로 사용하게 되는 자료구조가 Deque다. 사용하기야 자주 사용하지만 생각보다 deque을 잘 모르고 사용한다는 생각이 들어서 정리를 하기로 했다.큐의 앞, 뒤에서 삽 velog.io
[ Python ] 파이썬 코드 리펙토링/최적화 관련 참고 링크
·
언어/Python
1. 개요 회사에서 기존에 있는 코드를 조금씩 리펙토링하고 있다. 가독성이 좋도록 함수들을 분리시켜 관리가 쉽게 만들고 있고 일부 코드들을 최적화하고 있다. 추후에도 비슷한 작업을 할 때, 참고하면서 하기 위해서 코드를 아래에 기록해 둔다 2. 참고 링크 https://dongdongfather.tistory.com/69 [파이썬 기초] 유사 딕셔너리 defaultdict() 활용법 defaultdict()는 딕셔너리를 만드는 dict클래스의 서브클래스이다. 작동하는 방식은 거의 동일한데, defaultdict()는 인자로 주어진 객체(default-factory)의 기본값을 딕셔너리값의 초깃값으로 지정할 수 있 dongdongfather.tistory.com
[Python] try, except, raise 문
·
언어/Python
1. 개요 파이썬에서는 예외 처리를 위해 try, except 문을 많이 사용하지만 raise 가 들어가는 것을 많이 못 본 것 같다. 들어간 프로젝트의 코드를 분석하던 중에 raise 가 나와서 간단하게 기록하려고 한다 2. 내용 raise 문은 try, except 문에 인위적으로 에러를 발생시킬 때 많이 사용한다. 즉, 사용자가 직접 에러를 발생시키는 기능이라고 보면된다. 하지만, 많이 사용하면 코드를 읽기 어려워지기 때문에 필요한 곳에서만 사용해야 한다 3. 참고 링크 https://justkode.kr/python/try-except Python에서 try, except, raise로 예외 처리 하기. 항상 프로그램은 사용자의 실수든, 코드를 잘못 작성 했든, 원하지 않는 방향으로 흘러 갈 때가..
[Python] Library - pprint
·
언어/Python
1. 라이브러리 정의 임의의 파이썬 데이터 구조를 인터프리터의 입력으로 사용할 수 있는 형태로 《예쁘게 인쇄》할 수 있는 기능을 제공하다. 그리고 포맷된 구조에 기본 파이썬 형이 아닌 객체가 포함되면, 표현은 로드되지 않을 수 있으며, 파일, 소켓 또는 클래스와 같은 객체뿐만 아니라 파이썬 리터럴로 표현할 수 없는 다른 많은 객체가 포함된 경우 가능하다 자세한 사항은 아래 링크 참고할 것 2. 참고 링크 https://docs.python.org/ko/3/library/pprint.html pprint — 예쁜 데이터 인쇄기 — Python 3.10.1 문서 pprint — 예쁜 데이터 인쇄기 소스 코드: Lib/pprint.py pprint 모듈은 임의의 파이썬 데이터 구조를 인터프리터의 입력으로 사용..
[Python] Library - dateutil.parser
·
언어/Python
1. 라이브러리 정의 This module offers a generic date/time string parser which is able to parse most known formats to represent a date and/or time. 해당 모듈은 일반적인 날짜/시간 포멧으로 파싱이 가능한 날짜/시간 스트링 파서를 제공합니다. 2. 라이브러리 Functinos parser.parse(parserinfo=None, **kwargs)[source] Parse a string in one of the supported formats, using the parserinfo parameters. Parameters: timestr – A string containing a date/time stam..
[ Pandas ] columns 가 multi header 일때
·
언어/Python
1. 개요 에러는 아니지만 멀티 컬럼을 다루는 법을 이번에 알게되어 기록하고자 한다. 아래와 같다 그리고 이 header 를 컬럼만 따로 뽑아서 나타낼 경우에는 아래와 같이 나타난다. 이 중에서 하나만 뽑아서 사용하고 싶다 2. 추출하는 법 추출하는 법은 생각보다는 간단했다. read_csv, read_table 에 있는 header 에 리스트로 추출하고자 하는 컬럼의 인덱스 번호를 사용하면 된다. 그러면 아래 컬럼의 header 와 같이 나온다. 3. 참고 링크 https://stackoverflow.com/questions/41005577/python-pandas-two-rows-as-column-headers/51746183 Python Pandas, two rows as column headers..
[Python] MongoDB 파이썬으로 read( ) 하기
·
언어/Python
MongoDB 를 파이썬으로 불러오는 방법은 의외로 간단하다. 1. PYTHON 으로 클라이언트를 IMPORT 한다 # 라이브러리 임포트 from pymongo import MongoClient # 클라이언트를 통해 MONGO DB 연결 client = MongoClient("mongodb://localhost:27017/") 2. 그 다음 불러올 DB 이름을 CLIENT 에 적는다 # DB 접근 db = client['tm_events'] # db 이름 문자열로 할당 # DB 내 테이블에 접근 # Mongo 에서 테이블은 collection 이라고 불린다 collection = db['events'] # collection 내의 데이터 확인 doc = collection.find() 3. 그 이후 데이..
[Pandas] dataframe의 row를 shuffle하는법
·
언어/Python
아래 명령어를 사용하여 추후 데이터 프레임을 shuffle 할 일이 있을 때 사용할 것 # row 전체 shuffle df = df.sample(frac=1) # shuffling하고 index reset df = df.sample(frac=1).reset_index(drop=True)