반응형

사이드 프로젝트 5

데이터 직군 포트폴리오를 만들 때 참고할 것들

데이터분석직군지원할때 포트폴리오 관련... 깃허브링크 말고 플젝한것들 포트폴리오로 제출하라는 회사들이 종종 있다. 이럴때는 포트폴리오의 흐름을 어떻게 잡아가고 얼마나 디테일하게 써야될까..? 아는 분에게 들었던 것을 간단히 정리하자면 포트폴리오는 10장이내로 보통 진행하며 지원하는 회사&포지션에 맞게 프로젝트 구성을 달리하는 것이 기본이라고 한다 프로젝트를 정리할 때, 반드시 1장에 압축할 필요는 없지만 프로젝트별로 2장, 많으면 3장정도로 핵심적인 것만 추려서 정리하면 더 좋을 포트폴리오를 만들 수 있다. 만약에 지원자가 진짜한건지 팩트체크가들어올 경우에는 면접에서 문제가 되는 부분이기에 문제는 안되지만, 면접 때 조리있게 말할 수 있도록 정리하는 것이 필요하다. 그걸 위해서 전체적인 그림이 그려지게끔..

Python side project 05 : Python Story Generator (파이썬 스토리 생성기)

오늘은 파이썬 스토리 생성기를 간단하게 만들어 보았다. 처음에는 어려운줄 알았는데, 구글링을 몇번 하다보니 random 함수를 잘 사용하면 쉽게 할수 있는 프로젝트여서 프로젝트 전에 가졌던 긴장을 많이 내려놓을 수 있었던 side 프로젝트였다. import random import sys # 기본적인 정보들을 입력하면 # 파이썬이 랜덤으로 선택해서 출력하는 방식의 # 간단한 Story Generator 을 만들어보자. name = [] hobbies= [] age = [] # while 문을 통해 input 된 데이터를 list 형식으로 담는다 while True: n = input("이름을 입력해주세요! ex) 홍길동, 김누이") name.append(n) print(len(name)) print(na..

언어/Python 2020.07.23

Python side project 04 : binary search (이진 탐색)

이틀에 걸쳐서 이진 탐색을 했었다. 처음에 왜 이렇게 하는지 이해를 하지못해서.. 또 사소한 데 코드를 잘못쳐서.. 디버깅하고 에러를 찾느냐 시간을 많이 사용했던 프로젝트였다. 우선, 이진 탐색이란, 탐색할 자료를 둘로 나누어 해당 데이터가 있을 만한 곳을 탐색하는 방법이다. 탐색 방법은 두가지가 있는데 위에서 설명한 이진 탐색과 순차 탐색 두가지이다. 아래의 이미지를 참고하면 훨씬 이해하기가 쉬울 것 같다. 이진 탐색의 이해 (순차 탐색과 비교하며 이해하기) 두번째, 순차탐색의 경우에는 타겟을 찾는데 많은 시간이 걸린다는 단점이 있다. 하지만 이진 탐색의 경우에는 분할 정복 알고리즘을 사용하여 문제를 해결 가능할때까지 쪼개서 순차 탐색보다 빠르게 문제를 분할하여 답을 찾아내는 방식이다. 이를 활용하여 ..

언어/Python 2020.05.28

Side Project 00-1. 이번 사이드 프로젝트의 목표

이번 사이드 프로젝트의 목표는 다음과 같다. 처음 시작하는 것이니 만큼. 데이터 파이프라인의 구축에 이르는 일련의 과정 만드는 데 감을 잡고 더 나아가 간단하게 분석까지 해보고자 한다. 프로젝트 목표 - 성별 / 연령별 트렌드 데이터 수집 및 분석 프로세스 구축 최종 소비자 - (가상의 스타트업) 데이터 분석가들 데이터 수집의 목적 - 네이버 쇼핑 데이터에서 발생하는 트래픽 분석 - 트렌드 변화추이를 분석함으로써 향후 카테고리 진출에 대한 인사이트를 얻고자 함 파이프라인 구현 목표 - 매일 정해진 시간에 전날의 트랜드 데이터를 가져와서 축적하는 시스템 구축 - AWS 를 이용하여 비용과 시간을 절약하고 장소에 구애받지 않는 효율적인 수집-분석 시스템 구축 - 데이터 초기화에 대비한 백업 데이터 베이스를 ..

Python side project 03 : Email slicer (이메일 슬라이서)

지금 개인적으로 진행하고 있는 파이썬 사이드 프로젝트들은 꽤 간단한 편이다. 생각보다는 쉬워서 건너뒤고 다른 것을 해볼까 싶기도 하지만, 잠깐 잠깐 공부하고, 다시 기초를 다진다는 생각으로 하면서 점차 어려운 프로젝트로 발전시켜 나가면 좋을 것 같다 그런 의미에서 오늘은 간단한 email slicer 를 만들었다. 이메일을 입력하면 도메인 주소와 아이디를 분류해주는 코드이다. 처음에는 그저 어려운줄 알았지만, 막상 자료를 찾아보니 꽤 쉬웠다. emails = input("이메일을 입력해주세요!").strip() # -> strip()를 써준 이유는 input 입력과정에서 # 공백이 만들어질 수 있기에 이를 방지해주고자 썻다. # 다른 프로젝트에서 input 을 사용할 때 위 방법을 응용하면 공백방지에 도..

언어/Python 2020.05.24
반응형