반응형

머신러닝 3

aws_summit 01. SQL 로 머신러닝하기

어쩌다..AWS 홍보가 되버린듯하지만.. AWS 가 이렇게 많은 기능이 있었나? 다시금 생각해보는 시간이 되었다 아직도 파이썬으로만 머신러닝하니? 난 SQL 바로 쓴다 세이즈 메이커, 컴프리핸드 머신러닝에서 학습모델을 sql 모델 서비스인 아테나로 호출해서 부르는 서비스가 있다. 분석환경의 변화 그리고 변하지 않은 비즈니스 1. 진화하는 데이터 분석 환경 o 비즈니스 인텔리전스 대신 ai o 비즈니스 분석가보단 데이터 분석가 o 값비산 분석 소프트웨어 대신 개발자 커뮤니티에서 유행하는오픈 소스 협업 툴 o 데이터 분석 역량이 기업 보편 역량 2. 변함없는 비즈니스 목표 o 기업은 여전히 revenue 창출이 목표 o 기술은 비즈니스에 활용될때 유효하다. Create an analytics flywhell..

클라우드/AWS 2020.05.13

머신러닝 관련 참고 지식 : 오분류표/정확도/특이도/지지도/신뢰도

오분류표 (confusion matrix) 대부분의 분류 분석 모델 예측 결과는 분류 범주로 나타남에 따라 분류 분석 모형의 평가에는 오분류표가 일반적으로 사용된다. 오분류표는 목표 변수의 실제 범주와 모형에 의해 예측된 분류 범주 사이의 관계를 나타내는 표로 다음과 같이 나타낸다. 오분류표의 각 값이 의미하는 바는 다음과 같다. - TP(True Positives): 실제값과 예측치 모두 True 인 빈도 - TN(True Negatives): 실제값과 예측치 모두 False 인 빈도 - FP(Fasle Positives): 실제값은 False이나 True 로 예측한 빈도 - FN(Fasle Negatives): 실제값은 True 이나 Fasle 로 예측한 빈도 오 분류 표를 활용하여 모형을 평가하는 ..

머신러닝, AI 2020.03.12

가우시안 정규분포

머신러닝에서 서로 다른 변수의 값 범위를 일정한 수준으로 맞추는 작업을 피처스케일링 이라고 하는데 대표적인 방법 중 하나가 표준화 / 정규화입니다. 이 표준화는 데이터 피처 각각이 평균이 0이고 분산이 1인 가우시안 정규분포를 가진 값으로 변환하는 것을 의미하는데요. 여기서 가우시안 정규분포는 가우시안 분포는 연속 확률 분포의 하나입니다. 가우시안 분포는 보통 정규분포(standard distribution)로 알려져있습니다. 연속 확률 분포 중 가장 널리 알려진 분포 입니다. 여기서 파생된 중요한 정리가 중심극한 정리.. 동일한 확률분포를 가진 독립 확률 변수 n개의 평균의 분포는 n이 적당히 크다면 정규분포에 가까워진다 라는 정리 중심극한정리 참고 링크 https://bioinformaticsandm..

머신러닝, AI 2020.03.08
반응형