본문 바로가기

전체 글197

Python-Statistics) 이산형 확률 변수, 연속형 확률변수의 기대값, 분산 계산 (+numpy, sympy) #1. 이산형 확률변수 파이썬으로 이산형 확률변수의 기대값과 분산을 계산해본다. 이 때 필요한 패키지는 numpy이다. 코드를 구현하기에 앞서 이산형 확률변수 x의 기대값(=평균)과 분산을 구하는 공식은 아래와 같다. 기대값 E(x)는 확률변수와 그의 확률값을 각각 곱한 후 전체를 합하여 구한다. 분산 Var(x)는 확률변수 x를 제곱하여 그의 확률값을 각각 곱한 후 전체를 합한 값에 기대값의 제곱을 빼서 구한다. 이를 파이썬 코드로 구현하면 아래와 같다. 표준편차는 분산에 제곱근을 씌워서 구한다. numpy의 sqrt() 함수를 사용하면 쉽게 계산할 수 있다. #2. 연속형 확률변수 연속형 확률변수는 이산형 확률변수 계산보다 조금 더 복잡하다. 적분을 해야 하기 때문이다. 개인적으로 문과라서 미적분을 .. 2022. 6. 28.
LGU+알뜰폰, 모바일 데이터 차단 해결하기 (일시적으로 통화가 불가능...) LGU+ 알뜰폰을 사용하고 계신 아버지가 어느날 휴대폰이 안된다고 집전화로 연락을 해오셨다. 아버지가 뭔가를 눌렀는데 잘 못 눌렀는지 그 이후로 전화도 안 걸어지고 안 받아지고 휴대폰 기능이 다 잘 안된다고 하시는 것이다. 전화 착신은 되시는가 해서 내 휴대폰으로 아버지에게 전화를 걸어보았더니, 받는 것조차 안 되었다. 안내 멘트로 '일시적으로 통화가 불가능하거나 어쩌고 저쩌고...' 하더니 끝내 전화를 연결해 주지 않았다. 고객센터에 전화를 해보려고 해도 아버지 본인이 통화를 직접해야 한다는 걸 미리 알고 있었기에 일단, 아버지를 만나야했다. 아버지의 휴대폰을 보니 아래와 같이 안내 알람이 떠 있었다. 통화서비스 모바일 데이터 차단 일시적으로 통화가 불가능하거나 발신이 금지된 고객입니다. 고객센터(15.. 2022. 6. 27.
Python-Statistics) 파이썬으로 베이지안 방법, 사후 확률 구하기 베이지안 방법을 파이썬 코드로 보기 쉽게 정리해보려고 한다. 이를 위해 먼저 전확률의 정리와 베이즈의 정리의 개념을 알아본다. 전확률의 정리와 베이즈의 정리가 성립하기 위해서는 아래와 같이 표본공간 S를 이루고 있는 n개의 부분집합 A들이 있어야 한다. 즉, 부분집합 A들은 서로 겹치는 부분이 없어야 하고(교집합이 공집합), A들의 확률을 다 합쳤을 때 1이 되어야 한다. #1. 전확률의 정리 (Theorem of Total Probability) 전확률의 정리는 아래와 같이 정리할 수 있는데 쉽게 말하면, 사건 B의 확률을 구하는 방법이다. 사건 B의 확률을 구하기 위해 위에서 언급했던 서로 겹치지 않는 부분집합 A들을 사용한다. A1이 일어날 때 B가 일어날 확률(조건부 확률)에 A1이 일어날 확률을.. 2022. 6. 22.
ADP) ADP 25회 실기 시험 후기 및 문제 복기 (두번째 Try!) #1. 나의 두번째 ADP 실기시험 후기 이제 ADP 시험에 대해 감을 좀 잡을 수 있겠다. 이번에 깨달은 부분을 보완해서 다음 시험을 준비해야겠다. (^^... 또르르) 일단, 지난번 패착으로 생각했던 통계 공부를 깊이 팠었다. 그 결과 지난번 시험에 비해 통계분석 부분에서는 한문제(많은 응시생들을 패닉에 빠뜨렸던 NPV 문제)를 제외하고 나머지는 다 아는 문제였다. 게 중에 하나는 실수를 해서 틀리긴 했지만 ! 덕분에 통계부분 문제들은 1시간 안에 다 풀 수 있었다. 이번 패착은 여기에 있다. 한시간만에 문제 반을 풀었다고 생각하니 마음이 놓여서 그 이후 시간 안배를 잘 못 했다. 마음 놓고 군집분석 문제만 풀고 전처리하고 하다가 정작 메인인 시계열 분석은 30분만에 하느라 에러도 많이 나고 ... .. 2022. 6. 21.
Python Errors) ValueWarning: a date index has been provided, but it has no associated frequency information and so will be ignored when e.g. forecasting 해결! 시계열 데이터 분석 중 ValueWarning을 발견했다. 그 내용은 아래와 같다. ValueWarning: a date index has been provided, but it has no associated frequency information and so will be ignored when e.g. forecasting 데이트 인덱스가 제공되었지만, 빈도 정보가 없어서 forecasting할 때 무시될 것이라는 내용이었다. 시계열 데이터 분석을 하려면 데이터 값에서 날짜 정보 열은 인덱스로 지정을 해주어야 하고, 그 날짜에 대해 frequency, 즉 시계열 데이터 term에 대한 정보가 있어야 한다. 일반적으로 일, 혹은 월, 년 단위로 이미 전처리가 되어 있는 데이터라면 상관이 없는데, 데이.. 2022. 6. 13.