본문 바로가기

분류 전체보기196

Python Errors) 시계열 분해 STL의 TypeError 해결하기, TypeError: PeriodIndex given. Check the 'freq' attribute instead of using infer_freq. 1. statsmodels의 STL 함수를 사용해서 시계열 데이터 분해를 하고 있다가 아래의 에러를 만났다. TypeError: PeriodIndex given. Check the 'freq' attribute instead of using infer_freq. 에러메시지를 해석해 보면, PeriodIndex가 주어졌으니, 추측 빈도를 사용하는 대신에 '빈도' 속성을 확인해 봐라. 라고 한다. 알고보니 시계열 데이터 초기 셋팅 때 날짜 인덱스를 .to_period()로 해서 PeriodIndex로 셋팅했던 것이 기억이 났다. 2. 에러를 해결하려면? Period Index를 Datetime Index로 변경하면 된다 !! 날짜 인덱스를 기반으로 시계열 데이터의 산술적 처리를 하기 위해서는 인덱스가 꼭 D.. 2022. 8. 24.
착한 강아지, 까꿍이의 장례를 치른 기억 (+강아지 화장 장례, 반려견 사망신고 후기) 지난 4월, 까꿍이가 10년을 살고 우리의 곁을 떠났다. 함께 즐거운 시간을 보냈고 행복했고 고마운 기억이 참 많은 강아지 까꿍이. 까꿍이는 떠났지만, 아직도 우리 가족의 기억 속에 이야기 속에 함께 하고 있다. 노환이 오기는 했지만 그렇게 갑작스럽게 보내게 될 줄은 몰랐기에 슬픈 마음이 컸다. 이따금 상상했던 까꿍이의 마지막은 내 품에서 같이 있다가 토닥여주면서 보내주는 것이었는데... 마지막을 같이 있어주지 못한 게 너무 마음이 아팠지만, 이렇게 슬퍼하는게 까꿍이가 바라는 것은 아닐 거라고 생각하면서 좋은 기억들을 떠올려 보았다. 여느 요크셔테리어들과는 달리 순하디 순하고 짖지도 않고 물지도 않고 다시 떠올려봐도 까꿍이는 참 착한 강아지였다. 슬픈 일이 있을 때 따뜻한 체온으로 무릎에 앉아 나를 위로.. 2022. 7. 4.
Python-Statistics) 파이썬으로 연속형 확률분포 계산 (+scipy cdf 사용법) #1. 연속형 확률분포란? 연속형 확률분포(Continuous Probability Distribution)는 확률변수 x가 두 값 a, b 사이의 가능한 모든 값을 취할 수 있을 때 적용하는 확률분포이며, 확률값은 어느 구간의 누적확률(면적)로 표시된다. 그래프로 나타내면 x축은 확률변수 y축은 확률밀도함수(probability density function)인데 특정 이산형 x에 대한 y값은 0으로 본다. 다만 x의 구간이 a~b로 주어지면 그 사이에 생기는 면적을 구해서 이를 확률값으로 얻을 수 있다. 연속형 확률분포로는 정규분포, 지수분포, 균등분포, 베타분포, 와이블분포, 감마분포, 코시분포 등이 있다. 연속형 확률분포 중에서도 표본의 평균, 분산, 분산비가 따르는 연속형 확률분포를 t분포, 카.. 2022. 7. 1.
Python-Statistics) 파이썬으로 이산형 확률분포 계산 (+scipy pmf, cdf, ppf 사용법) **아래 코드는 kaggle code에서 다운로드 받을 수 있음 >> https://www.kaggle.com/janejo/statistics-1-discrete-random-variable #1. 이산형 확률분포란? 이산형 확률분포는 확률변수 x가 이산형(Discrete)인 경우 각 x의 확률이 어떻게 분포되는지를 나타낸다. 그래프로 그리면 막대그래프로 x 축에 확률변수를 놓고, y축에 확률값을 표시할 수 있다. 그리고 이 확률값을 구하기 위한 함수는 확률질량함수(Probability Mass Function)이라고 하며 각 확률 분포 별로 구하는 공식이 다르다. 이 확률질량함수 값이 y축에 놓이게 된다. #2. 파이썬 Scipy로 이산형 확률분포 계산 파이썬에서 자주 쓰이는 통계 패키지 중 하나인 s.. 2022. 6. 29.
Python-Statistics) 이산형 확률 변수, 연속형 확률변수의 기대값, 분산 계산 (+numpy, sympy) #1. 이산형 확률변수 파이썬으로 이산형 확률변수의 기대값과 분산을 계산해본다. 이 때 필요한 패키지는 numpy이다. 코드를 구현하기에 앞서 이산형 확률변수 x의 기대값(=평균)과 분산을 구하는 공식은 아래와 같다. 기대값 E(x)는 확률변수와 그의 확률값을 각각 곱한 후 전체를 합하여 구한다. 분산 Var(x)는 확률변수 x를 제곱하여 그의 확률값을 각각 곱한 후 전체를 합한 값에 기대값의 제곱을 빼서 구한다. 이를 파이썬 코드로 구현하면 아래와 같다. 표준편차는 분산에 제곱근을 씌워서 구한다. numpy의 sqrt() 함수를 사용하면 쉽게 계산할 수 있다. #2. 연속형 확률변수 연속형 확률변수는 이산형 확률변수 계산보다 조금 더 복잡하다. 적분을 해야 하기 때문이다. 개인적으로 문과라서 미적분을 .. 2022. 6. 28.