python
-
python upsampling, downsamplingpython/time series 2021. 8. 25. 20:50
time seires data를 분석할 때 불규칙적으로 수집되는 데이터의 특성상 주기가 다소 불규칙적일 때가 많아서 주기를 일정하게 변경해야할 필요성이 있다. 불규칙 적인 time seires data를 주기가 일정하게 변경하는 방법은 upsampling, downsampling 두가지가 있다. python에서는 pandas 라이브러리의 resample 함수를 활용하여 쉽게 upsampling, downsampling 할 수 있다. 언제 다운 샘플링과 업샘플링을 할까? (1) 다운샘플링 : 데이터의 빈도를 줄이는 것 원본 데이터의 시간 단위가 실용적이지 않은 경우 특정 주기에 집중하는 경우 더 낮은 빈도의 데이터에 맞추는 경우 3가지로 나누어 설명했지만, 수집 된 데이터가 우리가 핸들링 하기에 적당하지 ..
-
pandas.fillna() 누락 된 데이터를 채우는 방법python/pandas 2021. 8. 17. 21:03
Time Seires Data에서 누락된 데이터를 해결하는 일반적인 방법은 크게 3가지가 있다. 01. 누락 된 데이터를 해결하는 방법 1. 대치법(imputation) : 사용자가 누락 된 데이터를 관측에 기반하여 입력해서 채워 넣는다. 2. 보간법 (interpolation) : 인접한 데이터를 사용하여 누락된 데이터를 추정한다. 3. 제거 어떤 방법을 사용할지는 데이터에 따라 다르겠지만, 나 같은 경우에는 0이나, mean, 특정 통계량을 활용 할 때에는 대치법을 활용하고, time seires의 경향성이 보이는 경우에는 보간법을 활용하고 데이터가 제거해도 관계없다고 판단 되는 경우에는 제거한다. 02. 누락 된 데이터를 해결하는데 사용하는 함수 위의 3가지 방법을 활용하기 위해서는 pandas에서..
-
python 에서 LpProblem와 LpVariable를 활용하여 네트워크 문제 해결하기python/python 2021. 7. 13. 20:13
LpProblem¶: 우리가 해결하고자 하는 문자의 종류와 이름을 정한다. https://coin-or.github.io/pulp/technical/pulp.html LpProblem(문제이름, 문제의 종류) => 최댓값을 구해야하는가?, 최솟값을 구해야하는가? LpProblem(name='NoName', LpMinimize or LpMaximize) In [34]: # example prob = LpProblem("problumName",LpMinimize) prob Out[34]: problumName: MINIMIZE None VARIABLES LpVariable¶: 변수의 범위, 이름, 유형을 정한다. https://www.coin-or.org/PuLP/pulp.html lowBound : 하한선..
-
[pandas] Multi index에서 single index로, Multi column에서 single column으로 코드 한줄로 변경하기python/pandas 2021. 6. 23. 10:54
In [5]: import numpy as np import pandas as pd 인덱스를 생성하기 위한 array를 생성¶ In [3]: arrays = [ np.array(["bar", "bar", "baz", "baz", "foo", "foo", "qux", "qux"]), np.array(["one", "two", "one", "two", "one", "two", "one", "two"])] arrays를 index로 하는 DataFrame을 생성한다.¶ In [6]: df = pd.DataFrame(np.random.randn(8, 4), index=arrays) In [7]: df Out[7]: 0 1 2 3 bar one -0.855668 1.135211 2.552778 -1.380448 ..
-
[django] 01. 개발 환경 세팅python/django 2021. 4. 13. 09:44
1. 장고 프로젝트 생성하기 django-admin startproject config . config의 pakage와 manage.py를 생성한다. 2. 개발서버 구동하기 python manage.py runserver ⇒ 127.0.0.1:8000 에 접속하면 로컬서버로 접속가능 하다. 3. settings.py에서 언어/시간을 한국에 맞게 변경 # settings.py # 언어와 시간을 한국 기준으로 변경 # 수정 전 LANGUAGE_CODE = 'en-us' TIME_ZONE = 'UTC' # 수정 후 LANGUAGE_CODE = 'ko-kr' TIME_ZONE = 'Asia/Seoul'