본문 바로가기
반응형

Python/알고리즘3

[python] 직관적으로 cumulative count 계산하기(ft. pandas, numpy) 어떤 카테고리 내에서 시간 순으로 나열되어 있는 데이터에서, 특정 신호 전까지 누적카운트를 쭉 나열하는 방법을 생각해볼 수 있다. 망상해본 것이다.(원래 망상하면서 이것 저것 구현해봐야 한다.) 오늘은 이와 비슷한? 학년-반 내에서 학생 번호가 쭉 있을 때, 결석 전까지 누적 count를 매겨보려고 한다. 글로만 보면 이해안가니까 바로 코드로 deep dive! 1. Library오늘은 numpy, pandas 이외에 dictionary를 편하게 쓸 defaultdict 빌트인 함수를 가져온다.from collections import defaultdictimport numpy as npimport pandas as pd 2. Data대충 알겠지 않는가? 5,6학년 내에 1,2,3반이 있는데 각 8번.. 2025. 3. 19.
explode의 이해: Pandas dataframe에서 list 원소를 펼치는 방법 데이터프레임 전처리를 하다 보면, 가끔 아래처럼 grade별로 number가 list로 묶여있는 데이터를 마주하게 된다.data = {'grade': [1, 2, 3], 'number': [[10, 20], [30], [40, 50, 60]]}df = pd.DataFrame(data)### grade number0 1 [10, 20]1 2 [30]2 3 [40, 50, 60]### 이런 경험이 없으면, long form으로 쫙 펼쳐서 보고 싶은데 참 난감하다. 이 경우 pandas에서는 어떻게 쉽게 해결할 수 있는지, 그리고 그것을 구현해 보는 시간을 갖도록 한다.(직접 해보는 이유는, 단순히 method 하나 들고와서 "띡" 해결하는 것이 아닌 처리 로직을 이해하기 위함이다.) 1. .. 2025. 3. 9.
python 활용 x,y coordinates 정보 요약 x,y 좌표 스케일을 축약해서 범위 내 들어오는 값들을 요약하는 방법을 포스팅해보자 이 코드는 데이터프레임을 활용하여 특정 위치 기반으로 값을 매핑하고, 이를 시각화하는 과정까지 포함하는데,아래와 같은 순서로 진행한다.데이터 생성 및 결합 과정 수행위치 데이터를 기반으로 값들을 10x10 맵에 맵핑범주별로 따로 값 누적원하는 범주의 데이터를 시각화이러한 방식은 위치 기반 분석(예: 공정 데이터 분석, 지리적 데이터 처리)에서 유용하게 활용 가능할 것으로 보이며 아래 과정을 하나씩 살펴보자. 1. 라이브러리import osimport sysfrom collections import defaultdictimport pandas as pdimport numpy as npimport matplotlib.pypl.. 2025. 2. 12.
반응형