[TIL-260427] 멋쟁이사자처럼 그로스마케팅 4기 - 데이터분석 개론 day33 | 머신러닝

Growth Marketing/GM4

[TIL-260427] 멋쟁이사자처럼 그로스마케팅 4기 - 데이터분석 개론 day33 | 머신러닝 - 시계열 데이터 분석 2 & 코호트 리텐션율 예측

pamsyra 2026. 4. 27. 20:34

▼오늘 배운 사항들
1. 시계열 데이터 분석
2. 코호트 W1 리텐션율 예측

Part 1. 시계열 데이터 분석

[시계열 데이터 분석 단계]

1단계 : 데이터 만들기
2단계 : 데이터 분리
3단계 : 데이터 탐색 - 시각화
4단계 : ARIMA 모델 학습
5단계 : 모델 예측
6단계 : 모델 예측 결과 확인 - 시각화
7단계 : 정확도 요약
→ 마케팅 인사이트 : 모델링 인사이트
8단계 : 실제 데이터 예측

▶ 중요한 건 흐름이고 단계별로 나오는 데이터와 변수들이 다음단계에서 어떻게 적용되고 얼라인되는지 파악하는 것

[3단계&6단계] 데이터 탐색 - 시각화

실무에서는 노이즈가 많은 데이터를 다루게 됨
주어진데이터와 모델링 돌린 데이터 시각화를 비교

[예측결과 확인]
1. 좁게 시작했는데 넓어지는 현상 : 단기예측보다 장기예측이 더 어렵다는 점
2. 주황색 : 우리가 예측한 값으로 트렌드에 맞게 우상향하는걸 보아 트렌드 방향이 잘 되었구나
3. 실선에 점선이 잘 붙은걸 보아 예측 정확도가 나쁘지 않구나

[7단계] 정확도 요약

모델 성능 평가 시, 반복문 활용해서 steps만큼 나오는 연결성 잊지말기

[8단계] 실제 데이터 예측

실제 데이터를 넣을뿐 모델 예측과 동일하게 진행
미래예측결과를 가지고 마케팅 KPI 설정 시 근거로 활용

# 9. 실제 데이터로 학습하기
# 36개월 전부넣고 그 이후의 6개월에 대한 예측 실제로 진행

# 9-1 모델 생성
model = ARIMA(df['가입자'], order=(1,1,1))

# 9-2 모델 학습
최종모델 = model.fit()

# 9-3 모델 예측 - 향후 6개월
미래예측결과 = 최종모델.get_forecast(steps=6)

# 9-4 예측값 추출
미래예측가입자수 = 미래예측결과.predicted_mean.values # values는 배열형태로 값을 받겠다

# 9-5 95%에 대한 예측 범위
미래예측범위 = 미래예측결과.conf_int(alpha=0.05)
미래예측하한 = 미래예측범위.iloc[:,0].values
미래예측상한 = 미래예측범위.iloc[:,1].values

Part 2. 코호트 W1 리텐션율 예측

[리텐션 데이터]

리텐션율 : 앱이나 서비스를 사용하기 시작한 유저가 일정 기간 후에도 계속 사용하고 있는 비율
그럼 리텐션율=잔존율?

[실습] 데이터 파악 및 모델 선정

코호트 : 같은 주에 처음 앱을 설치한 유저 그룹
W1 리텐션 : 설치 후 7~13일 사이에 다시 접속한 비율
시계열 : 매주 새로운 코호트 생성, 해당 코호트의 W1 리텐션율을 주 단위로 기록하는 구조
이번주 신규유저의 W1리텐션은 지난주 리텐션과 자기상관이 높아서 자기회귀가 특징인 ARIMA모델로 진행~!
ARIMA : 시계열 데이터에서 패턴을 학습해 미래 값을 예측하는 통계 모델
실무에서 리텐션 예측하는 방법 : ARIMA / Prophet / LightGBM, XGBoost / 코호트 기반 생존 모

[데이터탐색 - 시각화]

우하향/ 계절성은 없는 것 같고 / 이벤트효과가 노이즈가 있어보이긴 하는데 트렌드는 일관적이니 진행해보기로

[모델 학습 및 오차계산]

예측값이 전부 59로 나왔는데 ARIMI 특성상 평탄하게 예측하려는 성향이 있음

[실제 데이터 예측]

정확도 요약은 못했지만, 실제데이터 예측 코딩은 해설안보고 직접했다~!
오류난이유는 future 오타..

복습하면 이해가 더 잘 돼서 복습해야하는데 물리적인 시간이 부족하다~!

코딩 같은 경우 티스토리보다 노션에 정리하는 게 편해서 어제부터 노션에 정리하고 있는데 TIL도 작성하려니 음..힘내보고

그리고 오늘 그냥 마음이 싱숭생숭한데 기분이 태도가 되지 말자..

'Growth Marketing > GM4' 카테고리의 다른 글

[TIL-260429] 멋쟁이사자처럼 그로스마케팅 4기 - 취업특강 day35 (0)	2026.05.01
[TIL-260428] 멋쟁이사자처럼 그로스마케팅 4기 - 데이터분석 개론 day34 \| 군집분석 → ABtest → ARIMA 모델링 (0)	2026.04.28
[TIL-260424] 멋쟁이사자처럼 그로스마케팅 4기 - 데이터분석 개론 day32 \| 머신러닝 - 군집 분석 결과 시각화 & 시계열 데이터 분석 (0)	2026.04.24
[TIL-260423] 멋쟁이사자처럼 그로스마케팅 4기 - 데이터분석 개론 day31 \| 머신러닝 - 다중회귀선형모델링 & 군집분석 (1)	2026.04.23
[TIL-260422] 멋쟁이사자처럼 그로스마케팅 4기 - 데이터분석 개론 day30 \| 머신러닝 기초 - 선형회귀분석모델 (0)	2026.04.23

현재글[TIL-260427] 멋쟁이사자처럼 그로스마케팅 4기 - 데이터분석 개론 day33 | 머신러닝 - 시계열 데이터 분석 2 & 코호트 리텐션율 예측

Pamsyra

방과후 컴퓨터교실에서 배운 타자실력으로 디지털 노트 정리

퍼포먼스마케팅, GTM, 그로스마케터, SQL, pandas, 마케팅자격증, 비전공자, 멋쟁이사자처럼, 마케터취준, 마케팅취준, 멋쟁이사자처럼후기, 마케터, Python, 그로스마케팅, 파이썬, sqld, 마케팅, GA4, 데이터분석, 부트캠프,

Today :
Yesterday :

Pamsyra