일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 대회
- 게임
- 통계학
- 오토인코더
- Kaggle
- 기초통계학
- 게임 데이터분석
- self-similarity
- AutoEncoder
- 봇탐지
- 자기유사도
- 유저이탈
- AE
- 사례
- google.oauth2
- 자료의요약
- PYTHON
- anomaly
- 게임 이탈 분석
- LTV
- 이상탐지
- 딥러닝
- google.cloud
- LTV예측
- 데이터 분석
- dacon
- 데이터분석
- 게임분석
- Detection
- anomaly detection
- Today
- Total
목록데이터분석 (11)
사쿠의 데이터 블로그
22년 7월 20일 겪은 이야기 A상품에 관한 분석을 하던 중, 위 아래 그림이 대충 비슷하기(눈 대중으로)에 유저 비율대로 잘 구매하고 있구나 하고 넘어갔지만... 너무 안일했다. ㅜ 동료분의 추가 확인은 나를 부끄럽게 만들었다. 로그인 유저들 중, 구매 유저의 비율을 보니, 80 레벨대 유저에서는 쥐 파먹은 모습이 보였다. 눈 대중으로 보지않고 "sample 추출시, 비율을 봐야하는 이유"를 배웠다.
제가 있는 곳에서는 데이터 분석팀이 있고 각자 담당하고 있는 프로젝트가 있습니다. 그리고 각 프로젝트에는 사업, 마케팅, 개발사가 있어서 그들과 함께 일을 합니다.그런데 각기 다른 프로젝트이지만, 공통적으로 요청하는 내용 중 하나는 유저 이탈 분석입니다. 그리고 보통 문의 내용들을 나열하면 다음과 같습니다."이탈 유저 대상 이벤트를 진행하려 하는데 10월 이후 미 접속 유저 리스트를 부탁합니다""초반 동선 구간별 이탈 유저 확인이 필요합니다""업데이트 후 스테이지 별 이탈 유저 분석 요청드립니다"1번 요청의 경우 추출 대상과 기간이 정확히 명시되어 있어 간단해 보이지만 왜 기준이 10월인지? 생각을 해보게 됩니다. 2번 요청은 보통 stage 클리어 비율이 급격히 낮아지는 구간이 어디인지 찾아내서 개선을..
이전 포스팅 LTV 예측하기 에서는 간략하게 LTV에 대한 개념과 예측이 필요한 이유에 대해 다뤄보았습니다. 참고한 사례 NCSOFT & DEVSISTERS는 데이터 분석을 잘 활용하는 기업으로, 서비스 중인 게임의 특성에 맞게 활용하는 모습을 볼 수 있었습니다. 이 방법은 단기간 LTV 예측에서 좋은 성과를 보이고, 실험을 진행해본 결과 만족할 만한 수준이었습니다. 이번 포스팅에서는 제가 두 사례를 참고하여 장기간 예측에 어떻게 활용을 하였는지 이야기 해보려 합니다. 글의 순서 입니다 LTV 예측하기 - 유리함수 fitting ARPU - Feature Engineering Summary LTV 예측하기 - 유리함수 fitting LTV는 Life Time Value의 약자로 쉽게 말해, 고객이 일생동..
LTV(Life Time Value) 예측에 관한 글을 작성하려 합니다. 주 내용은 다른 게임 회사에서 적용중인 프로세스들을 참고해정리한 내용으로 그들보다 배경과 이론 설명이 부족할 수 있습니다. 혹시 궁금하신 점이 있다면 댓글 혹은 제가 참고한 링크들을 참조 부탁드립니다. (Devsisters), (NCSOFT) 글의 순서 입니다 LTV 예측이 필요한 이유 LTV 계산하기 Summary LTV 예측이 필요한 이유 "항상 궁금한 예상 매출액을 집계할 수 있고, CPI 관리를 할 수 있어 마케팅에 더 집중할 수 있다." 최종 목적은 예상 위와 같습니다. 예상 매출액을 집계할 수 있다면 회계 작성 시에도 도움이 되고 앞으로 펼칠 사업의 방향을 정할 때도 매우 도움이 됩니다. 결과과 정확한 편이라면 장점은 나..
https://dacon.io/competitions/official/235584/overview/ [기상] AI프렌즈 시즌1 온도 추정 경진대회 출처 : DACON - Data Science Competition dacon.io 오늘(2020-04-13) 대회 마감인 온도 추정 경진대회는 아쉬움이 많이 남는 대회인것 같다. 첫 대회 문제를 살펴봤을 때는 그렇게 어렵지 않을거라 예상했지만 당연히 나의 착각&^^& 데이터 설명 데이터는 다른 대회 대비 크기(size)도 작고 간단하게 생겼다. train의 X 는 기상청에서 제공하는 데이터다. (기온, 현지 기압, 풍속, 누적강수량, 해면기압, 누적일사량, 습도, 풍향) Y00 ~ Y17은 대전 지역 실내외에서 측정한 기온 데이터다. 대회 목적은 제공된 데이..
이번 자료의 요약에서의 목적은 다음과 같다. 1. 자료의 형태를 구분 2. 범주형 자료의 요약방법 확인 3. 이산형 자료의 요약방법 확인 4. 연속형 자료의 요약 방법 확인 범주형 자료의 요약방법을 소개합니다. 도수분포표(Frequency Table) 도수: 관측값의 갯수 상대도수: 도수를 전체 자료의 개수로 나눈 수 신규 게임 출시에 대한 긍부정 반응 조사 예시 응답 도수 상대도수 긍정 68 0.356 그저 그렇다 43 0.225 부정 66 0.345 무응답 14 0.07 합 191 1 무응답은 전체의 7% 정도로 설문지 참여율은 높은 편인 것으로 보인다. 결과를 보면, 긍정과 부정이 약 35% 비율로 비교적 동일하게 나왔다. 유저별 취향이 극명하게 갈리는 부분이 있는 것으로 보인다. 원형그래프(Pie..
이번 자료의 요약에서의 목적은 다음과 같다. 1. 자료의 형태를 구분 2. 범주형 자료의 요약 방법 확인 3. 이산형 자료의 요약 방법 확인 4. 연속형 자료의 요약 방법 확인 자료(Data)의 형태는 크게 수치 자료(numerical data)와 범주형 자료(categorical data) 2가지로 구분이 된다. 타이타닉 데이터를 예시로 보면 아래와 같이 구분할 수 있다. 수치 자료: age, fare 범주형 자료: pclass, sex, sibsp, parch, survival 수치 자료란? 관측값이 수치로 측정되는 자료로, 키, 몸무게, 자동차 사고 건수 등이 있다 범주형 자료란? 관측값의 크기가 아니라 내용이 관심의 대상으로, 혈액형(A, B, O, AB), 지역(서울, 경기... ), 선호도 여..
간단하게 자주 사용하는 게임속 지표들을 정리해 보았습니다. 기본 유저 지표 용어 용어 (전체) 내용 NRU New Registered Users 신규 가입 유저 수 RU Registered Users 가입 유저 수 DAU Daily Active Users 일별 유니크 접속 유저 수 WAU Weekly Active Users 주별 유니크 접속 유저 수 MAU Monthly Active Users 월별 유니크 접속 유저 수 PU Purchased Users 일별 인앱 상품 구매 유저 수 RU Registered Users 전체 등록 유저(총 사용자) WU Withdraw User 탈퇴 고객 RAU Returned Activity User 7일 이상 미접속 유저 중 해당일에 접속한 유저 유니크 접속 유저란?-..