[FastCampus] 파이썬을 활용한 이커머스 데이터 분석하기¶ Ch04. 고객 이탈 예측(KNN)¶ 01. 분석의 목적¶ KNN 알고리즘으로 고객이탈(customer churn)을 예측 Binary Classification(고객 이탈을 한다 안한다를 예측하기 때문이다.) 통신사 고객데이터를 이용하여 유추해 보려한다. 통신사 고객 데이터는 고객 이탈이 빈번하기 때문에 이번 주제에 알맞는 데이터이다. 02. KNN의 원리¶ KNN의 뜻은 K-Nearly-Neighbors의 약자로 새로운 데이터의 특성을 가장 가까운 데이터의 특성을 이용하여 예측하는 방식이다. 03. 파이썬 Tip - list¶ 아래 코드와 같이 대괄호를 이용하여 리스트를 만든다. In [6]: x = [1,2,3] In [7]: ['a..
[FastCampus] 파이썬을 활용한 이커머스 데이터 분석하기¶ Ch03. 광고 반응률 예측¶ 01. 분석의 목적¶ Logistic Regression을 사용하여 고객별 반응율을 예측해보자. 연속된 값이 아닌 Yes or no 두 가지중 어디에 속하는지 이진분류를 예측하는 머신러닝 알고리즘이다. 02. 모듈, 데이터 로딩 및 데이터 확인¶ 필요한 모듈과 이번에 사용할 데이터를 로딩한 후 간단하게 데이터를 확인해 보자. In [32]: import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns In [33]: data = pd.read_csv("advertising.csv") In [34]: dat..
[FastCampus] 파이썬을 활용한 이커머스 데이터 분석하기¶ Ch02. 고객별 연간 예측 지출액 예측¶ 패스트 캠퍼스의 좋은 강의가 있어 이것을 따라해 보면서 기록을 남겨 보았다. 1. 모듈 및 데이터 로딩하기¶ 먼저 항상 사용하는 4가지 모듈을 미리 임포트 한다. In [3]: import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns 먼저 데이터를 불러오자. In [4]: data = pd.read_csv('ecommerce.csv') In [5]: data Out[5]: Email Address Avatar Avg. Session Length Time on App Time on Websi..