왜 자취생을 군집분석으로 분류해야 할까?
현대 사회에서 자취생은 단일한 정체성이 아니라, 다양한 생활 패턴과 소비 습관을 가진 복합적인 집단입니다. 누구는 매일 집밥을 해 먹고, 누구는 배달앱이 주식입니다. 어떤 자취생은 깔끔하게 살고, 또 어떤 자취생은 청소기를 몇 달째 켜지 않죠. 그렇기 때문에 자취생을 대상으로 한 제품 기획이나 마케팅 전략이 효과적이려면, 이들을 보다 정교하게 이해하고 분류할 필요가 있습니다.
이러한 맥락에서 이번 글에서는 군집분석(Clustering Analysis) 기법을 사용해 자취생들을 몇 가지 유형으로 분류해보고, 그 특징을 분석해보았습니다. 이는 소비자 세분화(Customer Segmentation) 관점에서도 매우 유의미한 시도입니다.
군집분석이란?
군집분석은 유사한 특성을 가진 개체들을 하나의 그룹(클러스터)으로 묶는 분석 기법입니다. 주로 비지도 학습(Unsupervised Learning)으로 분류되며, 사전에 라벨링된 데이터가 없이도 의미 있는 패턴을 찾아냅니다.
대표적인 군집 알고리즘은 다음과 같습니다.
- K-평균(K-Means): 가장 많이 쓰이며, 중심점을 기준으로 데이터를 분할
- DBSCAN: 밀도 기반 군집으로 이상치에 강함
- 계층적 군집(Hierarchical Clustering): 덴드로그램을 통해 군집 구조 시각화 가능
- Gaussian Mixture Model(GMM): 데이터가 여러 개의 정규분포로 구성됐다는 가정
본 글에서는 가장 대중적이고 직관적인 K-평균(K-Means) 알고리즘을 중심으로 설명합니다.
데이터 수집 및 전처리
데이터 구성은 아래와 같은 변수들로 구성했습니다. 실제 설문조사를 기반으로 구축된 모의 데이터셋을 사용했습니다.
변수명 | 설명 | 데이터 타입 |
---|---|---|
월 평균 식비 | 자취생의 월별 식비 (만원) | 연속형 |
요리 빈도 | 주간 직접 요리 횟수 | 연속형 |
배달 빈도 | 주간 배달앱 사용 횟수 | 연속형 |
수면 시간 | 하루 평균 수면 시간 (시간) | 연속형 |
청소 빈도 | 주간 청소 횟수 | 연속형 |
취미 시간 | 주간 취미생활 시간 (시간) | 연속형 |
외출 빈도 | 주간 외출 횟수 | 연속형 |
전처리 과정
- 표준화(Standardization): 변수 간 단위가 다르므로 평균 0, 분산 1로 변환
- 이상치 제거: IQR 방식으로 극단값 제거
- 결측치 처리: 평균 대체 및 삭제 방식 병행
최적의 클러스터 수 결정: 엘보우 기법
엘보우 기법을 사용하여 군집의 수($k$)를 결정합니다. 아래 그래프에서 SSE(Sum of Squared Errors)가 급격히 꺾이는 지점을 찾습니다.
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
sse = []
for k in range(1, 10):
km = KMeans(n_clusters=k, random_state=0)
km.fit(scaled_data)
sse.append(km.inertia_)
plt.plot(range(1, 10), sse, marker='o')
plt.xlabel('클러스터 수')
plt.ylabel('SSE')
plt.title('엘보우 기법으로 본 최적의 k')
plt.show()
결과적으로 **$k=4$**가 가장 이상적인 분기점으로 나타났습니다.
자취생 유형별 클러스터 분석 결과
1. 실속형 자취생 (Cluster 0)
- 식비: 낮음 (월 15~20만 원)
- 요리: 주 4회 이상
- 배달: 거의 없음
- 청소: 자주 함
- 취미시간: 짧음
- 외출: 적음
- 해석: 비용 효율성과 실용성을 중시하는 전통적 자취 스타일. 건강에 신경 쓰며 자취에 적응 잘 되어 있음.
2. 편의성 중시형 자취생 (Cluster 1)
- 식비: 매우 높음 (월 40만 원 이상)
- 요리: 거의 안 함
- 배달: 주 5회 이상
- 청소: 낮음
- 취미시간: 짧음
- 외출: 많음
- 해석: 바쁜 직장인 혹은 사회 초년생. 시간 부족으로 모든 것을 배달과 외부에서 해결. 라이프스타일이 도시적.
3. 감성 추구형 자취생 (Cluster 2)
- 식비: 중간
- 요리: 취미 수준
- 배달: 가끔 이용
- 청소: 자주 함
- 취미시간: 많음 (주 10시간 이상)
- 외출: 중간
- 해석: 자취 공간을 '나만의 공간'으로 꾸미는 것을 즐김. 인스타 감성, 홈카페, 브런치 문화 등을 좋아함.
4. 방치형 자취생 (Cluster 3)
- 식비: 불규칙
- 요리/배달: 불규칙
- 청소: 거의 안 함
- 취미시간: 없음
- 외출: 매우 적음
- 해석: 정신적, 환경적 여유가 부족한 상태. 건강관리 미흡. 경우에 따라 정책적 개입 대상이 될 수 있음.
시각화: 주성분 분석(PCA) 적용
PCA를 통해 고차원의 변수를 2차원으로 축소해 시각화한 결과는 다음과 같습니다.
from sklearn.decomposition import PCA
import seaborn as sns
pca = PCA(n_components=2)
X_pca = pca.fit_transform(scaled_data)
clusters = KMeans(n_clusters=4, random_state=0).fit_predict(scaled_data)
sns.scatterplot(x=X_pca[:, 0], y=X_pca[:, 1], hue=clusters, palette='Set2')
plt.title('자취생 유형별 군집 시각화 (PCA)')
plt.xlabel('주성분 1')
plt.ylabel('주성분 2')
plt.show()
마케팅과 정책 설계에의 활용 방안
유형 | 마케팅 활용 | 정책적 접근 |
---|---|---|
실속형 | 저가형 밀키트, 장보기 앱 | 식재료 쿠폰, 자취생 생활비 지원 |
편의형 | 프리미엄 배달 서비스, 간편식 | 피로 회복, 시간관리 교육 |
감성형 | 인테리어 제품, 브런치 키트 | 문화활동 지원, DIY 교육 |
방치형 | 건강관리 제품, 정신건강 앱 | 정신 건강 상담, 자취 지원 프로그램 |
결론: 자취생 이해, 데이터로부터 시작하라
군집분석은 단순한 분류 이상의 힘을 가집니다. 자취생이라는 하나의 그룹 안에도 다층적인 정체성이 존재하며, 이를 무시한 마케팅은 늘 반쪽짜리로 끝나기 마련입니다. 이번 분석처럼, 자취생의 실제 라이프스타일 데이터를 바탕으로 유형화하고 각자의 특성을 고려한 전략을 수립한다면, 훨씬 정밀하고 효과적인 접근이 가능할 것입니다.
'마케팅관련' 카테고리의 다른 글
다차원척도법으로 브랜드 감성 시각화 실험 (0) | 2025.05.10 |
---|---|
시간적 자기상관(Autocorrelation)을 무시한 캠페인 예산 편성의 실패 사례 (0) | 2025.05.09 |
지각도지도(Perceptual Map)에서 등장하지 않는 브랜드의 마케팅 전략 (0) | 2025.05.08 |
베이지안 A/B 테스트가 소규모 이벤트에 부적합한 이유 (0) | 2025.05.07 |
'로짓 회귀분석 Logistic Regression'으로 김밥 선호도 예측해보기 (0) | 2025.05.05 |