본문 바로가기

알고싶은

연관규칙분석이란? 연관규칙분석 예시 3가지

반응형

연관규칙분석 예시로 배우는 연관 규칙 분석

연관규칙분석이란?

연관규칙분석은 추천 시스템의 기저 알고리즘이다. 우리가 알고 있는 유튜브 알고리즘, 넷플릭스에서 나에게 맞는 콘텐츠 추천도 비슷한 예이다.

 

 

그룹을 알고 있을 경우에는 지도 학습을 한다. 군집분석은 순수하게 군집으로 쪼개고 싶을 때 사용하며, 의사결정트리는 어떻게 쪼개져 있는지 알 때 사용한다. youtube 광고에서 의사결정트리는 어떻게 나타날까?

 

데이터를 분석할 때

1. 어떤 군집인지 모르면 군집을 먼저 나눈다.
2. 군집이 나와있으면 기준이 나와있으니 의사결정나무로 돌린다.

출처 이상철 교수님 유튜브
ⓒ이상철 교수님 유튜브

연관규칙분석은 영수증 분석을 많이 한다. 아래 표를 보면 1-10번까지 있고 이 중 같은 물품을 구입한 사람의 확률들을 구한다.

출처 유튜브
ⓒ 고려대 DSBA 유튜브

동일한 물품을 구한 사람들을 보면 라면과 달걀은 통계적으로 상관없다. 우연으로 구매할 확률과 통계가 같다. 그래서 원인과 결과의 직접적인 인과관계가 아니며, 둘 또는 그 이상 품목들 사이의 상호 관련성의 규칙임을 알 수 있다.

출처 유튜브
ⓒ 고려대 DSBA 유튜브

연관규칙분석 측정도구

연관규칙분석을 구하는 방법은 지지도(support), 신뢰도(confidence), 향상도(lift)가 있다. 그렇다면 지지도와 신뢰도 향상도는 어떻게 계산하는 것인지 아래에서 확인해보세요.

지지도

지지도는 라면과 콜라를 함께 구매할 확률이다.

출처 유튜브
ⓒ 고려대 DSBA 유튜브

신뢰도

다음으로 신뢰도는 라면을 구입한 사람이 콜라도 구입할 확률이다. 라면을 포함하는 거래에 라면과 콜라가 같이 포함될 확률로 조건부 확률과 유사합니다. 라면을 구매했을 때 콜라의 확률로 라면의 확률을 라면과 콜라가 동시에 포함될 확률을 나눠 계산한다.

출처 유튜브
ⓒ 고려대 DSBA 유튜브

향상도

연관규칙분석의 향상도는 많이 팔리는 인기상품을 알아낼 때 사용한다. 여기서 분자는 신뢰도이고, 분모는 콜라의 인기도로 볼 수 있습니다.

라면이 없을 때의 콜라의 확률에 비해 라면이 주어졌을 때 콜라의 증가 비율을 계산하여 예측합니다. 향상도가 1보다 작으면 별로 좋지 못한 추천 결과가 됩니다.

출처 유튜브
ⓒ 고려대 DSBA 유튜브

Priori 알고리즘


두 개짜리 아이템 후보군을 선정할 때 양파가 들어간 것은 구분하지 않는다.
아이템 3개짜리 조합을 고려할 때는 라면과 참치는 구분하지 않는다.
일정 개수가 되면 연관 있는 것들이 줄어든다.

출처 유튜브
ⓒ 고려대 DSBA 유튜브

연관규칙분석은 둘 또는 그 이상 품목들 사이의 상호 관련성의 규칙임을 알 수 있다.

출처 유튜브
ⓒ 고려대 DSBA 유튜브

고려대학교 DBSA 연관규칙분석 강의

출처 유튜브
ⓒ 고려대 DSBA 유튜브

 

 

출처 유튜브
ⓒ 고려대 DSBA 유튜브

 

출처 유튜브
ⓒ 고려대 DSBA 유튜브

 

출처 유튜브
ⓒ 고려대 DSBA 유튜브

 

출처 유튜브
ⓒ 고려대 DSBA 유튜브

 

출처 유튜브
ⓒ 고려대 DSBA 유튜브

연관규칙분석 사례

올리브영 장바구니 분석

연관규칙분석 사례 3가지를 살펴보자. 먼저 올리브영 장바구니 분석이다. 올리브영 음료 매출이 저조하여 음료 매출을 향상시키기 위해 연관규칙분석을 사용하였다.

연관규칙분석 사례
연관규칙분석 사례

음료 매출을 향상시키기 위해 매출 데이터를 분석하였다. 그 결과 첫째, 여성이 아침시간에 음료 소비가 많다. 둘째, 헬스 초코바 같은 스낵류를 함께 구입한다는 것을 발견하였다.연관규칙분석을 활용한다면 구글 애즈 유튜브 광고는 어떻게 보여질까?

결과에 따른 데이터 활용 방안으로 음료 추가 대신 간단하게 아침대용으로 먹을 스낵류를 추가하였고 그 결과 음료 매출이 향상되었다.

 

농식품 소비자 패널조사 자료

다음 연관규칙분석 사례는 소비자의 신선식품 구매 패턴 분석이다. 농식품 소비자의 패널 조사이다. 사람들의 소비한 물품을 연령별, 계절별로 구매내역 자료를 나누었다.

연관규칙분석 사례
연관규칙분석 사례

 

상황인식 음악 추천 시스템

다음은 연관 규칙을 이용한 상황인식 음악 추천 시스템이다. 데이터 베이스에서 위치와 시간 정보, 음악 정보, 사용자 정보와 같은 상황정보를 수집하고 데이터 마이닝을 하고 그에 따라 추천 모듈을 만든다.

연관규칙분석 사례
연관규칙분석 사례

이상으로 연관 규칙 분석의 정의와 연관규칙분석 예시 3가지에 대해 알아보았다. 연관 규칙 분석을 하기 전에 왜 분석을 해야될까? 이는 사용자의 요구를 알기 위해서로 생각된다. 아래에서 요구분석에 관해 알아보자.

https://tr.educoco.kr/24

 

빅 데이터 교육프로그램, 교육프로그램 개발 단계 중 요구분석이란? 요구분석 단계는 어떻게 될까?

요구분석이란? 요구분석 단계 요구분석이란 교육프로그램 개발에 앞서 교육대상자의 요구를 분석하는 일이다.요구는 현재 상태와 목표 상태의 차이이자 개인 및 집단의 선호하는 상태이고 상

tr.educoco.kr

다양한 데이터 분석 방법에 대해 공부하는 중으로 이번에는 연관규칙분석을 알아보았다. 위의 내용 중 잘못된 것이 있다면 댓글로 남겨주세요. 감사합니다!!

반응형