연관규칙학습 측정방법
연관규칙 지지도, 신뢰도, 향상도
연관규칙이란? ‘A상품을 구매하면, B상품을 구매한다.’ 또는 ’A상품과 B상품을 구매하면, C상품을 구매한다.’는 형태로 동시 출현 행렬이다.
이 글은 아래 연관규칙분석의 개념과 장점을 함께 보시면 더 좋습니다.
1. 연관규칙학습 측정방법
연관규칙 분석 결과의 유의미성을 판단하기 위해서 항목들 간의 연관성을 보여줄 수 3가지 지표가 있다. 연관규칙학습 측정하기 위해 지지도, 신뢰도, 향상도를 알아야 한다. 연관규칙은 두상품을 동시에 포함하는 거래의 비율이다. 먼저 연관규칙학습 측정방법 중 지지도를 알아보자.
1) 지지도
지지도는 연관규칙의 강도에 대한 척도는 아니며 단순히 이러한 거래가 얼마나 빈번하게 발생하는지를 나타내는 척도로 구매율로 볼 수 있다.
2) 신뢰도
다음으로 신뢰도는 연관규칙의 강도를 나타내는 척도로 A를 구매했을 때, B도 함께 구매할 확률이다. 앞서 살펴본 지지도는 대칭적인 반면, 신뢰도는 대칭적이지 않다.
3) 향상도
연관규칙 향상도는 B 상품의 구매 확률이 A 상품의 구매에 따라서 얼마나 증가했는지를 의미한다. 향상도가 1 이라는 것은 두 상품의 구매가 독립적이라는 뜻이다.
즉, 항목B를 항목 A와 함께 구입한 경우와 항목 B만 구매한 경우의 비율이다. 향상도를 구하는 식은 아래와 같다. 향상도는 지지도와 신뢰도와 다르게 비율로 분자와 분모에 넣고 계산한다.
향상도가 1보다 크면 항목 A와 B가 양(+)의 상관관계로 볼 수 있다. 향상도가 1보다 작으면 음(-)의 상관관계가 있다고 볼 수 있다.
따라서 연관규칙을 찾을 때 정말 연관이 있는지 알고자 한다면 향상도의 값이 1보다 큰 수치로 나타나야 한다. 연관규칙에서 향상도의 값과 의미를 아래 표에서 확인해보자.
2. 연관규칙의 3가지 분류
첫째, 유용한 규칙이다. 분석 이전에는 알지 몰랐으나, 분석을 통해서 알아냈으며 실제로 활용 가능한 규칙으로 분류할 수 있다.
다음으로 사소한 규칙이다. 이미 잘 알고 있는 규칙이며 새로운 사실이 아니므로 실제 유용성은 떨어진다.
마지막으로 설명 불가능한 규칙이다. 연관규칙을 통해 발견되었으나, 실제로 해석이나 활용이 불가능한 경우이다. 그 예로 비가 오는 날 특정 상품이 많이 판매된다는 연관규칙이 생성되었으나, 그 이유를 알지 못하는 경우이다.
그렇다면 연관규칙학습 예시에 대해 아래에서 알아보자.
연관규칙학습의 측정방법인 지지도, 향상도, 신뢰도에 대해 알아보았다. 이 글은 연관규칙 분석 기법으로 이어집니다.
'알고싶은' 카테고리의 다른 글
팀기반 학습, 팀기반학습 장단점과 팀기반학습 과정 (0) | 2021.11.25 |
---|---|
[AI교육] 2021 AI 온라인 실무 응용 교육과정 with 엘리스 코딩 (0) | 2021.11.25 |
데이터 마이닝 순차패턴, 순차 패턴 마이닝, 순차패턴 정의와 순차패턴 분석 알고리즘 5단계 (0) | 2021.11.06 |
타켓 마케팅을 위한 연관규칙분석의 개념과 장단점 (2) | 2021.11.04 |
연관규칙분석이란? 연관규칙분석 예시 3가지 (0) | 2021.11.01 |
빅 데이터 교육프로그램, 교육프로그램 개발 단계 중 요구분석이란? 요구분석 단계는 어떻게 될까? (0) | 2021.10.25 |