tgoop.com/Amar_kadeh/6630
Last Update:
🔻معرفی الگوریتم "Apriori"
#مطلب_علمی
الگوریتم Apriori یکی از الگوریتمهای پرکاربرد در دادهکاوی است که برای پیدا کردن ویژگیهای آیتمهای مکرر و یافتن الگوها و ارتباطات بین آنها به کار میرود. این الگوریتم بهخصوص برای تحلیل سبد خرید مشتریان بسیار استفاده میشود و میتواند روابط میان اقلامی که معمولاً با هم خریداری میشوند را شناسایی کند.
💢مراحل کلی پیادهسازی این الگوریتم
1. جمعآوری دادهها (Data Collection): فرض کنید در یک فروشگاه لوازم الکترونیکی، تراکنشهای زیر ثبت شده باشد:
- خرید اول: لپتاپ، موس، کیف لپتاپ
- خرید دوم: گوشی موبایل، هدفون
- خرید سوم: لپتاپ، موس، گوشی موبایل
- خرید چهارم: لپتاپ، موس
- خرید پنجم: گوشی موبایل، هدفون، شارژر
2. محاسبه پشتیبانی (Support Calculation): تعداد دفعات خرید هر آیتم محاسبه میشود. برای مثال:
- لپتاپ: 3
- موس: 3
- کیف لپتاپ: 1
- گوشی موبایل: 3
- هدفون: 2
- شارژر: 1
3. حذف آیتمهای غیرمکرر (Pruning): با تعیین حداقل آستانه پشتیبانی (فرضاً 2 یا 3)، آیتمهایی که کمتر از 3 بار خریداری شدهاند حذف میشوند. نتیجه:
- لپتاپ: 3
- موس: 3
- گوشی موبایل: 3
- کیف لپتاپ، هدفون و شارژر حذف میشوند.
4. محاسبه جفت آیتمهای مکرر (Frequent Pairs Calculation): جفت آیتمهایی که با هم خریداری میشوند محاسبه میشود. نتایج بهدستآمده:
- (لپتاپ، موس): 3
- (لپتاپ، گوشی موبایل): 1
- (موس، گوشی موبایل):
5. ادامه فرآیند برای مجموعههای بزرگتر: این روند برای آیتمستهای طولانیتر ادامه مییابد تا دیگر مجموعه آیتمهای مکرر جدیدی یافت نشود.
💢مثال نهایی:
در این مثال، مجموعه آیتمهای مکرر شامل:
- لپتاپ
- موس
- گوشی موبایل
💢نتیجه گیری:
فروشگاه میتواند موس و لپتاپ را در کنار هم پیشنهاد کند یا برای تشویق مشتریان به خرید بیشتر، آنها را در تبلیغات یا بستههای تخفیفی ترکیب کند.
🆔 @StatisticsSBU2 | انجمن علمی آمار دانشگاه شهید بهشتی
BY آمارکده
Share with your friend now:
tgoop.com/Amar_kadeh/6630