DOTNETCODE Telegram 3067
جستجوی هوشمند یعنی چی؟ با Stemming آشنا شو!

تاحالا شده دنبال کلمه‌ی "خرید" بگردی ولی نتایجی که توشون "خریدم" یا "خریدن" هست رو پیدا نکنی؟ اینجاست که Stemming یا ریشه‌یابی وارد میشه!

---

ریشه‌یابی (Stemming) چیه؟

خیلی ساده‌ست! فرض کن یک هرس‌کننده‌ی هوشمند داری که شاخ و برگ اضافی کلمه‌ها رو میزنه تا به ریشه‌شون برسه.

برای مثال، این کلمات رو در نظر بگیر:
* کتاب‌ها
* کتابی
* کتابخانه

ریشه‌یاب همه‌ی این‌ها رو به یک کلمه‌ی اصلی برمی‌گردونه: "کتاب"

---

چطوری کار می‌کنه؟

وقتی در سیستمی مثل الاستیک‌سرچ (Elasticsearch) از ریشه‌یابی استفاده می‌کنیم، دو تا اتفاق مهم میفته:

۱. موقع ذخیره: وقتی متنی رو ذخیره می‌کنیم، سیستم کلمه‌ها رو به ریشه‌شون تبدیل می‌کنه.
- جمله‌ی "من کتاب‌ها را خواندم" اینطوری ذخیره میشه: "من کتاب را خواند"

۲. موقع جستجو: وقتی تو کلمه‌ی "کتاب" رو جستجو می‌کنی، سیستم دنبال ریشه‌ی "کتاب" می‌گرده و تمام نتایج مرتبط رو پیدا می‌کنه! 🎉

---

چند مثال دیگه:

* رفتم، می‌روی، رفتند ⬅️ رفت
* کارگر، کارها، کارخانه ⬅️ کار
* نوشته، می‌نویسم، نویسنده ⬅️ نویس

---

نتیجه نهایی:

با ریشه‌یابی، دیگه فرقی نمی‌کنه کاربر دنبال "خرید" بگرده یا "خریدار" یا "خریدند"؛ در هر صورت به چیزی که می‌خواد می‌رسه. این یعنی جستجوی دقیق‌تر، نتایج بیشتر و تجربه‌ی کاربری بهتر!

لینک منبع :

https://www.elastic.co/docs/manage-data/data-store/text-analysis/stemming

🎺برای یادگیری بیشتر و دریافت مطالب مفید در زمینه .NET و برنامه‌نویسی، به کانال ما بپیوندید!

📚💻 @dotnetcode 🖥👨‍💻
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32👏2👍1



tgoop.com/dotnetcode/3067
Create:
Last Update:

جستجوی هوشمند یعنی چی؟ با Stemming آشنا شو!

تاحالا شده دنبال کلمه‌ی "خرید" بگردی ولی نتایجی که توشون "خریدم" یا "خریدن" هست رو پیدا نکنی؟ اینجاست که Stemming یا ریشه‌یابی وارد میشه!

---

ریشه‌یابی (Stemming) چیه؟

خیلی ساده‌ست! فرض کن یک هرس‌کننده‌ی هوشمند داری که شاخ و برگ اضافی کلمه‌ها رو میزنه تا به ریشه‌شون برسه.

برای مثال، این کلمات رو در نظر بگیر:
* کتاب‌ها
* کتابی
* کتابخانه

ریشه‌یاب همه‌ی این‌ها رو به یک کلمه‌ی اصلی برمی‌گردونه: "کتاب"

---

چطوری کار می‌کنه؟

وقتی در سیستمی مثل الاستیک‌سرچ (Elasticsearch) از ریشه‌یابی استفاده می‌کنیم، دو تا اتفاق مهم میفته:

۱. موقع ذخیره: وقتی متنی رو ذخیره می‌کنیم، سیستم کلمه‌ها رو به ریشه‌شون تبدیل می‌کنه.
- جمله‌ی "من کتاب‌ها را خواندم" اینطوری ذخیره میشه: "من کتاب را خواند"

۲. موقع جستجو: وقتی تو کلمه‌ی "کتاب" رو جستجو می‌کنی، سیستم دنبال ریشه‌ی "کتاب" می‌گرده و تمام نتایج مرتبط رو پیدا می‌کنه! 🎉

---

چند مثال دیگه:

* رفتم، می‌روی، رفتند ⬅️ رفت
* کارگر، کارها، کارخانه ⬅️ کار
* نوشته، می‌نویسم، نویسنده ⬅️ نویس

---

نتیجه نهایی:

با ریشه‌یابی، دیگه فرقی نمی‌کنه کاربر دنبال "خرید" بگرده یا "خریدار" یا "خریدند"؛ در هر صورت به چیزی که می‌خواد می‌رسه. این یعنی جستجوی دقیق‌تر، نتایج بیشتر و تجربه‌ی کاربری بهتر!

لینک منبع :

https://www.elastic.co/docs/manage-data/data-store/text-analysis/stemming

🎺برای یادگیری بیشتر و دریافت مطالب مفید در زمینه .NET و برنامه‌نویسی، به کانال ما بپیوندید!

📚💻 @dotnetcode 🖥👨‍💻

BY DotNet | دات نت




Share with your friend now:
tgoop.com/dotnetcode/3067

View MORE
Open in Telegram


Telegram News

Date: |

Matt Hussey, editorial director of NEAR Protocol (and former editor-in-chief of Decrypt) responded to the news of the Telegram group with “#meIRL.” Private channels are only accessible to subscribers and don’t appear in public searches. To join a private channel, you need to receive a link from the owner (administrator). A private channel is an excellent solution for companies and teams. You can also use this type of channel to write down personal notes, reflections, etc. By the way, you can make your private channel public at any moment. Select: Settings – Manage Channel – Administrators – Add administrator. From your list of subscribers, select the correct user. A new window will appear on the screen. Check the rights you’re willing to give to your administrator. To upload a logo, click the Menu icon and select “Manage Channel.” In a new window, hit the Camera icon. Joined by Telegram's representative in Brazil, Alan Campos, Perekopsky noted the platform was unable to cater to some of the TSE requests due to the company's operational setup. But Perekopsky added that these requests could be studied for future implementation.
from us


Telegram DotNet | دات نت
FROM American