بن‌واژه‌یاب

بن‌واژه‌یاب (یا با مسامحه ریشه‌یاب)،‌ بن‌واژه (یا ریشه غیرتصریفی) کلمات را استخراج می‌کند. با توجه به ساخت‌واژه و نظام تصریفی پیچیده زبان فارسی ابهامات بسیار زیادی در استخراج بن‌واژه کلمات وجود دارد. به عنوان مثال بن‌واژه کلمه "آبی" می‌تواند به "آب" یا "آبی" باشد یا کلمه "تنها" می‌تواند بن‌واژه "تن" یا "تنها" داشته باشد و انتخاب مناسب باید با توجه به بافتی که کلمه در آن ظاهر شده انجام شود. اکثر سامانه‌های پردازش متون فارسی در صورت عدم استفاده از بن‌واژه‌یاب کارایی قابل قبولی نخواهند داشت.

در اینجا به دلیل محدودیتهای پردازشی منابع کمتری برای پردازش متن به کار گرفته می‌شود و در نتیجه نسخه‌ای ساده‌‌تری نسبت به نسخه نهایی بن‌واژه‌یاب به نمایش گذاشته می‌شود.