فرهنگ بسامدی

فرهنگ بسامدی میزان کاربرد کلمات زبان را بر حسب فراوانی وقوع آنها در یک پیکره زبانی که نماینده آماری زبان است نشان می‌دهد. کلمات پربسامد و کم‌بسامد می‌توانند شاخص ارزشمندی برای پی بردن به مولفه‌های فرهنگی یک جامعه زبانی باشند. میزان بسامد کلمات در یک فرهنگ بسامدی تابع بازه زمانی است که پیکره فرهنگ در آن زمان گردآوری شده است. بنابراین اطلاعات موجود در فرهنگ بسامدی رابطه مستقیم با تحولات تاریخی یک جامعه زبانی دارد. امروزه فرهنگ بسامدی در تحقیقات بین‌رشته‌ای مانند آموزش زبان دوم به خارجیان، زبان‌شناسی نظری و کاربردی و فناوری‌های زبان در محیط رایانه از قبیل ترجمه ماشینی و طراحی مدل زبانی برای سامانه‌های پردازش گفتار کاربرد موثری دارد. «فرهنگ بسامدی زبان فارسی امروز» شامل بن‌واژه‌هایی از پیکره فرهنگ (پیکره‌ای با حدود ۱۰ میلیون کلمه) است که فراوانی بیش 500 دارند. تعداد بن‌واژه‌های با فراوانی بیش از این مقدار در پیکره فرهنگ 1868 مورد است. ذیل این بن‌واژه‌ها 19987 کلمه که از نظر شکل نوشتاری و/یا برچسب واژگانی متفاوت هستند قرار گرفته است.

برای کسب اطلاعات جامع درباره تهیه فرهنگ می‌توان به کتاب«فرهنگ بسامدی زبان فارسی امروز»نشر دانشگاه تهران مراجعه کرد. در این کتاب علاوه بر شرح فرهنگ بسامدی، مداخل و فهرست ترتیبی واژه‌ها بر اساس بسامد، فصلی نیز به هم‌نگاره‌ها اختصاص یافته است. در فصل مذکور، هم‌نگاره‌هایی که نام کامل برچسب آنها دست‌کم در یک مقوله (به جز کسره اضافه) متفاوت باشد فهرست شده‌اند. در اینجا امکان جستجوی مدخل بر اساس متن و ترتیب فراهم شده است.