مقدمه در بسیاری از کاربردهای پردازش طبیعی زبان ۱برچسب زنی اجزای سخن نیاز
است . برچسب زنی تعیین برچسب دستوری برای یک کلمه در یک متن است . ورودی
این سیستم متن است و خروجی آن کلمه ها با تگ های مناسب است [۴]. بسیاری از
برچسب زن ها با …
ایست واژه ها (Stop words) در زبان فارسی و انگلیسی
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
۱ ابزارها, خدمات, روشهای متن کاوی, فرایند متن کاوی ۰ 131
ایست
واژه ها (Stop words) ایست واژه ها لغاتی هستند که علی رغم تکرار فروان در
متن، از لحاظ معنایی دارای اهمیت کمی هستند مثل “اگر”، “و”، “ولی”،”که” و
غیره. در نگاه اولیه کلمات ربط و تعریف، ایست واژه به نظر می آیند؛ در عین
حال بسیاری از افعال، افعال …
برای بسیاری از روشهای پردازش متن و
NLP، نیاز به نمایش عددی کلمات و متون داریم تا بتوانیم از انواع روشهای
عددی حوزه یادگیری ماشین مانند اکثر الگوریتم های دسته بندی روی لغات و
اسناد استفاده کنیم. یکی از رهیافت هایی که در این حوزه بسیار رایج شده است
، …
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
فرایند
متن کاوی، شامل سه مرحله است که عبارت اند از: آماده سازی، پردازش و تحلیل
متن. آماده سازی متن: این مرحله، انتخاب، پاکسازی و پردازش مقدماتی متن را
شامل می شود. در این مرحله، پایگاه ها یا منابعی که قرار است متن کاوی بر
روی آنان انجام پذیرد، انتخاب …
ادامه »