یک برنامه پایتون بنویسید که با استفاده از کتابخانه NLTK یک طبقهبند ساده Naive Bayes برای تشخیص پیامهای مثبت و منفی بسازد و دقت آن را نمایش دهد.
5.0 بازدید آخرین ویرایش در 201 روز قبل ساعت 03:22 0.0
برای حل این مسئله میتوانید از مجموعه دادههای آماده NLTK (مثل movie_reviews) یا یک لیست کوچک از متنهای برچسبخورده استفاده کنید؛ سپس متنها را توکنیزه کرده، به حروف کوچک تبدیل و در صورت نیاز توقفواژهها را حذف و ریشهیابی انجام دهید. ویژگیها را بهصورت وجود/عدم وجود کلمات (feature dict مانند {'contains(word)': True}) استخراج کنید، دادهها را به مجموعه آموزش و تست تقسیم کنید، از nltk.NaiveBayesClassifier.train برای آموزش استفاده کرده و با nltk.classify.accuracy یا محاسبه دستی دقت را بسنجید. نکات: قبل از اجرا نیاز به nltk.download برای کورپوسها و توقفواژهها دارید، برای سرعت میتوانید واژگان را به N کلمه پراستفاده محدود کنید و با random.seed نتیجه تکرارشونده بهدست آورید.
1 پاسخ
جدید ترین قدیمی ترین بالاترین امتیاز پاسخ های من
در حال بارگیری...
برای ارسال پاسخ باید با حساب کاربری وارد شوید.
ورود به حساب کاربری
برای کارایی بهتر، پیشپردازش را با تبدیل متن به حروف کوچک و حذف واژگان توقف انجام داده و از انتخاب N واژهٔ پراستفاده برای استخراج ویژگیها استفاده کنید. ویژگیها را به صورت وجود/عدم وجود واژگان استخراج کنید تا مدل ساده و قابل تفسیر بماند و دادهها را با یک seed ثابت تقسیم کنید تا نتیجهتان تکرارپذیر باشد. قبل از اجرا باید دستور nltk.download برای کورپوسها و واژههای توقف را اجرا کنید. در نهایت با nltk.NaiveBayesClassifier.train مدل را آموزش بدهید و با nltk.classify.accuracy دقت را روی مجموعهٔ تست بسنجید.
گزارش