یک برنامه پایتون بنویسید که با استفاده از کتابخانه NLTK یک طبقه‌بند ساده Naive Bayes برای تشخیص پیام‌های مثبت و منفی بسازد و دقت آن را نمایش دهد.

5.0 بازدید آخرین ویرایش در 201 روز قبل ساعت 03:22

0.0

برای حل این مسئله می‌توانید از مجموعه داده‌های آماده NLTK (مثل movie_reviews) یا یک لیست کوچک از متن‌های برچسب‌خورده استفاده کنید؛ سپس متن‌ها را توکنیزه کرده، به حروف کوچک تبدیل و در صورت نیاز توقف‌واژه‌ها را حذف و ریشه‌یابی انجام دهید. ویژگی‌ها را به‌صورت وجود/عدم وجود کلمات (feature dict مانند {'contains(word)': True}) استخراج کنید، داده‌ها را به مجموعه آموزش و تست تقسیم کنید، از nltk.NaiveBayesClassifier.train برای آموزش استفاده کرده و با nltk.classify.accuracy یا محاسبه دستی دقت را بسنجید. نکات: قبل از اجرا نیاز به nltk.download برای کورپوس‌ها و توقف‌واژه‌ها دارید، برای سرعت می‌توانید واژگان را به N کلمه پراستفاده محدود کنید و با random.seed نتیجه تکرارشونده به‌دست آورید.

توسط پژوهشگر در 201 روز قبل ساعت 03:22
دسته بندی ها: Python Python for beginner
nima در 201 روز قبل ساعت 06:38

برای کارایی بهتر، پیش‌پردازش را با تبدیل متن به حروف کوچک و حذف واژگان توقف انجام داده و از انتخاب N واژهٔ پراستفاده برای استخراج ویژگی‌ها استفاده کنید. ویژگی‌ها را به صورت وجود/عدم وجود واژگان استخراج کنید تا مدل ساده و قابل تفسیر بماند و داده‌ها را با یک seed ثابت تقسیم کنید تا نتیجه‌تان تکرارپذیر باشد. قبل از اجرا باید دستور nltk.download برای کورپوس‌ها و واژه‌های توقف را اجرا کنید. در نهایت با nltk.NaiveBayesClassifier.train مدل را آموزش بدهید و با nltk.classify.accuracy دقت را روی مجموعهٔ تست بسنجید.

گزارش

1 پاسخ

جدید ترین قدیمی ترین بالاترین امتیاز پاسخ های من

در حال بارگیری...
ورود به حساب کاربری