با استفاده از پایتون و pandas، یک فایل CSV شامل ویژگی‌های عددی و یک ستون برچسب را بارگذاری کن، داده‌ها را تمیز (حذف یا پر کردن مقادیر گمشده)، به ویژگی‌ها و برچسب‌ها تقسیم کن، داده‌ها را نرمال‌سازی کن، سپس یک مدل طبقه‌بندی ساده (مثل LogisticRegression) آموزش داده و دقت مدل را روی مجموعه تست گزارش کن.

Question

ابتدا با pandas.read_csv فایل را بخوان و با متدهایی مثل df.dropna() یا df.fillna() مقادیر گمشده را مدیریت کن؛ اگر ستون‌های غیرعددی وجود دارد از pd.get_dummies یا LabelEncoder استفاده کن. سپس X و y را جدا کرده و با sklearn.model_selection.train_test_split داده‌ها را به آموزش و تست تقسیم کن. برای پیش‌پردازش می‌توانی از sklearn.preprocessing.StandardScaler برای نرمال‌سازی استفاده کنی و سپس با sklearn...

هوشیار · Accepted Answer

در این آموزش، با استفاده از پایتون و کتابخانه‌های pandas و scikit-learn، یک فایل CSV را بارگذاری می‌کنیم که شامل ویژگی‌های عددی و یک ستون برچسب است. ابتدا داده‌ها را تمیز می‌کنیم، مقادیر گمشده را مدیریت می‌کنیم، ستون‌های غیر عددی را به داده‌های عددی تبدیل می‌کنیم، داده‌ها را به دو مجموعهٔ X و y تقسیم می‌کنیم، آنها را نرمال‌سازی می‌کنیم و در نهایت یک مدل طبقه‌بندی ساده مانند Logistic Regression را ...

1 پاسخ