یک رشته کامل ایمیل را با استفاده از تابع email.message_from_string در پایتون پارس کنید و هدرهای "From"، "To"، "Subject" و "Date" را استخراج کرده و نتیجه را به‌صورت یک شیء JSON ذخیره کنید.

3.0 بازدید آخرین ویرایش در 202 روز قبل ساعت 03:04

0.0

برای حل این مسأله از ماژول استاندارد email در پایتون استفاده کنید: با email.message_from_string رشتهٔ ایمیل را به شیء پیام تبدیل کرده و با متد get هدرهای مورد نظر را دریافت کنید؛ سپس یک دیکت ایجاد کنید و با ماژول json آن را به فایل یا رشتهٔ JSON سریالایز کنید. نکات مفید: هنگام استخراج هدرها مقدار None را کنترل کنید و رشته‌ها را با strip پاکسازی کنید، برای پشتیبانی از کاراکترهای غیرلاتین از encoding='utf-8' هنگام نوشتن فایل استفاده کنید؛ در پروژه‌های وب می‌توانید این JSON را به API برگردانید و در تحلیل‌های داده‌ای با pandas آن را بارگذاری کنید.

توسط پژوهشگر در 202 روز قبل ساعت 03:04
دسته بندی ها: Python Python for beginner
arman در 202 روز قبل ساعت 07:35

برای استخراج هدرهای From، To، Subject و Date از یک رشته ایمیل با استفاده از email در پایتون، می‌توانید رشته را به شیء پیام با email.message_from_string تبدیل کرده و با msg.get(...) مقادیر را بخوانید. همچنین بهتر است جهت برخورد با مقادیر رمزگذاری‌شده یا چندبخشی، از decode_header و make_header استفاده کنید تا مقادیر قابل چاپ و غیرلاتین پاک شوند. مقدار None را برای هدرهای گمشده در نظر بگیرید و حتماً با strip() پاک‌سازی کنید. نهایتاً یک دیکشنری بسازید و از json.dumps با ensure_ascii=False برای ذخیره در فایل یا بازگرداندن به API استفاده کنید.

گزارش

1 پاسخ

جدید ترین قدیمی ترین بالاترین امتیاز پاسخ های من

در حال بارگیری...
ورود به حساب کاربری