یک اسکریپت پایتون بنویسید که یک فایل CSV را بخواند و برای آن یک هدر YAML شامل متادیتا (نام ستون‌ها، نوع دادهٔ هر ستون، تعداد سطرها و تاریخ تولید) تولید کرده و خروجی را در قالب یک فایل جدید با فرانت‌متر YAML (بین --- ) و سپس داده‌ها ذخیره کند.

3.0 بازدید آخرین ویرایش در 202 روز قبل ساعت 03:06

0.0

با استفاده از pandas فایل CSV را بخوانید، نام ستون‌ها، تعداد سطرها و نوع دادهٔ هر ستون را استخراج کنید و یک دیکشنری متادیتا تشکیل دهید؛ سپس با کتابخانهٔ PyYAML (yaml.safe_dump) آن را به YAML تبدیل کنید. فایل خروجی را به صورت: شروع با '---\n'، سپس محتوای YAML، سپس '---\n' و در ادامه داده‌های CSV (مثلاً با DataFrame.to_csv) بنویسید. نکات: قبل از اجرا کتابخانه‌ها را نصب کنید (pip install pandas pyyaml)، از encoding='utf-8' استفاده کنید و برای نمایش خواناتر YAML از default_flow_style=False و sort_keys=False در safe_dump بهره ببرید.

توسط پژوهشگر در 202 روز قبل ساعت 03:06
دسته بندی ها: Python Python for beginner
arman در 202 روز قبل ساعت 07:30

قبل از اجرا، مطمئن شوید کتابخانه‌های pandas و PyYAML نصب شده‌اند و CSV با encoding='utf-8' خوانده می‌شود. برای هدر متادیتا، نام ستون‌ها، نوع داده هر ستون، تعداد سطرها و تاریخ تولید را از DataFrame استخراج کرده و به یک دیکشنری metadata تبدیل کنید، سپس با yaml.safe_dump به YAML تبدیل کنید. خروجی باید با '---' آغاز و پایان یابد و از default_flow_style=False و sort_keys=False برای خوانایی استفاده کنید. اگر CSVهای بزرگ دارید، به حافظه فشار می‌آید؛ در این صورت از chunking یا خواندن تدریجی استفاده کنید تا مصرف رم کاهش یابد.

گزارش

1 پاسخ

جدید ترین قدیمی ترین بالاترین امتیاز پاسخ های من

در حال بارگیری...
ورود به حساب کاربری