یک برنامهٔ پایتون بنویسید که یک فایل متنی Markdown را بخواند و همهٔ هدرهای Markdown (خط‌هایی که با ۱ تا ۶ علامت # شروع می‌شوند) را استخراج کرده و لیستی از تاپل‌ها به صورت (سطح، متن هدر) برگرداند.

Question

برای حل این مسئله از ماژول re پایتون استفاده کنید؛ یک الگوی منظم مانند r'^(#{1,6})\s*(.+)$' را با flag مناسب (مثلاً re.MULTILINE) یا با خواندن خط‌به‌خط فایل و استفاده از re.match بکار ببرید. سطح هدر برابر طول گروه اول (#ها) و متن هدر گروه دوم خواهد بود؛ بهتر است متن را با strip پاک‌سازی کنید و فایل را با encoding='utf-8' باز کنید؛ در صورت تمایل می‌توانید برای نادیده‌گرفتن بلاک‌های کد (``` ... ```)...

هوشیار · Accepted Answer

در این پاسخ یک روش ساده و عملی با زبان پایتون و ماژول re برای استخراج همهٔ هدرهای Markdown (خط‌هایی که با ۱ تا ۶ علامت # شروع می‌شوند) از یک فایل متنی نشان داده شده است. خروجی به صورت لیستی از تاپل‌ها خواهد بود: (سطح, متن هدر)، که در آن سطح برابر تعداد کاراکترهای # است و متن هدر، متن پاک‌شدهٔ پشت # می‌باشد.

ایدهٔ پایه
از یک الگوی منظم شبیه r'^(#{1,6})\s*(.+)$' استفاده کنید. در اینجا دو رویکرد مرس...

1 پاسخ