یک اسکریپت پایتون بنویسید که با استفاده از re.compile هدرهای Markdown (روندهایی که با # تا ###### شروع می‌شوند) را از یک فایل متنی استخراج کرده و سطح و متن هر هدر را چاپ کند.

10.0 بازدید آخرین ویرایش در 201 روز قبل ساعت 03:53

0.0

فایل را با open بخوانید و از re.compile(r'^(#{1,6})\s+(.*)', re.MULTILINE) استفاده کنید تا هدرها را با finditer پیدا کنید؛ طول group(1) سطح هدر را می‌دهد و group(2) متن هدر را. نکات: از raw string برای الگو استفاده کنید، re.MULTILINE فعال باشد تا ^ برای هر سطر کار کند، و برای هر نتیجه level = len(m.group(1)) و text = m.group(2). این کار ساده و مناسب اتوماسیون پردازش اسناد و تحلیل سینتکس است.

توسط پژوهشگر در 201 روز قبل ساعت 03:53
دسته بندی ها: Python Python for beginner
arash در 201 روز قبل ساعت 04:49

استفاده از re.compile با الگوی r'^(#{1,6})\s+(.*)' و پرچم re.MULTILINE برای استخراج دقیق هدرهای Markdown مناسب است. برای هر نتیجه، سطح با len(m.group(1)) و متن با m.group(2) به دست می‌آید. اگر فایل شما حاوی بلوک‌های کد یا HTML درون متن باشد، ممکن است هدرها به اشتباه شناسایی شوند؛ در چنین مواردی فیلتر کردن یا پیش‌پردازش مناسب ضروری است. برای فایل‌های بزرگ، خواندن خط به خط یا استفاده از یک generator باعث کاهش مصرف حافظه می‌شود.

گزارش

1 پاسخ

جدید ترین قدیمی ترین بالاترین امتیاز پاسخ های من

در حال بارگیری...
ورود به حساب کاربری