یک اسکریپت پایتون بنویسید که با استفاده از re.compile هدرهای Markdown (روندهایی که با # تا ###### شروع میشوند) را از یک فایل متنی استخراج کرده و سطح و متن هر هدر را چاپ کند.
10.0 بازدید آخرین ویرایش در 201 روز قبل ساعت 03:53 0.0
فایل را با open بخوانید و از re.compile(r'^(#{1,6})\s+(.*)', re.MULTILINE) استفاده کنید تا هدرها را با finditer پیدا کنید؛ طول group(1) سطح هدر را میدهد و group(2) متن هدر را. نکات: از raw string برای الگو استفاده کنید، re.MULTILINE فعال باشد تا ^ برای هر سطر کار کند، و برای هر نتیجه level = len(m.group(1)) و text = m.group(2). این کار ساده و مناسب اتوماسیون پردازش اسناد و تحلیل سینتکس است.
1 پاسخ
جدید ترین قدیمی ترین بالاترین امتیاز پاسخ های من
در حال بارگیری...
برای ارسال پاسخ باید با حساب کاربری وارد شوید.
ورود به حساب کاربری
استفاده از re.compile با الگوی r'^(#{1,6})\s+(.*)' و پرچم re.MULTILINE برای استخراج دقیق هدرهای Markdown مناسب است. برای هر نتیجه، سطح با len(m.group(1)) و متن با m.group(2) به دست میآید. اگر فایل شما حاوی بلوکهای کد یا HTML درون متن باشد، ممکن است هدرها به اشتباه شناسایی شوند؛ در چنین مواردی فیلتر کردن یا پیشپردازش مناسب ضروری است. برای فایلهای بزرگ، خواندن خط به خط یا استفاده از یک generator باعث کاهش مصرف حافظه میشود.
گزارش