کتابخانه graph-tool در پایتون

graph-tool یک کتابخانهٔ قدرتمند برای تحلیل گراف (شبکه‌ها) در پایتون است که هستهٔ آن به C++ نوشته شده و از قابلیت‌های پردازشی بالا بهره می‌برد. این کتابخانه مناسب تحلیل‌های سنگین، محاسبات ساختاری، کشف اجتماع‌ها و نمایش شبکه‌ها با کارایی بالا است. در این مقاله به مزایا، مثال‌های عملی، نکات نصب و مقایسهٔ آن با کتابخانه‌های دیگر می‌پردازیم.

ویژگی‌های کلیدی

پیاده‌سازی C++ در پس‌زمینه برای سرعت بالا.
ساختارهای دادهٔ بهینه (property maps، متغیرهای گرافی با نوع ثابت).
الگوریتم‌های پیشرفته: دسته‌بندی اجتماع (blockmodel)، PageRank، مسیر کوتاه، مؤلفه‌های متصل و …
ابزارهای بصری‌سازی مبتنی بر cairo و توانایی تولید تصاویر با کیفیت.
پشتیبانی از گراف‌های وزن‌دار، ناهم‌جهت و چندگراف.

نصب و نکات عملی

نصب graph-tool معمولاً ساده نیست چون وابستگی به کتابخانه‌های سیستمی مانند Boost و Cairo دارد. در توزیع‌های لینوکس مانند اوبونتو می‌توان از پکیج‌های رسمی یا مخازن استفاده کرد:

sudo apt-get install python3-graph-tool

در صورت نیاز به نصب از منبع، باید Boost، CGAL، cairo و بسته‌های توسعهٔ مرتبط را نصب کنید. در ویندوز نصب دشوارتر است؛ استفاده از ماشین مجازی یا WSL توصیه می‌شود.

مثال پایه: ساخت گراف و محاسبهٔ PageRank

from graph_tool.all import Graph, pagerank, graph_draw

g = Graph(directed=True)
v1 = g.add_vertex()
v2 = g.add_vertex()
v3 = g.add_vertex()

g.add_edge(v1, v2)
g.add_edge(v2, v3)
g.add_edge(v3, v1)

pr = pagerank(g)
for v in g.vertices():
    print(int(v), pr[v])

# رسم ساده
pos = g.new_vertex_property("vector")
pos[v1] = (0, 0)
pos[v2] = (1, 0)
pos[v3] = (0.5, 1)
graph_draw(g, pos=pos, vertex_text=pr, output_size=(300,300), output="simple_pr.png")

توضیح: این کد یک گراف جهت‌دار کوچک می‌سازد، سه رأس اضافه می‌کند و سه یال دورانی ایجاد می‌کند. سپس PageRank را محاسبه و مقادیر آن را چاپ می‌کند. در پایان گراف را با موقعیت دستی رأس‌ها رسم کرده و مقدار PageRank را به‌عنوان متن روی رأس‌ها قرار می‌دهد.

مثال پیشرفته: تحلیل اجتماع‌ها با stochastic block model

from graph_tool.all import Graph, minimize_blockmodel_dl, partition_entropy
from graph_tool.topology import remove_parallel_edges

g = Graph(directed=False)
# مثال بارگذاری از فایل edge list
with open("edges.txt") as f:
    for line in f:
        a, b = map(int, line.split())
        # فرض می‌کنیم اندیس‌ها از صفر شروع می‌شوند
        while max(a, b) >= g.num_vertices():
            g.add_vertex()
        g.add_edge(a, b)

# پاک‌سازی یال‌های موازی و حلقه‌ها برای مدل‌سازی بهتر
remove_parallel_edges(g)

# پیدا کردن مدل بلوکی با کمینه‌سازی تابع طول کد
state = minimize_blockmodel_dl(g)
b = state.get_blocks()

print("Number of blocks:", state.get_B())
print("Entropy per vertex:", partition_entropy(state)[0])

توضیح: در این مثال ابتدا یک گراف از فایل لیست یال‌ها بارگذاری می‌شود. سپس یال‌های موازی حذف می‌شود و با استفاده از minimize_blockmodel_dl مدل بلوکی کمینه‌سازی می‌شود. get_blocks() نقشهٔ بلوک‌ها را بازمی‌گرداند و state.get_B() تعداد بلوک‌ها را نشان می‌دهد. این روش برای کشف اجتماع‌ها (communities) بر پایهٔ مدل تصادفی بلوکی بسیار قدرتمند است.

نکات بهینه‌سازی و کار با خواص (properties)

برای کارایی بیشتر از property maps استفاده کنید (vertex_property، edge_property) به‌جای ذخیرهٔ داده در ساختارهای پایتونی.
در پردازش‌های بزرگ از توابع موازی داخلی کتابخانه بهره ببرید؛ بسیاری از الگوریتم‌ها چندنخی هستند.
از نوع‌گذاری مناسب برای propertyها استفاده کنید (int, double, vector<double>) تا تبدیل‌های پایتونی-سی++ کاهش یابد.

مثال: اضافه کردن ویژگی وزن به یال‌ها و محاسبهٔ مسیر کوتاه وزنی

from graph_tool.all import Graph, shortest_path, graph_draw

g = Graph(directed=False)
v = [g.add_vertex() for _ in range(4)]
e01 = g.add_edge(v[0], v[1])
e12 = g.add_edge(v[1], v[2])
e23 = g.add_edge(v[2], v[3])
e03 = g.add_edge(v[0], v[3])

w = g.new_edge_property("double")
w[e01] = 1.0
w[e12] = 2.5
w[e23] = 1.0
w[e03] = 5.0

distance, path = shortest_path(g, v[0], v[3], weights=w)
print("Distance:", distance)
print("Path:", [int(x) for x in path])

توضیح: در این کد، یک property از نوع double برای وزن یال‌ها ساخته شده و به هر یال وزن اختصاص می‌یابد. سپس تابع shortest_path با پارامتر weights فراخوانی می‌شود تا کوتاه‌ترین مسیر وزنی بین دو رأس محاسبه شود. خروجی فاصله و لیست رأس‌های مسیر است.

مقایسهٔ سریع: graph-tool در برابر NetworkX

معیار	graph-tool	NetworkX
سرعت	خیلی سریع (C++ backend)	کندتر برای گراف‌های بزرگ (پیور پایتون)
سهولت نصب	پیچیده‌تر (وابستگی‌های سیستمی)	نصب ساده‌تر (pure Python)
قابلیت‌ها	الگوریتم‌های پیشرفته و مدل‌سازی	کتابخانهٔ همه‌منظوره و گسترده

موارد کاربرد و توصیه‌های حرفه‌ای

تحلیل شبکه‌های زیست‌شناسی (مثلاً شبکه‌های پروتئینی) که نیاز به محاسبات سنگین دارند.
تحقیقات در حوزهٔ علوم اجتماعی و کشف جماعت‌ها در گراف‌های بزرگ.
سامان‌دهی داده‌های گرافی در صنعت برای محاسبات مقیاس‌پذیر (مثلاً پیشنهاددهی مبتنی بر گراف).
اگر پروژه شما کوچک یا نمونه‌سازی سریع است و نصب سختی دارید، ابتدا از NetworkX استفاده کنید؛ سپس برای نسخهٔ تولیدی یا تحلیل‌های حجیم به graph-tool مهاجرت کنید.

نکات پایانی و منابع

graph-tool گزینهٔ بسیار مناسبی برای محققان و مهندسانی است که با گراف‌های بزرگ و نیازمند عملکرد بالا کار می‌کنند. با وجود چالش‌های نصب، مزایای عملکردی و الگوریتم‌های پیشرفتهٔ آن باعث می‌شود برای تحلیل‌های جدی یک انتخاب قوی باشد. برای مستندات رسمی و مثال‌های بیشتر به صفحهٔ پروژه در GitHub و داکیومنت رسمی مراجعه کنید.

آیا این مطلب برای شما مفید بود ؟

خیر

بله