چرا شعر فارسی؟
ساختار منظم (وزن، قافیه، ردیف) و الگوهای تکرارشونده، آن را برای تحلیل ریاضی ایدهآل میکند.
ابهام معنایی در اشعار حافظ یا مولوی، چالشی جذاب برای مدلهای NLP است.
۱. تحلیل وزن عروضی با روشهای ریاضی
الف) مدلسازی اوزان با ماشین حالتمحدود (FSM)
هر وزن عروضی (مثلاً فعولن فعولن فعولن فعل) را میتوان با یک گراف حالت نمایش داد.
مثال:
مفاعیلن مفاعیلن فعولن → یک زبان منظم که با FSM قابل تشخیص است.
نرمافزارهایی مانند «عروضیاب» از این روش استفاده میکنند.
ب) خطاهای وزنی با احتمالات
برخی شاعران مدرن (احمد شاملو) عمداً از اوزان شکسته استفاده میکنند.
مدل پنهان مارکوف (HMM) میتواند الگوهای این «تخطیهای آگاهانه» را شناسایی کند.
۲. پردازش معنایی اشعار
الف) تحلیل احساسات (Sentiment Analysis)
آموزش مدلهای ML برای تشخیص غم/شادی/عرفان در شعر:
مثنوی مولوی: بیشترین تکرار واژههای مثبت («عشق»، «نور»).
غزلهای سعدی: ترکیبی از حکمت و اندرزهای اخلاقی.
ب) شبکههای معنایی (Word Embeddings)
ساخت فضای برداری برای واژههای شعر (مثلاً با Word2Vec):
در دیوان حافظ، «می» به «عارف» نزدیکتر است تا «شراب»!
این نشاندهندهی استعارههای عرفانی در شعر اوست.
۳. تولید شعر با هوش مصنوعی
الف) مدلهای زبانی (GPT برای شعر)
چالشها:
حفظ وزن و قافیه همراه با معنای عمیق.
مثال: خروجی مدل «حافظژن» (شعرهای مصنوعی به سبک حافظ).
ب) ارزیابی کیفیت شعرهای ماشینی
معیارهای ریاضی:
۱. انطباق وزن (با FSM).
۲. تنوع واژگانی (با آنتروپی شانون).
۳. همخوانی با سبک تاریخی (با Stylometry).
۴. کشف سرقت ادبی با روشهای کمّی
مثال:
مقایسهی تکرار واژهها در شاهنامه و گرشاسپنامه برای یافتن تأثیرپذیریها.
استفاده از فاصلهی لیونشتاین برای سنجش شباهت بین ابیات.
ابزارهای پیشنهادی برای تحلیل
ابزارکاربردمثال شعر فارسی
Python NLTKپردازش وزن و قافیه تحلیل عروض حافظ
TensorFlowآموزش مدلهای تولید شعرGPT به سبک مولوی
Gephiترسیم شبکههای معنایی ارتباط واژگان در مثنوی
چالشهای پیشرو
۱. ابهام معنایی: واژههایی مانند «ساقی» در حافظ همزمان ظاهری و عرفانی دارند.
۲. زبان تاریخی: تفاوت معنای واژهها در فارسی قدیم و جدید (مثلاً «دور» در شاهنامه = زمان).
پروژهی پیشنهادی برای شما:
«تحلیل تطبیقی وزن عروضی در غزلهای حافظ و سعدی با Python»
مراحل:
۱. استخراج متن دیوانها از پایگاههای دیجیتال.
۲. پیادهسازی یک FSM ساده برای تشخیص اوزان.
۳. مقایسهی آماری پرکاربردترین وزنها.
اگر مایلید، میتوانم کد نمونهای برای تحلیل وزن با پایتون ارائه دهم!
نظر شما؟ آیا روی جنبهی خاصی از NLP در شعر فارسی تمرکز کنیم؟
در این وبلاگ به ریاضیات و کاربردهای آن و تحقیقات در آنها پرداخته می شود. مطالب در این وبلاگ ترجمه سطحی و اولیه است و کامل نیست.در صورتی سوال یا نظری در زمینه ریاضیات دارید مطرح نمایید .در صورت امکان به آن می پردازم. من دوست دارم برای یافتن پاسخ به سوالات و حل پروژه های علمی با دیگران همکاری نمایم.در صورتی که شما هم بامن هم عقیده هستید با من تماس بگیرید.