از ویکی‌پدیا، دانشنامه آزاد

در تحلیل داده‌ها ، ماتریس خود-شباهتی ، نمایش گرافیکی توالی‌های مشابه در یک سری داده است.

شباهت را می‌توان با معیارهای مختلفی مانند فاصله مکانی ( ماتریس فاصلههمبستگی یا مقایسه هیستوگرام‌های محلی یا ویژگی‌های طیفی (مثلاً IXEGRAM [ 1 ] ) توضیح داد . یک نمودار شباهت می‌تواند نقطه شروع نمودارهای نقطه‌ای یا نمودارهای بازگشتی باشد .

تعریف

[ ویرایش ]

برای ساخت ماتریس خود-شباهتی، ابتدا یک سری داده به دنباله‌ای مرتب از بردارهای ویژگی تبدیل می‌شود. پنجم=(وی۱،وی۲،…،وین){\displaystyle V=(v_{1},v_{2},\ldots ,v_{n})}که در آن هر بردارویمن{\displaystyle v_{i}}ویژگی‌های مربوط به یک سری داده را در یک بازه محلی مشخص توصیف می‌کند. سپس ماتریس خود-شباهت با محاسبه شباهت جفت‌های بردارهای ویژگی تشکیل می‌شود.

س(جی،ک)=ها(ویجی،ویک)جی،ک∈(۱،…،ن){\displaystyle S(j,k)=s(v_{j},v_{k})\quad j,k\in (1,\ldots,n)}

کجاها(ویجی،ویک){\displaystyle s(v_{j},v_{k})}تابعی است که میزان شباهت دو بردار را اندازه‌گیری می‌کند، برای مثال، حاصلضرب داخلی ها(ویجی،ویک)=ویجی⋅ویک{\displaystyle s(v_{j},v_{k})=v_{j}\cdot v_{k}}سپس بخش‌های مشابه بردارهای ویژگی به صورت مسیری با شباهت بالا در امتداد قطرهای ماتریس نشان داده می‌شوند. [ 2 ] نمودارهای شباهت برای تشخیص عملی که نسبت به نقطه دید ثابت است [ 3 ] و برای قطعه‌بندی صوتی با استفاده از خوشه‌بندی طیفی ماتریس خود-شباهتی استفاده می‌شوند. [ 4 ]

مثال

[ ویرایش ]

نمودار شباهت، گونه‌ای از نمودار بازگشتی، که برای دیدگاه‌های مختلف از اعمال انسان به دست آمده است، الگوهای مشابهی را نشان می‌دهد. [ 5 ]

همچنین ببینید

[ ویرایش ]

https://en.wikipedia.org/wiki/Self-similarity_matrix