بعد ذاتی

از ویکیپدیا، دانشنامه آزاد

در زمینه های تشخیص الگوی و یادگیری ماشین ، بعد ذاتی برای یک مجموعه داده می تواند به عنوان تعداد متغیرهای مورد نیاز در بازنمایی حداقل داده ها فکر شود. به طور مشابه ، در پردازش سیگنال سیگنال های چند بعدی ، بعد ذاتی سیگنال توصیف می کند که چند متغیر برای تولید تقریبی خوب سیگنال مورد نیاز است.

با این حال ، هنگام تخمین بعد ذاتی ، تعریف کمی وسیع تر بر اساس بعد چند برابر استفاده می شود ، جایی که یک بازنمایی در بعد ذاتی فقط نیاز به وجود محلی دارد. چنین روش های تخمین بعد ذاتی می توانند مجموعه داده ها را با ابعاد ذاتی مختلف در بخش های مختلف مجموعه داده اداره کنند.

از بعد ذاتی می توان به عنوان مرز پایین تر از بعد استفاده کرد که می توان داده ها را از طریق کاهش ابعاد فشرده سازی کرد ، اما می تواند به عنوان معیار پیچیدگی مجموعه داده یا سیگنال نیز مورد استفاده قرار گیرد.

برای یک مجموعه داده یا سیگنال از متغیرهای N ، بعد ذاتی آن 0 ≤ M ≤ N را برآورده می کند .

 

فهرست

مثال ویرایش ]

اجازه دهید st \ textstyle f (x_ {1} ، x_ {2})}یک تابع دو متغیر (یا سیگنال ) باشد که از فرم است

 

{\ displaystyle f (x_ {1} ، x_ {2}) = g (x_ {1})}

 

برای برخی از عملکردهای یک متغیر g که ثابت نیست . این بدان معنی است که f ، مطابق با g ، با اولین متغیر یا در امتداد اولین مختصات متفاوت است . از طرف دیگر ، f نسبت به متغیر دوم یا در امتداد مختصات دوم ثابت است. برای تعیین مقدار f فقط لازم است مقدار یک ، یعنی اولین ، متغیر را بدانیم . از این رو ، یک عملکرد دو متغیر است اما بعد ذاتی آن یکی است.

یک مثال کمی پیچیده تر است

{\ displaystyle f (x_ {1} ، x_ {2}) = g (x_ {1} + x_ {2})}f هنوز ذاتی یک بعدی است که با ایجاد یک تغییر متغیر می توان آن را مشاهده کرد

 

display \ نمایشگر y_ {1} = x_ {1} + x_ {2

display \ Displaystyle y_ {2} = x_ {1} -x_ {2

که می دهد

 

{\ displaystyle f \ left ({\ frac {y_ {1} + y_ {2}} {2}}، {\ frac {y_ {1} -y_ {2}} {2}} \ Right) = g \ سمت چپ (y_ {1} \ سمت راست)}

 

از آنجا که تغییر در F را می توان با متغیر توصیف Y 1 بعد ذاتی آن است.

برای این مورد که f ثابت باشد ، ابعاد ذاتی آن صفر است زیرا برای توصیف تنوع ، هیچ متغیری لازم نیست. برای حالت کلی ، وقتی بعد ذاتی عملکرد دو متغیر f نه صفر یا یک است ، دو مورد است.

در ادبیات، از توابع است که از ابعاد درونی صفر، یک، و یا دو گاهی اوقات به عنوان i0D ، i1D یا i2D بود.

تعریف رسمی برای سیگنال ها ویرایش ]

برای N تابع متغیر F ، مجموعه ای از متغیرها را می توان به عنوان یک نشان N بعدی بردار X :

\ displaystyle f = f \ left (\ mathbf {x} \ right) {\ text {در کجا}} \ mathbf {x} = \ سمت چپ (x_ {1} ، \ نقطه ، x_ {N} \ سمت راست)

اگر برای برخی از M متغیر تابع گرم و M × N ماتریس آن مورد است که

  • برای همه{\ textstyle f (\ mathbf {x}) = g (\ mathbf {تبر}) ،}
  • M کمترین عددی است که می توان رابطه فوق بین f و g را یافت ،

سپس بعد ذاتی F است M .

بعد ذاتی توصیفی از f است ، یک خصوصیات نامشخص از g و A نیست . یعنی اگر رابطه فوق برای برخی از f ، g و A رضایت داشته باشد ، باید برای همان f و g ′ و A ′ داده شده نیز راضی شود

{\ displaystyle g '\ left (\ mathbf {y} \ right) = g \ left (\ mathbf {توسط} \ راست)}

\ displaystyle \ mathbf {A '} = \ mathbf {B} ^ {- 1} \ mathbf {A}

از آنجا که B یک ماتریس M - M غیر مفرد است

 

{\ displaystyle f \ left (\ mathbf {x} \ right) = g '\ left (\ mathbf {A'x} \ right) = g \ left (\ mathbf {BA'x} \ Right) = g \ left (\ mathbf {تبر} \ درست)}

 

تبدیل فوریه از سیگنال هایی با بعد ذاتی کم ویرایش ]

یک تابع متغیر N که دارای ابعاد ذاتی M  است ، یک تبدیل فوریه مشخصه دارد . بصری ، از آنجا که این نوع عملکرد در طول یک یا چند بعد ثابت است ، تبدیل فوریه آن باید مانند یک پالس (تبدیل فوریه یک ثابت) در همان بعد در حوزه فرکانس ظاهر شود .

یک مثال ساده ویرایش ]

بگذارید f یک تابع دو متغیر باشد که i1D است. این بدان معنی است که یک بردار عادی وجود دارد\ textstyle \ mathbf {n} \ in \ mathbb {R} ^ {2}و یک تابع متغیر g به گونه ای که

\ displaystyle f (\ mathbf {x}) = g (\ mathbf {n} ^ {\ operatorname {T}} \ mathbf {x})

برای همه\ textstyle \ mathbf {x} \ in \ mathbb {R} ^ {2}. اگر F تبدیل فوریه f است (هر دو عملکرد دو متغیر هستند) باید چنین باشد

 

\ displaystyle F \ left (\ mathbf {u} \ right) = G \ left (\ mathbf {n} ^ {\ mathrm {T}} \ mathbf {u} \ Right) \ cdot \ delta \ left (\ mathbf m} ^ {\ mathrm {T}} \ mathbf {u} \ Right)

 

در اینجا G است که تبدیل فوریه گرم (هر دو از توابع یک متغیر می باشد)، δ است تابع ضربه دیراک و متر یک بردار نرمال در است\ textstyle \ mathbb {R} ^ {2}}عمود بر n . این بدان معنی است که F در همه جا به غیر از خطی که از مبدا دامنه فرکانس عبور می کند و با موازی m است ، از بین می رود . در امتداد این خط F طبق G متفاوت است .

مورد کلی ویرایش ]

اجازه دهید F یک N تابع متغیر است که بعد ذاتی M ، این است که وجود دارد، یک وجود دارد M متغیر تابع گرم و M × N ماتریس به طوری که

{\ textstyle f (\ mathbf {x}) = g (\ mathbf {Ax}) \ quad \ forall \ mathbf {x}.}

تبدیل Fier آن F سپس می تواند به شرح زیر توصیف شود:

  • F همه جا به جز یک فضای فرعی از M از بین می رود
  • زیر فضای M توسط ردیفهای ماتریس A پوشانده شده است
  • در زیر فضای ، F با توجه به G تبدیل فوریه از g متفاوت است

کلیات ویرایش ]

نوع بعد ذاتی که در بالا توضیح داده شد فرض می کند که یک تغییر خطی در مختصات تابع N متغیر f برای تولید متغیرهای M که برای نشان دادن هر مقدار از f لازم است ، اعمال می شود . این بدان معنی است که بسته به N و M ، f در امتداد خطوط ، هواپیماها یا ابر هواپیما ها ثابت است .

در حالت کلی، F است ذاتی بعد M اگر وجود داشته باشد M توابع 1 ، 2 ، ...، M و M متغیر تابع گرم به طوری که

  • {\ textstyle f (\ mathbf {x}) = g \ چپ (a_ {1} (\ mathbf {x}) ، a_ {2} (\ mathbf {x}) ، \ نقطه ، a_ {M} (\ mathbf {x}) \ درست)برای همه x
  • M کمترین تعداد توابع است که امکان تغییر فوق را فراهم می کند

یک مثال ساده در حال تبدیل یک تابع 2 متغیر f به مختصات قطبی است:

 

{\ displaystyle f \ left ({\ frac {y_ {1} + y_ {2}} {2}}، {\ frac {y_ {1} -y_ {2}} {2}} \ Right) = g \ سمت چپ (y_ {1} \ سمت راست)}

 

  • {\ displaystyle f (x_ {1} ، x_ {2}) = g \ left ({\ sqrt {x_ {1} ^ {2} + x_ {2} ^ {2}}} \ Right)، f i1D است و در امتداد هر حلقه محور در مبدا ثابت است
  • {\ displaystyle f (x_ {1} ، x_ {2}) = g \ left (\ arctan \ left ({\ frac {x_ {2}} {x_ {1}}} \ Right) \ Right)، f i1D است و در طول پرتوهای از منشأ ثابت است

به طور کلی ، توصیف ساده ای از مجموعه های نقطه ای که f برای آن ثابت است یا تبدیل فوریه آن معمولاً امکان پذیر نیست.

تاریخچه ویرایش ]

در دهه 1950 روش های به اصطلاح "مقیاس گذاری" در علوم اجتماعی برای کشف و جمع بندی مجموعه داده های چند بعدی توسعه یافتند . [1] بعد از اینکه شپرد مقیاس چند بعدی غیر متریک را در سال 1962 معرفی کرد [2] یکی از مناطق اصلی تحقیق در مقیاس بندی چند بعدی (MDS) تخمین بعد ذاتی بود. [3] موضوع همچنین در تئوری اطلاعات مورد مطالعه قرار گرفت ، پیشگام بنت در سال 1965 که اصطلاح "بعد ذاتی" را ترسیم کرد و برای تخمین آن یک برنامه رایانه ای نوشت. [4] [5] [6]

در دهه 1970 روش های تخمین بصری ذاتی ساخته شده است که به کاهش ابعادی مانند MDS بستگی ندارد: بر اساس مقادیر ویژه محلی. [7] ، بر اساس توزیع فاصله [8] ، و بر اساس سایر خصوصیات هندسی وابسته به بعد [9]

برآورد بعد ذاتی مجموعه ها و اقدامات احتمالی نیز از حدود سال 1980 در زمینه سیستم های دینامیکی مورد مطالعه قرار گرفته است ، جایی که ابعاد جاذبه های (عجیب) موضوع مورد علاقه بوده است. [10] [11] [12] [13] برای جاذبه های عجیب هیچ فرضیه منیفولد وجود ندارد ، و ابعاد اندازه گیری شده نسخه ای از ابعاد فراکتال است - که همچنین می تواند غیرکامل باشد. با این حال ، تعاریف از ابعاد فراکتال ابعاد مانیفولد را برای مانیفولدها ارائه می دهد.

در دهه 2000 از "نفرین ابعاد" برای تخمین بعد ذاتی استفاده شده است. [14] [15]

برنامه ها ویرایش ]

مورد یک سیگنال دو متغیر که i1D است اغلب در دید رایانه و پردازش تصویر به نظر می رسد و ایده مناطق محلی تصویر که حاوی خط یا لبه هستند را ضبط می کند. تجزیه و تحلیل چنین مناطقی قدمتی طولانی دارد ، اما تا زمانی که یک رفتار رسمی و تئوریک از چنین عملیاتی آغاز نشد ، مفهوم بعد ذاتی برقرار شد ، حتی اگر این نام متفاوت باشد.

به عنوان مثال ، مفهومی که در اینجا به عنوان یک محله تصویری از بعد ذاتی 1 یا محله i1D گفته می شود توسط ناتسون (1982) ، [16] متقارن خطی توسط Bigün & Granlund (1987) [17] و محله ساده 1 بعدی نامیده می شود. در گرانلوند و ناتسون (1995). [18]

همچنین مشاهده کنید 

https://en.wikipedia.org/wiki/Intrinsic_dimension