真實(shí)世界中的很多數(shù)據(jù)都是高維的,如圖像和視頻、Web 文本、基因陣列以及時(shí)間序列等等。然而,由于“維數(shù)災(zāi)難”的影響會(huì)導(dǎo)致如下挑戰(zhàn)性問題:
1、分類所需要的有標(biāo)記樣本數(shù)隨著維數(shù)升高而指數(shù)級(jí)增長(zhǎng):
2、高維空間中的樣本點(diǎn)之間的距離會(huì)趨向于相等,從而造成多數(shù)基于距離度量的聚類算法的失效:
3、大多數(shù)分類和聚類算法的計(jì)算開銷隨維數(shù)升高而顯著增長(zhǎng)。因而,針...
|