時(shí)空大數據支持下的存量規劃方法論
1.3非監督分類(lèi)與矩陣分解在研究中的使用
分時(shí)人口密度數據作為曲線(xiàn)類(lèi)數據,其自身特點(diǎn)非常適合使用機器學(xué)習的方法進(jìn)行非監督分類(lèi)。筆者將數據整理為休息日的24小時(shí)分時(shí)人口數據與工作日的24小時(shí)分時(shí)人口數據,共48個(gè)時(shí)刻,結合20種不同類(lèi)型POI的數量,對3層空間尺度的研究單元進(jìn)行k-means聚類(lèi)分析。
為了能夠確定k-means中k的取值,筆者對每組數據均進(jìn)行了silhouette檢驗,尋找每組合適的k值,保證在分類(lèi)過(guò)程中,既不會(huì )出現因為k值過(guò)小而忽略某些特征,也不會(huì )出現因為k值過(guò)大使得多組分類(lèi)結果高度重合的情況。
為了對時(shí)間活動(dòng)的趨勢規律和地塊人口活動(dòng)規模進(jìn)行進(jìn)一步區分,筆者分別使用了歸一化的48個(gè)時(shí)刻數據和未歸一化的數據進(jìn)行非監督學(xué)習,使分類(lèi)結果更加詳細。在進(jìn)行48個(gè)時(shí)刻的非監督分類(lèi)同時(shí),筆者也嘗試了使用非負矩陣分解(NMF)的方法,將每個(gè)研究單元48個(gè)時(shí)刻中的特征提取出來(lái),在放大特征的基礎上進(jìn)行非監督分類(lèi)。
2研究結果
2.1地塊尺度研究結果
地塊尺度的分類(lèi)方法是,采用非負矩陣分解(NMF)的方法先對歸一化后的48個(gè)變量進(jìn)行降維(降成5維),然后采用k-means聚類(lèi)的方法對降維之后的5個(gè)變量進(jìn)行聚類(lèi)。多次進(jìn)行silhouette檢驗,發(fā)現k=9時(shí),分類(lèi)精度最高。
從地塊尺度分類(lèi)結果圖可以看出,該方法對商務(wù)辦公、商業(yè)商務(wù)混合、商業(yè)識別度最高,對游憩—公園、居住主導、商住混合—居住為主等功能的地塊也有較好的識別度,而混合—居住主導及其他兩類(lèi)混合類(lèi)則無(wú)法準確判斷,實(shí)際上這3類(lèi)在五環(huán)內的地塊中所占比例非常小,可以說(shuō),總體上基于地塊尺度的地塊分類(lèi)方法具有較高的精度。
地塊尺度分類(lèi)結果
除對典型的功能區有較高的識別度之外,該分類(lèi)對非典型功能區中精細地塊也能有較好的識別。以?shī)W林匹克森林公園所在區域為例,這塊區域包括了居住、商業(yè)、辦公、游憩公園等多種類(lèi)型。
地塊1經(jīng)過(guò)機器學(xué)習識別出的結果是游憩公園類(lèi)型,所表現的曲線(xiàn)特征為周末人多、平時(shí)人少、高峰在下午14—17點(diǎn),與人們游憩娛樂(lè )的行為習慣一致,進(jìn)一步對比百度地圖的結果,發(fā)現該地塊為奧林匹克森林公園南園所在地,為綠地類(lèi)型用地。
地塊2經(jīng)過(guò)機器學(xué)習識別出的結果是商務(wù)主導用地,曲線(xiàn)特征為明顯的周末幾乎無(wú)人、平時(shí)人多、10—18點(diǎn)長(cháng)高峰的特征,與人們工作的行為習慣一致,而在百度地圖中顯示該地塊為京東總部未搬遷之前的辦公所在地,為商務(wù)辦公用地類(lèi)型。
地塊3識別的結果是商業(yè)主導的用地類(lèi)型,曲線(xiàn)表現為周末、平時(shí)略突出的雙高峰特征,由于該購物中心為片區級購物中心,主要服務(wù)周邊居住、辦公的人群,因此商業(yè)特征相較商業(yè)中心不太明顯,但仍表現為商業(yè)主導的特征,而百度地圖上顯示該地塊為漂亮陽(yáng)光廣場(chǎng),為商業(yè)服務(wù)業(yè)用地類(lèi)型。曲線(xiàn)以及地圖實(shí)景均驗證了本部分所用分類(lèi)方法在精細地塊尺度上具有較高的識別度。
奧林匹克森林公園區域地塊識別功能、對應曲線(xiàn)、實(shí)際功能
編輯:lianqi