人工智能識別植物準確率高達80%
據《自然》雜志官網(wǎng)日前報道,一篇發(fā)表在最新一期《進(jìn)化生物學(xué)》雜志上的論文稱(chēng),用成千上萬(wàn)份標本圖像“訓練”過(guò)的計算機算法,已經(jīng)能自動(dòng)識別被壓制的、干燥植物標本的物種。這是科學(xué)家首次嘗試通過(guò)深度學(xué)習,讓計算機使用大型復雜數據集的神經(jīng)網(wǎng)絡(luò ),解決了識別自然物種分類(lèi)的困難任務(wù)。
世界各地的自然歷史博物館正在加速藏品數字化進(jìn)程,將標本圖像存儲在開(kāi)放數據庫中。比如美國國家科學(xué)基金會(huì )的iDigBio項目的一個(gè)數據庫,就擁有來(lái)自全美各地收集的超過(guò)1.5億張植物和動(dòng)物圖像。
目前,世界3.5億個(gè)物種中,只有一小部分被數字化了。但是,隨著(zhù)計算技術(shù)的進(jìn)步,哥斯達黎加理工學(xué)院計算機科學(xué)家艾瑞克·蒙塔羅和法國蒙彼利埃國際發(fā)展農業(yè)研究中心植物學(xué)家皮埃爾·邦尼特認為,為標本做大數據集已經(jīng)成為可能。他們的團隊已經(jīng)實(shí)現了植物識別的自動(dòng)化。
研究人員借助智能手機應用程序現場(chǎng)拍攝標本,積累了數以百萬(wàn)計的新鮮植物圖像,然后對1000多個(gè)物種、超過(guò)26萬(wàn)份植物標本進(jìn)行了掃描識別,采用先進(jìn)算法的識別準確率高達80%。
邦尼特說(shuō),這樣驚人的結果往往讓植物學(xué)家擔心其學(xué)術(shù)領(lǐng)域被輕視。“但人類(lèi)的專(zhuān)長(cháng)永遠不會(huì )被消除,識別結果仍需要植物學(xué)家來(lái)檢驗正確與否。”
人工智能識別標本的方法,極大地減少了植物學(xué)家收集和識別標本的時(shí)間,還能幫助改進(jìn)標本數據貧乏地區的植物鑒定水平,對生物多樣性豐富但植物標本較少的地區特別有用。
此外,這種方法還能讓研究人員對大數據進(jìn)行額外的分析。一般而言,植物標本樣本中含有豐富的數據信息,例如采集時(shí)間和地點(diǎn),采集時(shí)在開(kāi)花還是在結果,以及花群密集特征等。由于一些樣本是幾個(gè)世紀以前的數據,因此,可以幫助研究植物是如何適應氣候變化的。
美國賓夕法尼亞州立大學(xué)博士彼得·威爾夫說(shuō):“在自然歷史的進(jìn)程中,這種方法預示著(zhù)未來(lái)。”
編輯:dengzhuzhu