日前,由武漢大學與華為團隊聯(lián)合打造的全球首個遙感影像智能解譯專用深度學習框架“LuoJiaNET”和業(yè)界最大遙感影像樣本庫“LuoJiaSET”在華為昇思社區(qū)上線,向全世界用戶開源、開放,并接受公眾的性能測試、應用開發(fā)。
隨著遙感圖像被海量采集和生產(chǎn),正成為日常生活中必不可少的信息資源,也越來越依賴電腦對其進行分類、檢索、辨識等工作,而電腦完成這些工作需要解譯軟件。LuoJiaNET就是一款遙感影像智能解譯軟件,通過人工智能深度學習,讓電腦處理圖像越來越“聰明”。6月8日,記者在武漢大學信息學部遙感信息工程學院采訪該項目負責人胡翔云教授。他評價LuoJi-aNET:“我們突破了遙感影像解譯中幅面小、類型少、尺度有限、通道有限的局限,通過深度學習,不斷迭代,它會越來越準確,不斷逼近人類的水平。”
據(jù)悉,在中科院院士龔健雅教授的關心和指導下,LuoJiaNET是匯集了遙感學院、測繪遙感信息工程國家重點實驗室、計算機學院中青年學術骨干的武漢大學團隊和華為公司MindSpore框架團隊合作研發(fā)的,雙方共享知識產(chǎn)權(quán),聯(lián)合申請發(fā)明專利。胡翔云教授介紹,LuoJiaNET團隊約12人,平均年齡27歲,由張覓副研究員帶領與華為昇騰團隊合作,1年半來開發(fā)了822兆(約388萬行)代碼,終于搭建出LuoJiaNET系統(tǒng)。這個系統(tǒng)包含一套新的深度學習框架和遙感場景分類、目標檢測、地物分類、變化檢測、多視角三維重建等五大類基礎遙感應用模型。
如同電腦里的Windows、手機里的鴻蒙,LuoJiaNET也是一款基礎軟件。“好比一座房子,LuoJiaNET就是建房子的磚,任何人都可以在其基礎之上再開發(fā)各種應用軟件,拿著我們的磚去蓋不同的房子。”胡翔云表示,“比如現(xiàn)在熱門的自動駕駛,車載相機在行駛中要進行圖像辨識、解析,其模型也可以基于它來構(gòu)建。未來這些‘磚頭’搭建在手機上、衛(wèi)星上,都沒有問題。LuoJiaNET完全是我們自主研發(fā)的。它支持主流的CPU、GPU和Windows、Linux操作系統(tǒng),并對華為的昇騰NPU人工智能軟硬件做了優(yōu)化。遙感是一個戰(zhàn)略技術,LuoJiaNET可以實現(xiàn)我國遙感解譯領域的自主可控。”
在上線開源之前,LuoJiaNET在武大校內(nèi)進行了充分的測試,不僅在遙感應用上滿足各類型解譯任務,而且在一些關鍵指標上頗具優(yōu)勢。胡翔云舉例介紹說,圖像是由像素組成的,遙感解譯的一大任務就是要給每一個像素貼標簽,這個點到底是什么,是水是樹還是草地? 就是遙感分類,也是遙感解譯中的核心問題。目前通常做法是,將一張大圖裁成碎片,再一張一張解析合并成大圖。而LuoJiaNET從最開始的底層框架設計就走整體大圖片的邏輯路線,識別一個點,可以把周圍的很多信息關聯(lián)起來,既見森林,又見樹木,這樣辨析得更準確。“使用算子等價分解的分布式計算方式,對整張大幅遙感影像進行直接處理。”如同畫一幅《千里江山圖》,胸中有丘壑,筆下生風雷,“在解譯精度上有了明顯提高”,胡翔云頗為自豪。
在回答為什么要將軟件開源時,胡翔云分析說:“任何一個基礎軟件一定要人來用,在用的過程中逐步完善,目前的LuoJi-aNET還是一個雛形,我們希望有更多領域的人在它的基礎上搞應用開發(fā),越多越好。我們不僅將它放在了華為的公開社區(qū),也放在了海外網(wǎng)站上,歡迎所有人都來我們這里搬磚,做大朋友圈。”
LuoJiaNET的特長在于能夠深度學習,在學習中逐漸完善,就像一個人學習需要不斷刷題,而LuoJiaSET就是LuoJiaNET的“題庫”。“題庫越大,刷題越勤,考分就越高。”胡翔云解釋說,“LuoJiaSET解決了解譯軟件的數(shù)據(jù)源問題,遙感影像樣本庫庫容量夠大,覆蓋的種類夠多,才更能發(fā)揮軟件的優(yōu)勢。”相比較國外其他遙感影像樣本庫,LuoJiaSET具有500萬以上(國際上遙感圖像樣本的大小通常以512×512為一張)的樣本量。“預計今年可以升到1000萬張以上,翻一倍。就如同一個‘容器’,全世界的人都可以很方便地往里面添加數(shù)據(jù)、內(nèi)容。LuoJiaNET作為底層,LuoJiaSET作為樣本,所有人都可以在上面貢獻數(shù)據(jù)、模型、算法,這樣就可以形成一個生態(tài)。我們希望兩三年內(nèi)它們能變成我國遙感業(yè)界使用最廣泛的系統(tǒng),并推向全世界。”