美國人使用的地圖服務(wù)非常精良。在網(wǎng)上鍵入“漢堡王”幾個字,谷歌就可以提供附近十幾個漢堡王餐廳的信息,每一個都有精確的經(jīng)度和緯度數(shù)據(jù)。
但在世界上很多其他地方,并沒有這樣的地圖可用。雖然這些國家可能開展了普查工作,但可能只有縣一級或者省一級的數(shù)據(jù)可用,不會詳細到街道。
就拿人口數(shù)據(jù)來舉例吧,現(xiàn)在全世界有74億人口。他們生活在人口密集的城市中心,或者居住在農(nóng)場分隔的小城鎮(zhèn)中,或者住在叢林邊緣。但是其中有很多人口,沒人知道他們究竟住在哪里。
現(xiàn)在,F(xiàn)acebook表示,它已經(jīng)20億人制作出了不錯的人口地圖,效果超過以往任何的項目。該公司的連接實驗室(Connectivity Labs) 本周宣布,它制作了20個國家(其中大部分是發(fā)展中國家)的高分辨率人口分布圖。但是要到今年晚些時候,它才會發(fā)布這些地圖中的絕大部分。不過,如果這些地圖真的準確,它們就會是大多數(shù)國家有史以來質(zhì)量最好的人口地圖。
這些地圖值得注意的另一個原因是:如果它們很準確,就會宣告一個新的人工智能輔助時代的到來。
人口地圖的重要性
在富裕國家,可靠的人口信息被視為是理所當(dāng)然的事情。
人口分布圖在不同領(lǐng)域有幾十種應(yīng)用。城市規(guī)劃者需要用它來估計城市密度,以便規(guī)劃和改善道路狀況。流行病學(xué)和公共衛(wèi)生工作者使用它來跟蹤疫情或分析人們獲得衛(wèi)生醫(yī)療服務(wù)的狀況。如果有災(zāi)難發(fā)生,人口地圖都可以用來確定應(yīng)該優(yōu)先考慮為哪些地方提供緊急援助。
Facebook對這種數(shù)據(jù)的興趣存在利潤上的原因。全球大約有40億人還沒有使用Facebook,這事關(guān)該公司的未來發(fā)展前景,所以它對地圖的興趣,有基礎(chǔ)設(shè)施方面的原因。該公司想知道,對于這些地方的人,用哪種方法上網(wǎng)最好:使用光纖,還是無人機、衛(wèi)星或高空氣球?
這就是Facebook為什么會選擇這些國家的部分原因:在這些國家的一些農(nóng)村地區(qū),人們?nèi)匀粺o法上網(wǎng)。一共有20個國家,包括尼日利亞、肯尼亞、烏干達、土耳其、烏克蘭、烏茲別克斯坦和印度。隨便說一句,F(xiàn)acebook的Free Basics 產(chǎn)品剛剛在印度被潑了一瓢涼水。Free Basics和連接實驗室都隸屬于Internet.org,這個組織的目標(biāo)是擴大網(wǎng)絡(luò)以及Facebook服務(wù)的覆蓋范圍。
Facebook的方法很簡單?
但是,在所有這20個國家,F(xiàn)acebook是怎么做出更好的人口地圖,超越了當(dāng)?shù)卣降哪??他們又沒有像谷歌街景車那樣到處轉(zhuǎn)悠。答案就在于Facebook擁有極為可觀的計算能力。
這些地圖其實是這么制作的:首先,F(xiàn)acebook的連接實驗室要拿到當(dāng)前最優(yōu)質(zhì)的世界人口信息,這是哥倫比亞大學(xué)(Columbia University)提供的一個數(shù)據(jù)集,被稱為“全球人口網(wǎng)格”(Gridded Population of the World)。它綜合了各地的人口普查數(shù)據(jù),調(diào)整到相同的年份。雖然它是全世界目前最優(yōu)質(zhì)的人口地圖,但它的分辨率不怎么高: Facebook表示,一個網(wǎng)格可以代表城市地區(qū)的幾平方公里,也可以代表農(nóng)村地區(qū)的幾萬平方公里。
然后,F(xiàn)acebook又從DigitalGlobe公司購買了大量的高分辨率衛(wèi)星圖像。目前太空中大部分私人的高分辨率地球觀測衛(wèi)星都是由這家公司經(jīng)營的。當(dāng)你在谷歌地圖上看自己的房子時,你通常是(但并不總是)通過DigitalGlobe公司的四個軌道鏡頭之一看到的。
DigitalGlobe公司的圖像大多數(shù)屬于“小度量的”,也就是說,網(wǎng)格的一條邊不是數(shù)百公里,而是50厘米。 Facebook的開發(fā)人員訓(xùn)練該公司的神經(jīng)網(wǎng)絡(luò)算法,讓它識別在這些數(shù)據(jù)中,一棟建筑物從上面看起來是什么樣子。然后開始進行識別。該軟件根據(jù)它能看到的建筑物數(shù)量來估計城市人口密度,并且進行推算,把當(dāng)前最佳人口數(shù)據(jù)分配到居住區(qū)中。
“他們設(shè)定了一個相當(dāng)基本的假設(shè):如果看見到一棟建筑物,必定就有人在那里,”哥倫比亞大學(xué)地球科學(xué)家說羅伯特·陳說。他是Facebook所使用的基礎(chǔ)數(shù)據(jù)集“全球人口網(wǎng)格”團隊的主管。
你可能覺得這種方式聽上去很簡單,其實它本來就這么簡單。它僅僅需要訪問神經(jīng)學(xué)習(xí)軟件,需要耗用大量計算能力。 Facebook估計它分析了20個國家的2160萬平方公里土地,“為此,我們用神經(jīng)網(wǎng)絡(luò)處理了146億張圖像;這是Facebook每天分析的所有圖像數(shù)量的十倍多”。
羅伯特·陳警告說,F(xiàn)acebook的數(shù)據(jù)不能被用來計算和當(dāng)?shù)鼐用裼嘘P(guān)的城市密度。但是,“你可以想見,在其他很多情況下,這些數(shù)據(jù)有多么寶貴,”他說。
Facebook還沒有發(fā)布這些地圖的最終版本。它說,最終版本將在今年夏天發(fā)布。在發(fā)布之前,羅伯特·陳的團隊將對它的準確性進行判定。雖然Facebook的早期結(jié)果令人鼓舞,他羅伯特·陳說,他仍然不知道這項技術(shù)會有多么精確,也不知道適用性是否廣泛。 “我們只看到了它的部分狀況,”他說,但是,如果該技術(shù)的效果令人滿意,F(xiàn)acebook的這個項目就會新增另外6個國家。
一個重大勝利?
如果事實證明這些數(shù)據(jù)很有用,那么連接實驗室的成功就會標(biāo)志著一個重大勝利的到來,因為長期以來,開發(fā)人員在使用衛(wèi)星數(shù)據(jù)時一直面臨著一個阻礙:用算法解釋圖像。
在未來的五年里,硅谷投資的衛(wèi)星公司將向公眾發(fā)布大量影像,遠遠超過以前的水平。這些影像的成本會比以往任何時候都更加便宜,而且也更加“新鮮”:由于衛(wèi)星制造上的進步,以及火箭成本的下降,一些公司承諾提供每周六、七次的重訪問率(revisit rates)。
如果公司——尤其是金融公司——學(xué)不會如何用機器破譯這種新的數(shù)據(jù),它們就不會有什么價值。公司必須懂得如何從影像中抽取信息,而不需要人員坐在桌子旁埋頭苦干,目前,像Skybox(屬于Alphabet集團)和笛卡爾實驗室(Descartes Labs)這樣的初創(chuàng)公司表示,他們已經(jīng)在這方面取得了一些進步。如果Facebook制作的地圖真的成功了,那么這個目標(biāo)的可行性就會獲得進一步的證實。(Kathy)