方飛:AI 可以向善,博弈論+機器學習可以用于防止犯罪

2021年02月04日 14:43 來源:AI科技評論 作者:陳彩嫻
圖片

導語:去年 9 月,「外賣騎手,困在系統里」一文,使 AI 算法成為被大多數人詬病的反人性工具。但事實上,如今有許多 AI 研究可以用于解決社會問題。AI 向善還是向惡,本質上是取決于模型設計者的價值觀。

作者 | 陳彩嫻

許多人對象牙被殘忍盜獵的第一印象,也許是來自 2018 年由騰訊打造的國內首檔明星紀錄片《奇遇人生》。

在節目上映的第一期中,知名影星小 S 與阿雅到非洲贊比亞探望一家大象孤兒院。在這家孤兒院中的所有大象都有一個共同點:即它們的母親都被想要販賣象牙的盜獵者殘忍殺害。

其中,一只名為 Chamilando 的大象因為目睹母親被殺害,每天晚上睡覺都會尖叫,做噩夢?!昂茈y想象,有些人奪取象牙,只是為了想要一點首飾?!?/p>

而在短短幾天的拍攝中,節目便在一個國家公園邊界親眼目睹了大象被獵殺的情景:由于有三分之一的象牙長在頭部,盜獵者將大象的鼻子從頭部連根割掉,取走完整的象牙,隨之將象鼻拋在一邊,讓無辜的大象尸首無存,暴露在炎炎烈日下,由禿鷲任意蠶食。

根據大象孤兒院管理員 Rachael 的介紹,在非洲,每天大約有100只大象因為象牙盜獵而喪命。

除了大象,對老虎、雪豹、羚羊、犀牛、穿山甲等等野生動物的捕殺也仍在繼續。比如,根據 WWF 的統計,100年前,世界上大約有 60,000 只老虎,而今天只剩下 3,200 只。

針對嚴重的盜獵現象,我們可以做什么?想必關注該現象的讀者有時會感到無能為力。而更為大眾鮮聞的是:人工智能技術居然可以用于輔助巡邏,對付兇殘的盜獵者,從而保護野生動物。

來自卡內基梅隆大學計算機科學系的助理教授方飛是一名堅定的“AI向善”踐行者。自 2015 年起,她便結合博弈論與機器學習開發了 PAWS (Protection Assistant for Wildlife Security,“野生動物安全的保護助手”) 系統,幫助動物保護區制定隨機巡邏路線,提高搜捕盜獵痕跡銷量,從而大幅降低了盜獵比率。

除了反盜獵,方飛在將博弈論與機器學習相結合的研究過程中,還將基礎模型進行優化,應用于保護渡輪線路、保護樹林、減少食品浪費、降低高利貸危害、幫助流浪少年等等。近年,她還基于“博弈論+機器學習”進行多智能體互動研究,用于優化共享乘車平臺的出行效率。方飛始終堅信:“AI 是可以用于解決我們當前所面臨的許多社會問題的?!?nbsp;

1

南加州大學讀博:初入博弈論

在清華就讀本科期間,方飛開始接觸 AI 研究,但研究方向并非博弈論。

方飛在上海周邊長大,從初一開始學習 Pascal 語言,并對計算機產生了濃厚的興趣。2007年,方飛考入清華大學電子工程系攻讀本科。在清華學習期間,她很快認識到,自己更喜歡軟件應用,而不是硬件研究,于是開始從事計算機視覺相關的研究工作。在申請讀博時,她也投遞了許多計算機視覺方向的博士項目。

一次偶然的機會,她通過清華電子系的學姐楊蓉和學長王言治(現任東北大學教授)了解到南加州大學 Milind Tambe 教授團隊所進行的安全博弈研究工作。此前,方飛一直以為博弈論是偏理論的,距離她“所學即所用”的期望較遠,而 Milind Tambe 團隊的工作直接被應用于保護洛杉磯國際機場、防范飛機上的暴力行為等,令她看到了博弈論的應用潛力與影響力,覺得很有趣,于是便主動聯系了 Milind Tambe,毛遂自薦,并順利拿到讀博的 offer。

2011年,方飛赴南加州大學(USC)攻讀博士,師從 Milind Tambe。當時,Milind Tamber 在南加州大學工程系擔任 Helen N. 教授 與 Emmett H. Jones 教授,社會人工智能中心主任,是安全博弈領域的權威專家(現在哈佛大學擔任教授)。

自此,她開始應用博弈論來解決當下社會所面臨的三大挑戰:安全性、可持續性與流動性。

2012年,方飛在 AAAI 上發表了第一篇文章,將博弈論用于防止森林過度砍伐。2013年,方飛發表的工作被美國海關應用于保護紐約市的斯塔滕島渡輪線路(該渡輪每天搭乘超過6萬名乘客)。

2014年,方飛開始在博弈論中引入機器學習,開發了 PAWS 系統,用于幫助野生動物保護區制定隨機巡邏路線,尋找盜獵陷阱,對付盜獵分子。目前,PAWS 系統已在非洲、東南亞多個國家與中國等應用。

讀博期間,方飛發表了 12 篇論文,將博弈論與機器學習廣泛應用于解決社會問題,獲得了 IJCAI 2015 杰出論文獎,IAAI 2016 創新應用獎(PAWS),南加州大學最佳博士論文獎。

圖注:PAWS 的大致工作流程

從USC畢業后,2016年6月,方飛到哈佛大學計算與社會研究中心(CRCS)擔任博士后研究員,又開始從事多智能體的研究應用(如共享汽車平臺派單優化)。

在踐行“AI向善”的過程中,方飛感受到:當下的許多社會挑戰可以應用 AI 來解決,比如貧窮、食品安全、流浪者群體等。

比如,在發展中國家,農民想要銷售農作物,但難以接觸到大型的高度自動運轉的貿易平臺,于是他們一般是在當地市場銷售農產品。有時候,他們的定價特別低,因為整個村莊都在銷售同樣的產品。

針對這個問題,加拿大的研究人員(由Kevin Leyton-Brown教授領導)幫助開發了一個基于文本(text-based)的貿易平臺,你可以給平臺發消息,告知平臺你想以怎樣的價格銷售哪一種農產品,平臺會自動匹配買家與賣家。

在幫助流浪人群方面,Milind Tambe 所領導的USC研究小組通過設計算法來改進社會幫助流浪者的的效率,提高年輕的流浪者群體防范 HIV 的意識。

據方飛介紹,博導 Milind Tambe 是令她非常敬佩的一位老師。從他身上,方飛認識到,AI 研究(如博弈論)真的能夠用于解決社會問題,“AI 向善”是可行的:

“首先,他是真的關心實際問題。他會非常積極地與不同政府組織和非政府組織的人進行交流,向他們介紹我們團隊的研究,AI 研究可能以怎樣的方式幫助他們,或者詢問他們在工作當中遇到哪些困難需要解決,看看有哪些方面可以合作。他的積極態度深深地影響了我。

另一方面,他經常跟我們說,安全博弈的研究要從實際問題中出發。他非常鼓勵我們從事有實際應用場景的研究?!?/p>

除了學術研究,導師 Milind Tambe 也非常關心學生的就業發展。比如,他會經常催促學生去主動參加和組織各種各樣的研討會與學術論壇。當時,方飛并不能理解導師的用意:“我覺得我只要做好我的研究就行了,為什么要去攬這些亂七八糟的事?!?/p>

“但是后來,我慢慢意識到這是非常重要的。通過這樣的方式,你可以接觸到更多圈內人,你是為你的整個研究領域提供服務,幫助該領域的成長,而且你也從中鍛煉了自己各方面的能力?!?/p>

2

CMU:博弈論+機器學習

2017年8月,方飛入職卡內基梅隆大學計算機科學系軟件研究所(Institute for Software Research)擔任助理教授。

據統計,當前卡內基梅隆大學的計算機科學系中共有 29 位華人教職員工(含兼職),ISR 占 2 名(ISR 共有 44 名核心教職人員),方飛便是其中之一。

在擔任教職的這幾年,方飛團隊的工作攬獲多項 AI 頂會大獎,包括 AAMAS 2019最佳應用系統演示獎、IJCAI-ECAI-18 杰出論文獎。

方飛的主要研究方向是將博弈論與機器學習相結合。

最早,人們對博弈論的討論僅僅局限于在玩游戲時如何制定最佳策略。玩游戲時不能按固定的套路出牌,而是要將招數盡可能隨機化。比如,如果你正在玩“剪刀、石頭、布”的游戲,最好的玩法是隨機出剪刀、石頭、布。

如今,博弈論(Game Theory)研究開始針對實際問題的策略行為進行建模(如政策經濟學),如何計算或規定人們或智能體最終會使用的策略。雖然博弈論的起源很簡單,但目前已發展為在不同領域將策略行為建模為一個博弈的研究方向。

“只要一個情景包含多個利己主義的智能體,且這些智能體彼此之間有策略的交互,那么我們就可以使用博弈論對這個場景進行建模?!狈斤w介紹道。

入職 CMU 后,方飛繼續將“博弈論+機器學習”的研究應用于解決社會問題。

她所參與的論文“Computational Sustainability: Computing for a Better World and a Sustainable Future”曾登上 CACM 2019年9月的封面;她所參與撰寫的書籍 《Artificial Intelligence and Conservation》(《AI與野生動物保護》)被列入“AI向善”叢書系列。

許多野生動物保護區都面臨保護大象、老虎、犀牛等珍稀動物的任務,但資源有限,只能雇傭少數執法人員在保護區進行巡邏。如果有偷獵者,這些執法人員的生命安全很可能會受到傷害。

“你可以想象,如果執法人員(智能體)按照固定的方法巡邏,比如周一早上的巡邏路線固定,那就很容易被偷獵者(攻擊者)發現。因此,我們必須幫助他們將巡邏方法隨機化?!?/p>

在 PAWS 的項目中,方飛與團隊對執法人員與偷獵者的行為進行建模,應用博弈論幫助制定執法人員的最優巡邏路線。但這些模型并不能有效幫助巡邏人員執行任務。

方飛解釋,博弈論模型通常是假設人是完全理性的,并會選擇能夠取得最高效用的行為。但我們都知道,人不可能是完全理性的。因此,方飛與團隊需要從他們所收集的數據中對人類“玩家”進行實際學習。

這時,機器學習就派上了用場。

方飛的團隊使用他們的合作者從多個野生動物保護機構(如世界野生動物聯合會和野生動物保護協會)收集的巡邏與偷獵活動數據來建立有助于預測未來情況的行為模型。然后,他們在這些數據中應用博弈論創建最佳巡邏策略。

隨著巡邏人員遵循隨機路線、并向研究人員提供有關偷獵證據的反饋,越來越多數據進入模型,該模型將開始學習偷獵者的行為,并開發出最佳的隨機巡邏路線來阻止他們偷獵。

方飛希望,通過結合機器學習技術與博弈論,可以幫助改變野生動物的保護現狀。

在偷獵路徑上阻止偷獵者,只是方飛使用博弈論與機器學習來促進社會良好發展的應用之一。她的研究還用于幫助制定美國海關守衛的隨機巡邏路線,保護斯塔滕島渡輪免受攻擊,從衛星圖像中檢測非法挖礦地點,保護漁業等。

圖注:2019年12月,方飛在清華大學交叉信息院作學術報告

除了課題研究,方飛還在 CMU 開設了一門面向本科生與研究生的課程,名為《Artificial Intelligence Methods for Social Good》(為社會造福的 AI 方法),向課上的學生傳授機器學習、博弈論和機制設計、順序決策、計劃與優化等基礎知識。

此外,該門課還著重向學生介紹了醫療體系、社會福利、安全和隱私,以及環境可持續性等領域所面臨的挑戰,以及 AI 技術可以如何應用于解決這些挑戰。 

方飛提到:“有很多人雖然掌握了一定的 AI 技術,但沒有用這些技術來應對當今世界面臨的真正挑戰。我希望通過本課程,學生可以掌握能夠廣泛應用于為社會造福的 AI 方法?!?/p>

因其在“AI 向善”上的深入研究,方飛入選 2020年 IEEE System 所評選出的“AI 十大潛力人物”。

此外,在 Iridescent 于 2019 年 所評選出“AI領域最值得關注的5位女性”(“5 Women You Should Know Working in AI”),方飛是唯一入選的華人學者。

其余入選者均是 AI 領域的知名研究員,包括 CMU機器學習系主任兼計算機科學系教授 Manuela Veloso,密歇根大學計算機科學系教授Rada Mihalcea,CMU語言技術研究所教授Carolyn Rosé 以及 斯坦福大學計算機科學與電子工程系助理教授Chelsea Finn。

 3

研究探討 Q& A

1、您是如何想到結合博弈論與機器學習來解決社會問題?

讀博期間,我們組在做安全博弈的研究,研究如何保護機場、保護碼頭等建筑物。在與動物保護組織、世界銀行等機構的工作人員與其他研究學者介紹工作時,他們談到,我們所做的工作本質上是設計一種隨機化的巡邏或安保方案,以此來提高對目標物的保護程度。那么,這些研究也可以用于設計巡邏路線,保護動物,防止盜獵;或設計護林人員的巡邏路線,防止過度砍伐。

因此,我們便進一步了解這方面的工作,與一些動物保護組織取得聯系,聯系后,發現他們的確是有派出巡邏人員在保護區里面進行巡邏,以此來阻止盜獵行動。但是,跟很多安全問題一樣,他們沒有那么多巡邏人員,人手很緊張,他們需要更好地規劃人手的布局和巡邏方案。

跟以前研究的那些安全問題不同的是,在反盜獵的研究課題上,動物保護區的數據記錄和保存做得比較好,有的保護區能提供十幾年的巡邏觀察數據,如每一天所采取的巡邏路線,巡邏時在哪個地點發現了什么。

圖注:從現實數據對偷獵行為進行建模

在研究數據的過程中,我們意識到,單純用博弈論的模型去研究是不現實的,因為基礎的博弈論模型都有一個假設,就是:人是理性的,會采取能夠將他們的預期收益最大化的行動。而在反盜獵的問題中,盜獵者并不會進行精確的計算,如在某個特定地點布下陷阱、設下獵套,預期收益最大,便在某個地點設陷阱。

因此,我們需要先通過數據學習盜獵者的行為模型,基于這個行為模型,為巡邏人員設計巡邏路線,使巡邏的效率最大化。

2、在現在的研究中,您主要用到的博弈論基礎模型有哪些?

最基礎的模型還是斯塔克伯格安全博弈(Stackelberg Security Game, 簡稱SSG) 模型,然后基于這個模型增加新的內容。

就拿反盜獵來說。盜獵者的行為并不是完全理性的,我們要針對他們的行為進行建模,然后與SSG模型相結合。

原先的模型中,主要有兩個玩家在博弈,一個玩家是領導者,或者保護者(需要規劃防御資源的防御者,或巡邏人員,有需要保護的目標;另外一個玩家是跟隨者,通常也被稱為攻擊者(比如在反盜獵問題中的盜獵者),能夠了解保護者的策略后再決定去攻擊哪些目標。

攻擊者對每個目標的攻擊重要程度可能不一樣,每個目標對攻擊者的重要程度也不一定一樣,玩家最后的收益是根據攻擊者攻擊了哪個目標,且成功與否。如果成功,玩家可以得到一個比較好的收益;如果失敗,則得到一個非常差的收益。

在這個基礎模型中,有一些假設,比如攻擊者會找到他們來說收益期望最大的目標進行攻擊,而保護者需要了解攻擊者的行為后,去思考如何分配安保資源,使保護者的預期收益最大。

此外,還有一些比較特殊或更簡單的模型,就是當這個模型是一個完全零和游戲時,即使有保護者和攻擊者的區分,它的斯塔克伯格均衡、納什均衡和最大最小策略(maximin strategy)應該是一致的。在這種情況下,我就要在假設兩邊都是完全理性的情況下,找到保護者的最佳策略,即極小極大(minimax)策略。

3、機器學習與博弈論能夠在哪些層面進行很好的結合?

1)當人作為行為主體時,Ta 可能不是完全理性的。那么,我們就需要用機器學習去學 Ta 的行為模型,然后把這個行為模型嵌入到博弈論的模型當中。

2)在很多問題中,玩家之間的互動是非常復雜的。比如反盜獵的例子。在實際中,巡護員要走一條完整的巡護路線,期間會遇到很多實際情況,比如看到某處有個腳印,這個腳印不是護林員的,而有可能是盜獵者的。那么,他們會考慮要不要追著腳印走。有時候他們在樹上看到一些標記,如文字、箭頭,也會想是不是要跟著箭頭去追盜獵者。甚至有的時候,他聽到一些聲音,也會想要不要改變巡邏路線。

在這樣的情況下,他并不是在巡邏之前定好一條路線,然后期間遇到什么事都不管,就順著路線走就行。他是根據他所觀察到的情況進行應變,相當于連續性做決策。這跟強化學習的場景很像,也是連續性做決策。但是,它跟最基礎的強化學習不一樣的地方在于,我們會遇到能適應巡邏策略的對手。比如巡邏人員可能看到腳印就會去追著腳印跑,但如果他每次都這么做的話,盜獵者就會掌握巡護員的行為,依此采取措施。比如,盜獵者每次走路的時候,就故意往多個方向踩出一個腳印來迷惑護林員,或者想辦法把腳印全部都抹掉。這就變成了一個雙方在進行博弈的過程。

在這樣的問題中,如果我們建一個博弈論的模型,游戲就會非常復雜,有很多個采取行動的時間點,玩家在每個時間點都有很多可能采取的動作。這時候,我們就可以考慮使用強化學習中多智能體的方法來幫助找到比較接近平衡的值。

從這個角度看,未來很多場景可能都是如此,比如智能車也是多智能體,它們在某種意義上也是一個在不斷進行決策的過程,同時彼此之間又在博弈。如果將這類問題作為一個游戲,用傳統博弈論里的解法是非常困難的,因為在傳統的博弈論中,大家會用各種各樣的數學規劃進行求解,如線性規劃,整數規劃等等。這些方法在大型的博弈中無法解答。這時候,用強化學習的方法至少能夠幫助找到這些復雜問題的較好策略。

在我們之前的研究中,實際生活中遇到的博弈問題往往有一個難點,即我們不了解每個玩家的收益函數和訓練方式。如果我們知道這些行為體/玩家之前的互動,互動中所采取的行動數據,我們就可以通過他們以前的行動來推導,相當于“逆向工程”,找出他們的訓練方式。

近年來,我們也在討論如何通過機器學習的方法來求解支付函數(payoff function)。1月初,我和哈佛大學的 Andrew Parrot、UIUC的李博老師在IJCAI一起給了一個學術教程,關于機器學習和博弈論(Machine learning and game theory),他們也做了很多博弈論和強化學習相結合的工作,比如李博老師團隊的對抗機器學習,他們會思考如果把從數據中學習機器學習模型的問題當成一個斯塔克伯格博弈,保護者在設計模型及參數,攻擊者想要讓這個模型無法輸出正確的結果,那么如何求解。這也是另外一個可能的結合方式。

4、在所解決的社會問題中,您認為最有代表性的是哪一項工作?

我覺得這些研究在本質上都是我們設計的這些算法的應用,這些問題有一些共性:即多個智能體的策略行為。比如,保護野生動物不被偷獵在某種程度上與保護渡輪線路不受攻擊有些相似:都有一個保護者和一個攻擊者,然后我們是幫助保護者找到他們和攻擊者的博弈中最好的策略。這都在博弈論的框架里。

除了保護者和攻擊者的安全博弈,我現在比較感興趣的還有平臺和用戶的多智能體問題,如共享汽車平臺。類似滴滴這樣的平臺是博弈中的領導者,是制定策略的一方,司機的接單數量與對應的獎勵,如何派單,等等,都是策略的一部分。平臺上的用戶則相當于跟隨者,當平臺制定好策略后,用戶在這些平臺上采取自己的行動。

但與安全博弈類問題不同的是,在共享汽車平臺上,跟隨者不止一個。除了平臺,所有接單司機都有在進行互動和做決策。

最近兩年,我們有在和匹茲堡的一個食物拯救平臺 412 Food Rescue 合作做一些研究。

圖注:412 Food Rescue官網首頁

有些飯店和超市會有不適合售賣但是還沒有過期的食物需要趕快處理,不然食物會浪費,他們就會去聯系這個平臺,讓平臺幫忙及時將這些食物送給需要食物的群體,比如低保家庭等。這個平臺要對接餐館、超市、需要食物的人和幫忙送食物的志愿者等。這個平臺本質上是一個領導者,它制定了一系列的手機消息推送策略來聯系志愿者。

然后,平臺上的志愿者是跟隨者,會基于收到的推送和他們自己的喜好來決定是否幫忙送食物。我們幫助這個平臺預測志愿者的行動,并且設計推送通知的方案。

5、除了從保護區提供的數據,您還會通過哪些途徑去獲取您所需要的數據?

首先我們是需要當地保護區的巡護團隊所記錄的以往數據,否則很難去做預測。

然后,我們還需要很多地理數據,比如保護區里面的海拔變化,河流的位置,山脊線的位置,附近的村莊,附近的道路,甚至是附近的農田,哪一塊樹林是什么樣的樹林,等等。

我們現在獲取這一類數據的方式有兩種:1)和保護區合作,由保護區的工作人員提供保護區附近的地理信息;2)去網上找可能公開的信息,比如很多公開的數據集、衛星圖片上有海拔信息,或者我們半自動地去標定河流與道路,通過這樣的方式額外得到一些地理信息相關的數據。

根據這些數據,我們可以使用機器學習技術來預測偷獵者可能在哪里設置陷阱。但這還不夠,因為偷獵者會根據巡邏策略的變化來改變行動。如果巡邏者總是去偷獵者常去的地點巡邏,那么偷獵者很大概率會變換他們的地點。這時博弈論就派上了用場:研究人員需要考慮巡邏人員與偷獵者如何相互影響對方的行為,最終策劃出最優的巡邏策略。

6、您的主頁上有提到您在研究中進行實地考察,談談實地考察的意義。

一開始,在對這個領域不熟悉的情況下,我們首先是用一個簡單的理論模型,比如我們當時設計路線,把整個區域劃分成 1km * 1km 的格子,讓巡邏人員從格子 A 走到格子 B。后來保護區向我們反饋,說我們規劃的路線沒法走,因為從格子 A 到格子 B 之間隔了一座大山,根本走不過去。因此,他們就邀請我們去當地巡邏,感受一下實際的情況。

我們去了當地之后,發現地形的確是一個非常重要的因素,中間有很多我們忽略的實際問題。我們一開始所提出的很整潔的博弈模型沒有考慮到這些實際因素。所以我們在實地考察后,針對應用場景做了一系列的改變,創立了能夠更好處理實際地貌信息與生成符合地貌的巡邏路線的算法,使得最后設計的巡邏路線能夠起作用。

我本人是在2015年去了馬來西亞的熱帶雨林保護區,2017年去了中國東北的黃泥河保護區。我們論文的其他合作者還去了其他的一些保護區進行考察。

圖注:2015年7月在Rimba Panthera的邀請下到馬來西亞實地考察,地貌復雜

7、PAWS 這個項目您從讀博開始就已進行研究,現在還有在繼續嗎?

在保護野生動物這一塊,我們不僅僅是設計巡邏路線,因為你可以想象,整個鏈條上有各個環節,每個環節都有很多值得去做的問題。我在博士畢業以后,繼續沿著這個方向做了很多方面的嘗試。

盜獵者為什么要盜獵?原因可能是因為這件事有利可圖,即使被抓住了,可能受到的懲罰也不是很大。然后我們就考慮,如何設計一個合理的獎懲機制,能最大化地減少盜獵者想要盜獵的意圖,以及最后成果的可能性。

后來,我們又探索了如何發動當地群眾一起來幫助解決盜獵問題。有些地區的群眾會向護林員匯報一些線索,比如他們看到或聽說盜獵者可能會在哪些地方進行盜獵,那么作為護林員,得到了這些線索后,我們要如何去利用這些線索?如果這些線索是假的,又怎么辦?

所以,我們從研究者的角度,基于一個實際的問題,提煉了一個新的博弈模型:保護者-攻擊者-信息提供者的三方博弈模型,然后探討在這個模型里,均衡策略或最佳策略會是什么樣的。

8、目前 PAWS 取得了哪些具體成果?

我們現在得到的數據是:在每個區域,他們用我們的算法進行輔助巡邏期間,他們找到了多少盜獵的線索。我們的論文里面也提到,在我們進行實驗的這些區域里面,找到的獵套數量遠遠高于使用優化巡邏路線之前的獵套數量。

我們現在能夠分析的都是相對微觀的結果,比如在這個區域里面,我們在同樣的時間內,跟往年相比,通過我們設計的巡邏方案,找到了多少獵套?結果是比同時期的多很多。

9、在反盜獵這一塊,您希望您的研究最終取得怎樣的成果?

對于反盜獵這一塊,之前WWF也提出了一個目標,就是零偷獵。他們也提到,為了實現零盜獵的目標,有6個方面的工作需要去做,其中一個方面是如何能夠通過巡回的方式來減少盜獵,還有另一個方面是發動群眾,比如我剛才所說的由群眾來報告關于盜獵的線索。我是希望能夠跟這些動物保護組織一起能夠在多個方面合作,為他們提供計算工具,以幫助他們更好地實現或接近 零盜獵的目標。

我們現在所開發的算法,有一部分已經被整合進更大的平臺里面,還有一些是正在整合中。我所知道的情況是 Microsoft Azure那邊的團隊已經基于 PAWS 開發了一個API,希望給各個動物保護區提供云服務,讓他們可以直接通過 Microsoft Azure的平臺,利用這些算法來幫助他們進行盜獵活動的預測,甚至是盜獵路線的設計。據我所知,API 的部分已經完成,但我還不知道他們現在是不是已經完全上線或是否已經被使用。

此外,有一個叫做 SMART 的軟件,是多個動物保護組織一起出錢出力支持的軟件。在全世界范圍內有600~800個保護區都在用這個軟件進行數據的記錄和整理,SMART 軟件也在把 PAWS的相關算法整合到軟件中。整合完成后,原本在用 SMART 軟件的600-800個保護區就可以直接使用 PAWS 的功能。

10、您在平時的研究當中會跟不同領域的學者合作嗎?

會。我們之前去學盜獵者的行為模型時,跟心理學的學者合作過;我們最近有一篇關于流浪青年的工作是跟社會學的老師合作的。我們之前還有一篇論文是關于民間高利貸的內容,是跟法學系的老師合作的。像反盜獵的這一塊的內容,我們因為要跟 動物保護組織 的人合作,他們中的一些人有 conservation biology (保護生物學)這方面的背景。

11、您覺得如何能夠發動更多的人參與到其中? 

我是非常希望我們的算法能夠被應用。我自己的感受是,首先你需要去跟相關的機構合作,主動去尋找他們,包括會議上遇到的,我們做演講時聽眾給我們的提示與靈感,我覺得可能有用的都會去聯系。

此外,我也會積極參加其他組織所舉辦的會議,比如最近準備去參加谷歌舉辦的“AI for social good”的研討會,希望能夠通過他們這個項目接觸更多NGO組織。

12、對于那些想要應用AI解決社會問題的學生,您會給出哪些科研建議呢?

這個要看他處在科研的哪個階段。如果是本科生階段的話,我會非常建議他們去跟他們感興趣的機構去接觸,去實地做一些工作,比如我自己在 412 Food Rescue 平臺上也做過志愿者。親身經歷后,你自己會有一些體會。此外,技術部分的基礎要打牢。

對于博士生,我建議感興趣的學生從一年級開始就可以去主動聯系這些機構。從建立信任,到建立一個穩定深入的合作關系,需要很長的時間。你要提出好的研究問題,并實際應用一些算法,收集實踐數據,然后進行分析,這個過程可能就需要好幾年。

13、您現在有招收學生的需求嗎?

我今年至少會招一個學生。我現在主要是想招一個比較熟悉多智能體與強化學習的學生,同時也熟悉博弈論。像我剛剛說的,我最近比較感興趣的課題是在平臺和用戶之間的多智能體系統里尋找好的溝通和協作策略。

參考鏈接:

1、https://iridescentlearning.org/2018/04/game-theory-and-machine-learning-an-interview-with-fei-fang/

2、https://www.siliconrepublic.com/machines/fei-fang-ai-cmu

3、http://www.andrew.cmu.edu/user/feif/Publications/2019_IJCAI_EarlyCareer_Slides.pdf

4、https://www.raconteur.net/technology/artificial-intelligence/ai-social-good/

5、https://www.cs.cmu.edu/news/faculty-profile-fang-finds-fulfillment-ai-social-good

6、https://www.hindustantimes.com/environment/reseachers-get-ai-help-to-map-ecosystem-wildlife-conservation/story-ySwKqr2rAC4bmkR9JQVdyM.html

7、https://iridescentlearning.org/2019/02/5-women-you-should-know-working-in-ai/

8、https://feifang.info/

轉載自公眾號:AI科技評論 作者:陳彩嫻 本文經授權發布,不代表51LA立場,如若轉載請聯系原作者

更多互聯網行業動態>>請關注微信公眾號“我要啦統計”(微信ID:Analysis_51la)