過去一年,AI領(lǐng)域的作者數(shù)、具有重大影響的科學論文數(shù)、以及自稱的AI專家數(shù)均有了顯著提升。
摘要
一些有力的證據(jù)表明,AI頂級人才供不應(yīng)求。但是對于人才的稀缺度和集中度卻缺少精確的信息。為此,element.ai團隊連續(xù)第二年對全球AI人才的范圍和廣度進行調(diào)查。其研究主要依賴3個數(shù)據(jù)來源。1)AI領(lǐng)域21個領(lǐng)先的科學會議的出版物,分析其作者的概況。2)分析若干LinkedIn定向搜索的結(jié)果,看看有多少人自稱是博士并且具備相應(yīng)的必須技能的。3)外部報告及其他二手來源,幫助尋找相關(guān)背景,并更好地理解迅快變化的全球AI版圖中的人才情況。
報告發(fā)現(xiàn),2018年有22400人在一或多個機器學習的頂級會議上發(fā)表了論文,比2015年提升了36%,比去年也漲了19%。同行評審的出版物數(shù)量也比2015年提高了25%,比去年提高了16%。不過在這些會議上發(fā)表文章的研究人員當中,女性僅占18%,顯得名額不足。報告還發(fā)現(xiàn),全球的AI人才池是高度流動的,大概有1/3的研究人員的雇主所在國家與其獲得博士學位所在國家是不一樣的。報告的分析表明,在21種刊物上發(fā)表過作品的作者當中有18%(約4000人)對有著重大影響的研究(以過去2年被引用數(shù)為衡量)做出過貢獻。而擁有高影響力研究人員最多的國家依次是美國、中國、英國、澳大利亞以及加拿大。
對LinkedIn簡歷的輔助調(diào)查表明,有36524人符合自稱的AI專家資格,這比2018年的報告數(shù)字增加了66%。
此次調(diào)查的發(fā)現(xiàn)表明,無論是自我報告的AI專家數(shù)量,還是作者和在AI會議上發(fā)表的科學論文數(shù)量,均有了顯著的提升和拓展,這反映出該領(lǐng)域的活力和國際化。
介紹
對AI專家的需求空前高漲,自學習的算法預(yù)計可讓公司更好地駕馭發(fā)展性,獲取重要但此前不可見的信號,提供實時洞察,幫助員工更好地完成工作。
去年的第一次全球AI人才調(diào)查確認了一個AI業(yè)界的普遍假設(shè):即有人工智能經(jīng)驗的博士很難找。今年的調(diào)查將學術(shù)會議的樣本從3個提高到21個。同時還細分了性別、人才流動以及影響力指數(shù)情況。同時,報告還收集了LinkedIn上面的簡歷情況來評估自我報告的AI專家趨勢。最后,報告還將發(fā)現(xiàn)與外部報告和來源的數(shù)據(jù)進行關(guān)聯(lián)。
女性在AI會議出版物作者中的占比依舊不足
我們?nèi)ツ旮哆B線》合作分析了人才池的情況,試圖弄清楚女性在機器學習研究人員的占比。我們的評估認為目前這個領(lǐng)域的性別平衡問題依然非常嚴重:去年調(diào)查的3個領(lǐng)先的AI學術(shù)會議里面,我們發(fā)現(xiàn)只有12%的作者是女性。
今年的調(diào)查范圍擴大到了21個學術(shù)會議,結(jié)果發(fā)現(xiàn)雖占比有所提升,但這個群體的女性名額依然不足,比例為18%左右。根據(jù)我們的調(diào)查,AI存在的這種性別不平衡體現(xiàn)在了產(chǎn)業(yè)和學術(shù)兩方面:我們的數(shù)據(jù)表明學術(shù)界 19% 的會議作者為女性,而產(chǎn)業(yè)界的女性作者占比為16%。
考慮到機器學習潛在的廣泛社會影響,女性在AI開發(fā)和部署方面的參與度是個重要問題。Facebook AI研究實驗室負責人Joelle Pineau教授闡明了要增加本領(lǐng)域女性數(shù)量的理由:“相對于其他領(lǐng)域我們肩負著更多的科學責任,因為我們正在開發(fā)會影響很大一部分比例人口的技術(shù)?!監(jiān)penAI的CEO Sam Altman也提出了類似的觀點,稱機器學習在博士畢業(yè)生的性別方面是“目前我所知道的最扭曲的領(lǐng)域”,同時又是“對我們未來所生活的世界會產(chǎn)生最大影響的領(lǐng)域”。
據(jù)斯坦福大學發(fā)布的2018年AI指數(shù)報告,女性在學習AI和機器學習課程的大學生當中的占比也不足:學習斯坦福2017年的《AI導(dǎo)論》課程的 74%為男性學生,加州大學伯克利分校的比例則是73%。報讀《機器學習導(dǎo)論》的女性占比甚至更低,斯坦福大學這門課程男學生占到了 76%,而加州大學伯克利分校同樣課程的男學生占比更是高達79%。同一份報告還發(fā)現(xiàn),美國絕大部分AI職位的申請者都是男性(71%)。
此次調(diào)查的數(shù)據(jù)表明,不同國家/地區(qū)之間的性別差距各不相同。女性作者占比高于18%的平均水平的國家/地區(qū)包括西班牙(26%)、臺灣(23%)、新加坡(23%)、中國大陸(22%)、澳大利亞(22%)、美國(20%)、瑞士(19%)。在絕對數(shù)量上,美國的女性作者數(shù)量最多,其后是中國、英國、德國、加拿大、法國、澳大利亞、印度、意大利與新加坡。
培養(yǎng)出頂級AI專家的國家在雇用人才方面也領(lǐng)先
來自美國、中國、英國、德國、加拿大的作者占了72%
我們的會議研究人員數(shù)據(jù)讓我們得以觀察論文作者是在哪里接受培訓的。首先,在培養(yǎng)AI人才方面,美國繼續(xù)領(lǐng)先優(yōu)勢:在這份調(diào)查的會議作者樣本中,44%的作者的博士學位是在美國獲得的。而在中國受訓的作者占到了約11%,其后是英國(6%),德國(5%)以及加拿大、法國和日本(均為4%)。
雇用數(shù)據(jù)也顯示出了類似的地理分布特征。我們的調(diào)查表明,美國雇主繼續(xù)吸引研究人員前往工作,樣本數(shù)據(jù)中46%的人替美國的雇主工作,中國排名第二,占比為11%,第三的英國占比為7%。加拿大、德國、日本各占樣本的4%。排名前18的國家就占到了作者總量的94%。而排名前5的國家美國、中國、英國、德國、加拿大的占比達到了72%。
會議樣本絕大部分都是學術(shù)界的(77%),23%在產(chǎn)業(yè)界工作。盡管業(yè)界一些最大的私營公司仍繼續(xù)吸引人才入駐其總部,但我們也看到很多公司開始招聘專家讓他們在母國的辦公地點工作。這份報告也把這些人看成是為公司總部所在國工作。比如說,某人是在法國修得博士然后在Google的法國分公司工作,報告會把此人看成是在法國受訓為美國公司工作。所以在統(tǒng)計方面美國受益是最大的。
為他人做嫁衣——培養(yǎng)博士的國家未必總是受益
人才流動情況
左側(cè):在哪里獲得博士學位;右側(cè):在哪里工作
本次的會議數(shù)據(jù)還分析了研究人員在完成博士學業(yè)后去到了哪里工作??傮w而言,我們發(fā)現(xiàn)在樣本當中將近有1/3(27%)的研究人員工作的雇主所在國家跟他們接受培訓所在的國家是不一樣的。在作者數(shù)量至少在150以上的國家當中,這個比例甚至高達32%。這些人才流動的全球地圖很復(fù)雜,背后的故事當然是跟個人密切相關(guān)的。但無論如何,這一數(shù)據(jù)能讓我們對AI人才的跨境流動一探端倪。(編者注:從中國的人才流入和流出來看,我們還是凈流入的多;而美國流入流出的體量都很大)
首先,我們的數(shù)據(jù)表明,某些國家對機器學習領(lǐng)域的研究人員特別有吸引力??偛吭诿绹墓椭魑M馐苡栄芯咳藛T的幾率最高。中國是吸引在別國拿到博士學位的研究人員可能性第二大的國家,在吸引的研究人員數(shù)量上幾乎是美國的1/4。我們估計會有若干因素對此產(chǎn)生影響,其中就包括每個國家的相關(guān)職位情況。
其中人才流入大于流出的10個國家/地區(qū)是:中國臺灣、瑞典、韓國、西班牙、美國、瑞士、中國、日本、英國、澳大利亞。而在接受海外專家方面的贏家是瑞士和瑞典,外來人才占比分別達到了50%和49%。
不同國家人才流入流出情況對比
這一數(shù)據(jù)還可以讓我們對比每個國家/地區(qū)的人才流入流出情況。人才流入表示的是在x國/地區(qū)工作但是在y國/地區(qū)拿到博士學位的人數(shù)除以x國/地區(qū)的AI人才總數(shù)。這個指標可以用來衡量一個生態(tài)體系對人才的吸引力。
四象限:左上——錨定國;左下——生產(chǎn)國;右上——邀請國;右下:平臺國
另一方面,人才流出表示的是在x國/地區(qū)拿到博士學位但現(xiàn)在為y國/地區(qū)的雇主工作的人數(shù),再除以x國/地區(qū)的AI人才總數(shù)。這個比例可以看出一個國家/地區(qū)留住人才的能力。
跟平均水平相比,澳大利亞、西班牙、中國臺灣的流入情況要大于流出。這意味著這些國家/地區(qū)在挽留自己培養(yǎng)的人才并吸引外來人才方面相對更加成功。這些生態(tài)體系我們稱之為邀請國。相反,法國、以色列這樣的國家屬于生產(chǎn)國,因為跟平均水平相比,其人才流出要高于人才流入,但是差距并不大。
美國的人才流入和流出情況都相對較少。這并不能反映出其人才庫的深度:就絕對數(shù)字而言,美國依然是全球領(lǐng)先的人才磁石。相反,它反映的是人才庫的相對穩(wěn)定性。中國、德國、印度、意大利、日本和韓國也呈現(xiàn)出相同的模式。這類國家我們稱之為錨定國。
最后,還有好幾個國家的人才流入和流出都高于平均水平。這些國家成功地吸引了海外培養(yǎng)的人才,同時期研究生流動也高于平均水平。這些生態(tài)體系我們稱之為平臺國。,其中包括了加拿大、荷蘭、新加坡、瑞士以及英國。
我們的會議數(shù)據(jù)還發(fā)現(xiàn)一些國家之間的人才交流引人關(guān)注。中美之間的交流尤其突出,所以整體而言誰都沒有占太大的便宜:我們發(fā)現(xiàn)在我們的22400名研究人員數(shù)據(jù)集當中有約500位是在中國拿得到博士學位然后為美國雇主工作的,不過也有約500名字美國拿到博士學位的人為中國的雇主工作。美國與英國之間也有類似的現(xiàn)象。
重大影響研究:美國、中國、英國、澳大利亞、加拿大領(lǐng)先
今年的調(diào)查還發(fā)現(xiàn)在頂級國際學術(shù)會議上出現(xiàn)的作者數(shù)量比去年增加了19%。為了評估這些作者目前在領(lǐng)域內(nèi)的影響力,報告分析了其 2017、2018兩年間出版物的被引用情況。其中有18%(約4000人)具有較為顯著的影響力。這些人也是致力于將理論付諸應(yīng)用的團隊想要爭取的對象。
而具備高影響力的作者的國家也主要集中在幾個國家,分別是美國(1095)、中國(255)、英國(140)、澳大利亞(80)以及加拿大(45)。
不過如果分析高影響力作者在本地AI人才中的占比的話,情況會有所改變。這指標反映的是培養(yǎng)本地頂級人才的能力。這方面澳大利亞排名第一,18%的作者發(fā)表了具備重大影響的文章,其后是美國、英國和中國(均為13%),瑞士(11%)、新加坡(9%)、瑞典和西班牙(8%),以及以色列、加拿大與意大利(7%)。
總體而言,最具影響力的研究更有可能出自學術(shù)界而不是產(chǎn)業(yè)界。但是有些國家尤其如此。中國的高影響力研究是最有可能出自學術(shù)界的(90%),緊隨其后的是意大利(86%),美國(84%),德國(83%)以及中國臺灣(81%)。而來自產(chǎn)業(yè)界的占比最高的國家是法國(30%),其后是印度和以色列(29%),西班牙(28%)以及英國(27%)。
社交網(wǎng)絡(luò)數(shù)據(jù)表明更多人是自稱的AI專家
我們的會議研究人員數(shù)據(jù)表明在AI領(lǐng)域的21個頂級學術(shù)會議上發(fā)表論文的作者和論文數(shù)量均有了顯著提升。為了了解就業(yè)市場是否有同樣的情況,我們調(diào)查了全球使用最廣泛的職業(yè)社交網(wǎng)絡(luò)LinkedIn。
我們的研究對象是那些具備機器學習技術(shù)能力、若干工作經(jīng)驗,并且能夠在交叉學科環(huán)境下寫作的職場人士。搜索包括了“數(shù)據(jù)科學家”、“研究科學家”、“機器學習工程師”、“機器學習研究人員”以及“數(shù)據(jù)分析師”,而且學歷必須是博士。最后檢索出36524名符合條件的人士。相比之下,去年的數(shù)據(jù)為22064,也就是說比去年增長了66%。
跟去年,今年的調(diào)查發(fā)現(xiàn),LinkedIn上的AI專家主要集中在美國、英國、加拿大、法國以及德國。不過,增長率最快的國家是意大利、突尼斯、以色列、愛沙尼亞以及阿根廷。
從LinkedIn樣本分析來看,這些專家的主修專業(yè)各不一樣。其中計算機科學是占比最高的(28%)。而且在一些國家這個比例甚至還要大,比如法國(47%)和中國(44%)。類似地,一些國家其中一些學科的占比也比平均水平突出。比如物理專業(yè)的平均占比為9%,但在德國其占比卻高達28%。另一個例子是數(shù)學和統(tǒng)計。平均占比為18%,但以色列、美國這個數(shù)字就升到了27%,而俄羅斯更是高達35%。
不同國家的學科差異
計算機科學約占1/3,但不同國家差異很大
當然,利用LinkedIn分析有一些問題需要注意。首先是LinkedIn上面的信息都是用戶自述的。其次,LinkedIn的代表性對一些國家來說并不足。LinkedIn自稱有44%的美國人在上面有簡歷,加拿大的占比也有38%。但俄羅斯的占比比卻只有5%,而中國更是只有3%。
不過對于使用LinkedIn活躍的國家來說,LinkedIn上面的活動能夠為AI領(lǐng)域的人才規(guī)模和興趣改變提供洞察。就本次調(diào)查而言,我們發(fā)現(xiàn)機器學習專業(yè)出現(xiàn)了顯著的提升。這有可能是反映出一個日益重視AI技能與專業(yè)知識的市場推動了人才庫的擴張。
全球的AI人才熱點
中國
從會議作者數(shù)據(jù)看,約11%的會議作者是在中國培養(yǎng)的,也有相同比例的作者是為中國雇主工作。在樣本中中國占領(lǐng)女性作者的12%,其中有14%發(fā)表了最有影響力的研究。2018年在頂級會議上發(fā)表論文的作者當中,有13%屬于高影響力群體。
在AI方面,中國有著若干優(yōu)勢。其中包括大規(guī)模的數(shù)據(jù),具有活力的創(chuàng)業(yè)環(huán)境,政府支持等。根據(jù)清華大學 2018年6約發(fā)布的《中國人工智能發(fā)展報告》,中國在論文總量和高被引論文數(shù)量上都排在世界第一,中國已經(jīng)成為全球人工智能專利布局最多的國家,風險投資上,中國人工智能領(lǐng)域的投融資占到了全球的60%,成為全球最“吸金”的國家。但是,在頂級AI人才這個關(guān)鍵方面占比較低(排名依次是美國、英國、德國、法國、意大利和中國)。而在人才總量,方面,該報告認為中國僅次于美國。但是有跡象表明中美之間的差距很快就會縮?。篈llen Institute for Artificial Intelligence(艾倫人工智能研究所)最近的一項研究發(fā)現(xiàn),到2020年,中國的高影響力出版物就將超過美國。這也許就是中國的AI戰(zhàn)略將培養(yǎng)頂級人才列為優(yōu)先事項的原因之一。
這項戰(zhàn)略的部分內(nèi)容似乎是將海外工作的中國研究人員帶回中國,在提供杰出研究崗位、獎金補貼的激勵下,成功地吸引了成千上萬的研究人員將自己的工作帶到中國,其中絕大部分都是來自美國。與此同時,中國還建設(shè)了超過300座“創(chuàng)業(yè)園區(qū)”,讓海外學生和人員回國。
來自美國國家科學基金會的數(shù)據(jù)表明,相對于之前,稱學成后愿意留下來的在美國獲得數(shù)學或者計算機科學博士學位的中國博士生占比下降了。2012至2015年期間,中國學生占到了非美國籍的赴美留學博士生的42%,其中有87%的人說打算留下來,說絕對要留下來的比例也有57%。盡管表示學成后要留在美國的中國學生的占比仍高于世界平均水平,但相對于2004到07年期間,這兩個數(shù)字實際上是下降了,那段時間表達留下來意愿的占比為91%,說絕對會留下來的占到了65%。這些數(shù)據(jù)表明,在美國修完數(shù)學和計算機科學博士學位的海歸正在越來越多。
像國內(nèi)這樣的人才招募計劃,再加上AI領(lǐng)域空前的投資所帶來的商業(yè)機會,正在成為部分研究人員考慮將實驗室遷往中國的激勵因素。另一個考慮因素是所謂的“竹子天花板”:亞裔的STEM畢業(yè)生得到外國公司的雇用可能很容易,但是晉升卻不能像部分同事那么容易。2015年對Google、惠普、英特爾、LinkedIn以及Yahoo進行的一項雇用數(shù)據(jù)研究表明,盡管亞裔占到這些公司專業(yè)勞動力的27%,但主管的占比卻只有14%。
美國
在超過36500份LinkedIn簡歷的樣本里面,有將近一半(15747)是在美國的。其中很大一部分(約20%)目前或者之前在微軟(1077)、IBM(667)、Google(697)、Amazon(511)以及或者蘋果(393)工作。這些簡歷當中 87%都有至少6年的經(jīng)驗,而且?guī)缀跞迹?7%)稱有至少3年的經(jīng)驗。這個人才庫當中約有1/3都是在舊金山灣區(qū)工作。
在會議數(shù)據(jù)方面,美國幾乎在每一個指標的絕對數(shù)方面都是領(lǐng)先的。在美國受教育的人占到了樣本論文作者的將近一半(44%)。受雇美國公司或大學的占比達到了46%。在女性群體扎伊占比甚至更高:數(shù)據(jù)集的的4085名女性當中,有1960(48%)是為美國雇主工作的。在美國機構(gòu)工作的高影響力(論文被引用數(shù)排名靠前)作者占到了60%。高影響力人才占到了美國AI人才的13%。其中學術(shù)家占領(lǐng)84%,產(chǎn)業(yè)界占16%。
美國在若干指標領(lǐng)先并不出奇。一方面,美國在基礎(chǔ)AI研究上依舊領(lǐng)先。據(jù)李開復(fù)的說法,美國致力于在未來30到40年維持“研究領(lǐng)導(dǎo)力”和研究生教育方面的全球領(lǐng)先優(yōu)勢。
此外,美國公司和美國政府在AI研發(fā)方面的投入很大。Facebook、蘋果、微軟、Google和Amazon這些美國巨頭均在機器學習方面加倍下注。OECD 2018年12月發(fā)布的一份報告稱,無論是從交易額和交易數(shù)量來看,自從2011年以來,絕大部分的AI初創(chuàng)企業(yè)股權(quán)投資都流向美國公司。美國軍方也在積極投入AI研究:比方說DARPA在2018年11月就宣布未來5年投入20億美元用于“創(chuàng)造第三波AI技術(shù)潮的新老計劃”。
結(jié)論
我們的2019 全球AI人才報告表明,過去一年,AI領(lǐng)域的作者數(shù)、具有重大影響的科學論文數(shù)、以及自稱的AI專家數(shù)均有了顯著提升。不過女性的名額依舊不足,但有一些國家在性別均衡方面表現(xiàn)得更加出色。從人才分布的地緣情況看,美國在幾乎每一個指標的絕對數(shù)方面都是領(lǐng)導(dǎo)者。但這個領(lǐng)域無疑是非常國際化的,每一個本地生態(tài)體系都有獨特的優(yōu)勢和戰(zhàn)略。專注于培養(yǎng)這一領(lǐng)域?qū)I(yè)人士的國家正在幫助將AI人才庫的蛋糕做大,從而推動本領(lǐng)域向前發(fā)展。