《Science》雜誌:機器學習究竟將如何影響人類未來的工作?

《Science》雜誌:機器學習究竟將如何影響人類未來的工作?

▲(圖/翻攝自雷鋒網,下同)

【原文:《機器學習究竟將如何影響人類未來的工作?》,作者:Smiletalker,智慧機器人網編輯整理】

 

文、圖/雷鋒網

在過去的幾十年中,數字計算機已經改變了幾乎所有經濟部門的工作。由於機器學習( ML)的發展加快了自動化的步伐,我們正處於一個更大、更迅速轉變的開始階段。然而,雖然很明顯  ML 是一種「通用技術」,就像蒸汽機和電力一樣,產生了大量新的創新和能力,但關於  ML 系統擅長的任務並沒有廣泛的共識,  ML 對勞動力和經濟的具體影響的預期也沒有達成一致。在本文中,我們討論了  ML 對勞動力的關鍵影響,參考了目前這一代  ML 系統可以做和不可以做的事情。工作中的一部分可能是「適合  ML」( S ML),但這些相同工作中的其他任務並不適合  ML 的標準;因此,  ML 對就業的影響比一些人所強調的簡單的替代和替換更為複雜。雖然目前 ML 對經濟的影響相對有限,而且我們並沒有像有的人宣稱的那樣面臨即將到來的「工作的終結」,但 ML 對經濟和未來勞動力的影響卻是深遠的。

 

任何有關 ML 可以做什麼、不可以做什麼、以及可能對經濟產生哪些影響的討論,首先應該認識到兩個廣泛的基本考慮因素。第一,我們離通用人工智能還很遠;第二,機器不能完成人類的全部任務。此外,雖然創新總體上對收入和生活水平的提高是重要的,特別是 ML 之前的第一波信息技術(IT)系統創造了數万億美元的經濟價值,但技術進步也是造成工資不平等的重要因素,儘管造成不平等的因素有很多,比如全球化程度加深,但由於 ML 的巨大而迅速的變化潛力,可能對經濟影響造成很大的破壞性,既產生贏家,也產生輸家。這將需要政策制定者,商業領袖,技術人員和研究人員的高度重視。

 

當機器自動執行特定工作或流程中的適合 ML 的任務時,剩下的不適合 ML 的任務可能會變得更有價值。此外,機器將增強人的能力,使全新的產品、服務和流程成為可能。因此,即使在部分自動化的工作崗位內,對勞動力需求的影響既可能是負面的,也可能是正面的。雖然更廣泛的經濟影響是複雜的,但與 ML 能力接近的任務上,對勞動力需求更有可能下​​降,而作為這些系統補充的任務勞動力的需求可能增加。每當 ML 系統跨越一個門檻,在某個任務上比人類更具成本效益時,企業家和管理者為了利潤最大化,將越來越多地尋求用機器替代人類。這將影響整個經濟,提高生產力,降低價格,轉移勞動力需求,重組行業。

 

我們知道的多於我們所能言說的

正如哲學家波拉尼所說,我們知道的,多於我們所能言說的。認識一張臉、騎自行車和理解言語都是人類非常清楚怎麼做的任務,但是我們反思自己如何去做的能力卻很差。執行起來輕而易舉的任務要整理成正式規則卻很難,很多時候我們根本做不到。因此,在 ML 之前,波拉尼的悖論限制了通過編程計算機自動完成的任務種類。但是今天,在許多情況下, ML 算法已經使得訓練計算機系統比我們手動編程更精確和更有能力。

 

一直到近幾年,創建一個新的計算機程序都需要涉及勞動密集型的手工編程過程。但是,這個昂貴的過程正日益被增強,或者被一個更加自動化的、在適當的訓練數據上運行的 ML 算法流程所取代。這種轉變的重要性體現在兩個兩方面:在越來越多的應用程序中,這種模式可以產生比人類程序員更精確和可靠的程序(例如人臉識別和信用卡欺詐檢測);其次,這種模式可以大大降低創建和維護新軟件的成本。降低了成本,減少了實驗的障礙,並能夠探索潛在的計算機化任務,鼓勵發展計算機系統,實現許多類型的常規工作流程的自動化,減少或消除人為乾預。

 

在過去的 6 到 8 年裡, ML 在這方面的進展尤其迅速,這在很大程度上是因為大量的訓練數據,這些數據量足夠大,以至於可能捕捉到非常有價值且以前未被注意到的規律,可以在 ML 算法的處理能力範圍內進行檢查或理解。當有足夠多的訓練數據集時, ML 有時生成的計算機程序表現勝過人類。(例如皮膚病診斷、圍棋、檢測潛在的信用卡欺詐)。

 

算法的改進也是 ML 進展的關鍵,包括深度神經網絡(DNN)和更快的計算機硬件。例如,Facebook 已經都從基於短語的機器翻譯模式轉換到深度神經網絡,每天進行的翻譯超過45 億次;用於圖像識別的DNN 降低了ImageNet 上的錯誤率,ImageNet 是一個包含10000 多類標註圖像的大型數據集,錯誤率從2010 年的超過30% 下降到現在的不到3%;同樣,自2016 年7 月以來,DNN 幫助語音識別錯誤率從8.4% 提高到4.9%。圖像和語音識別率達到5% 的閾值非常重要,因為這幾乎接近人類在面對類似數據時的錯誤率。

 

自動推進的自動化

要產生一個定義明確的學習任務,以便應用 ML 算法,必須要有充分的說明任務、性能指標和訓練過程。在大多數實際應用中,要學習的任務與某些目標功能相對應,例如輸入醫療患者健康記錄,輸出患者診斷的功能,或者從自動駕駛汽車的傳感器接收輸入,然後輸出正確的轉向命令。最常見的訓練過程類型是由目標功能的輸入- 輸出對組成的數據(例如與正確診斷配對的醫療記錄)。然而獲取真實訓練數據在許多領域都很困難,如精神病診斷,招聘決策和法律案例。

 

成功的商業應用的關鍵步驟,通常包括精確識別要學習的功能;收集和清洗數據以用於訓練 ML 算法;通過工程數據特徵來選擇哪些數據可能有助於預測目標輸出,並且收集新的數據以彌補原始特徵的不足;嘗試不同的算法和參數設置,以優化學習分類器的準確性;並將提供的學習系統嵌入到日常業務運營中,從而提高生產力;如果可能,持續獲取更多訓練樣本。

 

測量未來自動化程度非常相關的方法是「學徒學習法」,其中人工智能程序作為學徒,通過觀察人類的決定來進行學習,並將其作為額外的訓練樣本。這種方法產生了新的商業模式。

 

訓練學徒模仿人為決策讓機器可以從它所協助的多個人的綜合數據中進行學習,這導致機器可能最終超過訓練它的團隊中的每個個體的表現。不過,其學到的專業知識可能仍受到團隊成員的技能水平和相關決策變量的可用性的限制。但是,在計算機可以訪問獨立數據來確定最佳決策(基本事實)的情況下,有可能改進人的決策,從而幫助人類提高自己的績效。例如,在從皮膚病學圖像中對皮膚癌進行醫學診斷時,將隨後的活檢結果作為訓練的標準可以產生比人類醫生更高診斷準確度的計算機程序。

 

什麼是最適合  ML 的任務

儘管近來 ML 系統的進步令人印象深刻,但它們並不適用於所有的任務。當前的成功浪潮在很大程度上取決於被稱為監督學習的範式,通常使用DNN(深度神經網絡)。在非常適合這種用途的領域, ML 非常強大。但是它的能力也比人的決策範圍要窄的多,也比人的決策更脆弱,而且這種方法對許多任務是完全無效的。當然, ML 的技術還在繼續進步,DNN 之外的其他方法可能更適合不同類型的任務。我們下面給出8 個關鍵評判標準,以區分適合 ML 的任務和不適合 ML 的任務。

 

1、明確定義的輸入和輸出

其中包括分類(例如,區分不同品種狗的圖像或根據癌症的可能性標註醫療記錄)和預測(例如分析貸款申請以預測未來違約的可能性)。不過,雖然 ML 系統可以根據統計上的相關性來預測與輸入(X)有最大關聯的輸出(Y),但可能無法學習如何判斷因果關係。

 

2、存在、或者能夠創建規模巨大、帶有成對的輸入輸出的數字化數據集

可用的訓練樣本越多,學習就越準確。DNN 的顯著特徵之一是在許多領域內的表現似乎並不會在樣本超過一定數量之後就停止增長。在訓練數據中捕獲所有相關輸入特徵尤為重要。儘管DNN 原則上可以表示任意函數,但是計算機很容易模仿和延續訓練數據中存在的不需要的偏差,解決方法是通過聘用專人來標記部分數據或創建全新的數據集,或通過模擬相關的問題設置來創建。

 

3、該任務提供明確的反饋,具有明確的目標和指標

當我們能夠清晰的描述目標,哪怕不能確定實現目標的最佳過程, ML 也能很好的運作。這就像早期的自動化方法,獲取個體輸入輸出決策的能力雖然允許學習模仿這些個體,但可能不能得到最佳的系統最性能,因為人類本身也無法做出完美的決策。因此,明確界定全系統績效指標(例如,優化整個城市的交通流量而不是特定路口)為 ML 系統提供了一條黃金標準。當訓練數據按照這種黃金準則進行標註時, ML 就特別有用,因為確定了預期的目標。

 

4、不需要基於豐富背景知識的很長的邏輯或推理鏈

 ML 系統在學習數據中關聯性方面非常強大,但是當任務需要依賴計算機沒有的常識或背景知識或複雜計劃時, ML 系統的效率較低。 ML 在電子遊戲中表現出色,這些遊戲需要快速反應,並提供即時反饋,但當遊戲中最佳選擇取決於記憶以前事件的時間和未知背景知識時,效率就會降低,例外是圍棋和象棋這樣的遊戲,因為這些非物理的遊戲可以以非常精確的速度進行快速模擬,因此可以自動收集數百萬個完全自我標記的訓練樣本。但是,在大多數現實世界中,我們無法做到完美的模擬。

 

5、沒有必要詳細解釋如何做出決策

大型神經網絡通過微妙地調整多達數億個數字權重來學習做出決定。解釋這種決定對人類來說很困難,因為DNN 與人類的思維繫統不同。目前的系統在這個方面相對較弱。例如,雖然計算機可以診斷特定類型的癌症或肺炎,甚至比專家醫生更準確,但與人類醫生相比,它們解釋為什麼以及如何作出診斷的能力較差。對於許多感性的任務,人類也很難解釋,例如,如何從所聽到的聲音中識別出單詞。

 

6、容錯性,不需要最佳的解決方案

幾乎所有的 ML 算法都是從統計和概率上推導出解決方案。因此,很難將其訓練到100% 的準確度。即使是最好的語音、物體識別和臨床診斷計算機系統也會犯錯(和人一樣)。因此,對學習系統誤差的容忍是製約這樣的系統應用的重要標準。

 

7、學習的現像或功能不應該隨著時間的推移而快速變化

一般來說,只有當需要處理的數據和訓練的數據分佈是類似的結構, ML 算法才能很好地工作。如果這些分佈隨著時間而改變,則通常需要重新訓練,因此成功取決於相對於新訓練數據獲取率的變化。

 

8、沒有特別的靈巧性,身體技能或流動性要求

在處理非結構化環境和任務中的物理操作時,機器人與人類相比仍然笨拙。這不是 ML 的缺點,而是機器人技術自身的局限性。

 

機器學習對工作的影響

之前 ML 對IT 的影響主要在於一些常規、高度結構化和重複性的任務。這也是勞動力需求下降的一個原因。未來,更廣泛的任務將被機器自動化或增強。這包括人類無法解釋的任務,但是簡單地根據過去的趨勢進行推斷將是錯誤的,需要一個新的框架。

 

一項工作中通常包含許多不同的但相互關聯的任務。在大多數情況下,這些任務中只有一部分適用於 ML,而且可能是傳統的技術不容易自動化的任務。例如,訓練 ML 系統可以幫助律師對案件的相關文件進行分類,但是在訪談潛在的證人或製定策略時使用 ML 就很困難。類似地, ML 系統在閱讀醫學圖像方面取得了迅速的進展,在某些應用中表現超過了人類。然而,與其他醫生交流、以及與患者交流和安慰患者的潛在情緒困擾的等任務,都不適合 ML 方法,至少不適合現有的 ML 系統。

 

這並不是說所有涉及情商的任務都 ML 系統都無法實現。銷售和客戶互動的某些方面就非常合適。例如,銷售人員和潛在客戶之間的大量在線聊天記錄可以用簡單聊天機器人替代,以識別哪些常見的詢問最有可能帶來銷售。也有公司使用 ML 來識別來自視頻中人們的微妙情緒。

 

另一個領域是涉及創意的任務。在舊的計算模式中,需要事先精確地規定一個過程的每個步驟。機器沒有任何「創造性」的空間,不能想出如何解決特定問題。但 ML 系統是經過專門設計的,使機器可以自己找出解決方案。所需要的不是預先詳細定義過程,而是需要明確規定所需解決方案的性質,並有一個合適的模擬器,以便 ML 系統可以探索可用替代方案並準確評估其性能。例如,設計複雜的新設備在一直是人類比機器更擅長的任務。但是生成式設計軟件可以為熱交換器等物體提供新的設計,比任何人設計的都能更有效地滿足所有的要求(例如重量,強度和冷卻速率)外觀和触感。

 

這是「創意」嗎?這取決我們如何定義。但以前人類的一些「創造性」任務在未來幾年將日益自動化。當最終目標可以被很好地規定並且解決方案可以被自動評估時,這種方法運行良好。因此,我們可以預見這些任務越來越受到自動化的影響。與此同時,人類在更明確界定目標方面的作用將更加重要,這意味著科學家,企業家和那些能夠提出正確的問題的人的作用將會增加。

 

 ML 期待人類工作的六個經濟因素

有許多非技術因素會影響 ML 對未來工作的影響。具體而言, ML 對勞動力需求和工資的總體影響可以歸類為六個不同經濟因素:

 

1、替換

基於  ML 創建的計算機系統可以直接在某些工作中取代人類,降低任何給定的輸出產量所需的人力。

 

2、價格彈性

通過機器學習實現自動化可以降低完成任務的成本, 這會導致總支增加或減少,取決於需求的價格彈性。例如,如果彈性小於-1,則價格下降導致購買數量的比例增加,總支出(價格乘以數量)將增加。例如,隨著技術在1903 年以後降低了航空旅行的價格,這類旅行的總支出增加了,就業也隨之增多。

 

3、互補性

任務B 對於另一個自動化的任務A 來說可能很重要,甚至是不可或缺。隨著A 的價格下降,對B 的需求將會增加。通過類比,隨著計算自動化的程度提高,對程序員的需求增加了。技能也可以是其他技能的補充。例如,人際交往能力與分析能力是一種互補關係。

 

4、收入彈性

自動化可能會改變人群的總收入。如果一個商品的收入彈性不為零,這又會改變對某些商品類型的需求,以及生產這些商品所需任務的需求。就像隨著總收入的增加,美國人花在餐館的錢也越來越多。

 

5、勞動力供給的彈性

隨著工資的變化,從事該項工作的人數也會變化。如果有許多人已經具備了必要的技能(例如駕駛汽車進行乘車服務),那麼供給就具有相當的彈性,即使需求增加(或下降)很多,工資也不會上漲(或下降)很多。相反,如果技能很難獲得,比如成為數據科學家,那麼需求的變化將主要體現在工資上而不是就業上。

 

6、重新設計業務流程

任何一組不同類型和數量的勞動力,資本和其他投入與產出聯繫起來的生產函數不是固定的。企業家,管理人員和員工不斷努力重塑相關流程。當面對新技術時,他們將通過設計或機緣巧合改變了生產過程,並找到更有效的方法來進行產量。這些變化可能需要一段時間,而且往往能夠節約昂貴的投入,增加需求彈性。同樣,隨著時間的推移,個人可以通過學習新技能或換新工作,來表示對於高工資的認可和回應,這樣會增加相關的供給彈性。

 

結語

由於需要改變生產流程、組織設計、商業模式、供應鏈、法律甚至文化環境,所以技術的採用和推廣往往需要幾年或幾十年的時間。這種互補性在現代企業和經濟中是無處不在的,並且具有相當大的慣性,從而放慢實施新技術不乏。例如,將自動駕駛卡車整合到城市街道上可能需要改變交通法規,責任規則,保險等,因此需要在多個維度上進行補充性修改,應用需要更長的時間來影響經濟和勞動力、法規、交通流量等,而將呼叫中心人員切換到虛擬助理可能只需要對業務過程或客戶體驗進行相對較少的重新設計。

 

隨著時間的推移,另一個因素變得越來越重要:新商品,新服務,新任務和新流程會出現。這導致全新的任務和工作,從而可以改變上述關係的程度和標誌。從歷史上看,隨著一些任務的自動化,釋放的勞動力會重轉移到新的商品或服務,進入到更有效的生產過程中。這種創新比增加資本、勞動力或資源投入,更能提高總體收入和生活水平。 ML 系統可以通過自動化來加速符合上述標準的許多任務。

 

隨著越來越多的數據進去線上並彙集起來,以及發現哪些任務應該由 ML 實現自動化,我們將更迅速地收集數據以創建更強大的系統。與我們以及掌握的解決方案不同,許多 ML 自動化任務的解決方案都幾乎可以立即在全世界傳播。我們可以期待未來的企業軟件系統都將嵌入 ML系統,自動化的成本將進一步降低。

 

近期監督學習系統的浪潮已經產生了相當大的經濟影響。 ML 進一步發展,最終影響的範圍和規模可能會超過或內燃機或電力等通用技術。這些進步不僅直接提高了生產力,而且更重要的是,引發了機器、商業組織乃至整個經濟的創新浪潮。在技​​能,資源和基礎設施等方面作出正確的互補性投資的個人、企業和社會得到了蓬勃發展,更好地理解每種類型 ML 的具體適用性及其對具體任務的影響,對於理解 ML 帶來的經濟影響至關重要。

【原文:《機器學習究竟將如何影響人類未來的工作?》,作者:Smiletalker,智慧機器人網編輯整理】

熱門標籤

延伸閱讀

留言