新華通訊社主管

首頁(yè) >> 正文

警惕人工智能時(shí)代的“智能體風(fēng)險”
2024-07-18 記者 彭茜 來(lái)源: 經(jīng)濟參考報

  一群證券交易機器人通過(guò)高頻買(mǎi)賣(mài)合約在納斯達克等證券交易所短暫地抹去了1萬(wàn)億美元價(jià)值,世界衛生組織使用的聊天機器人提供了過(guò)時(shí)的藥品審核信息,美國一位資深律師沒(méi)能判斷出自己向法庭提供的歷史案例文書(shū)竟然均由ChatGPT憑空捏造……這些真實(shí)發(fā)生的案例表明,智能體帶來(lái)的安全隱患不容小覷。

  智能體是人工智能(AI)領(lǐng)域中的一個(gè)重要概念,是指能夠自主感知環(huán)境、做出決策并執行行動(dòng)的智能實(shí)體,它可以是一個(gè)程序、一個(gè)系統或是一個(gè)機器人。

  智能體的核心是人工智能算法,包括機器學(xué)習、深度學(xué)習、強化學(xué)習、神經(jīng)網(wǎng)絡(luò )等技術(shù)。通過(guò)這些算法,智能體可以從大量數據中學(xué)習并改進(jìn)自身的性能,不斷優(yōu)化自己的決策和行為。智能體還可根據環(huán)境變化做出靈活的調整,適應不同的場(chǎng)景和任務(wù)。

  學(xué)界認為,智能體一般具有以下三大特質(zhì):

  第一,可根據目標獨立采取行動(dòng),即自主決策。智能體可以被賦予一個(gè)高級別甚至模糊的目標,并獨立采取行動(dòng)實(shí)現該目標。

  第二,可與外部世界互動(dòng),自如地使用不同的軟件工具。比如基于GPT-4的智能體AutoGPT,可以自主地在網(wǎng)絡(luò )上搜索相關(guān)信息,并根據用戶(hù)的需求自動(dòng)編寫(xiě)代碼和管理業(yè)務(wù)。

  第三,可無(wú)限期地運行。美國哈佛大學(xué)法學(xué)院教授喬納森·齊特雷恩近期在美國《大西洋》雜志發(fā)表的《是時(shí)候控制AI智能體》一文指出,智能體允許人類(lèi)操作員“設置后便不再操心”。還有專(zhuān)家認為,智能體具備可進(jìn)化性,能夠在工作進(jìn)程中通過(guò)反饋逐步自我優(yōu)化,比如學(xué)習新技能和優(yōu)化技能組合。

  以GPT為代表的大語(yǔ)言模型(LLM)的出現,標志著(zhù)智能體進(jìn)入批量化生產(chǎn)時(shí)代。此前,智能體需靠專(zhuān)業(yè)的計算機科學(xué)人員歷經(jīng)多輪研發(fā)測試,現在依靠大語(yǔ)言模型就可迅速將特定目標轉化為程序代碼,生成各式各樣的智能體。而兼具文字、圖片、視頻生成和理解能力的多模態(tài)大模型,也為智能體的發(fā)展創(chuàng )造了有利條件,使它們可以利用計算機視覺(jué)“看見(jiàn)”虛擬或現實(shí)的三維世界,這對于人工智能非玩家角色和機器人研發(fā)都尤為重要。

  智能體可以自主決策,又能通過(guò)與環(huán)境交互施加對物理世界影響,一旦失控將給人類(lèi)社會(huì )帶來(lái)極大威脅。哈佛大學(xué)齊特雷恩認為,這種不僅能與人交談,還能在現實(shí)世界中行動(dòng)的AI的常規化,是“數字與模擬、比特與原子之間跨越血腦屏障的一步”,應當引起警覺(jué)。

  智能體的運行邏輯可能使其在實(shí)現特定目標過(guò)程中出現有害偏差。齊特雷恩認為,在一些情況下,智能體可能只捕捉到目標的字面意思,沒(méi)有理解目標的實(shí)質(zhì)意思,從而在響應某些激勵或優(yōu)化某些目標時(shí)出現異常行為。比如,一個(gè)讓機器人“幫助我應付無(wú)聊的課”的學(xué)生可能無(wú)意中生成了一個(gè)炸彈威脅電話(huà),因為AI試圖增添一些刺激。AI大語(yǔ)言模型本身具備的“黑箱”和“幻覺(jué)”問(wèn)題也會(huì )增加出現異常的頻率。

  智能體還可指揮人在真實(shí)世界中的行動(dòng)。美國加利福尼亞大學(xué)伯克利分校、加拿大蒙特利爾大學(xué)等機構專(zhuān)家近期在美國《科學(xué)》雜志發(fā)表《管理高級人工智能體》一文稱(chēng),限制強大智能體對其環(huán)境施加的影響是極其困難的。例如,智能體可以說(shuō)服或付錢(qián)給不知情的人類(lèi)參與者,讓他們代表自己執行重要行動(dòng)。齊特雷恩也認為,一個(gè)智能體可能會(huì )通過(guò)在社交網(wǎng)站上發(fā)布有償招募令來(lái)引誘一個(gè)人參與現實(shí)中的敲詐案,這種操作還可在數百或數千個(gè)城鎮中同時(shí)實(shí)施。

  由于目前并無(wú)有效的智能體退出機制,一些智能體被創(chuàng )造出后可能無(wú)法被關(guān)閉。這些無(wú)法被停用的智能體,最終可能會(huì )在一個(gè)與最初啟動(dòng)它們時(shí)完全不同的環(huán)境中運行,徹底背離其最初用途。智能體也可能會(huì )以不可預見(jiàn)的方式相互作用,造成意外事故。

  已有“狡猾”的智能體成功規避了現有的安全措施。相關(guān)專(zhuān)家指出,如果一個(gè)智能體足夠先進(jìn),它就能夠識別出自己正在接受測試。目前已發(fā)現一些智能體能夠識別安全測試并暫停不當行為,這將導致識別對人類(lèi)危險算法的測試系統失效。

  專(zhuān)家認為,人類(lèi)目前需盡快從智能體開(kāi)發(fā)生產(chǎn)到應用部署后的持續監管等全鏈條著(zhù)手,規范智能體行為,并改進(jìn)現有互聯(lián)網(wǎng)標準,從而更好地預防智能體失控。應根據智能體的功能用途、潛在風(fēng)險和使用時(shí)限進(jìn)行分類(lèi)管理。識別出高風(fēng)險智能體,對其進(jìn)行更加嚴格和審慎的監管。還可參考核監管,對生產(chǎn)具有危險能力的智能體所需的資源進(jìn)行控制,如超過(guò)一定計算閾值的AI模型、芯片或數據中心。此外,由于智能體的風(fēng)險是全球性的,開(kāi)展相關(guān)監管?chē)H合作也尤為重要。

凡標注來(lái)源為“經(jīng)濟參考報”或“經(jīng)濟參考網(wǎng)”的所有文字、圖片、音視頻稿件,及電子雜志等數字媒體產(chǎn)品,版權均屬《經(jīng)濟參考報》社有限責任公司,未經(jīng)書(shū)面授權,不得以任何形式刊載、播放。獲取授權

國產(chǎn)榴蓮嶄露頭角 “榴蓮自由”更近了嗎?

國產(chǎn)榴蓮嶄露頭角 “榴蓮自由”更近了嗎?

榴蓮整體價(jià)格因供應量的增加而降低,被更多消費者所接受,從而將進(jìn)一步助推榴蓮消費增長(cháng)。

·“百模大戰”中,工業(yè)大模型如何闖出“新天地”?

迎峰度夏 國資央企多措并舉保障能源供應

近期,隨著(zhù)全國各地陸續出現大范圍高溫天氣,全國發(fā)用電量快速攀升,給迎峰度夏能源保供工作帶來(lái)挑戰。多地啟動(dòng)迎峰度夏能源保供具體措施,以應對夏季用電高峰。

·南方電網(wǎng)廣西電網(wǎng)公司實(shí)施國企改革深化提升行動(dòng)

《經(jīng)濟參考報》社有限責任公司版權所有 本站所有新聞內容未經(jīng)協(xié)議授權,禁止轉載使用

新聞線(xiàn)索提供熱線(xiàn):010-63074375 63072334 報社地址:北京市宣武門(mén)西大街57號

JJCKB.CN 京ICP備18039543號

010140010080000000000000011100001310781935
在线精品自偷自拍无码琪琪|国产普通话对白视频二区|巨爆乳肉感一区二区三区|久久精品无码专区免费东京热|亚洲中文色欧另类欧美