2024世界人工智能大會(huì )暨人工智能全球治理高級別會(huì )議(WAIC 2024)7月4日在上海開(kāi)幕。上海人工智能實(shí)驗室(簡(jiǎn)稱(chēng)“上海AI實(shí)驗室”)主任、清華大學(xué)惠妍講席教授周伯文在會(huì )議上提出“探索人工智能45°平衡律”的技術(shù)主張。
周伯文指出,當前,以大模型為代表的生成式人工智能快速發(fā)展,但隨著(zhù)能力的不斷提升,模型自身及其應用也帶來(lái)了一系列潛在風(fēng)險的顧慮。
從公眾對AI風(fēng)險的關(guān)注程度來(lái)看,首先是數據泄露、濫用、隱私及版權相關(guān)的內容風(fēng)險,其次是惡意使用帶來(lái)偽造、虛假信息等相關(guān)的使用風(fēng)險,當然也誘發(fā)了偏見(jiàn)歧視等倫理相關(guān)問(wèn)題,此外還有人擔心人工智能是否會(huì )對就業(yè)結構等社會(huì )系統性問(wèn)題帶來(lái)挑戰。在一系列關(guān)于人工智能的科幻電影中,甚至出現了AI失控、人類(lèi)喪失自主權等設定。
在周伯文看來(lái),這些由AI帶來(lái)的風(fēng)險已初露端倪,但更多的是潛在風(fēng)險,防范這些風(fēng)險需要各界共同努力,需要科學(xué)社區做出更多貢獻。對此,他表示,“可信AGI(人工通用智能)需要能夠兼顧安全與性能,我們需要找到AI安全優(yōu)先,但又能保證AI性能長(cháng)期發(fā)展的技術(shù)體系。我們把這樣一種技術(shù)思想體系叫做‘AI-45°平衡律’(AI-45°Law)?!?/p>
據介紹,AI-45°平衡律是指從長(cháng)期的角度來(lái)看,AGI要大體上沿著(zhù)45度安全與性能平衡發(fā)展,平衡是指短期可以有波動(dòng),但不能長(cháng)期低于45°(如同現在),也不能長(cháng)期高于45度(這將阻礙發(fā)展與產(chǎn)業(yè)應用)。這個(gè)技術(shù)思想體系要求強技術(shù)驅動(dòng)、全流程優(yōu)化、多主體參與以及敏捷治理。
實(shí)現AI-45°平衡律也許有多種技術(shù)路徑。周伯文表示,上海AI實(shí)驗室最近在探索一條以因果為核心的路徑,并取名為:可信AGI的“因果之梯”,致敬因果推理領(lǐng)域的先驅——圖靈獎得主Judea Pearl。
可信AGI的“因果之梯”將可信AGI的發(fā)展分為三個(gè)遞進(jìn)階段:泛對齊、可干預、能反思?!胺簩R”主要包含當前最前沿的人類(lèi)偏好對齊技術(shù)。但需要注意的是,這些安全對齊技術(shù)僅依賴(lài)統計相關(guān)性而忽視真正的因果關(guān)系,可能導致錯誤推理和潛在危險?!翱筛深A”主要包含通過(guò)對AI系統進(jìn)行干預,探究其因果機制的安全技術(shù),通過(guò)提高可解釋性和泛化性來(lái)提升安全性,同時(shí)也能提升AI能力?!澳芊此肌眲t要求AI系統不僅追求高效執行任務(wù),還能審視自身行為的影響和潛在風(fēng)險,從而在追求性能的同時(shí),確保安全和道德邊界不被突破。
周伯文表示,“正如可控核聚變對全人類(lèi)都是共同利益一樣,我們堅信AI的安全也是全球性的公共福祉,愿與大家一起攜手推進(jìn)AI-45°平衡律的發(fā)展,共享AI安全技術(shù)、加強全球AI安全人才交流與合作,平衡AI安全與能力的投入,共同構建開(kāi)放、安全的通用人工智能創(chuàng )新生態(tài)和人才發(fā)展環(huán)境?!?/p>
《經(jīng)濟參考報》社有限責任公司版權所有 本站所有新聞內容未經(jīng)協(xié)議授權,禁止轉載使用
新聞線(xiàn)索提供熱線(xiàn):010-63074375 63072334 報社地址:北京市宣武門(mén)西大街57號
JJCKB.CN 京ICP備18039543號