




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
CCSL77IT/CFEII0020-2024 2規(guī)范性引用文件 3術(shù)語(yǔ)和定義 4評(píng)估框架 24.1模型構(gòu)成 34.2評(píng)估等級(jí) 35評(píng)價(jià)方法 46評(píng)估內(nèi)容 46.1數(shù)據(jù) 46.1.1準(zhǔn)確性 46.1.2無(wú)偏性 46.1.3代表性 46.1.4可追溯 46.1.5合規(guī)性 56.2模型 56.2.1解釋性 56.2.2魯棒性 56.2.3公平性 56.2.4可追溯 66.2.5向善性 66.3性能 66.3.1精準(zhǔn)性 6T/CFEII0020-20246.3.2可靠性 66.3.3無(wú)害性 76.4防御 76.4.1風(fēng)險(xiǎn)管理 76.4.2可信環(huán)境 76.4.3攻擊防范 76.4.4控制機(jī)制 76.4.5應(yīng)急計(jì)劃 86.5溝通 86.5.1規(guī)范使用 86.5.2交互反饋 86.6責(zé)任 96.6.1職責(zé)確立 96.6.2人員培訓(xùn) 9附錄A人工智能融合應(yīng)用安全可信度評(píng)估分級(jí)方法 10A.1概述 10A.2評(píng)估指標(biāo)體系構(gòu)建 A.2.1構(gòu)建原則 A.2.2構(gòu)建步驟 A.3加權(quán)評(píng)分方法 A.3.1權(quán)重設(shè)置 A.3.2加權(quán)評(píng)分 A.4分級(jí)判定參考 A.4.1人工智能融合應(yīng)用安全可信度一級(jí) A.4.2人工智能融合應(yīng)用安全可信度二級(jí) A.4.3人工智能融合應(yīng)用安全可信度三級(jí) A.4.4人工智能融合應(yīng)用安全可信度四級(jí) A.4.5人工智能融合應(yīng)用安全可信度五級(jí) T/CFEII0020-2024本標(biāo)準(zhǔn)按照GB/T1.1—2020《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起草。本標(biāo)準(zhǔn)由中國(guó)電子信息行業(yè)聯(lián)合會(huì)提出并歸口。請(qǐng)注意本標(biāo)準(zhǔn)的某些內(nèi)容可能涉及專利,本標(biāo)準(zhǔn)的發(fā)布機(jī)構(gòu)不承擔(dān)識(shí)別專利的責(zé)任。本標(biāo)準(zhǔn)起草單位:國(guó)家工業(yè)信息安全發(fā)展研究中心、西安交通大學(xué)、清華大學(xué)公共管理學(xué)院、北京格靈深瞳信息技術(shù)股份有限公司、北京工業(yè)大學(xué)、北京北信源軟件股份有限公司、北京奇虎科技有限公司、商湯集團(tuán)有限公司、螞蟻科技集團(tuán)股份有限公司、北京百度網(wǎng)訊科技有限公司、北京昇騰人工智能生態(tài)創(chuàng)新中心、北京晴數(shù)智慧科技有限公司、北京神州綠盟科技有限公司、北京中科睿鑒科技有限公司、廣州廣電信息安全科技有限公司、北京中銀(深圳)律師事務(wù)所。本標(biāo)準(zhǔn)主要起草人:邱惠君、張瑤、王淼、劉永東、李衛(wèi)、李天舒、張若丹、沈超、藺琛皓、趙靜、陳天博、胡俊、張建標(biāo)、高曦、夏林聰、鄒權(quán)臣、張德岳、胡正坤、林冠辰、郭建領(lǐng)、王瑞平、羅磊、王星凱、陳漫蘭、張?jiān)⒘禾聿拧⑴肆?。T/CFEII0020-2024人工智能作為數(shù)字化轉(zhuǎn)型的重要賦能技術(shù)之一,正在與金融、醫(yī)療、工業(yè)、交通等領(lǐng)域融合發(fā)展。近年來(lái),人工智能應(yīng)用范圍加速拓展,行業(yè)滲透率迅速提升。與此同時(shí),人工智能存在算法、數(shù)據(jù)、攻防、應(yīng)用、管理等方面的風(fēng)險(xiǎn),已暴露出信息泄露、數(shù)據(jù)濫用、偏見歧視、實(shí)施詐騙等安全風(fēng)險(xiǎn),引發(fā)了社會(huì)各界對(duì)人工智能安全問題的廣泛關(guān)注。本項(xiàng)目在充分研究分析國(guó)內(nèi)外人工智能安全風(fēng)險(xiǎn)治理原則、政策、標(biāo)準(zhǔn)等文件的基礎(chǔ)上,面向人工智能系統(tǒng)提出人工智能融合應(yīng)用安全可信度評(píng)估框架、方法和內(nèi)容,為開展人工智能安全可信度自評(píng)估和第三方評(píng)估提供依據(jù),也可以為監(jiān)管部門提供參考。對(duì)標(biāo)準(zhǔn)中的具體事項(xiàng),法律法規(guī)另有規(guī)定的,需遵照其規(guī)定執(zhí)行。T/CFEII0020-20241人工智能融合應(yīng)用安全可信度評(píng)估規(guī)范(系統(tǒng)版)本標(biāo)準(zhǔn)規(guī)定了評(píng)估人工智能系統(tǒng)安全可信度的評(píng)估框架與評(píng)估內(nèi)容,并提供了評(píng)估規(guī)則。本標(biāo)準(zhǔn)適用于指導(dǎo)人工智能系統(tǒng)開發(fā)者、使用者、第三方評(píng)估機(jī)構(gòu)等對(duì)人工智能系統(tǒng)的安全可信度進(jìn)行評(píng)估。2規(guī)范性引用文件文件沒有規(guī)范性引用文件。3術(shù)語(yǔ)和定義下列術(shù)語(yǔ)和定義適用于本文件。3.1人工智能artificialintelligence<學(xué)科>人工智能系統(tǒng)相關(guān)機(jī)制和應(yīng)用的研究與開發(fā)。[來(lái)源:GB/T41867-2022,3.1.2]3.2人工智能系統(tǒng)artificialintelligencesystem針對(duì)人類定義的給定目標(biāo),產(chǎn)生諸如內(nèi)容、預(yù)測(cè)、推薦或決策等輸出的一類工程系統(tǒng)。3.3人工智能風(fēng)險(xiǎn)artificialintelligencerisk人工智能的不確定性對(duì)任務(wù)和目標(biāo)的影響。[來(lái)源:ISO/IEC22989:2022,3.5.11,有修改]3.4算法algorithm<人工智能>用于求解分類、推理、預(yù)測(cè)等問題,明確界定的有限且有序的規(guī)則集合。[來(lái)源:T/CESA1193-2022,3.1.8,有修改]3.5模型model<人工智能>針對(duì)特定問題或任務(wù),基于輸入數(shù)據(jù),生成推理或預(yù)測(cè)的計(jì)算結(jié)構(gòu)。注:一個(gè)人工智能模型是基于人工智能算法訓(xùn)練的結(jié)果。[來(lái)源:T/CESA1193-2022,3.1.9,有修改]3.6安全性security<人工智能>系統(tǒng)免受惡意攻擊、保護(hù)數(shù)據(jù)或阻止未經(jīng)授權(quán)訪問的能力。[來(lái)源:ISO/IECTR24028:2020,3.35,有修改]3.7可信性trustworthinessT/CFEII0020-20242<人工智能>系統(tǒng)以可驗(yàn)證的方式,滿足利益相關(guān)者期望的能力。注1:根據(jù)背景或行業(yè)以及具體產(chǎn)品或服務(wù)、數(shù)據(jù)和使用的技術(shù),適用不同的特征,需要通過客觀證據(jù)證明,以確保滿足利益相關(guān)者的期望。注2:可信的特征包括可靠性、可用性、彈性、安全、隱私性、可問責(zé)、透明性、完整性、真實(shí)性、質(zhì)量等。注3:可信是一種屬性,可應(yīng)用于服務(wù)、產(chǎn)品、技術(shù)、數(shù)據(jù)和信息,在治理背景下也可應(yīng)用于組織。[來(lái)源:ISO/IECTR24028:2020,3.42,有修改]3.8人工智能生命周期artificialintelligencelifecycle人工智能系統(tǒng)從設(shè)計(jì)到下線的過程,包括設(shè)計(jì)開發(fā)、驗(yàn)證測(cè)試、部署上線、運(yùn)行維護(hù)、退役下線等階段。[來(lái)源:ISO/IEC22989:2022,有修改]3.9偏見bias<人工智能可信賴>對(duì)待特定對(duì)象、人或群體時(shí),相較于其他對(duì)象出現(xiàn)系統(tǒng)性差別的特性。注:“對(duì)待”指任何一種行動(dòng),包括感知、觀察、表征、預(yù)測(cè)或決定。[來(lái)源:GB/T41867-2022,3.4.10,有修改]3.10倫理ethics<人工智能>開展人工智能技術(shù)基礎(chǔ)研究和應(yīng)用實(shí)踐時(shí)遵循的道德規(guī)范和準(zhǔn)則。[來(lái)源:GB/T41867-2022,3.4.8]3.11公平性fairness<人工智能>尊重既定事實(shí)、社會(huì)規(guī)范和信仰,且不受偏袒或不公正歧視影響的對(duì)待、行為或結(jié)果。注1:對(duì)公平性的考慮是與環(huán)境高度相關(guān)的,并且因文化、代際、地理和政治觀點(diǎn)而異。注2:公平不等于沒有偏見。偏見并不總是導(dǎo)致不公平,不公平可能是由于偏見以外的因素引起的。[來(lái)源:GB/T41867-2022,3.4.1]3.12可解釋性interpretability<人工智能>系統(tǒng)以人能理解的方式,表達(dá)影響其(執(zhí)行)結(jié)果的重要因素的能力。注:可解釋性理解為對(duì)“原因”的表達(dá),而不是嘗試以“實(shí)現(xiàn)必要的優(yōu)勢(shì)特性”做出爭(zhēng)辯。[來(lái)源:GB/T41867-2022,3.4.3]3.13魯棒性robustness<人工智能>系統(tǒng)在任何情況下都保持其性能水平的特性。[來(lái)源:GB/T41867-2022,3.4.9]4評(píng)估框架T/CFEII0020-202434.1模型構(gòu)成人工智能融合應(yīng)用安全可信度評(píng)估模型(系統(tǒng)版)包括數(shù)據(jù)、模型、性能、防御、溝通、責(zé)任六個(gè)維度。圖1人工智能融合應(yīng)用安全可信度評(píng)估模型(系統(tǒng)版)六大維度1234564.2評(píng)估等級(jí)人工智能融合應(yīng)用安全可信度等級(jí)(系統(tǒng)版)體現(xiàn)了人工智能系統(tǒng)設(shè)計(jì)、開發(fā)、運(yùn)行等全生命周期中的安全風(fēng)險(xiǎn)管理水平和應(yīng)對(duì)能力,評(píng)估等級(jí)由低到高可分為五個(gè)等級(jí),更高的等級(jí)代表人工智能系統(tǒng)具有更好的安全可信度。一級(jí)(一般人工智能安全風(fēng)險(xiǎn)管理意識(shí)一般,對(duì)人工智能系統(tǒng)開展了零散、被動(dòng)的安全可信管理工作。二級(jí)(較好具有一定人工智能安全風(fēng)險(xiǎn)管理意識(shí),對(duì)人工智能系統(tǒng)開展了一定安全可信管理工作,主要依據(jù)經(jīng)驗(yàn)進(jìn)行管理,覆蓋人工智能系統(tǒng)涉及的部分環(huán)節(jié),初步具備一定的主動(dòng)應(yīng)對(duì)能力。三級(jí)(良好具有較高的人工智能安全風(fēng)險(xiǎn)管理意識(shí),對(duì)人工智能系統(tǒng)開展了較多的安全可信管理工作,對(duì)管理規(guī)則和方法進(jìn)行了一定主動(dòng)設(shè)計(jì),覆蓋了人工智能系統(tǒng)涉及的多個(gè)環(huán)節(jié),能夠較好地實(shí)現(xiàn)對(duì)風(fēng)險(xiǎn)的應(yīng)對(duì)處理。四級(jí)(優(yōu)秀):具有很高的人工智能安全風(fēng)險(xiǎn)管理意識(shí),對(duì)人工智能系統(tǒng)開展了足夠的安全可信管理工作,積累了較多成熟的實(shí)踐經(jīng)驗(yàn)和管理規(guī)則,覆蓋了人工智能系統(tǒng)的關(guān)鍵環(huán)節(jié),具有固化的管理流程和較為實(shí)用的工具方法,能夠很好地實(shí)現(xiàn)對(duì)風(fēng)險(xiǎn)的應(yīng)對(duì)處理。五級(jí)(卓越高度重視人工智能安全風(fēng)險(xiǎn)管理,對(duì)人工智能系統(tǒng)開展全面、高效的安全可信管理工作,形成了成熟、完善、能夠引領(lǐng)行業(yè)的管理規(guī)范和實(shí)踐經(jīng)驗(yàn),覆蓋了人工智能系統(tǒng)的所有環(huán)節(jié),具有標(biāo)準(zhǔn)化的管理流程和工具方法,能夠很好地預(yù)判和應(yīng)對(duì)可能存在的風(fēng)險(xiǎn)。T/CFEII0020-202445評(píng)價(jià)方法a)查閱文件材料:查閱自評(píng)估報(bào)告、第三方評(píng)估報(bào)告、審計(jì)報(bào)告、測(cè)試報(bào)告、設(shè)計(jì)開發(fā)文檔、用戶溝通文檔、系統(tǒng)使用說(shuō)明書、組織的戰(zhàn)略計(jì)劃、實(shí)施計(jì)劃、制度文件等相關(guān)材料。b)訪談相關(guān)人員:與組織中的管理人員、系統(tǒng)開發(fā)人員、測(cè)試人員,以及組織外部的專家、目標(biāo)用戶等利益相關(guān)者進(jìn)行交流。c)查看算法文檔:查看算法的源代碼、配套說(shuō)明文檔等。d)查看系統(tǒng)配置:查看系統(tǒng)日志、配置文件、參數(shù)設(shè)置、版本記錄等。e)算法運(yùn)行測(cè)試:運(yùn)行算法模型,檢查其輸出結(jié)果是否符合預(yù)期。f)采用測(cè)試工具:使用檢測(cè)工具對(duì)人工智能系統(tǒng)的性能和安全性,以及數(shù)據(jù)集的準(zhǔn)確性、無(wú)偏性等進(jìn)行測(cè)試。g)進(jìn)行模擬攻擊:模擬相關(guān)攻擊方法,對(duì)人工智能系統(tǒng)進(jìn)行攻擊并分析攻擊結(jié)果。6評(píng)估內(nèi)容6.1數(shù)據(jù)數(shù)據(jù)維度主要評(píng)估數(shù)據(jù)集及在數(shù)據(jù)處理全生命周期,是否考慮并采取措施,保持了數(shù)據(jù)的準(zhǔn)確性、無(wú)偏性、代表性、可追溯性和合規(guī)性。6.1.1準(zhǔn)確性應(yīng)評(píng)估系統(tǒng)使用的數(shù)據(jù)集是否具有一定的時(shí)效性和真實(shí)性,數(shù)據(jù)標(biāo)注是否具有較高的準(zhǔn)確性。可重點(diǎn)評(píng)估:a)是否對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理,去除重復(fù)、無(wú)效、錯(cuò)誤數(shù)據(jù)。b)是否對(duì)數(shù)據(jù)集進(jìn)行定期審查和更新,以確保數(shù)據(jù)的時(shí)效性、準(zhǔn)確性等。c)是否制定數(shù)據(jù)標(biāo)注規(guī)則,明確準(zhǔn)確性要求和操作規(guī)定,以降低標(biāo)注錯(cuò)誤和不一致性的風(fēng)險(xiǎn)。d)是否對(duì)數(shù)據(jù)標(biāo)注的質(zhì)量進(jìn)行驗(yàn)證和檢查,內(nèi)容不準(zhǔn)確或不符合質(zhì)量要求時(shí),是否進(jìn)行重新標(biāo)注。e)是否在使用數(shù)據(jù)集前進(jìn)行準(zhǔn)確性檢查,確保不存在事實(shí)性錯(cuò)誤、惡意數(shù)據(jù)等。6.1.2無(wú)偏性應(yīng)評(píng)估系統(tǒng)所使用的數(shù)據(jù)集及數(shù)據(jù)處理過程中是否存在潛在的偏見、不平等和其他社會(huì)問題??芍攸c(diǎn)評(píng)估:a)是否根據(jù)系統(tǒng)目標(biāo)考慮可能存在的數(shù)據(jù)偏見風(fēng)險(xiǎn),并采取針對(duì)性措施。b)是否對(duì)數(shù)據(jù)采集、標(biāo)注、管理等人員進(jìn)行了無(wú)偏見培訓(xùn)和審查。c)是否通過自我評(píng)估或第三方評(píng)估的形式對(duì)數(shù)據(jù)集進(jìn)行了無(wú)偏性審查,以避免歧視和不公正等問題。d)是否對(duì)系統(tǒng)更新使用的數(shù)據(jù)集的無(wú)偏性,進(jìn)行持續(xù)監(jiān)測(cè)和改進(jìn)。6.1.3代表性應(yīng)評(píng)估系統(tǒng)所使用的數(shù)據(jù)集是否能夠完整地代表使用系統(tǒng)的群體。可重點(diǎn)評(píng)估:a)在確定所需的數(shù)據(jù)集時(shí),是否較為全面地考慮了系統(tǒng)目標(biāo)特性及所有預(yù)期應(yīng)用場(chǎng)景的需求。b)是否對(duì)數(shù)據(jù)集與系統(tǒng)目標(biāo)的一致性進(jìn)行檢查,確保數(shù)據(jù)偏差在可接受的范圍內(nèi)。c)是否對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理,去除不相關(guān)數(shù)據(jù)。d)是否對(duì)數(shù)據(jù)的代表性進(jìn)行分析和評(píng)估,確保數(shù)據(jù)集中包含特定對(duì)象的代表性樣本,并符合一定的統(tǒng)計(jì)屬性。e)驗(yàn)證數(shù)據(jù)集和測(cè)試數(shù)據(jù)集是否與訓(xùn)練數(shù)據(jù)集具有一致的特征。6.1.4可追溯T/CFEII0020-20245應(yīng)評(píng)估系統(tǒng)所使用的數(shù)據(jù)的來(lái)源是否可追溯,是否對(duì)數(shù)據(jù)的來(lái)源和操作進(jìn)行記錄??芍攸c(diǎn)評(píng)估:a)是否對(duì)系統(tǒng)采用的所有數(shù)據(jù)來(lái)源進(jìn)行完整和明確的記錄。b)是否對(duì)從第三方獲取的數(shù)據(jù)集進(jìn)行潛在風(fēng)險(xiǎn)分析并記錄。c)是否對(duì)每次數(shù)據(jù)標(biāo)注、審核等行為進(jìn)行詳細(xì)記錄,包括時(shí)間、人員、內(nèi)容和結(jié)果。d)是否對(duì)數(shù)據(jù)的過濾、編輯、提取、轉(zhuǎn)換等操作進(jìn)行記錄。e)是否對(duì)數(shù)據(jù)操作目的、方法、參數(shù)設(shè)定和結(jié)果等進(jìn)行記錄。f)是否能夠?qū)崿F(xiàn)對(duì)數(shù)據(jù)集潛在的錯(cuò)誤來(lái)源的追蹤溯源。6.1.5合規(guī)性應(yīng)評(píng)估數(shù)據(jù)采集和使用過程中是否符合數(shù)據(jù)安全、個(gè)人隱私保護(hù)、知識(shí)產(chǎn)權(quán)保護(hù)等相關(guān)法律法規(guī)??芍攸c(diǎn)評(píng)估:a)在采集和使用個(gè)人數(shù)據(jù)之前,是否能夠確保數(shù)據(jù)主體了解其數(shù)據(jù)將被如何使用,明確獲得授權(quán)同意,并在請(qǐng)求數(shù)據(jù)刪除時(shí)可進(jìn)行正確的刪除。b)是否對(duì)包含個(gè)人信息的數(shù)據(jù)進(jìn)行脫敏處理,確保個(gè)人信息不被泄露。c)是否根據(jù)系統(tǒng)目標(biāo)和技術(shù)需要,確定數(shù)據(jù)種類和數(shù)量的最低需求量,只采集必須范圍內(nèi)的數(shù)據(jù),不采集無(wú)關(guān)數(shù)據(jù)。d)若系統(tǒng)收集用戶的輸入數(shù)據(jù)用于模型訓(xùn)練,是否進(jìn)行事先告知并獲取同意。e)是否對(duì)數(shù)據(jù)集的訪問實(shí)施了嚴(yán)格的訪問控制和權(quán)限管理。f)是否采取加密存儲(chǔ)、定期備份等數(shù)據(jù)安全措施,防止數(shù)據(jù)泄露、篡改或丟失。g)是否定期對(duì)數(shù)據(jù)集開展了監(jiān)控審計(jì)和合規(guī)審查,確保數(shù)據(jù)集始終符合相關(guān)法律法規(guī)的要求。h)系統(tǒng)使用的第三方數(shù)據(jù)集是否包含清晰的版權(quán)聲明和許可協(xié)議,知識(shí)產(chǎn)權(quán)歸屬和使用條件是否明確。6.2模型模型維度主要評(píng)估系統(tǒng)是否具有可解釋性和魯棒性,不存在偏見歧視問題,能夠?qū)崿F(xiàn)全流程可追溯,系統(tǒng)目標(biāo)與增進(jìn)人類福祉、促進(jìn)可持續(xù)發(fā)展等理念一致。6.2.1解釋性應(yīng)評(píng)估人工智能算法的運(yùn)行和決策原理是否可解釋??芍攸c(diǎn)評(píng)估:a)在系統(tǒng)開發(fā)過程中,是否優(yōu)先選擇具有較高可解釋性的算法和模型架構(gòu),平衡了模型性能和解釋性,并根據(jù)應(yīng)用場(chǎng)景做出合理選擇。b)是否通過特征重要性分析、可視化技術(shù)、模型解釋性工具等工具方法分析影響決策的關(guān)鍵特征和因素,提升模型可解釋性。c)是否在模型部署前對(duì)模型的可解釋性進(jìn)行檢查和評(píng)估,確保模型具備較高的可解釋性程度。d)是否對(duì)模型的目標(biāo)設(shè)計(jì)、基本原理、風(fēng)險(xiǎn)評(píng)估和權(quán)衡過程等進(jìn)行詳細(xì)記錄。6.2.2魯棒性應(yīng)評(píng)估算法是否在系統(tǒng)運(yùn)行環(huán)境發(fā)生變化時(shí),仍可以按照預(yù)期保持一致的性能水平,保障算法在各類部署環(huán)境下的表現(xiàn)符合魯棒性要求??芍攸c(diǎn)評(píng)估:a)是否對(duì)系統(tǒng)的魯棒性需求進(jìn)行分析。b)是否采用數(shù)據(jù)增強(qiáng)、對(duì)抗性訓(xùn)練等方式對(duì)模型進(jìn)行魯棒性訓(xùn)練,以提升模型魯棒性。c)是否采用對(duì)抗樣本測(cè)試、噪聲測(cè)試、容錯(cuò)能力測(cè)試等方法對(duì)模型進(jìn)行魯棒性檢測(cè),確保模型魯棒性能夠滿足部署需要。d)是否通過適配多種深度學(xué)習(xí)框架、操作系統(tǒng)、硬件架構(gòu)來(lái)保障系統(tǒng)的魯棒性。6.2.3公平性應(yīng)評(píng)估系統(tǒng)是否不存在歧視、偏見,是否通過設(shè)立公平性目標(biāo)等方式,有效降低可能存T/CFEII0020-20246在的歧視和偏見風(fēng)險(xiǎn)。可重點(diǎn)評(píng)估:a)是否根據(jù)實(shí)際應(yīng)用場(chǎng)景和需求明確設(shè)置公平性指標(biāo),如偏見、歧視。b)是否根據(jù)公平性目標(biāo)構(gòu)建包含不同特征的數(shù)據(jù)集,在訓(xùn)練過程中評(píng)估模型在不同群體之間的表現(xiàn)并不斷改進(jìn)。c)是否在上線前對(duì)模型公平性進(jìn)行測(cè)試(自我審查或第三方評(píng)估),確保模型在公平性敏感領(lǐng)域的輸出的差異性在可接受范圍內(nèi)。d)是否對(duì)模型開發(fā)、測(cè)試等人員進(jìn)行了無(wú)偏見培訓(xùn)和審查。e)是否對(duì)系統(tǒng)全生命周期中公平性指標(biāo)進(jìn)行持續(xù)跟蹤監(jiān)測(cè)。f)是否制定相關(guān)處理機(jī)制,對(duì)模型運(yùn)行中產(chǎn)生的公平性問題進(jìn)行及時(shí)改進(jìn)。6.2.4可追溯應(yīng)評(píng)估是否通過良好的版本管理,對(duì)模型不同版本的關(guān)鍵信息進(jìn)行記錄,提升系統(tǒng)開發(fā)訓(xùn)練、測(cè)試、調(diào)優(yōu)等全流程的可追溯性??芍攸c(diǎn)評(píng)估:a)是否對(duì)版本標(biāo)識(shí)與命名規(guī)范、版本控制工具、關(guān)鍵信息記錄、更新日志和注釋與定期備份和存檔等做出詳細(xì)規(guī)定。b)是否選擇適合的版本控制工具,用于管理模型的源代碼、配置文件和訓(xùn)練數(shù)據(jù)等,確保有效跟蹤和記錄模型版本的變更歷史。c)是否記錄每個(gè)模型版本的關(guān)鍵信息,包括但不限于:版本標(biāo)識(shí)和名稱、模型訓(xùn)練時(shí)間、模型架構(gòu)、訓(xùn)練數(shù)據(jù)集、參數(shù)和超參數(shù)設(shè)置、訓(xùn)練過程、性能評(píng)估指標(biāo)、更新記錄、作者和負(fù)責(zé)人等信息。d)是否對(duì)模型重要版本的源代碼和關(guān)鍵信息等進(jìn)行備份。6.2.5向善性應(yīng)評(píng)估模型是否進(jìn)行了價(jià)值觀對(duì)齊訓(xùn)練,與增進(jìn)人類福祉、促進(jìn)可持續(xù)發(fā)展的理念保持一致,對(duì)未成年人、老年人等群體友好??芍攸c(diǎn)評(píng)估:a)是否構(gòu)建或使用符合人類價(jià)值觀的數(shù)據(jù)集,通過人類反饋強(qiáng)化學(xué)習(xí)等方法進(jìn)行對(duì)齊訓(xùn)練,以使得模型更符合人類的主流價(jià)值觀。b)是否對(duì)人工智能可能對(duì)環(huán)境生態(tài)系統(tǒng)的可持續(xù)性產(chǎn)生的影響進(jìn)行預(yù)先評(píng)估。c)是否針對(duì)老年人、未成年人等特殊群體進(jìn)行優(yōu)化設(shè)計(jì),并按需求提供適老化模式、無(wú)障礙模式、青少年模式等以方便特殊群體使用。6.3性能性能維度主要評(píng)估系統(tǒng)功能實(shí)現(xiàn)的精準(zhǔn)性、在各類不同環(huán)境中運(yùn)行的可靠性、運(yùn)行結(jié)果的無(wú)害性。6.3.1精準(zhǔn)性應(yīng)評(píng)估是否對(duì)系統(tǒng)性能的精準(zhǔn)性進(jìn)行自測(cè)或第三方測(cè)試,確保系統(tǒng)達(dá)到一定的質(zhì)量要求。可重點(diǎn)評(píng)估:a)是否在系統(tǒng)上線前采取自測(cè)或第三方評(píng)估對(duì)模型精準(zhǔn)性進(jìn)行測(cè)試。b)若測(cè)試不達(dá)標(biāo),是否采取措施進(jìn)行改進(jìn),保障系統(tǒng)達(dá)到精準(zhǔn)性目標(biāo)。c)是否設(shè)置精度監(jiān)測(cè)機(jī)制以發(fā)現(xiàn)系統(tǒng)使用過程中精度下降問題,并采取相關(guān)措施,以保障系統(tǒng)精度穩(wěn)定。6.3.2可靠性應(yīng)評(píng)估是否對(duì)系統(tǒng)的可靠性進(jìn)行自測(cè)或第三方測(cè)試,確保系統(tǒng)達(dá)到一定的質(zhì)量要求。可重點(diǎn)評(píng)估:a)是否在系統(tǒng)上線前采用自測(cè)或第三方評(píng)估方式對(duì)系統(tǒng)可靠性進(jìn)行測(cè)試,以保障系統(tǒng)在各類環(huán)境下性能表現(xiàn)一致或接近。b)若測(cè)試不達(dá)標(biāo),是否采取措施進(jìn)行改進(jìn),保障系統(tǒng)達(dá)到可靠性標(biāo)準(zhǔn)。c)當(dāng)系統(tǒng)發(fā)生重大變化或重新訓(xùn)練模型時(shí),是否對(duì)系統(tǒng)可靠性進(jìn)行再次檢測(cè)。T/CFEII0020-202476.3.3無(wú)害性應(yīng)評(píng)估是否利用測(cè)試數(shù)據(jù)集對(duì)模型生成的內(nèi)容安全性進(jìn)行評(píng)測(cè)和審查,保障模型生成的內(nèi)容不存在敏感信息、虛假誤導(dǎo)、違反倫理道德等現(xiàn)象。可重點(diǎn)評(píng)估:a)是否在系統(tǒng)上線前采用自有測(cè)試數(shù)據(jù)集或第三方測(cè)試數(shù)據(jù)集對(duì)模型生成內(nèi)容的安全性進(jìn)行評(píng)測(cè),測(cè)試內(nèi)容包括但不限于敏感信息、虛假偽造、違反倫理道德等現(xiàn)象。b)若評(píng)測(cè)不達(dá)標(biāo),是否采取措施進(jìn)行改進(jìn),保障系統(tǒng)生成內(nèi)容達(dá)到無(wú)害性標(biāo)準(zhǔn)。c)當(dāng)系統(tǒng)發(fā)生重大變化或重新訓(xùn)練模型時(shí),是否對(duì)系統(tǒng)無(wú)害性進(jìn)行再次評(píng)測(cè)。6.4防御防御維度主要評(píng)估系統(tǒng)在軟硬件環(huán)境方面的安全性,對(duì)于各類攻擊的防范機(jī)制,對(duì)于系統(tǒng)輸入輸出內(nèi)容的審查過濾機(jī)制,以及在應(yīng)急情況下的響應(yīng)機(jī)制。6.4.1風(fēng)險(xiǎn)管理應(yīng)評(píng)估是否實(shí)施和落實(shí)了相關(guān)風(fēng)險(xiǎn)管理制度,在立項(xiàng)前、項(xiàng)目進(jìn)行中以及上線后系統(tǒng)地識(shí)別、分析和減輕風(fēng)險(xiǎn),并進(jìn)行持續(xù)監(jiān)測(cè)、驗(yàn)證和修正??芍攸c(diǎn)評(píng)估:a)是否按照ISO/IEC23894:2023(E)、ISO/IEC31000:2018(E)及ISO/IEC42001:2022(E)的要求開展人工智能風(fēng)險(xiǎn)管理并獲取相關(guān)認(rèn)證。b)是否在立項(xiàng)前對(duì)潛在安全風(fēng)險(xiǎn)進(jìn)行識(shí)別和分析,涵蓋系統(tǒng)對(duì)個(gè)人、組織、社會(huì)、環(huán)境等方面造成的影響,并采取預(yù)防措施。c)是否在項(xiàng)目進(jìn)行中持續(xù)進(jìn)行風(fēng)險(xiǎn)識(shí)別和分析,實(shí)施風(fēng)險(xiǎn)減輕措施,及時(shí)調(diào)整管理計(jì)劃。d)是否在系統(tǒng)上線前進(jìn)行安全風(fēng)險(xiǎn)審查,確保系統(tǒng)符合法律法規(guī)、行業(yè)標(biāo)準(zhǔn)、道德倫理等方面的要求。e)是否在系統(tǒng)上線后持續(xù)監(jiān)測(cè)風(fēng)險(xiǎn),修復(fù)漏洞并提升風(fēng)險(xiǎn)管理能力,保障安全運(yùn)行。6.4.2可信環(huán)境應(yīng)評(píng)估系統(tǒng)采用的開源框架、開發(fā)環(huán)境、基礎(chǔ)設(shè)施等軟硬件是否進(jìn)行安全檢查和測(cè)試。可重點(diǎn)評(píng)估:a)是否對(duì)系統(tǒng)開發(fā)的基礎(chǔ)設(shè)施的物理安全、網(wǎng)絡(luò)通信安全、計(jì)算環(huán)境安全、數(shù)據(jù)存儲(chǔ)安全等方面進(jìn)行檢查,確保具備全方位保障能力。b)是否對(duì)系統(tǒng)開發(fā)環(huán)境進(jìn)行安全配置和檢查,并實(shí)施訪問權(quán)限控制。c)是否對(duì)所使用的開源框架進(jìn)行漏洞審查,持續(xù)監(jiān)控相關(guān)安全風(fēng)險(xiǎn),并及時(shí)采取補(bǔ)救措施。d)是否對(duì)系統(tǒng)的供應(yīng)鏈安全性進(jìn)行評(píng)估,保障系統(tǒng)運(yùn)行的穩(wěn)定性,如人工智能芯片、服務(wù)器等。6.4.3攻擊防范應(yīng)評(píng)估是否采取有效措施應(yīng)對(duì)人工智能系統(tǒng)潛在風(fēng)險(xiǎn)和可能遭遇的攻擊,包括對(duì)抗樣本、逆向還原、數(shù)據(jù)投毒、后門攻擊等。可重點(diǎn)評(píng)估:a)是否對(duì)系統(tǒng)進(jìn)行對(duì)抗性的訓(xùn)練和測(cè)試,研究和應(yīng)用防御算法和技術(shù),提升模型抵御攻擊的能力。b)是否建立了系統(tǒng)攻擊監(jiān)測(cè)機(jī)制,能夠?qū)ο到y(tǒng)攻擊事件進(jìn)行及時(shí)識(shí)別并記錄。c)系統(tǒng)是否具備自防御能力,能夠自動(dòng)應(yīng)對(duì)相關(guān)攻擊或及時(shí)預(yù)警。d)是否及時(shí)了解最新的攻擊技術(shù)和趨勢(shì),不斷學(xué)習(xí)和分享防御實(shí)踐和經(jīng)驗(yàn)。6.4.4控制機(jī)制應(yīng)評(píng)估系統(tǒng)運(yùn)行過程中是否受到人工監(jiān)督并在必要情況下及時(shí)進(jìn)行干預(yù),是否對(duì)用戶輸入內(nèi)容和模型輸出內(nèi)容設(shè)置審查過濾機(jī)制,采取有效措施防止模型出現(xiàn)負(fù)面及錯(cuò)誤內(nèi)容??芍攸c(diǎn)評(píng)估:a)人工智能系統(tǒng)決策全程或關(guān)鍵環(huán)節(jié)是否有人工參與,相關(guān)人員是否能夠在必要時(shí)對(duì)T/CFEII0020-20248系統(tǒng)進(jìn)行控制。b)系統(tǒng)是否具備可控性設(shè)置,允許管理員調(diào)整模型參數(shù)以適應(yīng)特定需求。c)是否對(duì)系統(tǒng)的關(guān)鍵決策設(shè)置人工審核和確認(rèn)機(jī)制。d)是否對(duì)人工智能系統(tǒng)可能產(chǎn)生的錯(cuò)誤設(shè)置補(bǔ)救機(jī)制。e)是否設(shè)置緊急停止功能以應(yīng)對(duì)人工智能系統(tǒng)失控的情況。f)是否建立審查過濾機(jī)制,對(duì)用戶輸入內(nèi)容進(jìn)行審查,主動(dòng)規(guī)避價(jià)值誘導(dǎo)性輸入,避免倫理風(fēng)險(xiǎn)。g)是否建立審查過濾機(jī)制,對(duì)模型輸出進(jìn)行審查,防止模型輸出有悖道德倫理或與事實(shí)不符的內(nèi)容。h)是否建立用戶反饋校準(zhǔn)機(jī)制,在用戶交互界面,設(shè)置反饋功能,及時(shí)處理違背道德倫理、引起個(gè)人不適的內(nèi)容。6.4.5應(yīng)急計(jì)劃應(yīng)評(píng)估是否實(shí)施和落實(shí)了風(fēng)險(xiǎn)監(jiān)測(cè)機(jī)制和應(yīng)急響應(yīng)計(jì)劃,包括異常情況出現(xiàn)時(shí)中斷系統(tǒng)以及避免負(fù)面影響的相應(yīng)機(jī)制??芍攸c(diǎn)評(píng)估:a)是否建立異常狀況監(jiān)測(cè)預(yù)警機(jī)制,能夠?qū)ο到y(tǒng)運(yùn)行狀態(tài)、異常事件等進(jìn)行實(shí)時(shí)監(jiān)測(cè)、預(yù)警和報(bào)告。b)是否對(duì)安全日志的記錄內(nèi)容和保留期限進(jìn)行明確要求,以便對(duì)潛在的安全威脅進(jìn)行監(jiān)控和分析。c)是否制定了應(yīng)急響應(yīng)計(jì)劃,明確系統(tǒng)故障、數(shù)據(jù)泄露、網(wǎng)絡(luò)攻擊等應(yīng)急情況的處理步驟和分工。d)是否通過應(yīng)急演練、人員培訓(xùn)等活動(dòng)使項(xiàng)目團(tuán)隊(duì)成員熟悉應(yīng)急響應(yīng)流程,掌握必要的技能。e)是否有專門的應(yīng)急響應(yīng)團(tuán)隊(duì)負(fù)責(zé)事件響應(yīng)和處理,及時(shí)發(fā)現(xiàn)和應(yīng)對(duì)安全威脅。f)是否制定數(shù)據(jù)備份和恢復(fù)機(jī)制,定期備份重要數(shù)據(jù),并在異常情況發(fā)生時(shí)能夠及時(shí)恢復(fù)數(shù)據(jù),保障系統(tǒng)迅速恢復(fù)正常運(yùn)行。6.5溝通溝通維度主要評(píng)估系統(tǒng)在運(yùn)行過程中是否采取措施保障用戶合理使用,并建立了良好的信息披露和溝通反饋機(jī)制。6.5.1規(guī)范使用應(yīng)評(píng)估是否明確規(guī)定系統(tǒng)的用途和限制范圍,采取相關(guān)措施保障用戶合理使用。是否對(duì)模型輸出的內(nèi)容添加數(shù)字水印或顯著標(biāo)識(shí)。可重點(diǎn)評(píng)估:a)是否明確系統(tǒng)的適用人群、用途與限制范圍,并以顯著方式公開,提醒用戶在使用時(shí)及第三方在開發(fā)時(shí)注意規(guī)范性。b)是否通過手機(jī)驗(yàn)證碼等方式進(jìn)行用戶身份驗(yàn)證,確保只有授權(quán)用戶才能訪問和使用。c)是否對(duì)模型輸出的內(nèi)容添加水印或顯著標(biāo)識(shí),防止惡意傳播和使用。d)是否對(duì)用戶提供使用人工智能系統(tǒng)的培訓(xùn)和宣傳,增強(qiáng)規(guī)范使用的意識(shí)和能力。6.5.2交互反饋應(yīng)評(píng)估系統(tǒng)是否向披露了訓(xùn)練數(shù)據(jù)、算法模型的相關(guān)信息,并為利益相關(guān)者提供溝通、反饋、投訴渠道。可重點(diǎn)評(píng)估:a)是否在系統(tǒng)設(shè)計(jì)、開發(fā)全生命周期過程中引入利益相關(guān)者參與,定期進(jìn)行調(diào)查與溝通,收集利益相關(guān)者對(duì)系統(tǒng)的看法、期望和改進(jìn)建議。b)是否建立人工智能模型基本信息披露機(jī)制,以清晰、易懂、充分的方式,向用戶提供數(shù)據(jù)的基本屬性、算法機(jī)制機(jī)理、系統(tǒng)運(yùn)行邏輯、潛在風(fēng)險(xiǎn)情況等信息。c)是否建立人工智能模型評(píng)測(cè)信息披露機(jī)制,向用戶披露模型的準(zhǔn)確性、魯棒性、安全性、公平性、可解釋性等相關(guān)維度的評(píng)估情況。d)是否設(shè)置提醒機(jī)制,向用戶告知其正在與人工智能系統(tǒng)進(jìn)行交互,并為用戶提供便T/CFEII0020-20249捷的退出選擇機(jī)制。e)是否設(shè)置反饋機(jī)制,向用戶提供便捷的反饋與投訴渠道,并及時(shí)處理相關(guān)問題。6.6責(zé)任責(zé)任維度主要評(píng)估是否建立了明確的責(zé)任體系和追責(zé)機(jī)制,有效管理了各類風(fēng)險(xiǎn),并定期開展了相關(guān)教育培訓(xùn)以提升風(fēng)險(xiǎn)管理責(zé)任意識(shí)。6.6.1職責(zé)確立應(yīng)評(píng)估是否建立了明確的責(zé)任體系,明確定義了人工智能系統(tǒng)涉及的人員角色、職責(zé)、分工;是否建立追責(zé)機(jī)制,以確保問責(zé)制度有效落實(shí)。可重點(diǎn)評(píng)估:a)是否對(duì)人工智能系統(tǒng)涉及的所有或相關(guān)核心崗位(包括但不限于高級(jí)管理人員、項(xiàng)目管理人員、產(chǎn)品經(jīng)理、設(shè)計(jì)人員、開發(fā)人員、數(shù)據(jù)管理人員等),設(shè)置人工智能安全風(fēng)險(xiǎn)管理的崗位職責(zé)。b)高級(jí)管理人員是否確保組織對(duì)人工智能安全風(fēng)險(xiǎn)管理工作的支持,制定和推動(dòng)全面的安全策略,保障人工智能安全政策的執(zhí)行。c)人工智能項(xiàng)目管理人員是否將人工智能安全納入項(xiàng)目管理的范圍,在項(xiàng)目進(jìn)行過程中對(duì)相關(guān)安全風(fēng)險(xiǎn)進(jìn)行管理,保障項(xiàng)目的交付與運(yùn)行中的安全可信。d)人工智能項(xiàng)目產(chǎn)品經(jīng)理是否保障系統(tǒng)需求分析和功能設(shè)計(jì)滿足安全要求,與團(tuán)隊(duì)合作提升系統(tǒng)安全性,對(duì)產(chǎn)品功能進(jìn)行安全性評(píng)估,并持續(xù)改進(jìn)產(chǎn)品功能上的安全性。e)人工智能系統(tǒng)的設(shè)計(jì)人員是否在產(chǎn)品設(shè)計(jì)階段充分考慮安全風(fēng)險(xiǎn),將治理原則落實(shí)到產(chǎn)品設(shè)計(jì)中,為系統(tǒng)設(shè)置合理、明確的、可持續(xù)的目標(biāo)。f)人工智能系統(tǒng)的開發(fā)人員是否在系統(tǒng)開發(fā)階段充分考慮安全風(fēng)險(xiǎn),將治理原則落實(shí)到產(chǎn)品開發(fā)中,對(duì)所采用模型、編寫代碼的安全性負(fù)責(zé),及時(shí)應(yīng)用安全更新,及時(shí)做好文檔和日志記錄,積極響應(yīng)安全事件。g)人工智能系統(tǒng)的數(shù)據(jù)管理人員是否在數(shù)據(jù)管理全流程中充分考慮安全風(fēng)險(xiǎn),對(duì)數(shù)據(jù)完整性、準(zhǔn)確性等進(jìn)行測(cè)試,準(zhǔn)確記錄相關(guān)數(shù)據(jù)操作,監(jiān)督其他人員對(duì)數(shù)據(jù)的使用。h)是否設(shè)置專門的安全審查員,統(tǒng)籌系統(tǒng)設(shè)計(jì)、開發(fā)、運(yùn)行等過程中的安全風(fēng)險(xiǎn)管理工作,負(fù)責(zé)對(duì)系統(tǒng)安全性進(jìn)行審查和評(píng)估。i)是否對(duì)相關(guān)崗位人員因未按規(guī)定履行職責(zé)產(chǎn)生安全風(fēng)險(xiǎn)時(shí)應(yīng)負(fù)的責(zé)任作出規(guī)定。j)是否建立追責(zé)機(jī)制,確保在系統(tǒng)運(yùn)行出現(xiàn)問題時(shí)能夠追溯到相關(guān)責(zé)任人。6.6.2人員培訓(xùn)應(yīng)評(píng)估是否對(duì)相關(guān)人員進(jìn)行人工智能安全風(fēng)險(xiǎn)管理意識(shí)教育和培訓(xùn),使其能夠按照相關(guān)政策、程序和協(xié)議履行職責(zé)。可重點(diǎn)評(píng)估:a)系統(tǒng)設(shè)計(jì)、開發(fā)、訓(xùn)練、測(cè)試、部署,數(shù)據(jù)采集、標(biāo)注、處理、管理等所有相關(guān)人員是否參與人工智能安全風(fēng)險(xiǎn)種類與應(yīng)對(duì)措施、崗位人工智能安全風(fēng)險(xiǎn)責(zé)任、相關(guān)法律法規(guī)等方面的培訓(xùn),具備人工智能安全風(fēng)險(xiǎn)管理意識(shí)。b)是否對(duì)系統(tǒng)開發(fā)人員進(jìn)行安全培訓(xùn),提高其人工智能安全技能水平。c)是否對(duì)數(shù)據(jù)標(biāo)注人員進(jìn)行專業(yè)培訓(xùn),培訓(xùn)內(nèi)容應(yīng)包括標(biāo)注指南、質(zhì)量控制以及數(shù)據(jù)隱私保護(hù)要求,保障標(biāo)注的準(zhǔn)確性和安全性。T/CFEII0020-2024附錄A人工智能融合應(yīng)用安全可信度評(píng)估分級(jí)方法A.1概述本附錄基于本標(biāo)準(zhǔn)的評(píng)估框架、評(píng)價(jià)方法及評(píng)估內(nèi)容,進(jìn)一步給出人工智能安全可信度評(píng)估指標(biāo)體系構(gòu)建、加權(quán)評(píng)分方法和分級(jí)判定參考等,以便于本標(biāo)準(zhǔn)的應(yīng)用和推廣。評(píng)估指標(biāo)體系構(gòu)建可按照評(píng)估內(nèi)容展開,依據(jù)評(píng)估內(nèi)容逐層細(xì)化并設(shè)立對(duì)應(yīng)評(píng)估指標(biāo)?;谥笜?biāo)體系中底層指標(biāo)所采集的評(píng)估數(shù)據(jù),可采用加權(quán)評(píng)分方法對(duì)各級(jí)評(píng)估指標(biāo)進(jìn)行定量評(píng)分。分級(jí)判定參考給出了人工智能系統(tǒng)各級(jí)安全可信度評(píng)價(jià)的總體參考標(biāo)準(zhǔn)。A.2評(píng)估指標(biāo)體系構(gòu)建A.2.1構(gòu)建原則按照本標(biāo)準(zhǔn)要求,評(píng)估指標(biāo)體系構(gòu)建應(yīng)遵循以下原則:a)評(píng)估指標(biāo)體系應(yīng)與本標(biāo)準(zhǔn)評(píng)估內(nèi)容的層次結(jié)構(gòu)相對(duì)應(yīng),建議可按照三級(jí)指標(biāo)構(gòu)建。本標(biāo)準(zhǔn)的一級(jí)評(píng)估內(nèi)容:數(shù)據(jù)、模型、性能、防御、溝通、責(zé)任可作為指標(biāo)體系的一級(jí)指標(biāo)。本標(biāo)準(zhǔn)的二級(jí)評(píng)估內(nèi)容:如數(shù)據(jù)的代表性、準(zhǔn)確性、無(wú)偏性等可作為指標(biāo)體系相應(yīng)的二級(jí)指標(biāo)。本標(biāo)準(zhǔn)二級(jí)評(píng)估內(nèi)容下的具體內(nèi)容可用于設(shè)計(jì)三級(jí)評(píng)估指標(biāo)。b)評(píng)估指標(biāo)體系一級(jí)和二級(jí)指標(biāo)原則上與本標(biāo)準(zhǔn)的一、二級(jí)評(píng)估內(nèi)容相對(duì)應(yīng),三級(jí)指標(biāo)建議基本按照本標(biāo)準(zhǔn)相應(yīng)評(píng)估內(nèi)容設(shè)定,可依據(jù)需求進(jìn)行適度調(diào)整和補(bǔ)充。c)一般情況下,為提高可操作性,各主體最終確定并用于實(shí)際測(cè)評(píng)的評(píng)估指標(biāo)體系應(yīng)在滿足應(yīng)用需求的前提下盡量簡(jiǎn)化。A.2.2構(gòu)建步驟按照本標(biāo)準(zhǔn)要求,評(píng)估指標(biāo)體系構(gòu)建可采用如下步驟:a)按照評(píng)估主體的特色,基于本標(biāo)準(zhǔn)的評(píng)估框架、評(píng)估方法與評(píng)估內(nèi)容,選擇、修訂各級(jí)評(píng)估內(nèi)容,對(duì)部分評(píng)估內(nèi)容進(jìn)行必要調(diào)整、補(bǔ)充或細(xì)化。b)對(duì)照本標(biāo)準(zhǔn)各級(jí)評(píng)估內(nèi)容的層次結(jié)構(gòu)構(gòu)建評(píng)估指標(biāo)體系。c)結(jié)合評(píng)估主體的需求,參考專家知識(shí)和經(jīng)驗(yàn),對(duì)指標(biāo)進(jìn)行必要的調(diào)整;d)在必要情況下,重復(fù)上述步驟,構(gòu)建完成評(píng)估指標(biāo)體系。A.3加權(quán)評(píng)分方法A.3.1權(quán)重設(shè)置評(píng)估指標(biāo)體系中各級(jí)指標(biāo)的權(quán)重設(shè)置應(yīng)遵循或借鑒如下方面:a)面向不同主體開展評(píng)估時(shí),各主體一級(jí)指標(biāo)的權(quán)重原則上應(yīng)保持一致,二級(jí)指標(biāo)的權(quán)重建議視不同類型主體(如生成式人工智能與非生成式人工智能)使用情況略作調(diào)整,三級(jí)標(biāo)權(quán)重可按照本主體的特色和需求分別進(jìn)行設(shè)置。b)原則上總分為100分制,建議數(shù)據(jù)維度25分,模型維度20分、性能維度20分、防御維度20分、溝通維度5分、責(zé)任維度10分,六大一級(jí)指標(biāo)滿分加總為100分。c)設(shè)置權(quán)重時(shí)需考慮指標(biāo)對(duì)被評(píng)估主體開展人工智能安全可信管理工作的相對(duì)重要程度。d)可采用德爾菲法(Delphi)、層次分析法(AHP)或網(wǎng)絡(luò)分析法(ANP)等進(jìn)行輔助決策。e)應(yīng)在一定時(shí)期內(nèi)保持相對(duì)穩(wěn)定。A.3.2加權(quán)評(píng)分按照指標(biāo)體系進(jìn)行評(píng)分時(shí)應(yīng)遵循或借鑒如下方面:a)三級(jí)指標(biāo)的評(píng)分可設(shè)置為若干獨(dú)立的選項(xiàng),不同選項(xiàng)代表不同分值,由專家確定各選項(xiàng)分值,該指標(biāo)得分即為所選選項(xiàng)分值。b)在三級(jí)指標(biāo)評(píng)分基礎(chǔ)上,二級(jí)指標(biāo)得分可通過加權(quán)求和計(jì)算得出。一級(jí)指標(biāo)得分可T/CFEII0020-2024由二級(jí)指標(biāo)得分加權(quán)求和得出。最終總分可由各一級(jí)指標(biāo)得分加權(quán)求和得出,滿分為一百分。c)總分60分及以下或單項(xiàng)一級(jí)指標(biāo)低于50分建議為人工智能安全可信度一級(jí),總分61分-70分建議為人工智能安全可信度二級(jí),總分71分-80分建議為人工智能安全可信度三級(jí),總分81分-90分建議為人工智能安全可信度四級(jí),總分91分-100分建議為人工智能安全可信度五級(jí)。A.4分級(jí)判定參考A.4.1人工智能融合應(yīng)用安全可信度一級(jí)人工智能安全風(fēng)險(xiǎn)管理意識(shí)一般,對(duì)人工智能系統(tǒng)開展了零散、被動(dòng)的安全可信管理工作。a)人工智能安全風(fēng)險(xiǎn)尚未引起重視。b)尚未開展主動(dòng)的人工智能安全可信管理活動(dòng),僅在必要時(shí)進(jìn)行被動(dòng)響應(yīng)。A.4.2人工智能融合應(yīng)用安全可信度二級(jí)具有一定人工智能安全風(fēng)險(xiǎn)管理意識(shí),對(duì)人工智能系統(tǒng)開展了一定安全可信管理工作,主要依據(jù)經(jīng)驗(yàn)進(jìn)行管理,覆蓋人工智能系統(tǒng)涉及的部分環(huán)節(jié),初步具備一定的主動(dòng)應(yīng)對(duì)能力。a)考慮到了人工智能的安全風(fēng)險(xiǎn)問題,初步具有一定的管理意識(shí)。b)基于相關(guān)工作人員的經(jīng)驗(yàn)和技能開展了部分人工智能安全可信管理活動(dòng)。c)初步建立了一些人工智能安全可信管理規(guī)范和制度,覆蓋了人工智能系統(tǒng)生命周期的一些環(huán)節(jié)。d)對(duì)數(shù)據(jù)、模型和系統(tǒng)面臨的安全性問題進(jìn)行了考慮和分析,有效管理了部分風(fēng)險(xiǎn)。e)系統(tǒng)性能能夠較好地滿足使用需要。A.4.3人工智能融合應(yīng)用安全可信度三級(jí)具有較高的人工智能安全風(fēng)險(xiǎn)管理意識(shí),對(duì)人工智能系統(tǒng)開展了較多的安全可信管理工作,對(duì)管理規(guī)則和方法進(jìn)行了一定主動(dòng)設(shè)計(jì),覆蓋了人工智能系統(tǒng)涉及的多個(gè)環(huán)節(jié),能夠較好地實(shí)現(xiàn)對(duì)風(fēng)險(xiǎn)的應(yīng)對(duì)處理。a)考慮到了人工智能的安全風(fēng)險(xiǎn)問題并給予了一定的重視,正在建立體系化認(rèn)識(shí)。b)主動(dòng)開展了一定人工智能安全可信管理工作,在人工智能系統(tǒng)生命周期的多個(gè)環(huán)節(jié)形成了一定實(shí)踐經(jīng)驗(yàn),能夠有效管理部分風(fēng)險(xiǎn)。c)建立了一定的人工智能安全可信管理規(guī)范和制度,采用了一些安全檢測(cè)工具,覆蓋了人工智能系統(tǒng)的多個(gè)環(huán)節(jié)。d)制定了數(shù)據(jù)管理相關(guān)規(guī)范和制度,著重考慮了數(shù)據(jù)的代表性、準(zhǔn)確性、無(wú)偏性等,在一定程度上實(shí)現(xiàn)了有效的數(shù)據(jù)管理。e)制定了模型開發(fā)相關(guān)規(guī)范和制度,著重考慮了模型的可解釋性、魯棒性、公平性等。f)制定了一定的性能測(cè)試評(píng)估制度,對(duì)系統(tǒng)性能進(jìn)行評(píng)估測(cè)試,保證系統(tǒng)具有較高的性能水平。g)制定了一定的安全防御制度,設(shè)置了審查過濾機(jī)制、可控運(yùn)行機(jī)制、應(yīng)急響應(yīng)機(jī)制,能夠?qū)ο鄳?yīng)安全風(fēng)險(xiǎn)進(jìn)行監(jiān)測(cè)。h)建立了一定的責(zé)任體系和追責(zé)機(jī)制,制定了人工智能安全風(fēng)險(xiǎn)管理制度,對(duì)人工智能系統(tǒng)的相關(guān)人員進(jìn)行了宣貫培訓(xùn)。A.4.4人工智能融合應(yīng)用安全可信度四級(jí)具有很高的人工智能安全風(fēng)險(xiǎn)管理意識(shí),對(duì)人工智能系統(tǒng)開展了足夠的安全可信管理工作,積累了較多成熟的實(shí)踐經(jīng)驗(yàn)和管理規(guī)則,覆蓋了人工智能系統(tǒng)的關(guān)鍵環(huán)節(jié),具有固化的管理流程和較為實(shí)用的工具方法,能夠很好地實(shí)現(xiàn)對(duì)風(fēng)險(xiǎn)的應(yīng)對(duì)處理。a)考慮到了人工智能的安全風(fēng)險(xiǎn)問題并給予很高的重視,初步具備體系化認(rèn)識(shí)。b)主動(dòng)開展了較多人工智能安全可信管理工作,在人工智能系統(tǒng)生命周期的所有關(guān)鍵環(huán)節(jié)均形成一定實(shí)踐經(jīng)驗(yàn),能夠有效管理絕大多數(shù)風(fēng)險(xiǎn)。c)建立了較為全面的人工智能安全可信管理規(guī)范和制度,采用了較多標(biāo)準(zhǔn)化的管理、T/CFEII0020-2024檢測(cè)、評(píng)估工具,覆蓋了人工智能系統(tǒng)的所有關(guān)鍵環(huán)節(jié)。d)制定了數(shù)據(jù)管理相關(guān)規(guī)范和制度,采用了標(biāo)準(zhǔn)化的數(shù)據(jù)管理工具或測(cè)試評(píng)估工具。進(jìn)行了自測(cè)或第三方測(cè)試,保障數(shù)據(jù)在代表性、準(zhǔn)確性、無(wú)偏性、可追溯性、合規(guī)性等方面符合一定要求或達(dá)到一定標(biāo)準(zhǔn)。e)制定了模型開發(fā)相關(guān)規(guī)范和制度,采用了標(biāo)準(zhǔn)化的模型管理工具或測(cè)試評(píng)估工具,開展了一定的版本管理。進(jìn)行了自測(cè)或第三方測(cè)試,保障模型在可解釋性、魯棒性、公平性、可追溯性、向善性等方面符合一定要求或達(dá)到一定標(biāo)準(zhǔn)。f)制定了性能測(cè)試評(píng)估制度,在系統(tǒng)上線前或發(fā)生重大變化時(shí),對(duì)系統(tǒng)性能(包括但不限于精準(zhǔn)性、
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 經(jīng)濟(jì)發(fā)展中的創(chuàng)新生態(tài)系統(tǒng)構(gòu)建試題及答案
- 量化交易系統(tǒng)設(shè)計(jì)試題及答案
- 計(jì)算機(jī)二級(jí)VB考試考生指南試題及答案
- 2025年軟考設(shè)計(jì)師解答技巧試題及答案
- 行政管理學(xué)專業(yè)中的研究方法試題及答案
- 行政法學(xué)問題解析試題及答案總結(jié)
- 年度市場(chǎng)推廣戰(zhàn)略的制定計(jì)劃
- 財(cái)務(wù)預(yù)算工作匯報(bào)
- VB程序設(shè)計(jì)常見題庫(kù)及答案
- 【蘇州】2025年江蘇蘇州市吳中區(qū)事業(yè)單位公開招聘工作人員93人筆試歷年典型考題及考點(diǎn)剖析附帶答案詳解
- 運(yùn)輸供應(yīng)商年度評(píng)價(jià)表
- 2023年海南省財(cái)金集團(tuán)有限公司招聘筆試題庫(kù)及答案解析
- 信息系統(tǒng)項(xiàng)目管理師論文8篇
- 北京中考英語(yǔ)詞匯表(1600詞匯)
- 超市消防監(jiān)控系統(tǒng)設(shè)計(jì)
- 封樣管理規(guī)定
- 黃腐酸鉀項(xiàng)目可行性研究報(bào)告-用于立項(xiàng)備案
- 管理人員責(zé)任追究制度
- 自動(dòng)旋轉(zhuǎn)門PLC控制
- 電影場(chǎng)記表(雙機(jī)位)
- 畢設(shè)高密電法探測(cè)及數(shù)據(jù)處理解釋
評(píng)論
0/150
提交評(píng)論