標準解讀
《GB/T 45288.3-2025 人工智能 大模型 第3部分:服務能力成熟度評估》是一項國家標準,旨在為評估人工智能大模型的服務能力提供一套系統化的框架。該標準適用于各類基于大規模數據訓練的人工智能模型,包括但不限于自然語言處理、計算機視覺等領域的大規模預訓練模型。
標準首先定義了“服務能力”的概念,指出其不僅涵蓋模型的準確性、穩定性等技術性能指標,還包括用戶友好性、可訪問性等非技術因素。接著,提出了一個五級的能力成熟度模型,從低到高分別為初始級、基礎級、進階級、高級和卓越級。每一級別都詳細描述了相應的特征與要求,幫助企業或機構定位自身所處階段,并明確提升方向。
對于如何進行評估,《GB/T 45288.3-2025》提出了一套完整的流程指南,包括準備階段(確定目標、組建團隊)、實施階段(選擇方法論、收集證據)以及報告階段(分析結果、編寫報告)。此外,還特別強調了在整個過程中應遵循的原則,如客觀公正、持續改進等。
在具體指標方面,該標準列出了多個維度來衡量大模型的服務能力,比如功能完整性、響應速度、安全性保障、隱私保護措施等。每個維度下又細分出若干子項,確保評估過程全面而細致。同時,也鼓勵采用定量與定性相結合的方式來進行綜合評價,以獲得更準確的結果。
如需獲取更多詳盡信息,請直接參考下方經官方授權發布的權威標準文檔。
....
查看全部
- 現行
- 正在執行有效
- 2025-01-24 頒布
- 2025-01-24 實施





文檔簡介
ICS35240
CCSL.70
中華人民共和國國家標準
GB/T452883—2025
.
人工智能大模型
第3部分服務能力成熟度評估
:
Artificialintelligence—Large-scalemodel—
Part3Servicecaabilitmaturitassessment
:pyy
2025-01-24發布2025-01-24實施
國家市場監督管理總局發布
國家標準化管理委員會
GB/T452883—2025
.
目次
前言
…………………………Ⅲ
引言
…………………………Ⅳ
范圍
1………………………1
規范性引用文件
2…………………………1
術語和定義
3………………1
縮略語
4……………………1
概述
5………………………2
大模型服務類型
5.1……………………2
服務能力框架
5.2………………………2
評估指標
6…………………3
大模型平臺
6.1…………………………3
大模型開發定制
6.2……………………7
大模型推理及運營
6.3…………………9
成熟度分級規則
7…………………………11
成熟度等級
7.1…………………………11
能力要求
7.2……………12
成熟度評估方法
8…………………………13
評分方法
8.1……………13
評估域權重
8.2…………………………13
計算方法
8.3……………13
成熟度等級判定
8.4……………………14
Ⅰ
GB/T452883—2025
.
前言
本文件按照標準化工作導則第部分標準化文件的結構和起草規則的規定
GB/T1.1—2020《1:》
起草
。
本文件是人工智能大模型的第部分已經發布了以下部分
GB/T45288《》3,GB/T45288:
第部分通用要求
———1:;
第部分評測指標與方法
———2:;
第部分服務能力成熟度評估
———3:。
請注意本文件的某些內容可能涉及專利本文件的發布機構不承擔識別專利的責任
。。
本文件由全國信息技術標準化技術委員會提出并歸口
(SAC/TC28)。
本文件起草單位中國電子技術標準化研究院華為技術有限公司浪潮云信息技術股份公司清華
:、、、
大學華為云計算技術有限公司中國科學院自動化研究所北京百度網訊科技有限公司深圳市騰訊計
、、、、
算機系統有限公司菲特天津檢測技術有限公司北京奇虎科技有限公司北京航空航天大學國能信
、()、、、
息技術有限公司麒麟合盛網絡技術股份有限公司上海市人工智能行業協會上海燧原科技股份有限
、、、
公司阿里云計算有限公司平頭哥上海半導體技術有限公司上海計算機軟件技術開發中心浙江大
、、()、、
華技術股份有限公司青島海信電子技術服務有限公司上海人工智能研究院有限公司南方電網人工
、、、
智能科技有限公司航天信息股份有限公司廣東電網有限責任公司北京大學長沙計算與數字經濟研
、、、
究院北京大學中國科學院軟件研究所螞蟻科技集團股份有限公司中國移動通信集團有限公司
、、、、、
馬上消費金融股份有限公司深圳云天勵飛技術股份有限公司深圳思謀信息科技有限公司北京格靈
、、、
深瞳信息技術股份有限公司中國南方電網有限責任公司超高壓輸電公司北京軟件產品質量檢測檢驗
、、
中心有限公司中國電力科學研究院有限公司上海文鰩信息科技有限公司浪潮軟件科技有限公司
、、、、
浪潮電子信息產業股份有限公司浪潮軟件集團有限公司中電科大數據研究院有限公司上海商湯智
、、、
能科技有限公司中國電信集團有限公司科大訊飛股份有限公司中國電信股份有限公司北京研究院
、、、、
中移蘇州軟件技術有限公司中國科學院新疆理化技術研究所杭州海康威視數字技術股份有限公
()、、
司上海文鰩信息科技有限公司西北工業大學云知聲智能科技股份有限公司北京工業大學北京智
、、、、、
芯微電子科技有限公司
。
本文件主要起草人徐洋馬珊珊于超王莞爾董建陶建華曹曉琦鮑薇黃現翠馬騁昊
:、、、、、、、、、、
鄭佳佳鄭子木朱貴波王金橋劉靜汪群博楊旭馬同森靳偉劉海濤曹彬張向征任海峰
、、、、、、、、、、、、、
劉祥龍劉艾杉張旭陳曦趙春昊蔣燕梅敬青彭駿濤張藝伯陳敏剛孔維生劉微劉常昱
、、、、、、、、、、、、、
宋海濤任正國邵彥寧劉佳寧周昊楊超孟令中孫曦金鏑李寬王志芳呂江波胡全一王寧
、、、、、、、、、、、、、、
王志剛孔昊莫文昊仲凱韜王珂琛劉璐張天霖蔣慧劉敬謙劉威辰高建清孟建舒玨淋
、、、、、、、、、、、、、
商興宇李旭東楊雅婷鐘凱倫仲凱韜張濤梁家恩劉崢鄭哲武姍姍
、、、、、、、、、。
Ⅲ
GB/T452883—2025
.
引言
大模型已成為人工智能發展的重要技術手段在引領產業變革中發揮重要作用國內外人工智能相
,,
關機構相繼研究開發百余種大模型產品和評測榜單導致用戶難以有效評價人工智能產品的技術水平
,
和服務能力旨在規定通用大模型的技術要求評測指標和服務能力擬由五個部分
。GB/T45288、,
構成
。
第部分通用要求目的在于確立大模型的參考架構規定通用技術要求
———1:。,。
第部分評測指標與方法目的在于確立大模型的評測指標描述評測方法
———2:。,。
第部分服務能力成熟度評估目的在于給出大模型服務能力成熟度等級及評估方法
———3:。。
第部分計算機視覺大模型目的在于定義計算機視覺大模型的概念和功能規定技術要求
———4:。,
和測試方法
。
第部分多模態大模型目的在于定義多模態大模型的概念和功能規定技術要求和測試
———5:。,
方法
。
Ⅳ
GB/T452883—2025
.
人工智能大模型
第3部分服務能力成熟度評估
:
1范圍
本文件給出了大模型服務能力框架和評估指標描述了大模型服務能力成熟度等級劃分及評估
,
方法
。
本文件適用于服務提供方和需求方對大模型平臺模型定制及推理運營服務的能力進行全面評估
、,
也適用于指導大模型服務能力的規劃設計和實現
、。
2規范性引用文件
下列文件中的內容通過文中的規范性引用而構成本文件必不可少的條款其中注日期的引用文
。,
件僅該日期對應的版本適用于本文件不注日期的引用文件其最新版本包括所有的修改單適用于
,;,()
本文件
。
信息技術人工智能平臺計算資源規范
溫馨提示
- 1. 本站所提供的標準文本僅供個人學習、研究之用,未經授權,嚴禁復制、發行、匯編、翻譯或網絡傳播等,侵權必究。
- 2. 本站所提供的標準均為PDF格式電子版文本(可閱讀打印),因數字商品的特殊性,一經售出,不提供退換貨服務。
- 3. 標準文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質量問題。
最新文檔
- 養生房轉讓合同樣本
- 倉庫物資轉讓合同樣本
- 公司領導合同樣本
- 企業變更勞動合同樣本
- 班主任的心理健康教育實踐計劃
- 企業影視廣告代理合同標準文本
- 保障房轉租合同樣本
- 農場經營代養合同樣本
- 第20講 生物的遺傳與變異 2025年會考生物學專題練習(含答案)
- 住房質押合同標準文本
- 2024北京中學高二(下)期中數學試題及答案
- 榜樣的力量有一種力量叫榜樣的力量課件
- 防控醫療糾紛課件
- 陜西省扶風縣法門小學-小學班主任帶班方略【課件】
- 2025年超高功率大噸位電弧爐項目建議書
- 寵物殯葬創新創業
- 2025年第三屆天揚杯建筑業財稅知識競賽題庫附答案(801-900題)
- 2024年黑龍江出版集團招聘筆試真題
- 2024年4月27日浙江省事業單位招聘考試《職業能力傾向測驗》真題及答案
- 【初中歷史】遼宋夏金元時期經濟的繁榮 課件 2024-2025學年統編版七年級歷史下冊
- 2025-2030中國橄欖球行業市場全景調研及投資價值評估咨詢報告
評論
0/150
提交評論