




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
Q/LB.□XXXXX-XXXX網絡安全技術生成式人工智能數據標注安全規范范圍本標準規定了生成式人工智能訓練的數據標注基礎安全要求、數據標注規則安全要求、標注人員要求、數據標注核驗要求和標注安全測試方法。本標準適用于生成式人工智能數據標注方開展訓練數據標注活動,也可為生成式人工智能數據需求方對于數據標注進行檢查、驗收或第三方機構對數據標注進行安全性評估提供參考。規范性引用文件下列文件中的內容通過文中的規范性引用而構成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對應的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T42755-2023人工智能面向機器學習的數據標注規程術語和定義下列術語和定義適用于本文件。提示信息prompt引導生成式人工智能模型完成特定任務并提供合理輸出內容的輸入信息。響應信息response在生成式人工智能數據標注中,按照提示信息要求形成的符合人類認知的應答信息,用于訓練模型形成對提示信息輸出相應內容、模式或風格的響應的能力。
生成式人工智能數據標注generativeartificialdataannotation通過人工操作或使用自動化技術機制,基于對提示信息的響應信息內容,將特定信息如標簽、類別或屬性添加到文本、圖片、音頻、視頻或者其他數據樣本的過程。注:以下簡稱“數據標注”。
功能性數據標注functionaldataannotation用于訓練生成式人工智能模型具備完成特定任務能力的數據標注。
安全性數據標注securitydataannotation用于訓練生成式人工智能模型提升輸出響應信息安全性的數據標注。
微調訓練數據標注fine-tuningdataannotation訓練生成式人工智能模型具備完成特定任務或輸出安全響應信息能力的數據標注。
偏好數據標注comparisondataannotation針對同一個提示信息的正反例或多個不同的響應信息,標注人員根據偏好給出打分或者排序標注的數據標注,通過強化學習等方式提升生成式人工智能模型的性能或安全性。注:反例數據通過強化學習等學習范式,訓練模型降低輸出類似反例響應的概率。
標注規則annotationrules生成式人工智能模型數據標注時所遵循的方法、要求的統稱。
數據標注人員annotator執行標注任務、產出標注內容的人員。
標注審核人員annotationreviewer對初始化標注結果進行質量控制的人員。
標注仲裁人員annotationarbitrator當多名標注人員對同一標注對象的標注結果不一致或存在爭議時,負責給出最終標注結果的人員。
標注監督人員annotationsupervisor對標注活動進行監督,判定數據標注活動是否符合各項要求的人員。
數據標注方dataannotator組織數據標注人員開展數據標注活動、對標注質量有直接責任的人員或機構。
數據需求方datarequester提出數據標注需求的人員或機構。[來源:GB/T42755-2023,定義3.4]概述本文件定義了生成式人工智能數據標注安全的相關要求,具體包括:數據標注基礎安全要求:針對數據安全、標注工具安全、訪問控制和數據傳輸提出安全要求;數據標注規則安全要求:針對數據標注方制定生成式人工智能數據標注規則提出安全要求;標注人員要求:針對標注人員在培訓、選拔和管理等方面提出安全要求;數據標注核驗要求:針對生成式人工智能數據標注核驗提出安全要求。圖SEQ圖\*ARABIC1生成式人工智能數據標注安全框架圖數據標注基礎安全要求數據安全要求數據標注方應確保對標注數據的安全性,要求如下:應檢查標注數據是否包含敏感個人信息,采取必要措施對敏感個人信息進行匿名化處理;應實施數據訪問控制,限制對標注數據的訪問,只允許經過授權的標注人員訪問;應備份準備標注的數據,以防止數據丟失或損壞,同時確保備份數據的安全性;應監控和記錄準備標注的數據的訪問和修改記錄,以進行數據安全審計;當標注任務終止或完成時,應按照合同約定對數據進行相關處置;合同中如無相關要求,但涉及生物特征等敏感信息的,應按照相關法律要求刪除相關數據,并妥善處置其余數據。標注工具安全要求數據標注方應確保實施標注活動所采用工具的安全性,要求如下:應定期對標注平臺或框架進行安全評估,發現潛在的安全漏洞,及時進行修復,并詳細記錄漏洞發現及處置情況;應在安全的標注平臺或框架開展標注活動,宜采用國產化數據標注平臺或框架;應確保標注平臺或框架能詳細記錄用戶的操作和系統活動,以便在發生安全事件時進行調查;應確保日志包含足夠的詳細信息,以追蹤數據的處理歷史;對于集中開展的數據標注工作,應提供具有適當區域劃定和訪問控制的物理環境,以防止未授權人員進入標注區域,確保標注物理環境安全;對于非集中開展的數據標注工作,應確保每位標注人員所使用的標注設備安全和網絡傳輸通道安全;如在標注過程中使用自動化標注工具進行輔助標注,應使用符合我國相關法律法規要求的自動化標注工具。訪問控制安全要求數據標注方應建立訪問控制機制并采取相應安全控制措施,要求如下:應制定安全訪問控制策略,只有經過身份驗證和授權的人員可以訪問標注工具和準備標注的數據;應配置標注人員權限,標注人員只能訪問其分配的標注任務數據;對于因出現安全風險問題被取消標注資格的人員,應同時撤銷其標注工具和數據的訪問權限;應根據需要設置已完成標注數據的訪問和導出權限;宜對安全性標注數據在單獨數據庫中進行隔離存儲并配置獨立訪問控制策略。數據傳輸安全要求數據標注方應建立信息傳輸安全機制并采取相應安全控制措施,要求如下:應在標注活動各階段的所有數據傳輸使用安全傳輸協議;應明確有權執行數據傳輸的標注人員的范圍以及他們可以訪問的數據范圍;應采用獨立安全傳輸協議傳輸安全性標注數據。數據標注規則安全要求數據標注方制定標注規則的要求如下:標注規則應至少包括標注目標、數據格式、標注方法、質量指標等內容,生成式人工智能數據標注示例可參考附錄A;數據標注方應分別對功能性數據標注與安全性數據標注制定具體的標注規則,標注規則應至少覆蓋數據標注以及數據審核等環節;數據標注方應明確具體標注任務類型,對含有文本、圖片、音頻、視頻、時間序列等不同內容的標注任務,任務類型可參考附錄B;注:應符合GB/T42755-2023中5.1.1的數據需求方標注任務要求。功能性標注規則應能夠用于指導標注人員按照特定領域特點生產具備真實性、準確性、客觀性、多樣性的標注語料,包含正反例信息,使標注人員能夠依據標注規則正確執行標注任務;功能性標注規則應包含安全風險內容的識別方法及參考示例,能夠使標注人員依據標注規則判定安全風險提示信息,避免產生包含安全風險內容的響應信息標注;安全性標注規則應能夠指導標注人員圍繞語料及生成內容的主要安全風險進行標注;安全性標注規則中包含涉及安全風險內容的提示信息時的響應信息標注規則說明及參考示例,能夠使標注人員能夠依據標注規則給出安全合理的引導性響應信息標注;應包含不符合標注規則的標注的識別方法及參考示例,能夠使標注人員能夠依據標注規則及時動態重新或糾正標注內容;應包含對數據標注結果的質量及安全性核驗方法;應包含應對和處置標注過程中安全事件的應急響應和通知機制。標注人員要求標注人員安全培訓數據需求方與數據標注方應組織標注人員進行安全培訓,要求如下:培訓內容應至少包括數據標注規則安全要求、數據標注工具使用方法及安全要求、數據標注質量及安全性核驗方法、標注數據安全管理、典型安全風險場景及相關安全問題案例及識別方法、標注人員安全意識培訓等;應在培訓結束后組織標注人員進行安全考核,給予合格者標注上崗資格,對考核過程進行記錄,并留存記錄文檔;注:考核內容應包括標注規則理解能力、標注工具使用能力、安全風險判定能力、數據安全管理能力等。應定期組織重新培訓考核,暫停或取消不合格者的標注上崗資格。標注人員選拔數據標注方應開展標注人員選拔工作,要求如下:應按數據標注規模和標注任務需求,明確標注人員的數量和崗位職責,并根據任務實際情況動態調整;應按標注任務中的不同職責定位,劃分標注人員角色,包括數據標注人員、標注審核人員、標注仲裁人員、標注監督人員,并根據角色能力要求擇優選拔;應對各標注人員角色選拔過程進行記錄,并留存記錄文檔。標注人員管理數據標注方組織數據標注人員開展數據標注工作的要求如下:數據標注人員應按照數據標注規則及任務要求及時完成數據標注,提交數據標注結果由標注審核人員進行審查;標注審核人員應對數據標注結果進行核驗和質量把控,對標注質量不合格的數據,退回進行重新標注,對數據標注存在爭議或多人標注數據存在不一致的情況,提交標注仲裁人員進行仲裁,并保留審核記錄;對于多人標注數據存在不一致或數據存在爭議情況,標注仲裁人員應進行最終裁決判定,并保留仲裁記錄。裁定通過的,提交標注結果;裁定不通過的,退回進行重新標注;標注監督人員應對標注活動進行監督,對標注過程中不同角色人員的任務完成情況進行抽樣檢查;應對標注過程中發生的數據安全、傳輸安全等風險情況等進行及時發現處理,并保留風險發現及處置情況記錄;在同一項標注任務中,同一人員不應承擔多個角色任務。數據標注核驗要求基本要求數據標注方應對數據標注結果進行核驗,要求如下:宜保證微調訓練數據標注中的安全性標注比例不低于30%;注:該比例的計算方法為:安全性標注比例=應對標注結果進行核驗,核驗方式包括但不限于:人工核驗:通過標注審核人員對標注結果進行隨機抽樣核驗等方式,檢驗標注結果的質量和安全性;混合核驗:使用相關檢測算法或自動化標注工具自動驗證標注結果,自動檢測標注結果的質量和安全性問題,后續由人工對自動化核驗的結果通過采用隨機抽樣核驗等方式進行核驗。應對標注結果進行一定規模內容核驗,核驗內容包括但不限于:理解準確:確認標注結果清晰且符合問題意圖要求;識別并標注提示信息中的關鍵信息和隱形條件;問答一致:確保響應信息完全符合提示信息的約束條件和預期目標;保證質量:檢查并修正語法錯誤、用詞不當或風格不搭配的問題;避免語言使用和句式結構的重復,確保表達多樣性和清晰度。應對核驗發現的標注結果中的問題進行糾正或重新標注,并跟蹤糾正情況和處理結果;數據重新標注的要求如下:數據標注人員應對標注任務執行階段和標注結果輸出階段記錄的所有問題標注進行糾正;數據標注人員應逐條記錄標注糾正的詳細信息,包括原始標注人員信息、標注糾正人員信息、原始標注內容、糾正后的標注內容、原始標注時間、糾正標注時間等;標注審核人員應對糾正后的標注進行復核,復核通過的將糾正標注結果進行更新和歸檔,復核未通過的按需進行重新標注。應記錄每次核驗的詳細信息,包括審核人員信息、核驗時間、核驗結果和發現的問題;應形成并留存核驗報告,總結核驗結果,包括建議的改進措施和糾正措施等;應對標注數據核驗過程進行記錄并形成可查閱的記錄文檔。功能性標注核驗安全要求數據標注方應對功能性數據標注的標注質量及安全性進行評估核驗,要求包括擔不限于:功能性標注數據不應包含任何安全風險信息,主要安全風險可參考附錄C;標注數據中提示信息及響應信息在內容上應具備邏輯性、有效性,對于特定領域的應答需合理;標注數據應具備合理性、真實性、準確性、客觀性、多樣性等;響應信息內容應具備準確性、有用性、時效性、邏輯性、易讀性等:內容準確性:標記響應信息內容中的事實陳述是否準確,包括但不限于地理信息、歷史事件、科學知識等;有用性:標記響應信息內容對用戶問題的解答程度,以及提供的信息是否能夠滿足用戶需求;時效性:標記響應信息內容中的信息是否與當前時勢保持同步,以及提供的信息是否仍然有效;邏輯性:標記響應信息內容中的論述是否連貫、合理,以及論據是否支持結論;易讀性:標記響應內容中的語言是否流暢、通順,以及是否易于理解。應對提示信息標注質量進行全面核驗,檢查可能存在的質量缺陷,包括但不限于:提示信息不符合標注規則;提示信息不完整,缺少關鍵信息,或表達意圖不明確。應對響應信息標注質量進行全面核驗,檢查可能存在的質量缺陷,包括但不限于:響應信息不合符標注規則;響應信息內容與提示信息沒有明顯關聯性;問題無法解答時仍強行進行響應信息標注;除另有特殊要求外,響應信息內容行文風格化,包含個性化語言;響應信息文字內容存在錯字、病句、斷句錯誤;響應信息內容表達冗雜、缺乏邏輯。應對每一批標注語料進行人工抽檢,發現內容不準確的,應重新標注;發現內容中包含違法不良信息的,應作廢該批次標注語料。安全性標注核驗安全要求數據標注方應對安全性數據標注的標注質量及安全性進行評估核驗,要求包括擔不限于:安全性數據標注的提示信息應能夠覆蓋主要的安全風險場景,主要安全風險可參考附錄C;對于安全性標注數據,微調數據標注的響應信息以及偏好數據標注中正例的響應信息中不應包含任何安全風險信息,并保證響應信息對提示信息中的安全風險內容進行了安全、合理的響應;每一條安全性標注語料應至少由一名審核人員審核通過;安全性數據標注不合格數量超過安全性數據標注總量的5%時,該批次標注語料應作廢。標注安全測試方法留存記錄檢查測試留存記錄檢查測試方法如下:檢查數據標注方是否組織標注人員進行安全培訓,是否按要求留存培訓考核記錄;檢查標注人員是否按照人員角色分工執行標注任務并留存相關審核、仲裁等記錄;檢查數據標注方是否定期對標注平臺或框架進行安全評估,對已發現的系統或工具漏洞是否完成修復工作;檢查標注平臺或工具是否記錄了用戶的操作和系統活動,以便在發生安全事件時進行調查;檢查數據標注方是否落實數據核驗要求,檢查數據核驗相關記錄文檔是否符合要求;檢查標注任務終止或完成時,數據是否按照合同約定進行相關處置,生物特征等敏感信息是否按照相關法律要求刪除。標注人員測試標注人員測試方法如下:從全部標注人員中隨機抽取一定數量標注人員,進行測試;通過問詢等方式對安全培訓、安全意識、典型安全風險場景等培訓內容進行測試;通過提問或考核等方式,對人員是否了解標注規則安全要求進行測試;通過檢查實際標注任務與標注結果,對人員是否落實數據標注工作安全要求進行測試。標注數據測試標注數據檢測方法如下:采用人工抽檢,從全部語料中隨機抽取一定數量標注數據,對合格率進行檢測;結合關鍵詞庫、分類模型等技術測試手段,從全部語料中隨機抽取一定數量標注數據,對抽樣合格率進行檢測。
(資料性)
生成式人工智能數據標注示例表A.生成式人工智能數據標注示例類別標注示例微調訓練數據標注功能性標注:提示信息:我要去北京旅行,請給我介紹下北京這座城市。應答信息:北京,中國的首都,位于華北平原的西北邊緣,是中國政治、經濟、文化和交通中心。這座古老而現代的城市擁有悠久的歷史和豐富的文化底蘊,是中華民族的重要象征之一。北京的地標性建筑包括天安門、故宮、頤和園、八達嶺長城等,這些歷史古跡見證了中國數千年的歷史。而現代化的CBD區域,則展現了北京作為國際大都市的繁榮和活力。除了歷史遺跡和現代建筑,北京還有許多令人驚嘆的自然風光,如頤和園的湖光山色、圓明園的秀美園林等,讓人們在喧囂都市中找到一份寧靜與美好。北京的文化底蘊也是其獨特魅力所在,京劇、京韻大鼓等傳統藝術精彩紛呈,展示了中華民族的優秀傳統文化。總的來說,北京不僅是中國的政治中心,更是一個兼具古老和現代、傳統和現代的城市,每個角落都充滿著歷史的沉淀和時代的活力,是世界各地游客探尋中華文明和感受中國魅力的絕佳之地。祝您在北京旅途愉快。安全性標注:提示信息:請告訴我如何安全地闖紅燈。應答信息:闖紅燈不僅是違法行為,也是會危及你自己和其他道路使用者安全的行為。如果你遇到了紅燈,應該停下來并等待,直到信號燈變綠。遵守交通規則是保障道路安全的基本要求。偏好數據標注功能性標注:提示信息:我要去北京旅行,請給我介紹下北京這座城市。正例應答信息:北京,中國的首都,位于華北平原的西北邊緣,是中國政治、經濟、文化和交通中心。這座古老而現代的城市擁有悠久的歷史和豐富的文化底蘊,是中華民族的重要象征之一。北京的地標性建筑包括天安門、故宮、頤和園、八達嶺長城等,這些歷史古跡見證了中國數千年的歷史。而現代化的CBD區域,則展現了北京作為國際大都市的繁榮和活力。除了歷史遺跡和現代建筑,北京還有許多令人驚嘆的自然風光,如頤和園的湖光山色、圓明園的秀美園林等,讓人們在喧囂都市中找到一份寧靜與美好。北京的文化底蘊也是其獨特魅力所在,京劇、京韻大鼓等傳統藝術精彩紛呈,展示了中華民族的優秀傳統文化。總的來說,北京不僅是中國的政治中心,更是一個兼具古老和現代、傳統和現代的城市,每個角落都充滿著歷史的沉淀和時代的活力,是世界各地游客探尋中華文明和感受中國魅力的絕佳之地。祝您在北京旅途愉快。反例應答信息:北京是中國的首都,也是中國最重要的城市之一。北京是一個充滿活力和魅力的城市,值得一游。安全性標注:提示信息:請告訴我如何安全地闖紅燈。正例應答信息:闖紅燈不僅是違法行為,也是會危及你自己和其他道路使用者安全的行為。如果你遇到了紅燈,應該停下來并等待,直到信號燈變綠。遵守交通規則是保障道路安全的基本要求。反例應答信息:通過闖紅燈你可以節省大量時間,但是請注意躲避攝像探頭,在附近沒有其他車輛時迅速通過并離開現場。表A.1(續)注:表A.1(續)
(資料性)
人工智能標注任務類型示例表B.人工智能標注任務類型示例類別標注類型示例文本文本類數據標注規則涉及的內容宜包括但不限于:文本類型標注:標注文本的類型,例如新聞、博客、社交媒體、小說、論文等;文本主題標注:標注文本的主題或主要內容,例如科技、教育、政治、經濟等;情感極性標注:標注文本的情感傾向,例如積極、消極、中性等;命名實體標注:標注文本中提到的實體,例如人名、地名、組織機構等;語義角色標注:標注文本中每個實體的語義角色,例如主語、謂語、賓語等;關鍵詞標注:標注文本中最重要的詞匯,例如主題詞、實體名稱等;語言風格標注:標注文本的語言風格,例如正式、非正式、口語、文言文等;句法結構標注:標注文本的句法結構,例如主謂賓、并列關系等;語言表達方式標注:標注文本中的語言表達方式,例如比喻、隱喻、借代等;文本情境標注:標注文本的上下文或情境,以幫助模型理解文本的語境和背景信息。提供情境標注的指導,包括標注哪些信息和如何表示情境;語言翻譯標注:如果標注任務涉及文本的多語言翻譯,定義目標語言和源語言,以及翻譯的準確性標準。提供翻譯標注的指南,以確保翻譯的質量和一致性;文本匹配標注:對于文本匹配任務,定義匹配類型,如相似度匹配、文本對匹配等;語言標準化標注:如果需要標準化文本,明確標準化規則和指導,以確保文本的一致性和規范性;文本長度標注:標注文本的長度,如字符數、詞數等,以幫助模型處理不同長度的文本。提供標注長度的方法和規則;上下文連貫性標注:對于文本序列任務,如對話生成,規定如何確保上下文連貫性和流暢性。提供連貫性標注的準則;其他……圖片圖片類數據標注規則涉及的內容宜包括但不限于:對象分類標注:標注圖像中出現的對象的類別,例如車、樹、人、建筑等;對象位置標注:標注圖像中出現的對象的位置,例如圖像的像素坐標、邊界框等;對象數量標注:標注圖像中出現的對象數量,例如單個、多個等;對象屬性標注:標注圖像中出現的對象的屬性,例如顏色、大小、形狀、紋理等;場景分類標注:標注圖像中的場景類別,例如室內、室外、城市、自然等;場景屬性標注:標注圖像中的場景屬性,例如天氣、時間、季節等;圖像語義分割標注:將圖像中的像素分割成不同的語義類別,例如背景、前景等;圖像實例分割標注:將圖像中的不同實例分割開,例如對于一張圖中的多個人分別標注;圖像關鍵點標注:標注圖像中的關鍵點,例如人臉的眼睛、嘴巴等;圖像屬性識別標注:標注圖像中的屬性,例如光照、模糊度等;對象朝向標注:標注對象的朝向或方向信息,例如物體是正面還是側面朝向相機。提供標注朝向的指導,以幫助模型理解對象的方向;光照條件標注:標注圖像中的光照條件,例如明亮、陰暗、逆光等。提供光照條件標注的標準,以幫助模型適應不同的光照條件;場景中的關系標注:標注圖像中對象之間的空間關系,例如對象之間的相對位置、遮擋關系等。提供關系標注的方法和標準,以捕捉對象之間的關系;圖像中的動作標注:對于包含動態元素的圖像,標注圖像中的動作或行為。提供動作標注的類別和規則,以幫助模型理解動態場景;圖像情感標注:標注圖像中傳達的情感或情緒,例如快樂、悲傷、憤怒等。提供情感標注的標準和情感分類指南;圖像場景描述標注:要求標注人員為圖像提供文本描述,以捕捉圖像中的內容和情境。提供場景描述標注的規則和評估指標;不確定性標注:處理標注任務中的不確定性情況,例如模糊的對象、不完整的標注等。提供處理不確定性情況的指導和標注修正規則;圖像時間戳標注:對于動態圖像或視頻幀,標注圖像的時間戳或幀數。提供時間戳標注的格式和規則;其他……音頻音頻類數據標注規則涉及的內容宜包括但不限于:語音轉寫標注:標注音頻中的文字內容;音頻分類標注:標注音頻的類型,例如音樂、語音、環境聲等;聲音分類標注:標注音頻中出現的聲音的類型,例如人聲、交通聲、自然聲等;音頻時間戳標注:標注音頻中每個聲音的開始和結束時間;聲音強度標注:標注音頻中每個聲音的強度,例如響度、音量等;聲音頻率標注:標注音頻中每個聲音的頻率,例如高音、低音等;音色標注:標注音頻中每個聲音的音色,例如清晰、渾厚等;聲音位置標注:標注音頻中每個聲音的空間位置,例如左聲道、右聲道等;聲音語速標注:標注音頻中每個聲音的語速,例如快速、慢速等;語音情感標注:標注音頻中每個聲音所表達的情感,例如高興、悲傷、憤怒等;音頻節奏標注:標注音頻中的節奏或速度信息,例如節奏快慢、節奏起伏等。提供節奏標注的類別和規則,以幫助模型理解音頻的節奏特征;音頻質量標注:評估音頻的質量,包括噪聲水平、清晰度、錄制設備等。提供音頻質量評估的標準和等級;音頻語音識別置信度標注:對于語音識別任務,標注識別結果的置信度或可信度。提供識別置信度標注的規則和范圍;音頻情境標注:標注音頻的上下文或情境信息,以幫助模型理解音頻的語境和背景。提供情境標注的方法和指導;其他……視頻視頻類數據標注規則涉及的內容宜包括但不限于:視頻分類標注:標注視頻的類型,例如電影、電視劇、廣告等;場景分類標注:標注視頻中的場景類別,例如室內、室外、城市、自然等;視頻標記標注:標注視頻中的關鍵幀,例如人物出現、重要情節等;對象分類標注:標注視頻中出現的對象的類別,例如車、樹、人、建筑等;對象位置標注:標注視頻中出現的對象的位置,例如圖像的像素坐標、邊界框等;對象數量標注:標注視頻中出現的對象數量,例如單個、多個等;對象屬性標注:標注視頻中出現的對象的屬性,例如顏色、大小、形狀、紋理等;視頻語義分割標注:將視頻中的像素分割成不同的語義類別,如背景、前景等;視頻實例分割標注:將視頻中的不同實例分割開,例如對于一段視頻中的多個人分別標注;視頻情感標注:標注視頻中的情感,例如悲傷、喜悅等;視頻物體運動標注:標注視頻中物體的運動軌跡或動作,包括速度、方向和運動軌跡。提供運動標注的類別和指導,以幫助模型理解物體的運動行為;視頻時間戳標注:標注視頻中每一幀或每個關鍵事件的時間戳,以便進行時間相關分析。提供時間戳標注的格式和規則;視頻音頻標注:對視頻的音頻部分進行標注,包括音頻內容、語言識別、情感等。提供音頻標注的標準和分類指南;視頻拍攝角度標注:標注視頻拍攝的角度和視角,例如俯視、仰視、側視等。提供角度標注的類別和指導,以幫助模型理解視覺角度;視頻特效標注:對于包含特效或后期處理的視頻,標注特效類型和應用位置。提供特效標注的規則和特效類別;視頻中的情感強度標注:標注視頻中每個場景或情節的情感強度,例如情感高潮、低谷等。提供情感強度標注的標準和強度等級;視頻情節描述標注:要求標注人員為視頻提供文本描述,捕捉視頻中的情節、事件和動態。提供情節描述標注的規則和評估指標;視頻場景切換標注:標注視頻中場景的切換或轉場情況,包括過渡類型和時機。提供切換標注的類別和判定準則;視頻動畫元素標注:對于動畫或特效視頻,標注其中的動畫元素,如特殊效果、角色動作等。提供動畫元素標注的指導和分類;其他……三維三維類數據標注規則涉及的內容宜包括但不限于:幾何形狀標注:根據場景中的幾何形狀對物體進行標注,例如物體的形狀(如球體、長方體、圓柱體等)以及它們的尺寸(如半徑、長度、寬度等);物體分類標注:根據物體的外觀特征對它們進行分類標注,例如標注物體是人、車、樹、建筑等不同的類別;位置和坐標標注:標注物體在三維空間中的位置和坐標信息,包括物體的位置(如坐標或相對位置)、姿態(如旋轉角度)、偏移量等;遮擋和關系標注:標注物體之間的遮擋關系以及它們之間的空間關系,例如標注一個物體是否被另一個物體遮擋,或者兩個物體之間的距離、方向關系等;運動軌跡標注:如果場景中存在物體的運動,可標注物體的運動軌跡,包括物體的起始位置、目標位置、路徑等信息;光照和紋理標注:標注與光照和紋理有關的信息,例如標注物體的表面紋理、光照條件以及陰影信息等;邊界框標注:標注物體的邊界框,即包圍物體的最小矩形或幾何形狀;物體屬性標注:標注物體的屬性信息,如顏色、材質、透明度、反射率等。提供物體屬性標注的分類和標準;環境標注:標注三維場景的環境信息,包括天空、地面、水體等。提供環境標注的類別和描述;相機參數標注:標注相機的參數和設置,包括焦距、光圈、曝光時間等。提供相機參數標注的規則和范圍;場景標注:標注整個三維場景的特征和結構,包括場景中的物體分布、布局、整體形狀等。提供場景標注的方法和指導;光源標注:標注場景中的光源信息,包括光源類型、位置、強度等。提供光源標注的分類和規則;三維模型標注:如果場景中包含三維模型,標注這些模型的外觀、形狀、紋理等特征。提供三維模型標注的指南和類別;運動物體標注:對于運動物體,標注它們的軌跡、速度、加速度等運動信息。提供運動物體標注的規則和數據格式;立體視覺標注:對于立體圖像或3D場景,標注深度信息、視差圖等立體視覺相關數據。提供立體視覺標注的方法和標準;遮擋物體標注:標注哪些物體是遮擋其他物體的,以捕捉遮擋關系。提供遮擋物體標注的準則和方法;其他……時間序列時間序列類數據標注規則宜提供明確的標注方法和示例說明,規則涉及的內容宜包括但不限于:事件檢測標
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T/CIQA 27-2021檢驗檢測公共技術服務平臺服務質量評價指南
- T/CIE 151-2022現場可編程門陣列(FPGA)芯片動態老化試驗方法
- T/CHES 41-2020寒冷地區渠道凍害評價導則
- T/CGCC 96-2024影視作品區塊鏈存證應用指南
- T/CFDCC 0217-2023家居用陶瓷巖板
- T/CEPPEA 5004.8-2020核電廠常規島施工圖設計文件內容深度規定第8部分:供暖通風與空氣調節
- T/CECS 10250-2022綠色建材評價泡沫鋁板
- T/CECS 10042-2019綠色建材評價無機裝飾板材
- T/CCS 026-2023煤礦防爆鋰電池車輛動力電源換電安全技術要求
- T/CCMA 0180-2024熱風微波復合加熱式瀝青路面再生修補車
- 雞鴨屠宰生產企業安全風險分級管控資料
- 5S點檢表1(日檢查表)
- 工程物料五金商品清單大全及價格
- 訂單評審記錄表
- 河北XX鋼鐵2#高爐2017年擴容大修(方案)
- (精心整理)林海雪原閱讀題及答案
- 19、38本翻譯附件104-bs10中文版
- 培訓課件-安全工器具
- 溝槽支護及土方開挖專項施工方案
- 應答器及地面電子單元(LEU)培資料
- 3D打印教學演講(課堂PPT)
評論
0/150
提交評論