DB3302T 1163-2024 基層智治公共數據整合規范_第1頁
DB3302T 1163-2024 基層智治公共數據整合規范_第2頁
DB3302T 1163-2024 基層智治公共數據整合規范_第3頁
DB3302T 1163-2024 基層智治公共數據整合規范_第4頁
DB3302T 1163-2024 基層智治公共數據整合規范_第5頁
已閱讀5頁,還剩8頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

3302Specificationforpublicdataintegrationofgrass-rootsintelligentgovernanceI本文件按照GB/T1.1—2020《標準化工作導則第1部分:標準化文件的結構和起草規則》的規定1基層智治公共數據整合規范DB33/T2487公共數據安全體系建設DB3302/T1126—2021公4整合原則b)準確性:通過動態更新和錯誤識別,使數據信息符合實際;d)一致性:整合前后數據信息內容、含義無歧義;e)關聯性:多源數據之間建立對應關系,相互關聯的數據信息內容無矛盾。2包括數據歸集、數據處理、質量控制、成果形成四個流程環節(人工采集數據加工數據回流數據人工采集數據加工數據數據歸集數據清洗數據完善物聯感知數據數據清洗數據完善數據處理數據關聯數據分類質量控制成果形成3通過影像采集、AI識別、智能感知等設備終7.2.1.2人工采集數據應以村(社區)為單位進行7.2.1.3對數據進行排序算法,按照預定義的重復標識規則進行檢測和去重,對刪除數據進行單獨備7.2.1.4對數據按照重要性等級進行判斷,根據判斷結果和缺失比例制定規則進行刪除或填充,對刪7.2.1.5用統計分析方法、簡單規則庫或不同屬性間的約束、外部數據進行檢測、識別,修正錯誤值7.2.1.6對多源數據進行關聯性驗證,調整、去除關聯數據間的矛盾內容,并通過分析檢測,使數據7.2.1.7對包括但不限于時間、日期、數值等錯誤顯示的格式進行7.2.2.2應對錯項、空項數據進行核7.2.2.3根據產權部門、更新時間、數據質量等屬性,建立數據更新機制和多源數據的優先為基本數據,其他字段按照數源單位最新的更新時間為準,針對一數多源情況(如),對數據設置標簽(見附錄A),并建立人房數據關聯、人地數據關聯、人企數據關聯、房地數據關47.3.1數據質量應按DB33027.3.2應對數據實行動態管理,實現回流、共享數據自動更新。人工采集數據經核實后手動更新,并7.4.1應形成數據庫及相應數據元,整合過程相關記錄、文檔等整7.4.2數據元應具備數據建模的可用7.4.3不同來源的相同數據元應保持一致,并建立對應關系(見附錄C)。51234567896h)08:共青團工作,握到某個標簽對應樣本的本質特征,從而達到分類的7a)分類定義:通過公司業務專家與技術專家積累的經驗,將事件歸類;b)樣本打標:將十萬綜合治理線上數據打上對應的分c)算法訓練:對事先標注好的樣本,逐條進行hanlp分詞處理,并基于訓練好的詞向量庫、自生成的one-hot等來表征每條樣本的特征張量。采用深度學習環神經網絡建模,批量輸入樣本特征集,利用梯度下降法,不斷調整模型輸出的樣本預測分類的概率分布,期望模型預測分類的概率分布和樣本實際標注分類的概率分布越相似越好,e)接口對接:將標準的算法接口授權給業務系統,業務系統通過簡單對接后,即可調用,接口a)抽取數據:以每月評估每個模型一次為例,每月初,隨機抽取上月的部分數據。原則上每個b)實施人工標注:針對每個模型的數據進行專業實施打標,打標過程中存在爭議的數據,參考線上用戶標注結果,由三個或三個以上實施人d

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論