電子政務基礎教程 第十一章 政務信息代理服務_第1頁
電子政務基礎教程 第十一章 政務信息代理服務_第2頁
電子政務基礎教程 第十一章 政務信息代理服務_第3頁
電子政務基礎教程 第十一章 政務信息代理服務_第4頁
電子政務基礎教程 第十一章 政務信息代理服務_第5頁
已閱讀5頁,還剩24頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第十一章政務信息代理服務11.1政務信息代理概述大型政務系統中,資源引擎能與成百上千個網站和各類數據庫、數據中心互連,構起龐雜的信息管道。顯然,各政府機構履行的職能互不相同,所需信息也不一樣;同一機構中不同部門、不同崗位人員所需的信息也不一樣。于是從信息管理角度就出現了矛盾:一是從宏觀需求角度,希望相關資源聚集越多、越全面、越詳細越好;而對具體人員,則希望信息越精準、越齊備與越方便越好。在信息爆炸、全球每個個人、每件物品、每個事件和每個過程全都數碼化的今天,這一矛盾就日益尖銳。于是,信息代理技術就應運而生:它一端面對海量信息資源,另一端面對數以千計的不同業務領域中需要專業化、精準化資源服務的用戶,中間通過一套智能識別、加工與聚類機制,將資源的抓取、識別、分析、檢索和推送等功能交由計算機自動實現,體現信息代理樞紐的功能。11.2政務信息代理功能11.2.1信息代理概述信息代理又稱智能代理(IntelligentAgent),簡稱代理(Agent)或代理機,是一種智能化、可進行復雜的自動數據處理的軟件,用于自動搜索與各類特定主題相關的信息,是近年人工智能領域研究的熱點。它綜合多種技術,融合智能化、個性化、規?;畔z索與推送式服務的核心技術。目前它已成為大量電商系統、社交和自媒體平臺等的后臺,為其用戶提供個性化服務與提升客戶體驗的不可缺少的工具。信息代理的服務質量主要取決于代理機的程序、設定信息源的數量與質量、代理程序的功能與自分析自學習性能?;ヂ摼W中,簡單的代理機可根據用戶提供資源樣本、給定的匹配度閾值等,在全網漫游抓取信息;也可根據用戶提供的信源網站目錄跟蹤抓取信息;還可按主題或地域范圍等掃描抓取。因此,這類程序又稱網絡爬蟲,它與聚類分析等程序結合就構成代理機。11.2.2信息代理的框架與流程1)信息代理框架

代理可有多種框架,各層功能如下:(1)資源層

框架底部代表政務系統包含的各種不同形態、不同來源、不同格式與內容資源,可以包含內部與外部信息,以及業務信息等。歸整層

中間代表系統對從資源層抽取的各類信息進行的歸集整理處理,主要處理對象有各種非結構化信息,半結構化信息與結構化信息,以及語音和圖像等信息。引擎層

引擎又可分為自動分類引擎,實現如第10章的自動分類與聚類處理等功能;智能推理引擎,針對資源特征、類型、分類與用戶資源需求及使用行為等畫像與建模;個性化用戶引擎,實現用戶專題服務,跟蹤反饋其使用習慣與興趣等,提供針對性的服務。

由于代理只負責資源處理,功能上屬于中間件,并不直接呈現結果。故在此3層之上,應通過各種協議與接口等,呈現在不同的終端或傳輸給其他應用。2)信息代理作業流程代理機被視為知識處理實體,運行一般需要知識庫、規則庫、推理機、各引擎間的通信協議等;功能上要能實現知識發現代理、通信協作代理、規則庫應用代理、監督代理、知識庫管理代理、推送代理等。各代理機邏輯上都有自己的知識庫,各用戶的信息需求傳給相應的知識庫。系統按用戶庫中對其設定的需求特征、興趣、檢索行為、工作內容等為樣本來篩選信息。系統通過知識發現系統檢查知識庫中是否有用戶既往的信息需求,若有就將其記錄提取出來,通過與近期搜索的增量信息比對,將其中達到要求者推送給用戶界面。若庫中沒有其信息需求,經規則應用庫代理生成一定的搜索匹配規則,傳給知識發現代理進行搜索,結果經信息過濾后存于信息數據庫,再經知識庫的推理機制推斷用戶的潛在需求,作為用戶需求歷史記錄,結果推送給用戶。代理機還根據一定規則,實時動態地跟蹤信息數據庫中歷史記錄在內部或Internet網上的變化,一旦知識發現代理收集到相關的更新內容,就通知規則應用庫生成新的檢索規則或應用,并通知用戶有新的信息內容,還可將更新內容以推送方式提交給用戶。檢索完成后允許用戶對結果進行滿意度和相關度的評價并反饋知識庫,一方面了解用戶的新需求,另一方面完善用戶所需信息相關度的匹配規則,為其未來的信息檢索提供內容。11.2.3信息代理的特點

目前有許多代理軟件,具備程度不等的智能性。智能代理技術是人工智能在網絡信息技術領域的運用,具有顯著特性和強大功能。1)信息代理的主要特點(1)智能性

體現為對信息特征作自動識別與比對,有一定的運算推理和經驗學習能力,能接受用戶的資源目錄、數據或文獻樣本、給定閾值等條件,以建立資源搜取目標;在運行中它能對用戶的使用行為(如網頁駐留時間、跟蹤訪問層級與退出行為等)分析其意圖,再從信息路徑、選擇過程等興趣特征上建立用戶特征記錄。(2)替代性

替代用戶進行某些操作,反饋其結果。典型的如代替用戶進行信息查詢、跟蹤選擇、下載比對等作業,管理用戶的個人資料及其專用目錄下的知識庫等。管理員可為用戶創建代理,或允許其自己創建代理,“代理機”稱呼也由此特性而來。

(3)學習性

也稱自主性。代理機能根據資源環境、應用環境和用戶等的變化,動態調整去完成各項任務的規則、模型與知識庫。能通過觀測用戶使用過程,持續修改與優化其運算、聚類與代理策略等。(4)自動性

可在網絡中漫游搜索目標主機,按規則進行資源篩選與抽取,將結果返回用戶界面,能隨用戶興趣主題的改變而改變搜索模式、采集對象與內容等。(5)主動性

能根據用戶設定的具體信息源,或主題領域等,跟蹤檢測對象的變化。當其發現新增信息時,會主動將其適用內容下載并提交用戶。(6)合作性

各智能代理有標準接口,采用統一通信格式交流信息。多代理系統由代理組成,通過代理本身的搜索活動和相互之間的交互活動,構成系統的群體活動,相互之間分工合作共同完成復雜任務,從而實現系統整體的功能或目的,同時,每個代理也在這種交互的過程中實現了自己的功能與目的。(7)媒介性

能通過知識匹配、領域匹配、使用習慣匹配等方式使本代理的用戶與其他智能主體進行信息交流,建立聯絡,相互協調共同完成復雜的任務,等等。(8)持續性

各代理機對應不同的任務,如在互聯網搜索訪問,或針對特定政務信源的訪問。這種活動動是多點并行的,具有可跨地域、時空持續運行的功能特點。2)信息代理的核心技術代理的特點都建立在計算機“理解”信息內容的基礎上?!袄斫狻笔怯嬎銠C通過對大量文章中的詞語要素等的劃分,對其語義、語境、語法、語用和領域等的記錄分析的積累性實驗、學習、反饋、驗證與改進等,形成統計意義上的知識庫、規則庫、模型庫與過程庫等。技術上要求系統具有自動信息采集、自動分類整理、自動網頁鏈接、自動全文概括、自動關聯信息提要、全文自然語言查詢與信息多渠道發送等。能為用戶自動建立個性化資料中心,并以個性窗口呈現;能為用戶自動建立信息渠道,通過關聯性優化選擇信息至桌面。性能上要求的處理量級為2~3小時內,能對百萬量級的文章完成核心內容自動分類與運算,完成依據用戶的興趣模型或種子樣本的聚類,將閾值以上的資源推送到桌面。3)信息代理的分類

目前,代理可分為4種基本類型:①一般信息代理;(二)檢測和監視代理;(三)數據挖掘代理;(四)用戶或個人代理。代理技術最初應用于商業領域,隨著技術和應用的發展,其特性和功能也不斷地擴展,應用在智能搜索代理、數字圖書館、電子商務、遠程教育和版權檢查與保護等領域。隨著電子政務的深入化、精準化與個性服務的發展,代理技術在政務領域開始了許多新應用11.3代理機制的建立11.3.1電子政務的代理需求隨著電子政務朝深度與廣度的整合發展,由政務數據的4項基本特性帶來的3個關聯性矛盾就在資源處理上日顯困難。4項基本特性是:①政務數據的多源性;(二)政務數據的海量性;(三)政務數據的相關性與;(四)政務數據的多態性;3個關聯是:(一)傳統的結構化技術無法處理大量非結構化政務數據的矛盾;(二)不同應用間的數據難于形成跨系統的內容關聯的矛盾,(三)缺乏成熟的智能服務模型,無法為各級管理者與公眾者提供個性化、專題化的信息支持等。從本質上看,谷歌、百度等搜索引擎就是信息代理機,具有從海量信息源中抽取專題信息的功能。但電子政務還有其他代理需求,主要有4點區別。代理機的性質與體量不同針對的信源不同擁有主體不同服務方式不同11.3.2代理機功能實例以HP旗下Autonomy公司為例,它為全球一萬多個政府機構及跨國公司提供信息代理服務,其產品采用基于語義計算模型的代理機可在資源篩選端讓機構配置互聯網和內部網中的資源站點,能根據業務需要設立公眾反饋、討論室、內部業務數據流和各資源庫列表等。用戶端允許不同使用者自行創建個性化的資源欄目、信息頻道,并與其業務平臺整合,隨時通知各用戶與其特定角色和興趣相關的發展狀況,實時跟蹤外部領域新聞和系統內部的各類動態。其具體功能如下:運用自然語言實例(關鍵詞、樣本文檔或部分片段)創建興趣聚焦代理。重新訓練興趣聚焦代理。自動建立超鏈接與文檔摘要。可定義結果數量與質量特征。可選信息源。可設置時間段、語種、搜索方式等。個性化顯示,等等。用戶在這些功能支持下,通過設置興趣領域來定制代理機。代理機將持續識別所有相關內容,然后在簡潔的個性化頁面中以完整的URL鏈接顯示所有篩選內容;還會在出現新信息時及時監測到并提交用戶。用戶職能或崗位變化,其關注領域改變時,就可重新訓練代理機,以切換到新領域。在“推”式服務中,當用戶關注主題出現了一個消息,或公眾反饋欄目中,甚至跟蹤的某些公網網站開始出現一些能反映輿情民意的話題時,用戶會通過郵件、短信、屏幕窗口或其媒介收到提示。通過代理實時反饋新聞,持續搜索與增加各用戶興趣目錄的匹配資源,能使政務機構具有更高的服務效率、洞察能力與決策水平。11.4代理服務簡介

1)作業界面

圖11-3是一個采用AutonomyAgents構建的政務知識管理與決策支持系統的用戶界面示意。圖中前有小三角標志的“專題”,就是系統中的代理機界面。圖11-3中的“專題”指用戶要求代理的具體領域,代理機由此建立資源泵,對后臺資源進行篩選、抽取、閾值計算與匹配,將結果推送到用戶桌面。此界面可看出,創建代理就是建立多渠道聚類,以用戶自定主題的方式來進行。但與一般聚類不同的是,聚類是針對所有信息,按特定算法經統計分析后自行分類;代理則由人工指定主題域、其他樣本詞甚至一個文獻片斷后提交系統,經代理機搜索梳理后建立定向聚焦。用戶均可指定專題,選擇信源、建立專題域,開展個性化信息服務。示例中建立了“金融服務、科技服務、生產服務、現代服務業發展與產業優化升級、物流、服務業、廣東省建立文化大省規劃綱要、商貿服務、信息服務業、上海市信息服務業發展五年規劃”等主題域代理,顯然,以這些種子片語作標題可為使用者提供了專題代理,將由后臺進行聚類后輸出。當然,用戶可通過增加與刪除任何樣本來調整聚集結果。2)專題代理示例

現以“金融服務”為例,說明建立代理的具體過程。(1)聚集名

在“聚焦名”框中輸入“金融服務”作為一個專題的聚焦名。(2)初始訓練

對代理機進行初始訓練?!坝柧殹笔且韵盗兄黝}詞、整篇文檔或文章片段輸入系統作為其所需專題的代表性概念框架。所選主題詞可是一個或一批,如本例“金融服務”的訓練詞目為“銀行、債券、股票、紐約證交所、倫敦證交所、納斯達克、期貨、上證指數、深圳股市、上海股市、投資、融資、基金、風險投資、投資環境、保險、銀監會、保監會、證監會”等。輸入這些詞并提交后,系統就以此為概念模型對資源進行內容挖掘,將符合度閾值以上的文檔全部發送的用戶桌面上來。(3)結果數量

當查詢到的資源數量較多時,設定每頁面一次顯示的結果文檔數。(4)最低相關度

文檔內容與樣本概念群比對后的統計符合度閾值,其值從10、20、30…90,代表百分比。(5)結果期限

表示代理機挖掘的資源時間期限,可設定“當天、一天、二天…、一周、二周…”。(6)信息源

表示代理機挖掘的信息源目錄,可按需在各信道前的小框中打勾,也可在“全選”框中打勾,表對所有信息源按上述概念群進行資源挖掘比對。(7)語言

默認為中文。(8)排序

與前述分類部分面板相同。(9)在社區中顯示

表示本用戶所建立的代理是否要在社區中顯示,打勾則顯示在社區中。該功能用于通過專題聚焦與其他用戶或專家建立聯系,是在電子政務領域中一項新穎而重要的功能。3)建立專題代理示例二對代理的訓練,除用主題詞集外,還可用整篇文章或其部分片段輸入“初始訓練”窗,如圖11-5所示:聚焦名為“上海市信息服務業發展五年規劃”,訓練文章采用“上海市信息服務業發展五年規劃”,提交后,初始訓練窗下就顯示該文章名,并在前面的小框內打上勾。這時,在專題主頁“您的聚焦”目錄中,本文標題后出現“(訓練過的)”字樣。以文章作為訓練樣本交系統進行挖掘比對時,其結果數量可能不多,特別在高閾值情況下,但資源相似度較高,如本例檢索時就將各其他各省市的類似五年規劃全部檢出。代理結果的質量取決于兩點:一是系統跟蹤的信息源數量與專業程度,二是描述專題對象的主題是否準確、周全,或者說取決于資源架構與概念模型的質量。4)結果顯示用戶建好聚焦主題提交系統后,代理將其“淘取”的符合條件的資源推送到桌面,如前述“金融服務”經代理抽取出的部分結果就如圖11-6所示,并顯示“Matchingdocumentsforagents金融服務”。每篇文章由4部分描述:相關度百分比及小框、文檔標題及右側五個小標志、摘要、相關文檔等。百分比值是代理機將從資源引擎中抽取的所有文檔經比對后相關度值大于圖11-5中設定“最低相關度”的文章目錄列出,按從大到小排序。右側有五個小標志按鈕,從左至右功能分別為:

(1)Contents(內容)。

(2)HighlightedContents(重點內容)。

(3)Summary(提要)。

(4)CreateAgentBasedonthisStory(按此文章創建代理)。

(5)Emailthislink(郵件發送此鏈接)。11.5專家集聚1)專題社區的建立信息代理適于構建個性化資源服務,多由使用者自行建立。在電子政務中,同一領域會同時受到不同部門領導、專家和相關的社會專業人士關注,如通貨膨脹問題,經濟主管部門、金融機構、統計部門、財政系統等的專家和甚至公眾都可能要求建立代理,添加并跟蹤其關注的信源與分析報導等。此時,系統不僅應將信息資源聚類,同時還會將建立本領域專題代理的專家或信息使用者們也聚集起來,組成一個虛擬社區,為不同部門、不同機構、不同地區的專家提供一個相互認識與在線交流的空間,發揮知識交流與倍增作用。可見,代理機不僅能在政務資源層面建立,還能在人與人之間建立選擇與聚集機制,將需要信息的人員與擁有答案的人員之間建立聯系,動態組成涵蓋眾多領域、有眾多人員參與的專題社區。特別是能隨某項研究過程的進展中,在理解正在執行的內容之時,找出相應領域的專家。這一功能對于公眾與社會機構參政議政、民主決策、行使監督權、跟蹤了解某個領域的進展、協同研究等起到良好的作用。同時,這一功能還能使系統在不斷了解各執行人員的經驗基礎與積累上,由代理機在人員之間建立起能提升團隊整體競爭力的聯系。2)專家聚集的主要服務形式采用信息代理的專家聚集,主要能產生如下一些形式的政務服務:內容交叉推送完善資源頻道優化檢索功能結果可擴展同樣,這些漫游既可針對資源文檔進行,也可針對專題組內的專家進行,使得在政務研判活動中,能針對具體問題,找到最適合的專家與見解等。11.6信息代理的發展

1)智能代理簡介信息代理正朝機器學習與智能代理方面發展。美國斯坦福大學的HayersRoth認為“智能代理”應具有3項功能:1)能在感知環境中的動態條件,執行動作影響環境,進行推理以解釋感知信息;2)能求解問題;3)產生推理和決定動作。Roth定義的智能代理是在物聯網環境中運行的,代理應在選擇執行過程中進行識別、推理和規劃。這樣的智能代理就包括人類與社會中具有感知或觀察能力的智能設備的聯網與動態分析和處理能力,使智能代理能自動收集信息并提供相關服務,不需要人工干預即可執行一些任務。在電子政務領域,開展智能代理的一些基礎設施業已具備。如各城市的一些單位、機關、商店、街區與道路上,均已安裝了攝像裝置;公安、城管等執法人員也已配備了行政執法記錄儀等。這些裝置對于動態記錄感知范圍的對象與過程,各類事件的追溯等起到重要作用。但目前,這些裝置只是一種記錄設備,尚不具備對所攝取的影像資料進行分析、研判與自動報警等能力。進一步的發展,就需要后臺強大的影像模式識別與分析軟件,對一些可能涉及違法和影響安全的動作與場景等進行動態分析比對,對符合報警條件閾值的一些行為場景等自動報警,引起監控觀察者的注意,對于輔助人工干預與自動提示相關人員注意防范等將起重要作用。2)智能代理的基本特性智能代理應至少具備自主性、機動性與個性化服務能力等,具體如下:

(1)自主性智能代理具有自主與協調工作能力,表現其運行的自動化程度,即其操作行為可無需人工干預。但代理在系統中仍須通過人工加以控制,當代理提出請求時,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論