標準解讀

《GB/T 36338-2018 信息處理用藏文文獻文本信息標記規范》是一項國家標準,旨在為藏文文獻的數字化處理提供一套統一的信息標記規則。該標準主要針對藏文電子文檔中的文字、段落、標題等元素如何進行結構化和語義化的標注給出指導,以便于這些文獻能夠在不同的軟件系統間被正確解析與利用。

在具體內容上,《GB/T 36338-2018》定義了一系列標簽(或稱為元素),每個標簽都有其特定用途,用來描述文本的不同部分或屬性。例如,可能會有專門用于標識文章標題、作者姓名、出版日期等信息的標簽。通過使用這些預定義好的標簽來包裹相應的內容,可以使得計算機程序更容易識別并處理藏語文獻中的關鍵信息。

此外,該標準還可能涵蓋了關于如何表示特殊字符、音標符號以及非標準寫法等方面的指南,這對于確保藏文內容在網絡環境下的準確傳輸非常重要。同時,它也可能包含了對XML或其他標記語言語法的具體要求,因為這類語言常被用來實現復雜的文檔結構標記。


如需獲取更多詳盡信息,請直接參考下方經官方授權發布的權威標準文檔。

....

查看全部

  • 現行
  • 正在執行有效
  • 2018-06-07 頒布
  • 2019-01-01 實施
?正版授權
GB/T 36338-2018信息處理用藏文文獻文本信息標記規范_第1頁
GB/T 36338-2018信息處理用藏文文獻文本信息標記規范_第2頁
GB/T 36338-2018信息處理用藏文文獻文本信息標記規范_第3頁
GB/T 36338-2018信息處理用藏文文獻文本信息標記規范_第4頁
免費預覽已結束,剩余20頁可下載查看

下載本文檔

GB/T 36338-2018信息處理用藏文文獻文本信息標記規范-免費下載試讀頁

文檔簡介

ICS3524001

L70..

中華人民共和國國家標準

GB/T36338—2018

信息處理用藏文文獻文本信息標記規范

SpecificationonTibetanliteraturetextmarkupforinformationprocessing

2018-06-07發布2019-01-01實施

國家市場監督管理總局發布

中國國家標準化管理委員會

GB/T36338—2018

目次

前言

…………………………Ⅰ

范圍

1………………………1

規范性引用文件

2…………………………1

術語和定義

3………………1

藏文文獻的標記框架

4……………………1

藏文文獻文本基本屬性的標記

5…………2

藏文文獻文本結構信息的標記

6…………4

藏文文獻文本標記規范

7…………………8

附錄資料性附錄更敦群培文集的標記范例

A()《》TEI……………18

GB/T36338—2018

前言

本標準按照給出的規則起草

GB/T1.1—2009。

請注意本文件的某些內容可能涉及專利本文件的發布機構不承擔識別這些專利的責任

。。

本標準由全國信息技術標準化技術委員會提出并歸口

(SAC/TC28)。

本標準起草單位中國電子技術標準化研究院西北民族大學西藏自治區藏語文工作委員會辦公

:、、

室西藏大學青海師范大學西藏自治區工業與信息化廳中國標準化研究院中國科學院軟件研究所

、,、、、、

青海民族大學中國藏學研究中心民族出版社北京北大方正電子有限公司濰坊北大青鳥華光照排有

、、、、

限公司

。

本標準主要起草人多拉扎西加熊濤尼瑪才讓楊本加多杰卓瑪索南才讓冷本扎西劉匯丹

:、、、、、、、、、

仁青卓么項見措格桑多吉黃鶴鳴才讓加

、、、、。

GB/T36338—2018

信息處理用藏文文獻文本信息標記規范

1范圍

本標準規定了藏文數字文獻的文本信息標記

。

本標準適用于藏文語料庫建設及藏文各種文獻的數字化標記

2規范性引用文件

下列文件對于本文件的應用是必不可少的凡是注日期的引用文件僅注日期的版本適用于本文

。,

件凡是不注日期的引用文件其最新版本包括所有的修改單適用于本文件

。,()。

信息處理文本和辦公系統標準通用置標語言

GB/T14814—1993(SGML)

3術語和定義

下列術語和定義適用于本文件

。

31

.

藏文文獻Tibetanliterature

由藏文包括古藏文及梵文轉寫構成的各種文獻

()。

32

.

文本置標語言textencodinginitiativeTEI

;

一種定義電子文檔結構和描述其內容的國際標準語言

。

注1目前在信息處理界電子圖書館相關計劃中普遍使用的置標語言適用于對電子形式的全文的編碼和描述

:,。

注2元數據標準同時也規定了可供數據交換的標準編碼格式采用文件格式

:TEI,SGML。

33

.

班智達Bantita

梵語意為學識淵博的學者專指參與經典翻譯的印度等地學者

,,。

注班智達和譯師分為藏文文獻厘定前與厘定后兩種

:。

4藏文文獻的標記框架

適用于對電子形式的全文的編碼和描述元數據標準同時也規定了可供數據交換的標準

TEI。TEI

編碼格式使用規定的作為其編碼語言格式具有很大限度的靈活

,GB/T14814—1993SGML。TEI

性綜合性可擴展性能支持對各種類型或特征的文檔進行編碼元數據標記可以對語料庫的文

、、,。TEI

本屬性信息與文本結構信息進行規范的標記

。

文檔也是一個文檔一般有四個部分題名文本前的信息

TEI,SGML,:teiHeader(),front(),body

正文文本后的信息對電子文本對象的描述對正文前的信息描述包含

(),back()。TeiHeader:

溫馨提示

  • 1. 本站所提供的標準文本僅供個人學習、研究之用,未經授權,嚴禁復制、發行、匯編、翻譯或網絡傳播等,侵權必究。
  • 2. 本站所提供的標準均為PDF格式電子版文本(可閱讀打?。驍底稚唐返奶厥庑裕唤浭鄢?,不提供退換貨服務。
  • 3. 標準文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質量問題。

評論

0/150

提交評論