




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、2013高教社杯全國大學(xué)生數(shù)學(xué)建模競賽承 諾 書我們仔細(xì)閱讀了全國大學(xué)生數(shù)學(xué)建模競賽章程和全國大學(xué)生數(shù)學(xué)建模競賽參賽規(guī)則(以下簡稱為“競賽章程和參賽規(guī)則”,可從全國大學(xué)生數(shù)學(xué)建模競賽網(wǎng)站下載)。我們完全明白,在競賽開始后參賽隊員不能以任何方式(包括電話、電子郵件、網(wǎng)上咨詢等)與隊外的任何人(包括指導(dǎo)教師)研究、討論與賽題有關(guān)的問題。我們知道,抄襲別人的成果是違反競賽章程和參賽規(guī)則的,如果引用別人的成果或其他公開的資料(包括網(wǎng)上查到的資料),必須按照規(guī)定的參考文獻的表述方式在正文引用處和參考文獻中明確列出。我們鄭重承諾,嚴(yán)格遵守競賽章程和參賽規(guī)則,以保證競賽的公正、公平性。如有違反競賽章程和參賽
2、規(guī)則的行為,我們將受到嚴(yán)肅處理。我們授權(quán)全國大學(xué)生數(shù)學(xué)建模競賽組委會,可將我們的論文以任何形式進行公開展示(包括進行網(wǎng)上公示,在書籍、期刊和其他媒體進行正式或非正式發(fā)表等)。我們參賽選擇的題號是(從A/B/C/D中選擇一項填寫): 我們的參賽報名號為(如果賽區(qū)設(shè)置報名號的話): 所屬學(xué)校(請?zhí)顚懲暾娜?參賽隊員 (打印并簽名) :1. 2. 3. 指導(dǎo)教師或指導(dǎo)教師組負(fù)責(zé)人 (打印并簽名): (論文紙質(zhì)版與電子版中的以上信息必須一致,只是電子版中無需簽名。以上內(nèi)容請仔細(xì)核對,提交后將不再允許做任何修改。如填寫錯誤,論文可能被取消評獎資格。) 日期: 年 月 日賽區(qū)評閱編號(由賽區(qū)組委會
3、評閱前進行編號):2013高教社杯全國大學(xué)生數(shù)學(xué)建模競賽編 號 專 用 頁 賽區(qū)評閱編號(由賽區(qū)組委會評閱前進行編號): 賽區(qū)評閱記錄(可供賽區(qū)評閱時使用):評閱人評分備注全國統(tǒng)一編號(由賽區(qū)組委會送交全國前編號):全國評閱編號(由全國組委會評閱前進行編號):基于文字特征的碎紙片拼接匹配算法【摘要】破碎文件的拼接在許多領(lǐng)域都有著重要的應(yīng)用,現(xiàn)有的拼接算法主要針對邊界不規(guī)則碎紙片,利用邊緣形狀匹配進行拼接。基于人們的生活習(xí)慣和碎紙機的廣泛使用,很多情況下文字碎片都有著規(guī)則的邊界。尋找對于邊界規(guī)則的碎紙片有效快速的拼接算法是亟待解決的問題。對于問題一,我們首先對碎紙片信息進行預(yù)處理,得到每片碎紙片
4、的灰度值矩陣,并將其轉(zhuǎn)化為0-1矩陣。由于問題一給出的碎紙片只是縱向切割,其拼接方向僅為水平方向左右拼接,我們抽取每個0-1矩陣中的第一列組成左灰度矩陣,將其最后一列組成右灰度矩陣。根據(jù)文字排版中的頁邊距要求,快速準(zhǔn)確的篩選出初始碎片。然后對于左灰度矩陣中的選定碎片對應(yīng)的元素與右灰度矩陣的未拼接碎片對應(yīng)的元素,以相關(guān)系數(shù)大小為依據(jù),挑選相關(guān)系數(shù)最大的兩列碎片進行拼接,設(shè)計了一種相關(guān)系數(shù)匹配算法,對附件1、2給出的碎紙片得到了滿意的拼接結(jié)果。對于問題二,由于碎片既有縱向也有橫向切割,而且碎片較小,在進行拼接時可能遇到某塊碎片有多塊可備選用的碎片的情況。此時計算機無法通過問題一中的匹配算法進行識別
5、,需要進行人工干預(yù)。為了克服這一問題,我們對待拼接的碎片的字高、字寬、間距等邊界特征進行了深度挖掘,基于問題一的相關(guān)系數(shù)匹配算法進行改進,設(shè)計了一種深度匹配算法,對附件3、4進行了成功拼接。其優(yōu)點在于能成功的避免有多塊可備選拼接碎片的情況下計算機無法識別的難題,避免了人工干預(yù),節(jié)省了大量人力和時間。對于問題三,我們在問題二的算法基礎(chǔ)上,對碎片雙面是否都能匹配進行了驗證。由于碎片的正反面未知,待匹配的碎片數(shù)量比之前多了一倍,與某些碎片可能匹配的備選碎片也比較多。但是基于雙面匹配的特殊性,碎片從左往右橫向的排列順序在正反兩面正好相反,因此我們通過深度匹配雙面檢驗算法對附件5給出的碎片進行拼接,得到
6、了滿意的拼接結(jié)果。關(guān)鍵詞:文字特征 灰度矩陣 相關(guān)系數(shù) 匹配算法一 問題的重述破碎文件的拼接在許多領(lǐng)域都有著重要的應(yīng)用。傳統(tǒng)上,拼接復(fù)原工作需由人工完成,準(zhǔn)確率較高,但效率很低。特別是當(dāng)碎片數(shù)量巨大,人工拼接很難在短時間內(nèi)完成任務(wù)。隨著計算機技術(shù)的發(fā)展,人們已開發(fā)出多種碎紙片的自動拼接技術(shù),這些技術(shù)一般利用碎片邊緣的尖點特征、尖角特征、面積特征等幾何特征,搜索與之匹配的相鄰碎紙片并進行拼接。這種基于邊緣幾何特征的拼接方法并不適用于邊緣形狀相似的碎紙片。對于邊緣形狀相同的文字型碎紙片,由于大多數(shù)文字文檔的文字行方向平行且單一,如果碎片內(nèi)的文字行在碎片邊緣斷裂,那么與它相鄰的碎紙片在邊緣處一定有相
7、同高度、相同間距的文字行,憑此特征可以很容易地從形狀相似的多碎片中挑選出相鄰碎片。因文字行線的高度特征、間距特征、字跡斷線識別比碎片邊緣的尖點特征、尖角特征、面積特征等幾何特征的識別實現(xiàn)起來要容易得多,并且也是實際可行的。如何利用現(xiàn)有技術(shù),獲取碎片文字所在行、列的特征信息,比如文字行的行高,文字行的間距等信息,設(shè)計利用這些信息進行拼接的高效算法,有巨大的理論意義和實際應(yīng)用價值。需討論以下問題:(1) 對于給定的來自同一頁印刷文字文件的碎紙機破碎紙片(僅縱切),建立碎紙片拼接復(fù)原模型和算法,并針對附件1、附件2的中、英文各一頁文件的碎片數(shù)據(jù)進行拼接復(fù)原。(2) 對于給定的來自同一頁印刷文字文件的
8、碎紙機破碎紙片(既縱切又橫切),建立碎紙片拼接復(fù)原模型和算法,并對附件3、附件4出的中、英文各一頁文件的碎片數(shù)據(jù)進行拼接復(fù)原。如果復(fù)原過程需要人工干預(yù),請寫出干預(yù)方式及干預(yù)的時間節(jié)點。(3) 對于有雙面打印文件的碎紙片拼接復(fù)原問題需要解決。請嘗試設(shè)計相應(yīng)的碎紙片拼接復(fù)原模型與算法,并就附件5的碎片數(shù)據(jù)給出拼接復(fù)原結(jié)果。二 模型的假設(shè)與符號的說明2.1模型的假設(shè)(1)假設(shè)附件中的每個碎片都必須使用,沒有多余的碎紙片;(2)全部碎紙片正好可恢復(fù)成一篇完整文章,沒有缺失的碎紙片;(3)假設(shè)每個碎片的形狀都一樣;(4)假設(shè)原文件的文字方向都是沿水平方向從左往右的;(5)假設(shè)每個漢字的高度和寬度是一樣的
9、,且每兩個漢字之間的間距相同,每兩行漢字之間的行間距相同;(6)每個英文字母的字號相同,且每兩行之間的行間距相同;2.2符號的說明符號說明相關(guān)系數(shù)碎片的灰度(像素)矩陣碎片的左灰度矩陣碎片的右灰度矩陣左灰度矩陣的列向量右灰度矩陣的列向量注:其他符號已在文章的相應(yīng)部分給出說明三 問題一的分析與建模3.1碎紙片的預(yù)處理附件1、附件2中分別提供了中文、英文19條規(guī)則的文章矩形碎紙片,這些碎紙片形成多種切割類型,有些沿文字從中間被切開,有些在間隔處被切開,如果要恢復(fù)成原文章,相同類型的碎片才能拼接在一起。根據(jù)假設(shè),原文章的文字方向是沿水平方向從左至右的。首先,將給定的碎紙片按文字方向進行排列整理。利用
10、計算機照相技術(shù)將碎片導(dǎo)入成為圖像文件。然后,我們用Matlab軟件,根據(jù)像素特征將圖片轉(zhuǎn)換為對應(yīng)的灰度值矩陣,利用灰度值矩陣得到兩個碎片相關(guān)系數(shù),根據(jù)相關(guān)系數(shù)的大小進行拼接。3.2像素矩陣的建立 附件1中有19個碎片,每個碎片的圖像大小為1980*72像素。我們用matlab軟件將每張圖片轉(zhuǎn)換為1980*72大小的矩陣。矩陣中每個數(shù)值記錄了圖片對應(yīng)像素的灰度信息。如果該對應(yīng)位置的圖像是全白的則數(shù)值為255,全灰的數(shù)值為0,其余的介于0和255之間。為了簡化處理,將矩陣中數(shù)字為255的記為0,表示灰度為全白,數(shù)字不為0的記為1,表示有部分灰度。這樣依照題目中碎紙片的編號順序,對于每張碎片我們可以
11、得到一個1980*72階的0-1矩陣,稱為該碎片的像素矩陣。19個碎片可以得到19個像素矩陣。由于附件1碎紙片都是縱切的,在實際的拼接過程中,只能在一片碎紙片的左、右兩側(cè)按照水平方向進行拼接。這樣在拼接過程中我們只會用到碎紙片的左、右兩個邊緣的信息,反映到該碎片的像素矩陣中,即的第一列和最后一列的信息。通過上面的討論,提取19個像素矩陣中每個矩陣的第一列,組成一個1980*19的0-1矩陣,稱為碎片的左灰度矩陣, 提取19個像素矩陣中每個矩陣的最后一列,組成一個1980*19的0-1矩陣,稱為碎片的右灰度矩陣。類似可以對附件2做類似處理,得到相應(yīng)的各19個左灰度矩陣和右灰度矩陣。3.3碎片相關(guān)
12、系數(shù)的計算 兩片碎紙片能否成功進行拼接,取決于這兩片碎紙片待拼接的邊界的信息,即這兩片碎紙片待拼接的邊界吻合、相似程度。可以用這兩片碎紙片的左灰度矩陣,右灰度矩陣中列向量的相關(guān)系數(shù)按照公式:來計算。相關(guān)系數(shù)的變化范圍為-1到1。的值越大,表示這兩片碎紙片待拼接的邊界吻合、相似程度越好,拼接成功的可能性越大,反之的值越小,表示這兩片碎紙片待拼接的邊界不吻合、相似程度越差,拼接成功的可能性越小。 在進行相關(guān)性分析時,要求變量的標(biāo)準(zhǔn)差不為零,對應(yīng)此題即要求兩片碎紙片的左灰度矩陣,右灰度矩陣中列向量都不全為0或不全為1。倘若出現(xiàn)此類情況則需要進行人工干預(yù)或探究更深層次的算法。顯然,此題的碎片長度能很好
13、地保證變量的標(biāo)準(zhǔn)差不為零,所以可以應(yīng)用相關(guān)性分析來拼合碎片。以008號碎紙片為例,利用如果欲將剩余的18條碎紙片拼接在其右端。利用左灰度矩陣中第九列元素與右灰度矩陣中列向量按照上述公式計算可得相關(guān)系數(shù)為:表一 相關(guān)系數(shù)表編號000001002003004005006007009相關(guān)系數(shù)0.25550.28060.01540.19450.17960.25530.19100.12620.0883編號010011012013014015016017018相關(guān)系數(shù)0.20710.16040.04010.06580.72550.00100.09620.17310.2852 由上表可以得知,008號右邊拼
14、接014號紙條的相關(guān)匹配效果最好。3.4模型建立與算法設(shè)計3.4.1初始碎片的選取 根據(jù)文字排版要求,文章左邊留有一定寬度的空格。反應(yīng)在我們建立的像素矩陣上即矩陣左側(cè)有若干列數(shù)字全為0,反映在灰度矩陣上即為:左灰度矩陣中必有若干列所有元素全為0,此列對應(yīng)的碎片應(yīng)該排在原文檔的第一列。因此,根據(jù)文章文字排版格式,空格的寬度大約為11像素,我們可以從像素矩陣中挑選左邊11列元素全為0的碎片為初始碎片,按照文字水平方向從左至右進行拼接。3.4.2碎片拼接規(guī)則 按照上面的分析,我們選取相關(guān)系數(shù)的兩片碎片進行拼接。其中、3.4.3算法設(shè)計步驟一:記全體未拼接碎片組成的集合為,已拼接碎片組成的集合為,;步
15、驟二:令k=0;步驟三:從左灰度矩陣中挑選元素全為0的一列對應(yīng)的碎片為初始碎片,記為;步驟四:令,;步驟五:記對應(yīng)的左灰度矩陣列向量為,記中對應(yīng)的碎片右灰度矩陣的列向量為,計算相關(guān)系數(shù);步驟六:令k=k+1;步驟七:選取使得相關(guān)系數(shù)最大的對應(yīng)的碎片為。將拼接在的右邊;步驟八:若,則匹配結(jié)束。否則,則跳至步驟四。算法流程圖如下:3.5模型計算結(jié)果 將附件1、附件2中的19條碎紙片信息代入我們模型和算法,利用Matlab編程,得到結(jié)果如下:表二 附件1的碎片數(shù)據(jù)拼接復(fù)原結(jié)果008014012015003010002016001004005009013018011007017000006表三 附件2
16、碎片數(shù)據(jù)拼接復(fù)原結(jié)果003006002007015018011000005001009013010008012014017016004 四 問題二的分析與建模4.1問題二的分析附件3、4中分別提供了中文、英文各209條規(guī)則的既縱切又橫切的文章矩形碎紙片,每個碎片的像素為180*72,大小僅為問題一中碎片大小的十一分之一。如果原照問題一中的處理方法,由于碎片上文字像素的高度和寬度均有限,在進行拼接時會遇到相關(guān)系數(shù)相同的幾片碎片同時都可以作為備選碎片,如下列情況出現(xiàn),此時計算機是無法識別的,必須采取人工干預(yù)的方法進行拼接。利用人工干預(yù)的方法有一定的偶然性,并且會消耗大量的人力和時間。為了解決問題,
17、我們設(shè)計一種深度匹配算法,能夠有效的避免人工干預(yù)。 情況1. 003 159 012 076 085 如果要在003號碎片右端拼接一塊碎片,通過計算相關(guān)系數(shù),159、012,076、085號碎片與003號碎片有相同的相關(guān)系數(shù),這四片碎片都可以作為003號碎片右方拼接的備選碎片,計算機無法進行選擇,這時就要進行人工干預(yù)。由于文字的高度始終是不變的,能夠拼接在一起的文字的高度要相等,即在灰度矩陣中兩塊碎片相鄰的灰度高度應(yīng)該相同,通過計算機識別,明顯發(fā)現(xiàn)003號碎片與076號碎片有不同的灰度高度,它們不能進行拼接。雖然003號碎片與012、076、085拼接后有相吻合的灰度高度。但是文章中字的寬度是
18、不變的約為40個像素,經(jīng)過計算機識別,如果將003號碎片與012、085碎片拼接形成一個完整的字,它的寬度大大超過了40個像素,而將003號碎片與159號碎片拼接,能夠形成一個完整的字,所以003號碎片右邊應(yīng)與159號碎片拼接。情況2. 036 067 007 061 094 如果要在036號碎片右端拼接一塊碎片,通過計算相關(guān)系數(shù),067,007、061、094號碎片與003號碎片有相同的相關(guān)系數(shù),這四片碎片都可以作為036號碎片右方拼接的備選碎片,能夠拼接在一起的文字的高度要相等,即在灰度矩陣中兩塊碎片相鄰的灰度高度應(yīng)該相同,通過計算機識別,明顯發(fā)現(xiàn)036號碎片與094號碎片有不同的灰度高度
19、,它們不能進行拼接。雖然036號碎片與012、076、085拼接后有相吻合的灰度高度。但是文章中字與字間距是不變的,約為5個像素,經(jīng)過計算機識別,如果將003號碎片與007、061號碎片拼接在一起時,它們的間距大大超過了5個像素,而將036號碎片與067號碎片拼接,能夠恰好形成合適的間距,所以036號碎片右邊應(yīng)與067號碎片拼接。對于英文文件,可以將英文單詞圖像拆分成類漢字圖像,即將英文單詞圖像分割成寬度與高度近似的類漢字圖像,應(yīng)用上面的方法進行類似處理。4.2模型建立與算法設(shè)計4.2.1像素矩陣的建立與初始碎片篩選 仿照問題一,對附件3中209個碎片進行照相,每個碎片的圖像大小為180*72
20、像素,進而得到相應(yīng)的209個180*72階灰度矩陣、209個180*72階的0-1像素矩陣、兩個180*209階的左灰度矩陣和右灰度矩陣。 類似問題一,以文章左邊空格的寬度11像素為條件,先篩選出位于文章第一列的11塊碎紙片,為編號007,014,029,038,049,061,071,089,094,125,168的碎紙片。4.2.2 深度匹配算法 按照問題一的匹配拼接算法,依次對第一列11塊碎片進行橫向拼接。如果遇到上邊例子中舉出的情況,此時算法無法進行下去,我們分別利用文字在碎塊中的高度、寬度和文字之間的間隔距離分情況進行深度匹配,將碎塊拼接為11塊長度為1*19的大塊。以其中一組的拼接
21、過程為例:步驟一:記全體未拼接碎片組成的集合為,已拼接碎片組成的集合為,;步驟二:令k=0;步驟三:挑選初始碎片,記為;步驟四:令,;步驟五:記對應(yīng)的左灰度矩陣列向量為,記中對應(yīng)的碎片右灰度矩陣的列向量為,計算相關(guān)系數(shù);步驟六:選取使得相關(guān)系數(shù),若相關(guān)系數(shù)有唯一最大值,即有唯一匹配的碎片則跳至步驟七,否則跳至步驟九;步驟七:令k=k+1;步驟八:選取唯一匹配的碎片為。將拼接在的右邊。跳至步驟九;步驟九:利用文字在碎塊中的高度、寬度和文字之間的間隔距離分情況進行深度匹配。若得到唯一匹配,則跳至步驟七;步驟十:若k19或,匹配結(jié)束。否則,則跳至步驟四。算法流程圖如下:4.2.3大碎片的縱向拼接 通
22、過上邊的算法,我們最后得到11條橫向拼接完成的大碎紙條。將這11塊大碎紙條按照順時鐘方向旋轉(zhuǎn)90度,即原位于最下面的紙條轉(zhuǎn)到第一列,第一行大紙條位于最后一列。此時我們就將問題轉(zhuǎn)化為形如問題一中的11列的橫向拼接問題。此時只需給出這11塊大紙條的左灰度矩陣和右灰度矩陣。這可以通過重新照相掃描得到。或者通過現(xiàn)有灰度矩陣通過選取它們最下面一行元素組成下灰度矩陣和選取它們最上面一行元素組成下灰度矩陣,然后將它們旋轉(zhuǎn)90度得到。4.3模型計算結(jié)果將附件3、附件4中的209條碎紙片信息代入我們模型與算法,利用Matlab編程,得到結(jié)果見附錄三、四、五、六。五 問題三的分析與建模5.1問題的分析附件5中提供
23、了英文雙面打印的418個規(guī)則的矩形碎片圖像,這418個圖像分別為209塊碎片的a、b面,其中每個圖像的像素為180*72。由于我們不知道每塊碎片對應(yīng)的a、b面是屬于文章的正面還是反面,因此在匹配過程中,需要將一塊碎片的某一面與其他碎片的雙面都進行匹配嘗試,從而找出最佳匹配碎片。在問題二的深度匹配算法基礎(chǔ)之上,我們對418塊圖像進行拼接,同時基于雙面打印文章的特性,碎片從左往右橫向的排列順序在正反兩面正好相反,我們還能通過觀察碎片正反兩面拼接的效果,驗證雙面是否都能成功匹配,并將屬于同一面的碎片準(zhǔn)確拼接還原成原文。5.2模型建立與算法設(shè)計5.2.1像素矩陣的建立與初始碎片篩選 仿照問題一和問題二
24、,對附件5中的418個碎片進行照相,每個圖像的大小為180*72像素,進而得到相應(yīng)的418個180*72大小的灰度矩陣,并按照問題一和問題二的方法轉(zhuǎn)化得到180*72階的0-1像素矩陣。由于此問中的切割方式同問題二,除了縱切還有橫切,我們采取問題二中的方式提取矩陣的邊緣信息,得到相應(yīng)的左灰度矩陣、右灰度矩陣。 類似問題二,以文章左邊空格的寬度11像素作為條件,先篩選出位于文章第一列的22個碎片圖像,它們分別屬于11行碎片的兩面。選出的紙片編號為:003b、005b、009a、013b、023b、035b、054a、078b、083b、088b、089a、090b、099a、105b、114a、
25、136a、143a、146a、165b、172b、186b、199b的碎紙片。5.2.2深度匹配雙面檢驗算法按照問題二的匹配拼接算法,先篩選出位于第一列的碎紙塊,由于按雙面計算,則位于第一列有22塊碎紙塊。再依次對第一列22塊碎片進行橫向拼接。算法設(shè)計步驟如下:以其中一組的拼接過程為例步驟一:記全體未拼接碎片組成的集合為,已拼接碎片組成的集合為,;步驟二:令k=0;步驟三:挑選初始碎片,記為;步驟四:令,;步驟五:記對應(yīng)的左灰度矩陣列向量為,記中對應(yīng)的碎片右灰度矩陣的列向量為,計算相關(guān)系數(shù);步驟六:選取使得相關(guān)系數(shù),若相關(guān)系數(shù)有唯一最大值,即有單面最優(yōu)匹配的碎片則跳至步驟七;否則跳至步驟十;步
26、驟七:將與對應(yīng)的另一面與進行相似度檢驗。若通過相似度檢驗,即與也能匹配,則跳至步驟九;否則跳至步驟八。步驟八:舍棄單面最優(yōu)匹配方案,即令,若,匹配結(jié)束;否則據(jù)相關(guān)系數(shù)選取次優(yōu)匹配的碎片,跳至步驟七。步驟九:令k=k+1,選取經(jīng)檢驗可以匹配的的碎片為。將拼接在的右邊。若k19,匹配結(jié)束;否則跳至步驟四;步驟十:利用文字在碎塊中的高度、寬度和文字之間的間隔距離分情況進行深度匹配。若得到唯一最優(yōu)匹配,則跳至步驟七。當(dāng)22行碎片橫向拼接完成后,我們需要將每一行碎片縱向拼接復(fù)原成原文章。根據(jù)紙張雙面的特征,我們發(fā)現(xiàn)碎片從左往右橫向的排列順序在正反兩面正好相反。我們也恰利用這一特點對拼接匹配的紙條進行檢驗
27、,如某一行一面的排列順序為:003b007b085b148b077a004a069a032a074b126b176a185a000b080b027a135b141a204b105a則該行在另一面的碎片排列順序為:105b204a141b135a027b080a000a185b176b126a074a032b069b004b077b148a085a007a003a 因此,我們可以根據(jù)已排列完成的22條長碎片的頭尾編號將22條兩兩對應(yīng)分為11組,重新編號為iA或iB,i=1,211。然后我們改進了第二問中的算法,設(shè)計了雙面橫向匹配算法,即首先根據(jù)問題二中運用的大碎片的縱向拼接法,對重新編號后的11
28、條iA,i=1,211和11條iB,i=1,211分別單獨地進行A、B兩面的拼接。待拼接好后,核對A、B兩面的碎片拼接順序,遵從碎片從上倒下的排列順序兩面相同,碎片從左往右橫向的排列順序在正反兩面正好相反的規(guī)則。運用雙面橫向匹配算法,我們得到了附件5較滿意的結(jié)果。5.3模型計算結(jié)果 將附件5中的418塊碎紙片信息代入我們模型和算法,利用Matlab編程,得到的結(jié)果見附錄七、附錄八、附錄九與附錄十。四 模型的評價與推廣4.1模型的評價4.1.1模型的主要優(yōu)點: 拼接復(fù)原的模型是基于文字信息構(gòu)建,先對邊緣像素矩陣進行相關(guān)性分析,將相關(guān)性系數(shù)較大的紙片進行匹配。相比手工復(fù)原,這大大提高了工作效率。
29、在對小塊紙片拼接中,我們重復(fù)利用文章文字的信息與文章結(jié)構(gòu)的特征。對小分塊做相關(guān)性分析時,當(dāng)遇到有多個相似度較高的紙片時,我們又抓住文字的行高、列寬、文字間距、文字大小等信息建立深度匹配算法再進行拼接匹配,大大提高了匹配效率,將人工干預(yù)減小到最小化,節(jié)省了大量的人力。 模型不僅可以解決中文字碎片的拼接,在英文單詞拼接方面也有很大的實用性。 深度匹配雙面檢驗算法模型對兩面進行相關(guān)性分析進而進行匹配,通過正反兩面的檢驗大大提高了匹配的效率。4.1.2模型的改進:文章中所構(gòu)建的模型是從像素矩陣的相關(guān)性分析出發(fā),所以照片像素大小影響了匹配的效率與準(zhǔn)確率。而照片像素越高,分得越細(xì),其識別率和匹配路程越高,
30、所以在拼接技術(shù)提高這一塊可以提高照片的像素或進一步改進匹配方式來提高工作效率。4.2模型的推廣 該模型有很大的應(yīng)用前景,對于規(guī)則無序的小碎片可以進行快速拼接匹配,大大減少人力、財力,特別在司法物證復(fù)原、歷史文獻修復(fù)、軍事情報獲取等領(lǐng)域能發(fā)揮很大的作用。參考文獻1賈海燕,碎紙拼接關(guān)鍵技術(shù)研究,國防科學(xué)技術(shù)大學(xué)研究生院:7-8,2005.2羅智中,基于文字特征的文檔碎紙片半自動拼接,計算工程與應(yīng)用:2012.3韓中庚,數(shù)學(xué)建模方法及其應(yīng)用,高等教育出版社,2009年.4姜啟源,數(shù)學(xué)模型,高等教育出版社,2007年.5胡曉東,董辰輝,MATLAB從入門到精通,人民郵電出版社,2010年.附錄附錄一
31、附件1復(fù)原圖附錄二 附件2復(fù)原圖附錄三 附件3復(fù)原圖附錄四 附件3復(fù)原圖的碎片序號0490540651431860020571921781181900950110221290280911881410610190780670690991620961310790631161630720061770200520361681000760621420300410231471910501791200861950260010870180381480461610240350811891221031301930881670250080091050740711560831322000170800332021980
32、151331702050851521650270600141280031590821991350120731602031691340390310511071151760940340841830900471210421241440771121490971361641270580431250131821091970161841101870661061500211731571812041391450290641112010050921800480370750550442060101040981721710590072081381581260681750451740001370530560931530
33、70166032196089146102154114040151207155140185108117004101113194119123附錄五 附件4復(fù)原圖附錄六 附件4復(fù)原圖的碎片序號191075011154190184002104180064106004149032204065039067147201148170196198094113164078103091080101026100006017028146086051107029040158186098024117150005059058092030037046127019194093141088121126105155114176182
34、151022057202071165082159139001129063138153053038123120175085050160187097203031020041108116136073036207135015076043199045173079161179143208021007049061119033142168062169054192133118189162197112070084060014068174137195008047172156096023099122090185109132181095069167163166188111144206003130034013110025
35、027178171042066205010157074145083134055018056035016009183152044081077128200131052125140193087089048072012177124000102115附錄七 附件5(一)復(fù)原圖的碎片序號附錄八 附件5(一)復(fù)原圖的碎片序號136a047b020b164a081a189a029b018a108b066b110b174a183a150b155b140b125b111a078a005b152b147b060a059b014b079b144b120a022b124a192b025a044b178b076a036b
36、010a089b143a200a086a187a131a056a138b045b137a061a094a098b121b038b030b042a084a153b186a083b039a097b175b072a093a132a087b198a181a034b156b206a173a194a169a161b011a199a090b203a162a002b139a070a041b170a151a001a166a115a065a191b037a180b149a107b088a013b024b057b142b208b064a102a017a012b028a154a197b158b058b207b116a
37、179a184a114b035b159b073a193a163b130b021a202b053a177a016a019a092a190a050b201b031b171a146b172b122b182a040b127b188b068a008a117a167b075a063a067b046b168b157b128b195b165a105b204a141b135a027b080a000a185b176b126a074a032b069b004b077b148a085a007a003a009a145b082a205b015a101b118a129a062b052b071a033a119b160a095b
38、051a048b133b023a054a196a112b103b055a100a106a091b049a026a113b134b104b006b123b109b096a043b099b附錄九 附件5(二)復(fù)原圖附件十 附件5(二)復(fù)原圖的碎片序號078b111b125a140a155a150a183b174b110a066a108a018b029a189b081b164b020a047a136b089a010b036a076b178a044a025b192a124b022a120b144a079a014a059a060b147a152a005a186b153a084b042b030a038a1
39、21a098a094b061b137b045a138a056b131b187b086b200b143b199b011b161a169b194b173b206b156a034a181b198b087a132b093b072b175a097a039b083a088b107a149b180a037b191a065b115b166b001b151b170b041a070b139b002a162b203b090a114a184b179b116b207a058a158a197a154b028b012a017b102b064b208a142a057a024a013a146a171b031a201a050a190b092b019b016b177b053b202a021b130a163a193b073b159a035a165b195a128a157a168a046a067a063b075b167a117b008b068b188a127a040a182b122a172a003b007b085b148b077a004a069a032a074b126b176a185a000b080b027a135b141
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 武漢學(xué)院《城鄉(xiāng)空間分析與規(guī)劃新技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 上海健康醫(yī)學(xué)院《城市經(jīng)濟分析方法(雙語)》2023-2024學(xué)年第二學(xué)期期末試卷
- 濰坊學(xué)院《創(chuàng)意文化產(chǎn)業(yè)》2023-2024學(xué)年第二學(xué)期期末試卷
- 泰山學(xué)院《幼兒保健學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 南陽職業(yè)學(xué)院《景觀設(shè)計快題表達(dá)》2023-2024學(xué)年第二學(xué)期期末試卷
- 石屏縣2024-2025學(xué)年三下數(shù)學(xué)期末調(diào)研模擬試題含解析
- 確山縣2025年數(shù)學(xué)三下期末監(jiān)測模擬試題含解析
- 江西水利職業(yè)學(xué)院《燃?xì)馀c蒸汽聯(lián)合循環(huán)》2023-2024學(xué)年第二學(xué)期期末試卷
- 二零二五版家具買賣合同樣式
- 酒店投資協(xié)議書范例二零二五年
- FANUC發(fā)那科機器人常規(guī)點檢保養(yǎng)
- 醫(yī)藥有限公司公司獎懲制度
- 微電子學(xué)概論全套課件
- 實驗室氣瓶使用記錄
- DB37T 2974-2017 工貿(mào)企業(yè)安全生產(chǎn)風(fēng)險分級管控體系細(xì)則
- DB13(J)∕T 8054-2019 市政基礎(chǔ)設(shè)施工程施工質(zhì)量驗收通用標(biāo)準(zhǔn)
- 混雜纖維增強的復(fù)合材料介紹、特點和應(yīng)用
- 星巴克哈佛商學(xué)院案例
- 工程項目內(nèi)部控制流程圖表
- 強夯試夯報告(共12頁)
- 骨優(yōu)導(dǎo)介紹PPT
評論
0/150
提交評論