




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
成年線蟲高分辨率圖像的自動標注什么是秀麗隱桿線蟲秀麗隱桿線蟲(Caenorhabditiselegans)是一種能夠在溫和環境中獨立生存的土壤線蟲,以微生物如大腸桿菌(E.coli)等為食,有雄性及雌雄同體(hermaphrodite)兩種性別。自然界中,絕大多數個體為雌雄同體,雄性僅占0.05%秀麗隱桿線蟲的優勢線蟲是一種非常簡單多細胞真核生物。線蟲結構簡單且通身透明體細胞數目恒定,雌雄同體的成蟲含有959個體細胞和約2000個生殖細胞;雄性成蟲有1031個體細胞和約1000個生殖細胞線蟲生命周期短,從一個受精卵發育成可以產卵的成蟲只需要兩三天,節約了實驗所消耗的時間由于具有雄性和雌雄同體這兩種性別,線蟲在遺傳研究上具有無可比擬的優勢秀麗隱桿線蟲的生命周期研究秀麗隱桿線蟲的意義線蟲在生命科學的各個領域,包括胚胎發育、性別決定、細胞凋亡、行為與神經生物學等的研究中得到廣泛應用。在MAPK信號傳導、細胞程序性死亡、TGF-β信號傳遞途徑、RNAi干擾和smallRNA、衰老和壽命及脂肪代謝等方面取得了重大突破。可見線蟲作為模式生物對于生命科學領域具有非凡的意義。組合優化問題介紹三要素:變量,約束和目標函數變量:求解過程中選定的基本參數約束:對變量取值的限制目標函數:可行方案衡量標準的函數目標:從組合問題的可行解集中求出最優解組合優化問題介紹組合優化問題是在給定的約束條件下,求目標函數最優值(最小值或最大值)的問題。組合優化問題的一個實例可以表示為一個對偶(S,f),其中解空間S為可行解集,目標函數f是一個映射,定義為f:S->R求目標函數最小值的問題稱為最小化向題,記為minf(i),i屬于S同理,求目標函數最大值的同題稱為最大化間題,記為maxf(i),i屬于S算法提出的意義過去標定秀麗隱桿線蟲圖像上的細胞是手動分割的,這非常的單調并且耗時之前偶匹配算法是適用于L1狀態(第一幼蟲時期),它是基于位置的算法,L1時期細胞位置和數目是相對固定的。但是到成蟲期,細胞數目急劇增長,細胞種類和空間位置也發生明顯變化,故在成蟲期不適用本文算法介紹本文作者將成年線蟲的細胞標定問題轉為為組合優化問題,該算法基于先前的偶匹配算法,但豐富了評價函數。加入了諸如細胞尺寸,鄰里密度等特征然后,作者介紹了利用最小損失最大流來解決組合優化問題,并且運用一種基于交叉熵–基學習算法來調節模型的參數,提高匹配正確率上圖是成年線蟲在Z軸上的投影,藍色部分有由DAPI染色,代表細胞中的DNA,綠色是由綠色熒光蛋白(GFP)染色,代表細胞核算法的表示將細胞標定問題轉化為組合優化問題假設圖像中有p個細胞
(它們的位置和邊界已經在預處理中提取)。表示我們希望預測每個細胞所對應的標簽,表示的候選標簽代表那些沒有被標定細胞,等代表訓練集中q種由專業人員標定的不同細胞。于是給每個細胞決定的任務就變成了如下組合優化問題:(i)每個細胞只分配一個來自的標簽(ii)每個標簽只分配給每個細胞(iii)這個未指定的標簽可能對應了多個細胞算法的表示是一個矩陣,當細胞和標簽相匹配時,將置1,否則置0。同樣的,是由可能的細胞標簽分配所組成的損失函數,最后,問題可表示為:
subjectto
注:上面的這些限制確保了每個細胞只能分配惟一的標簽,反過來也是一樣
損失矩陣的定義眾所周知損失值是算法重要因素。所以我們相對之前的算法考慮了更多的特征,列舉如下:(1)細胞位置(2)細胞尺寸(3)GFP表達水平(4)DAPI強度(5)附近細胞(6)細胞形狀所有上面的因素都是專業標定師在標定成熟線蟲所考慮的特征損失矩陣的定義這里,我們先單獨考慮細胞的位置(其他的特征的損失矩陣類似)。假設我們已經得到了線蟲圖像的訓練集我們用表示在標準蟲坐標空間的3D向量坐標,每一維都是零均值和方差。損失矩陣的一種表示方法是馬氏距離:
(2)
表示是一個3D向量,它表示具有標簽訓練細胞位置的平均值表示樣本位置的協方差矩陣,當然上述表達式可簡寫為
(3)這里的均值和方差都是由基于來自訓練數據中標簽為細胞估計的。最后,損失函數可以表示為:
(4)這里,是(log)權值。最后,損失函數可以表示為:組合優化算法的求解-最小損失一種方法是應用直接的最大權值的二分匹配。該算法主要思想是構造一個二分圖,圖的兩邊各包含p個節點。左邊空間每個節點代表每個輸入細胞右邊空間每個節點代表每個非空標簽以及p-q個代表空標簽的左邊空間第i個節點與右邊空間第j個節點匹配的開銷記為求最小損失匹配最終的復雜度為,是比較耗時的算法本文算法在求解最小損失的復雜度為,該算法很靈活,允許我們進一步的拓展來處理細胞分裂的特殊情況本文算法-最小損失最大流問題構造一個有向圖G=(V,E)包括p個輸入細胞節點(表示)q+1個節點代表細胞的可能標簽()還有2個節點s和t,分別代表源和底邊包括以下幾方面:(1)表示從源節點到第i個輸入細胞的節點的邊(2)表示第i個輸入細胞節點到第j個標簽節點的邊(3)第j個標簽節點到底節點邊每條邊(a,b)都有一個下限,一個上限,損失我們規定:前兩行約束確保所有的細胞和非空標簽都匹配一次,第三行確保有p-q個細胞匹配空標簽最后一行指細胞匹配標簽的損失本文算法算法的最小損失最大流問題可以表示如下:
subjectto這里代表了每個節點標記后的補充值,表示如下ifu=sifu=totherwise這里,表示用標簽注釋細胞分裂細胞的注釋雖然成年線蟲的細胞譜系是已知的,基本上是固定的,但是仍然有例外,尤其是本文數據中每個線蟲有四個細胞可能會經歷一次細胞分裂,分別在P={143,146,149,152}
對于標簽為j的母細胞,其子女細胞可表示為{j+1,j+2}我們通過增加點和邊來改變前面的二分圖,對于每個母細胞j,創建兩個‘決定”節點,創建的邊如下表示:修改:原先所有直接從到底節點t的應該刪除空標簽到底節點,約束修改為r表示可以進行分裂的母細胞的個數,這里r=4
分裂細胞的注釋‘決定”節點被用來加強互斥約束。例如右圖中確保了母節點或子節點在最后的注釋顯示出來,同樣的,同樣的,決定是否注釋特別地,如果被注釋了,確保也被注釋。同樣的,如果沒有被注釋,即母細胞沒有分裂,那么確保母細胞被注釋實驗結果訓練數據:成年雌雄同體線蟲25天的圖像,這些圖像同樣被DAPI和GFP染色。每張圖像都被注釋了142標簽包括腸道,肌肉和皮下細胞,另外,一同被注釋的還有經歷分裂的細胞和12個特殊的額外細胞,我們從這些細胞中提取位置,尺寸等特征。1、采用五倍交叉驗證的未經訓練的匹配方法上表是利用五倍交叉驗證每個單獨細胞注釋的結果:用20組線蟲訓練,預測剩下的5組表中前兩行表示模型單獨用"位置"特征,不包括未標記的細胞損失時(loc-),模型得到了平均每只線蟲36%的正確率,否則即(loc+)得到了41%的正確率。其他的在表中可以看出。實驗結果2、使用經過訓練的特征權值為了提高單個線蟲的平均正確率,在以上方法的基礎上對損失函數的權值進行訓練,結果如下:
上表是包括了未標簽細胞的損失,且包括所有特征(full+)從表中數據可以看出,相比用平均特征權重,使用訓練后的特征權重單個線蟲和細胞的正確率上升了,達到了77%。實驗結果黑色代表未經訓練的并且只包含位置特征模型,灰色代表未經訓練的全特征模型,白色代表使用了經過訓練后的全特征模型從表中可以看出,僅僅使用位置特征的模型正確率中位數為35%,對于訓練后的模型它為84%。(平均值為77%)。實驗結果使用網絡流識別分裂細胞的正確率由前面知識可知:每只線蟲只有4個細胞可能發生分裂本次試驗中,我們觀察到54處腸細胞經歷了細胞分裂,在25個線蟲中只有3個線蟲的四個細胞沒有發生分裂。Ventral9andVentral10代表兩個腹側細胞,Dorsal9andDorsal10代表兩個背腸細胞由表可知,總體的正確率為80%。背腸細胞的正確率分別為80%和88%。最具有挑戰性的是Ventral9,只取得了72%的正確率。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度新能源項目資金入股合作協議
- 二零二五年度醫療健康產業干股投資合同
- 二零二五年度人工智能教育平臺研發人員勞動合同
- 2025年度集體合同協商中的工作時間和休息制度
- 二零二五年度體育賽事組織與勞務派遣協議
- 2025年度求職者職業發展支持合同模板
- 互聯網汽車租賃平臺服務提供商合作協議
- 軟件安全開發項目安全協議
- 雙方協商解除勞動合同合同書
- 農業無人機飛防服務合同模板大全
- 【初中道法】認識生命說課課件-2024-2025學年統編版道德與法治七年級上冊
- GB/T 44823-2024綠色礦山評價通則
- 2024年官方獸醫牧運通考試題庫(含答案)
- 分光光度法測定破壁靈芝孢子粉中總三萜含量研究
- GB/T 44679-2024叉車禁用與報廢技術規范
- 《民航概論》課件-3.飛行環境與操控
- 地球-宇宙的奇跡 (教學設計)五年級下冊科學教科版
- 小學生防火安全教育課件
- 2024二手房屋買賣的合同樣本
- 鋼結構翻新合同
- 學校有限空間作業安全管理制度
評論
0/150
提交評論