女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

面臨挑戰(zhàn)的基因組數(shù)據(jù)壓縮技術(shù)

IEEE電氣電子工程師 ? 來源:lq ? 2018-12-12 13:42 ? 次閱讀

你是否進(jìn)行過基因組測序?全世界已經(jīng)有數(shù)百萬人進(jìn)行了基因組測序,到2025年,這一人數(shù)可達(dá)10億。

研究人員獲取的基因組數(shù)據(jù)越多,個人和公共健康的前景就越好。目前,產(chǎn)前DNA測試已可對胎兒發(fā)育異常進(jìn)行篩查。很快,患者就可以通過血液測序找到可能預(yù)示著傳染病的非人類基因。將來,癌癥研究人員將能夠通過對多個組織的DNA和RNA進(jìn)行日常單細(xì)胞測序,來跟蹤疾病的進(jìn)展。

全民DNA測序?qū)⑹刮覀兏娴亓私庹麄€社會的健康狀況。這就是英國生物銀行的目標(biāo),它旨在對50萬名志愿者的基因組進(jìn)行測序,并對他們進(jìn)行數(shù)十年的追蹤。覆蓋廣泛人口的基因組研究已經(jīng)成為一項日常應(yīng)用,對與特定疾病相關(guān)聯(lián)的突變進(jìn)行識別。對空氣、土壤和水中的生物體進(jìn)行定期測序?qū)⒂兄谧粉櫫餍胁?、食物病原體、毒素等。

要實現(xiàn)這樣的愿景,需要存儲并分析的數(shù)據(jù)量將大到難以想象。通常,一臺DNA測序儀處理一個人的整個基因組就會產(chǎn)生數(shù)十至數(shù)百千兆字節(jié)的數(shù)據(jù)。在存儲時,數(shù)百萬基因組累積的數(shù)據(jù)將達(dá)到數(shù)十艾字節(jié)。

這還僅是開始。發(fā)現(xiàn)并應(yīng)用基因組數(shù)據(jù)的科學(xué)家、醫(yī)生以及其他相關(guān)人士對每個個體并不會僅僅進(jìn)行一次測序,他們還會想對多個人體組織中的多個細(xì)胞進(jìn)行反復(fù)測序。隨著測序速度的增加和其成本的下降——現(xiàn)在個人基因組測序只需要1000美元,并且還在迅速下降——他們還想對其他動物、植物、微生物和整個生態(tài)系統(tǒng)的DNA進(jìn)行測序。此外,新應(yīng)用程序,甚至新產(chǎn)業(yè)的出現(xiàn),都會催生出更多的測序行為。

雖然現(xiàn)在很難預(yù)測基因組數(shù)據(jù)所有的未來收益,但我們已經(jīng)看到了一項不可避免的挑戰(zhàn):數(shù)據(jù)存儲量幾乎達(dá)到了令人難以置信的程度。目前,存儲基因組數(shù)據(jù)的成本仍然只占實驗室總預(yù)算的一小部分。但該成本正急劇增長,遠(yuǎn)遠(yuǎn)超過了存儲硬件價格的下降。在未來5年內(nèi),存儲數(shù)十億人類、動物、植物和微生物基因組的成本將達(dá)到每年數(shù)十億美元。這些數(shù)據(jù)需要保存數(shù)十年,甚至更長時間。

數(shù)據(jù)壓縮顯然非常有用。生物信息學(xué)專家們已經(jīng)使用類似gzip的標(biāo)準(zhǔn)壓縮工具,將文件大小縮小到原來的1/20。一些研究者還使用了更為專業(yè)的、針對基因組數(shù)據(jù)進(jìn)行優(yōu)化的壓縮工具,但這些工具都沒有得到廣泛采用。我們兩人都從事數(shù)據(jù)壓縮算法研究,我們認(rèn)為是時候提出一種新的壓縮方案了——一種效率更高、速度更快、更適用于基因組數(shù)據(jù)獨有特性的方案。正如專用視頻音頻壓縮對YouTube和Netflix等流媒體服務(wù)至關(guān)重要一樣,面對基因組數(shù)據(jù)爆炸,也必須利用專用的基因組數(shù)據(jù)壓縮工具才能獲取收益。

在解釋如何更好地壓縮基因組數(shù)據(jù)以前,讓我們仔細(xì)觀察一下數(shù)據(jù)本身。“基因組”是指4種核苷酸堿基的序列——腺嘌呤、胞嘧啶、鳥嘌呤和胸腺嘧啶——它們形成了我們熟悉的DNA堿基A、C、G、T。這些核苷酸出現(xiàn)在組成人類基因組的23對染色體的A-T和C-G堿基對的堿基鏈中。這些染色體包含大約60億個核苷酸,存在于大部分人體細(xì)胞中,并且包括編碼基因、非編碼因子(如染色體末端的端粒)、調(diào)控因子和線粒體DNA。伊諾米那(Illumina)、牛津納米孔科技公司(Oxford NanoporeTechnologies)和太平洋生物科技(Pacific Biosciences)等公司的DNA測序儀能夠在數(shù)小時內(nèi)對一份DNA樣本完成一組人類基因組的自動測序。

這些商業(yè)DNA測序儀不產(chǎn)生單個基因組長度的ACGT串,而是產(chǎn)生大量的子串或“讀序”(reads)?!白x序”彼此有部分重疊,需要由序列裝配軟件重建完整的基因。通常,當(dāng)進(jìn)行全基因測序時,每一段基因出現(xiàn)在不超過約100個“讀序”中。

根據(jù)所使用的測序技術(shù),一個“讀序”的長度可以在大約100到10萬個堿基對間不等,“讀序”的總數(shù)在數(shù)百萬到數(shù)百億堿基不等。短的“讀序”可以發(fā)現(xiàn)單個堿基對的突變,長的“讀序”能更好地檢測在成千上萬個堿基對中發(fā)生的缺失或插入等復(fù)雜變異。

DNA測序是一個充滿噪聲的過程,“讀序”包含錯誤很常見。因此,除了ACGT核苷酸串以外,每個“讀序”還包括質(zhì)量評分,標(biāo)明測序儀對每個DNA核苷酸的置信度。測序儀的質(zhì)量評分以對數(shù)形式表達(dá)錯誤概率。其使用的算法是專利技術(shù),但在事后可查。如果質(zhì)量評分為20(對應(yīng)的錯誤概率為1%),那么用戶可確認(rèn)在已知DNA序列中大約有1%的堿基對是不正確的。使用這些文件的程序依賴質(zhì)量評分來區(qū)分出測序錯誤和突變等變化。相對于測序錯誤,真正的突變將具有更高的平均質(zhì)量評分——也就是說,更低的錯誤概率。

測序儀將含有核苷酸串、質(zhì)量評分以及其他一些元數(shù)據(jù)的“讀序”逐個地粘貼在一起,形成所謂的FASTQ文件。一個完整基因組的FASTQ文件通常包含數(shù)十至數(shù)百千兆字節(jié)的數(shù)據(jù)。

這些文件冗余度很高,其原因是任意兩個人的基因組幾乎都是一樣的。平均而言,每1000個核苷酸中,只有大約1個核苷酸不同,通常人們只對這些基因組差異感興趣。一些DNA測序針對特定的差異區(qū)域——例如,像23andMe這樣的DNA基因分析應(yīng)用僅查找特定的差異,刑事調(diào)查中DNA分析則會查找某些標(biāo)記重復(fù)次數(shù)的變化。

但是,如果你不知道有需要關(guān)注的區(qū)域在哪里——例如,你試圖診斷一種未知遺傳來源的疾病,那你就需要對整個基因組測序,這就意味著獲取更大量的測序數(shù)據(jù)。

重復(fù)的測序數(shù)據(jù)也是為了清除錯誤,因此對基因組相同部分進(jìn)行多次讀取。有時單一樣本包含多種變異序列,因此你會想對其進(jìn)行重復(fù)測序來捕捉這些變異。比如檢測一個組織樣本中的癌細(xì)胞,或檢測孕婦血液中胎兒DNA的痕跡。這可能意味著要對每個DNA堿基對進(jìn)行很多次測序,通常超過100次,以識別稀有變異與常見變異,區(qū)分真正的差異與測序錯誤。

━━━━

到目前為止,對DNA測序為何會產(chǎn)生如此多的冗余數(shù)據(jù)你應(yīng)該已有了更好的理解。事實證明,這些冗余正是數(shù)據(jù)壓縮的理想選擇。無須存儲同一基因組數(shù)據(jù)的多個副本,你可以只存儲一份副本。

為了壓縮基因組數(shù)據(jù),你可以首先將每個DNA序列“讀序”分為較小的數(shù)據(jù)塊,然后為每個數(shù)據(jù)塊分配一個數(shù)字索引。最終,所有索引構(gòu)成了一部字典,其中的條目不是單詞,而是DNA堿基對短序列。

文本壓縮器就以這種方式工作。例如,GitHub擁有一個廣泛使用的單詞列表,可用它來為每個單詞分配數(shù)字索引。因此,要將一段文本編碼為二進(jìn)制,需要將每個單詞替換為其數(shù)字索引——比如GitHub的列表中用數(shù)字64872代表單詞“compression”(壓縮)——隨后再以二進(jìn)制形式表示這些數(shù)字。為了壓縮二進(jìn)制表示,可以按單詞使用頻率對字典進(jìn)行排序,而不是按字母表順序,以便使更常用的單詞獲得更小的數(shù)字,這樣它們需要編碼的位數(shù)就更少。

另一種常見的策略是Lempel-Ziv算法系列,它建立一個由越來越長的短語(而不是單詞)組成的詞典。例如,如果某個文本經(jīng)常在“基因組”后跟“數(shù)據(jù)”一詞,則會把單個的數(shù)字索引分配給短語“基因組數(shù)據(jù)”。

很多通用的壓縮工具,例如gzip、bzip2、臉書的Zstandard和谷歌的Brotli,都使用這兩種方法。雖然這些工具對壓縮基因組文本有效,但為特定的數(shù)據(jù)類型開發(fā)的專用壓縮器與它們相比有更顯著的優(yōu)勢。

再看視頻流的情況。單幀視頻及其播放方向使得視頻壓縮軟件能夠預(yù)測下一幀,因此壓縮文件不包含每一幀中每個像素的數(shù)據(jù)。此外,觀眾可以容忍難以察覺的視頻信息丟失或失真,這與基于文本的數(shù)據(jù)情況不同。為了利用這一特點,一家國際聯(lián)盟組織花費數(shù)年制定了H.264視頻壓縮標(biāo)準(zhǔn)(如今藍(lán)光光碟、YouTube、iTunes Store、Adobe Flash Player和微軟的Silver- light便使用該標(biāo)準(zhǔn))。

研究人員同樣也在設(shè)計專用的基因組數(shù)據(jù)壓縮工具,在每個月的學(xué)術(shù)文獻(xiàn)中都涌現(xiàn)出一些新的工具。很多人使用“基于參照”的壓縮方法,它的切入點是以人類基因組序列作為參照。任何人類DNA短序列——由不超過100個堿基對組成的序列——很可能出現(xiàn)在該參照中的某處,哪怕有測序錯誤和突變。因此,專用的壓縮器不列出序列中所有近100個堿基對,而是僅記錄該串在參照中的開始位置(例如“5號染色體中的第1000個堿基對”)并描述相對于參照序列的所有差異(例如“刪除第10個堿基對”)。除了壓縮軟件之外,該方法還需要用戶提供一份人類基因組的參照副本,其數(shù)據(jù)大小約為1千兆字節(jié)。

如上所述,F(xiàn)ASTQ文件不只包含DNA序列,還包含表明潛在錯誤的質(zhì)量評分。遺憾的是,基于參照的壓縮無法用于壓縮FASTQ質(zhì)量評分,因為沒有針對質(zhì)量評分的參照序列。但是,這些工具著眼于質(zhì)量評分的模式——例如,一個低質(zhì)量得分之后很可能是另一個低質(zhì)量得分,或者DNA“讀序”開始階段的質(zhì)量評分往往比結(jié)束階段的要高。就像對所有單詞按照使用頻率降序編碼可以壓縮文本一樣,對一組質(zhì)量評分?jǐn)?shù)據(jù)按照其預(yù)測可能性高低的順序進(jìn)行編碼,可以對該數(shù)據(jù)進(jìn)行壓縮。研究人員有時會丟棄低質(zhì)量數(shù)據(jù),而不對其進(jìn)行存儲和壓縮,但數(shù)據(jù)壓縮程序可能無法決定丟棄哪些數(shù)據(jù)或確定“低質(zhì)量”的閾值是多少。

━━━━

這些新的壓縮器是個良好的開端,但它們還不完美。隨著對數(shù)據(jù)的理解不斷加深,我們壓縮數(shù)據(jù)的能力也隨之提高。數(shù)據(jù)壓縮迫使我們尋找數(shù)據(jù)中的隱性模式和冗余;當(dāng)數(shù)據(jù)壓縮深入到一定的程度時,我們就會意識到我們完全理解了這些數(shù)據(jù)。如果基因組數(shù)據(jù)壓縮器能夠?qū)?shù)據(jù)中的細(xì)微模式納入考慮,那么就將能夠縮小文件大小并降低存儲成本。

在斯坦福大學(xué)我們自己的研究中,我們得出了一項有潛力的觀察結(jié)果:基因組中兩個連續(xù)DNA變異之間的距離遵從“雙冪律”分布。你可能熟悉“冪律”分布的概念,即某種結(jié)果出現(xiàn)的概率與該結(jié)果數(shù)量級的倒數(shù)(負(fù)指數(shù)冪)成正比,可能達(dá)到某個冪數(shù)。城市人口通常遵循這種分布:擁有200萬人口的城市數(shù)量大約是擁有100萬人口的城市數(shù)量的一半。該定律也適用于國家財富分布,20%的人口占有80%的財富(二八定律)。

雙冪律包括兩種不同的冪律,它們作用在相同類型的數(shù)據(jù)上,但覆蓋不同的范圍。例如,二八定律可以應(yīng)用于人口財富占比中的下半部分,而一九定律適用于上半部分。雙冪律可以用于描述臉書上的好友數(shù)量、電話呼叫的持續(xù)時間,以及硬盤驅(qū)動器上的文件大小。

事實證明,通過DNA堿基對測量得出相鄰遺傳變異之間距離的直方圖看起來符合雙冪律,交叉點出現(xiàn)在大約1000個DNA堿基對附近(見本文的“雙冪律”圖表)。何種進(jìn)化過程導(dǎo)致了該種分布尚不明確,但是其存在使改進(jìn)壓縮成為可能。克勞德?香農(nóng)在信息理論的一個基本成果中指出:數(shù)據(jù)無法被壓縮到其分布的信息熵以下——信息熵是一種隨機性測度。雙冪律分布證明了現(xiàn)實基因組的隨機性比假設(shè)模型的隨機性要小,即具有較低的信息熵,模型假設(shè)基因組中每個位置出現(xiàn)變異的可能性相等。我們對這一發(fā)現(xiàn)感到興奮——這不僅是一個有趣的生物學(xué)現(xiàn)象,還暗示存在尚未開發(fā)的更大壓縮潛能。

━━━━

今天使用的基因組數(shù)據(jù)壓縮器是無損的——也就是說,允許你逐個數(shù)位地將壓縮文件恢復(fù)至與壓縮前完全一樣。但有一種情況允許一定量的損失,不是在DNA序列中,而是在測序儀對數(shù)據(jù)的質(zhì)量評分中。雖然只有4種DNA核苷酸(A、C、G、T),但通常大約有40種可能的質(zhì)量評分,因此構(gòu)成無損壓縮的FASTQ文件中的大多數(shù)數(shù)位是質(zhì)量評分,而不是DNA序列。這種精確度是無用的,因為使用基因組數(shù)據(jù)的應(yīng)用軟件傾向于忽略質(zhì)量評分中的微小變化,或是可能完全丟棄質(zhì)量評分。當(dāng)質(zhì)量評分以有損方式壓縮時,類似于尋找兩個基因組之間變化的某些任務(wù)的性能實際上得到了改善,因為有損壓縮消除了質(zhì)量評分間的無關(guān)變化,有效地除去了數(shù)據(jù)中的噪聲。

我們還可以通過丟棄某些基因測序信息來節(jié)省存儲空間。DNA“讀序”出現(xiàn)在FASTQ文件中的確切順序?qū)﹄S后的分析來說通常并不重要。類似識別遺傳變異等很多情形,隨機攪亂“讀序”,產(chǎn)出的結(jié)果幾乎相同。因此,你可以利用“排序的列表比未排序的列表能夠壓縮得更多”這一事實,按字母表順序?qū)NA“讀序”進(jìn)行排序。文本壓縮中的類似情況是對單詞列表進(jìn)行排序,并說明相鄰單詞之間的距離。例如,“decompressed”和“decompresses”(“解壓”的不同時態(tài))在字典中是相鄰的,它們的最后一個字母(d和s)在字母表中相隔15個字母,因此你可用整數(shù)15對第二個單詞進(jìn)行編碼。

舉例說明該方法如何運用在DNA上,讓我們按字母表順序?qū)π蛄蠥CGAAA、ACGAAG和 ACGAAT進(jìn)行排序。前5個字母都是一樣的,因此我們只對第6個字母之間的差異感興趣。第二個序列被編碼為整數(shù)2(因為最后一個字母G,是核苷酸字母表ACGT中排在A之后的第2個字母),第3個序列被編碼為1(因為它的最后一個字母T,是G之后的1個字母)。相對于按原始順序存儲DNA“讀序”,這種方法可以節(jié)省兩倍乃至更多的存儲量。

當(dāng)然,壓縮率只是壓縮工具能力的衡量標(biāo)準(zhǔn)之一。速度是另一個衡量因素。很多專用FASTQ壓縮器并行運行,比單CPU運行節(jié)省時間;有些壓縮器利用GPU和現(xiàn)場可編程門陣列處理器,這些硬件經(jīng)常用于加速視頻處理和機器學(xué)習(xí)。另一個實用的因素是能夠搜索壓縮數(shù)據(jù)。你一定不希望在只想快速搜索一段特定DNA序列時,還必須先解壓整個文件。

基因組壓縮工具的選擇越來越多,此時我們需要的是標(biāo)準(zhǔn)化。就像視頻壓縮技術(shù)要等到業(yè)內(nèi)大部分人士達(dá)成一個標(biāo)準(zhǔn)才能起步一樣,基因組壓縮技術(shù)也必須形成一個標(biāo)準(zhǔn)——或至少是一組標(biāo)準(zhǔn)。

幸運的是,基因組測序數(shù)據(jù)壓縮的標(biāo)準(zhǔn)已經(jīng)開始制定。動態(tài)圖像專家組(MPEG)——也就是開發(fā)MP3音頻格式和幾項流行視頻格式的機構(gòu)——多年來一直在制定一項壓縮基因組數(shù)據(jù)的標(biāo)準(zhǔn),名為MPEG-G。該規(guī)范有望于今年晚些時候完成。該標(biāo)準(zhǔn)將隨著技術(shù)的提高而發(fā)展,就像視頻壓縮標(biāo)準(zhǔn)曾經(jīng)的方式一樣。

我們開發(fā)高效、健全和標(biāo)準(zhǔn)化的基因組數(shù)據(jù)壓縮的速度只是一個經(jīng)濟學(xué)問題。隨著存儲數(shù)據(jù)量的飆升,存儲成本日益高漲,降低成本才能推動行業(yè)采用更好的壓縮方法。

現(xiàn)在,隨著序列數(shù)據(jù)總量的累積,基因研究可能處于取得意外收獲的風(fēng)口,目前,該領(lǐng)域與10年前人工智能的處境相似。最近人工智能所取得的巨大進(jìn)步在很大程度上是由大量可用的數(shù)據(jù)集所驅(qū)動的,原先使用中等數(shù)據(jù)量表現(xiàn)不佳的深度學(xué)習(xí)算法,在使用大量數(shù)據(jù)集后,變得非常強大。基因研究人員已經(jīng)開始對他們的數(shù)據(jù)使用深度學(xué)習(xí)算法,但在取得類似收獲之前,他們不得不等待大量基因信息的累積。但有一件事是清楚的:沒有基因數(shù)據(jù)壓縮技術(shù)的重大進(jìn)步,他們就無法取得成功。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • DNA
    DNA
    +關(guān)注

    關(guān)注

    0

    文章

    244

    瀏覽量

    31406
  • 冗余數(shù)據(jù)
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    1532

原文標(biāo)題:面臨挑戰(zhàn)的基因組數(shù)據(jù)壓縮技術(shù)

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    基因組數(shù)據(jù)CNV分析簡介 精選資料分享

    除了利用aCGH和snp芯片來檢測CNV之外,也可以通過NGS數(shù)據(jù)來分析CNV, 比如全基因組和全外顯子測序。針對全基因組CNV的檢測,還針對開發(fā)了一種稱之為C...
    發(fā)表于 07-29 08:24

    基因組測序的優(yōu)勢 精選資料分享

    基因組測序的優(yōu)勢目前,隨著高通量測序技術(shù)快速發(fā)展、測序成本的進(jìn)一步降低以及組裝方法的不斷完善,全基因組測序研究主要包括3個方面。第一種為不參考任何現(xiàn)有序列從頭組裝測序,是對未知基因組
    發(fā)表于 07-29 08:31

    基因組CNV分析的策略是什么?

    基因組CNV分析的策略是什么?
    發(fā)表于 10-27 06:43

    基因組測序的優(yōu)勢是什么?

    基因組測序的優(yōu)勢是什么?
    發(fā)表于 10-27 06:27

    數(shù)據(jù)壓縮技術(shù)

    一、數(shù)據(jù)壓縮的必要性二、多媒體數(shù)據(jù)壓縮的可能性三、壓縮方案應(yīng)滿足的要求四、編碼方案分類五、數(shù)據(jù)壓縮(編碼)的主要步驟六、一些基本的壓縮
    發(fā)表于 03-25 13:19 ?35次下載

    什么是基因組序列數(shù)據(jù)

    什么是基因組序列數(shù)據(jù)庫 GSDB是基因組序列數(shù)據(jù)庫(Genome Sequence Data Base),由美國新墨西哥州Santa Fe的國家
    發(fā)表于 06-17 07:37 ?1538次閱讀

    區(qū)塊鏈對基因組數(shù)據(jù)的保護

    我相信,我是唯一有權(quán)擁有關(guān)于我的基因組信息的人,就像我有表達(dá)想法的權(quán)利,選擇工作或宗教的權(quán)利。
    發(fā)表于 07-16 09:12 ?900次閱讀

    你去將你的基因組測序了嗎?面臨挑戰(zhàn)基因組數(shù)據(jù)壓縮技術(shù)

    雖然很難預(yù)測基因組數(shù)據(jù)的全部未來收益,但我們已經(jīng)看到了一個不可避免的挑戰(zhàn):所需要的存儲空間幾乎是難以想象的大。目前,存儲基因組數(shù)據(jù)的費用仍然
    的頭像 發(fā)表于 09-10 10:40 ?4880次閱讀

    基因組醫(yī)學(xué)中區(qū)塊鏈出現(xiàn)的原因解析

    基因組醫(yī)學(xué)打開了遺傳數(shù)據(jù)的世界,提供了準(zhǔn)確的診斷,預(yù)后和適當(dāng)?shù)闹委?。利?b class='flag-5'>基因組技術(shù),一個人的遺傳信息被可以剖析,以確定他們對疾病的易感性和適當(dāng)?shù)闹委煼桨?,為他們提供個性化的醫(yī)療。然而,
    發(fā)表于 10-24 10:24 ?775次閱讀

    國產(chǎn)芯片助力全球首次實現(xiàn)手機個人全基因組測序分析

    在手機上也能進(jìn)行全基因組測序分析?沒錯!近日,生命大數(shù)據(jù)高峰論壇暨第四屆基因組云計算技術(shù)開發(fā)者峰會(GCTA 4)在貴州貴陽新世界酒店隆重舉行。華大
    的頭像 發(fā)表于 06-05 15:08 ?4024次閱讀

    華大發(fā)布高精度基因組標(biāo)準(zhǔn)及解決方案 開啟基因組測序“全高清”時代

    基因組測序“全高清”時代!
    的頭像 發(fā)表于 06-19 15:10 ?3456次閱讀

    北鯤云超算平臺對于基因組學(xué)研究能夠提供哪些幫助?

    隨著眾多生物基因組測序項目的完成,生物學(xué)數(shù)據(jù)正在加速度增長。從高通量/多組學(xué),到單分子/單細(xì)胞;從多倍體/單倍型到宏基因組/環(huán)境基因組;從精準(zhǔn)醫(yī)療到系統(tǒng)醫(yī)學(xué)等等,后
    發(fā)表于 11-15 14:24 ?598次閱讀

    微流控芯片技術(shù)在單細(xì)胞基因組學(xué)研究中的應(yīng)用

    單細(xì)胞基因組學(xué)包括單細(xì)胞全基因組測序和以單細(xì)胞和微量細(xì)胞為材料的全基因組范圍內(nèi)的基因功能研究。功能基因組學(xué)以結(jié)構(gòu)
    的頭像 發(fā)表于 03-03 13:04 ?2382次閱讀
    微流控芯片<b class='flag-5'>技術(shù)</b>在單細(xì)胞<b class='flag-5'>基因組</b>學(xué)研究中的應(yīng)用

    Clara Parabricks 3.7可加速基因組的分析

    種工具, Clara Parabricks 為臨床和研究工作流程中的基因面板、外顯子基因組提供準(zhǔn)確和加速的基因組分析。
    的頭像 發(fā)表于 04-06 15:43 ?1712次閱讀
    Clara Parabricks 3.7可加速<b class='flag-5'>基因組</b>的分析

    人工智能如何改變基因組學(xué)?

    人進(jìn)行測序,還是大規(guī)模人群的遺傳學(xué)研究,全基因組測序正在成為臨床工作流程和藥物研發(fā)的重要一環(huán)。 但基因組測序只是第一步。基因組測序數(shù)據(jù)分析需要通過加速計算、
    的頭像 發(fā)表于 04-05 00:25 ?806次閱讀