練習1:簡短閱讀程序集
對于第一個練習,我們將使用數據作為單個讀取。如果您有雙端數據,通常不會這樣做,但我們只是演示匯編程序如何管理未配對的數據。選擇包含讀取的兩個文檔(正向讀取和反向讀取)。
現在單擊??Align / Assemble?并選擇De Novo Assemble?,然后在窗口左下角的Settings cog下單擊Reset to defaults?。在結果部分下,選擇保存程序集報告并保存到子文件夾中。保留共有序列已開啟,因為我們要將它們映射回原始參考序列以查看它們匹配的程度。
Click?OK. This should produce an assembly with 4 contigs which will be placed in the Assembly subfolder.
Two of these are very short, the others much longer as you can see from the?Assembly Report. When there are multiple contigs produced, this document will also give you the?N50 statistic?which is a commonly used measure of the quality of an assembly.
要查看這些重疊群如何與原始序列對齊,請選擇De Novo Assembly Tutorial?父文件夾,然后單擊新的Assembly?文件夾,以查看兩者的內容。按住cntrl /命令,選擇Consensus Sequences?和NC_009487提取文檔。現在選擇對齊/組裝→映射到參考。檢查NC_009487是否設置為參考序列,然后單擊確定。
一旦這個程序集完成后,您可以查看重疊群,并查看組合的重疊群與原始序列的映射情況。您應該看到有一個區域匯編程序遇到麻煩,無法加入它生成的最長重疊群。
在程序集中選擇此區域(大約90,000)并放大。您應該看到有一部分沒有重建重疊群,這就是為什么兩個最長的重疊群無法連接的原因。在下一個練習中,我們將看看使用配對結束信息是否有幫助。