薔薇亞綱(Rosids)下的植物,委託者提供兩組織與兩處理,共四組分別定序110~ 120x106 pairs不等的RNA-Seq資料。並且,委託者提供數篇參考文獻,並期望探索相關的homologous gene,或甚至orthologous gene。
因尚無已發表之同物種基因體可用,故進行轉錄體重新組裝(de novo transcriptome de assembly)。將組裝結果,透過初步之差異表現分析(differential expression analysis),探索得具高度可信的目標基因,且近似於full-length cDNA。
因定序資料量充足、目標之基因構成特別、且委託者取樣精準,在高度完成率的組裝轉錄體為基礎下,可探索得該基因。恰逢運算設備可全力支援,於2019下半年度以四週工期完成。
蘭科植物,委託者提供三組織各一,共三組分別定序得 29 ~ 32x106 pairs的RNA-Seq資料。並提供數篇參考文獻,並期望探索相關的orthologous gene。
有相近物種之蘭科基因體,但當時尚無同一物種被發表,故進行轉錄體重新組裝。除了期望目標基因群,且期望能得到全轉錄體的功能性註解,為未來發表準備。差異性比較也在組裝完成後進行。
為達到較高的組裝完成度,在已收取資料內,反覆進行重新組裝。於2021年上半年度,以工期七週達目前進度,已交付全轉錄體組裝之資料與報告。
為期一週的生物資訊實作夏令營,大約40名學生,程度為大學或碩士班在學學生。主要目的在於使學員了解基因體資料與生物資訊工具的特性。
從上午9:00~ 12:00,下午14:00~17:00,連續五日。從初次接觸的文字介面操作、簡單的輸出、入串流、shell script協助串接工作指令,到掃描得全基因體變異、基因表現的計量與比較。