Users of CLCs bioinformatics software for DNA, RNA, and protein sequence analyses enjoy the user-friendliness, the advanced bioinformatics functionalities, and the top-quality user support that we provide.

名前によるマルチプレックスシーケンシング

CLC bio: Multiplex Sequencing by Name 異なるサンプルをバッチシーケンスする際、マルチプレッキシング技術を使用することで、1度のランで異なるサンプルの処理が可能です。1つのサンプルから作成されたリードが一緒にアセンブリされるようにシーケンスリードを分けるということは、しばしば難しい課題となります。

CLC Genomics Workbench は2つのマルチプレッキシング技術に対応したサンプルの自動グループ分けを備えています:

  • By name: 名前に基づいてリードのグループ分けをサポートします
  • By sequence tag: 配列(タグ配列)内の情報に基づいてリードのグループ分けをサポートします

名前による配列の分類

この機能でシーケンシングリードはファイルの名前に基づいて、分類することができます。
典型的な例として以下のようなファイル名があります:
...
A02__Asp_F_016_2007-01-10
A02__Asp_R_016_2007-01-10
A02__Gln_F_016_2007-01-11
A02__Gln_R_016_2007-01-11
A03__Asp_F_031_2007-01-10
A03__Asp_R_031_2007-01-10
A03__Gln_F_031_2007-01-11
A03__Gln_R_031_2007-01-11
...

この例では、ファイル名に5つのはっきりとした特徴があることがわかります(一番目のものを参照します):

  • A02 は 96-well plate のポジションのことです
  • Asp シーケンスされる遺伝子名です
  • F はリードの配向性(フォワード / リバース)を示します
  • 016はサンプルを見分けるための ID です
  • 2007-01-10はシーケンシングランの日付です

CLC Genomics Workbench ではデータを分け、好みに合わせて別々の配列リストへデータを保存することが可能です。

3種類の分類方法が用意されています:

  • Simple: アンダースコア、ダッシュ、波型ダッシュ等の指定された記号を使用して、名前別に分類します
  • Positions: ファイル名の最初か最後のポジションに 6~14の数字を入力して、名前別に分類します
  • Java regular expression: この選択肢は特別な文法を用いて分類を行う上級ユーザー向けです

名前が別々の部分に分割される時、ユーザーは配列名のどの部分を各配列リストの分類に用いるか選ぶことができます。

それから各配列リストは別々にアセンブルされます。

スクリーンショット: アンダースコアごとに名前を分割し、サンプル ID と遺伝子名を使用して分類します

Copyright © CLC bio Japan, Inc.