名前によるマルチプレックスシーケンシング
CLC Genomics Workbench は2つのマルチプレッキシング技術に対応したサンプルの自動グループ分けを備えています:
- By name: 名前に基づいてリードのグループ分けをサポートします
- By sequence tag: 配列(タグ配列)内の情報に基づいてリードのグループ分けをサポートします
名前による配列の分類
...
A02__Asp_F_016_2007-01-10
A02__Asp_R_016_2007-01-10
A02__Gln_F_016_2007-01-11
A02__Gln_R_016_2007-01-11
A03__Asp_F_031_2007-01-10
A03__Asp_R_031_2007-01-10
A03__Gln_F_031_2007-01-11
A03__Gln_R_031_2007-01-11
...
A02__Asp_F_016_2007-01-10
A02__Asp_R_016_2007-01-10
A02__Gln_F_016_2007-01-11
A02__Gln_R_016_2007-01-11
A03__Asp_F_031_2007-01-10
A03__Asp_R_031_2007-01-10
A03__Gln_F_031_2007-01-11
A03__Gln_R_031_2007-01-11
...
この例では、ファイル名に5つのはっきりとした特徴があることがわかります(一番目のものを参照します):
- A02 は 96-well plate のポジションのことです
- Asp シーケンスされる遺伝子名です
- F はリードの配向性(フォワード / リバース)を示します
- 016はサンプルを見分けるための ID です
- 2007-01-10はシーケンシングランの日付です
CLC Genomics Workbench ではデータを分け、好みに合わせて別々の配列リストへデータを保存することが可能です。
3種類の分類方法が用意されています:
- Simple: アンダースコア、ダッシュ、波型ダッシュ等の指定された記号を使用して、名前別に分類します
- Positions: ファイル名の最初か最後のポジションに 6~14の数字を入力して、名前別に分類します
- Java regular expression: この選択肢は特別な文法を用いて分類を行う上級ユーザー向けです
名前が別々の部分に分割される時、ユーザーは配列名のどの部分を各配列リストの分類に用いるか選ぶことができます。
それから各配列リストは別々にアセンブルされます。





