Users of CLCs bioinformatics software for DNA, RNA, and protein sequence analyses enjoy the user-friendliness, the advanced bioinformatics functionalities, and the top-quality user support that we provide.

Digital Gene Expression

CLC bio: Digital Gene Expression CLC Genomics Workbench のインテグレーションの1つとして CLC bio は Digital Gene Expression 解析を提供します

現在のお客様やこれから製品のご購入を予定されているお客さまからのご要望をもとに、Digital Gene Expression をサポートする最初の手法として mRNA-seq を選択しました。

スクリーンショットでは NGS mRNA リード配列ファイルから取り出された発現サンプル表を示しています。その表では遺伝子発現レベル値(read per kilo base of exon model: RPKM)に加えリードカウント、エクソン、転写産物に関する統計量の記載があります。各遺伝子は新しいウィンドウでマッピングビューアーを開くことができ、これによりどのように遺伝子がマップされているかより詳細を調べることが可能になります。
図1(クリックして拡大):
NGS mRNA リードの配列ファイルから作成された発現サンプル表
実装されている mRNA-seq 法で利用している統計手法は Mortazavi A らにより "Mapping and quantifying mammalian transcriptomes by RNA-Seq", Nat Methods. 2008 Jul;5(7):585-7として発表されています。

このモデルのひとつの利点は、統計量に RPKM(Reads Per Kilobase exon Model per million mapped reads)を用いていることです。これによりデジタル遺伝子発現を利用する際、遺伝子発現レベルを正規化することが容易になります。

CLC Genomics Workbench での mRNA-seq のワークフローは以下のようになります。

  1. すべてのリードは染色体上の既知遺伝子にマッピングされます。まず最初に遺伝子にユニークにマッピンされたリードがすべてカウントされます。それ以外のユニークにマッチしなかったリードは比率に応じて遺伝子に分配されます。
  2. RPKM については Exon にマッピングされたリードのみが興味の対象となります。RPKM 値はある実験における Exon の全長とマッチした数に基づいて正規化され、それにより異なる実験間での比較が可能となっています。
  3. CLC Genomics Workbench で採用されている一般的な遺伝子発現機能を利用して、mRNA-seq 実験をマイクロアレイの結果と比較することで mRNA-seq の実験を評価することが可能です。

新しい転写産物変異の発見

上記に加えて、mRNA-seq では新規エクソン(比較的高いマッチ数を含むイントロン領域)を見つけるために利用することができます。これはその領域に転写産物の多型が存在している事を示唆するものになります。CLC Genomics Workbench にすでに搭載されているプライマーデザインツールを使って新規エクソンを評価するためのプライマーのデザインが可能です。

実装されているアノテーション機能

参照配列遺伝子にアノテーション付けをするため、 GTF / GFF ファイルアノテーションプラグインを利用することができます。これによって、様々なソース(例: UCSC ゲノムブラウザや Ensembl)からのデータを利用した柔軟な参照配列を作成する方法を提供します。

ユーザーマニュアルに Digital Gene Expression に関する詳細についてはユーザーマニュアルの以下に記載があります。
RNA-Seq analysis
Expression profiling by tags

Copyright © CLC bio Japan, Inc.