DNAシーケンシングプラットフォームの比較

DNAシーケンスDNA sequencing、DNA-seq)の重要性

DNAは、すべての生物の遺伝暗号を含む分子であり、DNA内の特定のヌクレオチド塩基配列が生物の生物情報を決定しています。DNA-seqを用いてDNA分子内の ヌクレオチド の順序を決定することにより、未知のゲノムを特定し、病気の発症や種の表現型の変化に影響を及ぼす可能性のある変異( 変異 )を検出することができます。また、DNAシーケンスでは、DNA結合タンパク質の領域や 転写因子 の領域など、DNA鎖の特徴的な領域を特定することができ、これらは遺伝的要素を持つ疾患の治療ターゲットとなり得るため重要です (Novogene、2011a、2011b) 。そのため、DNA-seqは生物学や医学の研究および発見において人気のあるツールとなっています(Novogene、2011a)。

各種DNA-seqプラットフォームの概要

現在、Novogeneでは様々なDNA-seqプラットフォームが利用可能です(図1)。使用するシーケンスプラットフォームの種類は、必要なデータ量(シーケンスリードの幅と深さ)を考慮した上で、シーケンスされるデータの種類(リード長(長いか短いか))に依存します。これらのプラットフォームの違いを理解することで、アプリケーションにとってより有用なプラットフォームをより適切に判断することができます。これらのプラットフォームの比較をTable 1に示します。

1. ショートリードおよびロングリードのシーケンスプラットフォーム。

表1. 異なるDNA-seqプラットフォームの比較。

1(Illumina (2023a).

2(Illumina (2023b).

3Illumina (2023c).

4Illumina (2023d).

5Illumina, (2023e).

6Illumina (2023f).

7PacBio (2023).

8Oxford Nanopore Technologies (2008).

9Average read lengthとは、DNA断片から配列された塩基対の数です。

10Sequencing qualityとは、ある塩基が誤ってコール/シーケンスされる確率を示す指標です。ある塩基のシーケンス品質スコアQは、「Q = -10log10(e)」という式で計算されます(eは塩基の呼び出しが不正確である推定確率)。Qスコアが高いほど、誤りの確率は小さくなります。例えば、品質スコア20(Q20)は、100分の1のエラー率(すなわち、100bpのシーケンスリードごとに1つのエラーが見つかる)を表し、対応するコール精度は99%です。Sequencing qualityがQ30の場合、1000分の1のエラー率を表し、したがって、ほぼすべてのリードが正しく、エラーやあいまいさがないことを表します。また、「≧75% Q30+」は、エラーレートが1000分の1以下の塩基が75%以上ある(Q30+)ことを表しています(Illumina, 2023g)。

11Outputとはシーケンスの結果として生成されるデータ量です.

12Number of readsとは、解析に入るリードの総数を指します。使用するシーケンスライブラリとフローセルの数に依存します。. 

13Zhou (2022).

参考文献

Illumina. (2023a). Illumina sequencing platforms. Illumina, Inc. https://www.illumina.com/systems/sequencing-platforms.html

Illumina. (2023b). Technology: platform. Illumina, Inc. https://www.novogene.com/us-en/technology/platforms/

Illumina. (2023c). Specifications for the NovaSeq system. Illumina, Inc. https://www.illumina.com/systems/sequencing-platforms/novaseq/specifications.html

Illumina. (2023d). HiSeq3000/HiSeq 4000 system quality and performance. Illumina, Inc. https://www.illumina.com/systems/sequencing-platforms/hiseq-3000-4000/specifications.html

Illumina. (2023e). Performance specifications for the HiSeq 2500 system. Illumina, Inc. https://www.illumina.com/systems/sequencing-platforms/hiseq-2500/specifications.html

Illumina. (2023f). HiSeq X series of sequencing systems. Illumina, Inc. https://jp.illumina.com/content/dam/illumina-marketing/documents/products/datasheets/datasheet-hiseq-x-ten.pdf

Illumina. (2023g). Measuring sequencing accuracy. Illumina, Inc. https://www.illumina.com/science/technology/next-generation-sequencing/plan-experiments/quality-scores.html

Novogene. (2011a). A beginner’s guide to DNA sequencing. Novogene Co., Ltd. https://www.novogene.com/us-en/resources/blog/a-beginners-guide-to-dna-sequencing-blog/

Novogene. (2011b). Data analysis: the perks and fruits of next generation sequencing. Novogene Co., Ltd. https://www.novogene.com/us-en/resources/blog/data-analysis-next-generation-sequencing/

Oxford Nanopore Technologies. (2008). Product specifications. Oxford Nanopore Technologies plc.https://nanoporetech.com/products/specifications#comparison[tab]=specifications

PacBio. (2023). Sequel systems. PacBio. https://www.pacb.com/technology/hifi-sequencing/sequel-system/

Zhou, Y. (2022). A beginners guide to DNA-seq: bioinformatics analysis [webinar]. Novogene Co., Ltd. https://www.novogene.com/us-en/resources/onlineevent/a-beginners-guide-to-dna-seq-bioinformatics-analysis/