DNAシーケンスDNA 内のヌクレオチドまたは塩基の正確な配列を決定する技術。 (DNADNAは 「deoxyribonucleic acid」の略で(デオキシリボ核酸)、2本のポリヌクレオチド鎖からなるポリマーで、互いに巻きついて二重らせんを形成しています。 More sequencing、DNA-seq)の重要性
DNAは、すべての生物の遺伝暗号を含む分子であり、DNA内の特定のヌクレオチド塩基配列が生物の生物情報を決定しています。DNA-seqを用いてDNA分子内の ヌクレオチド窒素塩基と糖およびリン酸基が結合した化合物。ヌクレオチドはDNAなどの核酸の基本構造単位を形成します。 の順序を決定することにより、未知のゲノムを特定し、病気の発症や種の表現型の変化に影響を及ぼす可能性のある変異生物のゲノムの核酸配列の変化。( 変異 )を検出することができます。また、DNAシーケンスでは、DNA結合タンパク質の領域や 転写因子DNAをRNAに転写する過程に関与するタンパク質。 の領域など、DNA鎖の特徴的な領域を特定することができ、これらは遺伝的要素を持つ疾患の治療ターゲットとなり得るため重要です (Novogene、2011a、2011b) 。そのため、DNA-seqは生物学や医学の研究および発見において人気のあるツールとなっています(Novogene、2011a)。
各種DNA-seqプラットフォームの概要
現在、Novogeneでは様々なDNA-seqプラットフォームが利用可能です(図1)。使用するシーケンスプラットフォームの種類は、必要なデータ量(シーケンスリードの幅と深さ)を考慮した上で、シーケンスされるデータの種類(リード長DNA 断片から配列決定された塩基対 (basepair、bp))の数。(長いか短いか))に依存します。これらのプラットフォームの違いを理解することで、アプリケーションにとってより有用なプラットフォームをより適切に判断することができます。これらのプラットフォームの比較をTable 1に示します。
図1. ショートリードおよびロングリードのシーケンスプラットフォーム。
表1. 異なるDNA-seqプラットフォームの比較。
1(Illumina (2023a).
2(Illumina (2023b).
3Illumina (2023c).
4Illumina (2023d).
5Illumina, (2023e).
6Illumina (2023f).
7PacBio (2023).
8Oxford Nanopore Technologies (2008).
9Average read lengthとは、DNA断片から配列された塩基対の数です。
10Sequencing qualityとは、ある塩基が誤ってコール/シーケンスされる確率を示す指標です。ある塩基のシーケンス品質スコアQは、「Q = -10log10(e)」という式で計算されます(eは塩基の呼び出しが不正確である推定確率)。Qスコアが高いほど、誤りの確率は小さくなります。例えば、品質スコア20(Q20)は、100分の1のエラー率(すなわち、100bpのシーケンスリードごとに1つのエラーが見つかる)を表し、対応するコール精度は99%です。Sequencing qualityがQ30の場合、1000分の1のエラー率を表し、したがって、ほぼすべてのリードが正しく、エラーやあいまいさがないことを表します。また、「≧75% Q30+」は、エラーレートが1000分の1以下の塩基が75%以上ある(Q30+)ことを表しています(Illumina, 2023g)。
11Outputとはシーケンスの結果として生成されるデータ量です.
12Number of readsとは、解析に入るリードの総数を指します。使用するシーケンスライブラリとフローセルの数に依存します。.
13Zhou (2022).
参考文献
Illumina. (2023a). Illumina sequencing platforms. Illumina, Inc. https://www.illumina.com/systems/sequencing-platforms.html
Illumina. (2023b). Technology: platform. Illumina, Inc. https://www.novogene.com/us-en/technology/platforms/
Illumina. (2023c). Specifications for the NovaSeq system. Illumina, Inc. https://www.illumina.com/systems/sequencing-platforms/novaseq/specifications.html
Illumina. (2023d). HiSeq3000/HiSeq 4000 system quality and performance. Illumina, Inc. https://www.illumina.com/systems/sequencing-platforms/hiseq-3000-4000/specifications.html
Illumina. (2023e). Performance specifications for the HiSeq 2500 system. Illumina, Inc. https://www.illumina.com/systems/sequencing-platforms/hiseq-2500/specifications.html
Illumina. (2023f). HiSeq X series of sequencing systems. Illumina, Inc. https://jp.illumina.com/content/dam/illumina-marketing/documents/products/datasheets/datasheet-hiseq-x-ten.pdf
Illumina. (2023g). Measuring sequencing accuracy. Illumina, Inc. https://www.illumina.com/science/technology/next-generation-sequencing/plan-experiments/quality-scores.html
Novogene. (2011a). A beginner’s guide to DNA sequencing. Novogene Co., Ltd. https://www.novogene.com/us-en/resources/blog/a-beginners-guide-to-dna-sequencing-blog/
Novogene. (2011b). Data analysis: the perks and fruits of next generation sequencing. Novogene Co., Ltd. https://www.novogene.com/us-en/resources/blog/data-analysis-next-generation-sequencing/
Oxford Nanopore Technologies. (2008). Product specifications. Oxford Nanopore Technologies plc.https://nanoporetech.com/products/specifications#comparison[tab]=specifications
PacBio. (2023). Sequel systems. PacBio. https://www.pacb.com/technology/hifi-sequencing/sequel-system/
Zhou, Y. (2022). A beginner’s guide to DNA-seq: bioinformatics analysis [webinar]. Novogene Co., Ltd. https://www.novogene.com/us-en/resources/onlineevent/a-beginners-guide-to-dna-seq-bioinformatics-analysis/