최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 - BioIN · 2018. 7....

15
최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 이수민 Page 1 / 15 BRIC View 2014-T05 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 이수민 국립과학수사연구원 E-mail: [email protected] 요약문 차세대염기서열분석법 (Next-generation sequencing; Massive parallel sequencing) 은 유전체를 무수히 많은 조각으로 나눈 뒤 각각의 염기서열을 조합하여 유전체를 해독하는 분석 방법으로, 2004년 최초로 상용화된 후 현재까지 그 성능이 비약적으로 발전해왔다. Illumina 등 주요 NGS 플랫폼들은 각자 고유한 특성을 지니고 있으며, 플랫폼 및 시약 등의 성능을 경쟁적으로 향상시키고 있다. NGS 기술의 발달과 분석 비용의 하락으로 인해 다양한 연구 분야에서 NGS가 보편적으로 활용되고 있으며, 기초 연구 목적 외에도 의료계 및 산업계에서 NGS 기법은 활발하게 사용될 것이다. NGS 방법의 한계를 극복할 대안으로 단분자 염기서열 분석법이 개발되고 있으며, 현재는 초기 개발 단계지만 가까운 시일 내에 기술적 향상이 일어날 것이라 예측된다. Key Words: Next-generation sequencing, NGS, massive parallel sequencing, Third-generation sequencing, Single-molecule DNA sequencing 목 차 1. 서론 2. 차세대염기서열분석법(Next-Generation Sequencing) 의 발전 동향 2.1 플랫폼의 변화 2.2 케미스트리의 변화 2.3 데이터 보관 및 처리법의 변화 3. NGS를 이용한 최신 연구 동향 3.1 Resequencing 3.2 de novo assembly BRIC View 동향리포트

Transcript of 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 - BioIN · 2018. 7....

Page 1: 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 - BioIN · 2018. 7. 9. · 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향

최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 이수민 Page 1 / 15

BRIC View 2014-T05

최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구

방향

이수민

국립과학수사연구원

E-mail: [email protected]

요약문

차세대염기서열분석법 (Next-generation sequencing; Massive parallel sequencing) 은 유전체를

무수히 많은 조각으로 나눈 뒤 각각의 염기서열을 조합하여 유전체를 해독하는 분석

방법으로, 2004년 최초로 상용화된 후 현재까지 그 성능이 비약적으로 발전해왔다. Illumina 등

주요 NGS 플랫폼들은 각자 고유한 특성을 지니고 있으며, 플랫폼 및 시약 등의 성능을

경쟁적으로 향상시키고 있다. NGS 기술의 발달과 분석 비용의 하락으로 인해 다양한 연구

분야에서 NGS가 보편적으로 활용되고 있으며, 기초 연구 목적 외에도 의료계 및 산업계에서

NGS 기법은 활발하게 사용될 것이다. NGS 방법의 한계를 극복할 대안으로 단분자 염기서열

분석법이 개발되고 있으며, 현재는 초기 개발 단계지만 가까운 시일 내에 기술적 향상이

일어날 것이라 예측된다.

Key Words: Next-generation sequencing, NGS, massive parallel sequencing, Third-generation

sequencing, Single-molecule DNA sequencing

목 차

1. 서론

2. 차세대염기서열분석법(Next-Generation Sequencing) 의 발전 동향

2.1 플랫폼의 변화

2.2 케미스트리의 변화

2.3 데이터 보관 및 처리법의 변화

3. NGS를 이용한 최신 연구 동향

3.1 Resequencing

3.2 de novo assembly

BRIC View 동향리포트

Page 2: 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 - BioIN · 2018. 7. 9. · 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향

최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 이수민 Page 2 / 15

3.3 Transcriptome 분석 (RNA-Seq)

3.4 ChIP-Seq

3.5 생명공학, 합성생물학에서 NGS의 응용

4. 단일분자염기서열분석법 (“Third-generation Sequencing”)

5. 결론

1. 서론

Next-generation sequencing (NGS), 또는 Second-generation sequencing이라는 표현으로 더욱

잘 알려진 차세대 염기서열분석법 (이하 NGS) 은 Massive parallel sequencing을 일컫는 말로,

한국어로는 ‘대용량 염기서열 분석법’, ‘대규모 병렬형 염기서열 분석법’ 등으로 번역된다. NGS

분석법의 기본 발상은 컴퓨터 공학에서 한 작업을 동시에 수행하는 것을 뜻하는 병렬 컴퓨팅 (Mas-

sively parallel processing) 과 유사한데, 하나의 유전체를 무수히 많은 조각으로 분해하여 각 조각을

동시에 읽어낸 뒤, 이렇게 얻은 데이터를 생물 정보학적 기법을 이용하여 조합함으로써 방대한

유전체 정보를 빠르게 해독하고자 하기 위함이다. 이러한 NGS의 기본 개념은 1992년 시드니

브레너 등에 의해 제시되었지만, 기술적 한계 등으로 인하여 2004년에야 최초로 상용화될 수

있었다 [1, 2]. 그러나 2000년대 중반 이후 광학, 전자, 화학 등 세부 분석 기술과 컴퓨팅 파워가

비약적으로 향상되면서 NGS 플랫폼도 급속도로 진화하였다.

최초의 염기서열 분석법인 생어 시퀀싱에 비해 다양한 장점을 갖고 있는 NGS 기술의

발전으로 인하여 유전체 분석에 소요되는 비용은 해가 갈수록 감소하고 있다. 미국의 NHGRI (Na-

tional Human Genome Research Institute) 는 2004년 “1,000 달러 지놈 ($1,000 Genome)” 을 목표로

유전체 분석 관련 프로젝트에 연구비를 투자하기 시작했다 [3]. 그 결과, 2014년 7월 발표된 유전체

시퀀싱 비용은 약 4,500달러 수준으로 감소하였으며, 인간 유전체의 경우는 그보다 더 낮은

비용으로 분석할 수 있게 되었다. 유전체 분석 비용이 하락하면서 인간을 비롯한 다양한 생명체의

전장유전체 분석이 본격적으로 시작되었으며, 또한 인간 유전체의 다양성을 파악하기 위한 다양한

연구 프로젝트들이 수행되고 있다. 인간 유전체의 변이를 연구하고자 하는 HapMap과 1000 Ge-

nome Project, ENCODE와 modENCODE 등이 그 예이다.

이러한 연구 추세에 따라 NGS는 앞으로 생명과학 및 의과학의 다양한 분야에서

본격적으로 활용될 것이라 예상된다. 현재 약 25억 달러의 가치로 평가되는 세계 NGS 마켓은

2020년에는 87억 달러 규모까지 성장할 것이라 예측되고 있다 [4]. 이러한 세계적 추세에 발맞추어

한국에서도 농촌진흥청, 농림축산식품부, 미래창조과학부 등이 공동으로 주관하는 “포스트게놈

다부처 유전체사업”을 통해 2014년부터 2021년까지 총 5,788억 원을 투자, 밀레니엄 농생명 자원

유전체 해독사업, 농림축산식품 바이오 정보 고도화 사업, 국제 협력 사업 등을 수행할 계획이다.

본 보고서에서는 차세대 염기서열분석법의 최신 기술 발전 동향을 소개하고, NGS 기법을

이용한 연구 동향을 간략하게 짚어보고자 한다. 또한 주목 받고 있는 “3세대 염기서열 분석법” 에

대해 살펴보며 향후 염기서열 분석법의 발전 방향에 대해 논의하고자 한다.

Page 3: 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 - BioIN · 2018. 7. 9. · 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향

최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 이수민 Page 3 / 15

2. 차세대염기서열분석법(Next-Generation Sequencing) 의 발전 동향

2.1 플랫폼의 변화

현재 상용화 되어 있는 NGS 분석 장비의 기본적인 원리는 서로 비슷하지만, 각 과정에서

사용하는 화학 반응 및 염기서열 검출 원리 등 세부 기술에 따라 고유의 특성 및 장단점을 지니고

있다. 최초로 상용화된 NGS 플랫폼인 ‘454’ 가 2004년 출시된 후로 현재까지 다양한 NGS 분석

플랫폼이 출시되고 또한 진화하였다.

표 1. 최근 5년간 주요 NGS 회사의 플랫폼 변화

이 중 가장 널리 사용되는 것은 Illumina 사의 플랫폼으로, GenBank에 등록된 염기서열의 90%

가량이 Illumina의 플랫폼으로 생성된 데이터일 정도로 NGS 분야에서 광범위하게 사용되고 있다.

기술 컨설팅 회사인 HTStec에서 2012년 발표한 보고서에 따르면, 조사 결과에서는 Illumina의 HiSeq

2000/1000을 사용한다고 답변한 응답자가 전체의 39%로 (복수응답) 가장 높은 비율을 차지했으며,

그 외에도 Roche의 454 GS FLX+ (35%), Illumina MiSeq (31%), Thermo Fisher사의 Ion Torrent PGM

(28%), Illumina Genome Analyser IIx (26%), Illumina HiSeq 2500/1500 (20%), Life Technology 사의

ABI SOLiD 2000 (12%), Roche 454 GS Junior (12%) 등이 사용되고 있다 [5]. Pacific Biosciences RS

(5%), Intelligent BioSystems/Azco MAX-Seq (1%) 등의 점유율은 낮은 편이다.

2014년 5월 발간된 국가연구시설장비진흥센터의 자료에 따르면, 한국도 세계적 추세와

비슷하게 Illumina의 플랫폼을 가장 많이 사용하고 있는 것으로 밝혀졌다. 2014년 4월 기준으로

Page 4: 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 - BioIN · 2018. 7. 9. · 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향

최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 이수민 Page 4 / 15

High Perfomance급 장비는 Illumina 플랫폼 (HiSeq, Genome Analyzer 2X) 이 53대로 전체의

70.7%를 차지하는 것으로 나타났다. Benchtop급 장비는 Thermo Fisher (Life Technologies) 사의 Ion

Torrent가 23대로 전체의 45.1%를 차지하고 있으며, Illumina의 MiSeq이 18대 (35.3%) 로 그 뒤를

이었다 [6].

Illumina의 기존 플랫폼들이 이미 NGS 시장의 큰 비중을 차지하며 널리 사용되고 있지만, Il-

lumina는 이에 안주하지 않고 다양한 규격의 플랫폼을 지속적으로 선보임으로써 보다 공격적으로

시장에 진출하고 있다는 평가를 받는다. Illumina는 2014년 1월, 새로운 플랫폼인 NextSeq500과

HiSeq X Ten을 발표하였다 [7].

(1) NextSeq500 - 최초의 하이브리드형 NGS 플랫폼

NextSeq500은 기존의 Illumina 플랫폼인 HiSeq과 MiSeq의 장점을 모두 갖춘, 다시 말해

high-throughput의 성능을 가지면서 소규모 실험실에서도 사용 가능한 desktop sequencer의 기능을

수행하는 것을 목표로 제작된 기계이다. NextSeq500의 가장 큰 장점은 한 대의 기계로 High-

Output과 Mid-Output라는 두 종류의 키트를 번갈아 사용할 수 있다는 것이다. High-Output Kit는

약 하루 정도의 run time으로 최대 400M의 read를 갖는데, 인간 유전체 하나를 30x coverage로

분석할 수 있으며, 9종의 Exome과 10종의 Transcriptome 분석이 가능하다. Mid-Output Kit는 최대

130M read로 3종의 exome, 6종의 enrichment panel과 96개의 amplicon panel을 분석할 수 있다.

따라서 용도에 따라 whole-genome sequencing과 de novo assembly부터 소규모의 타겟 유전자

분석까지 하나의 장비로 해결할 수 있다.

기존의 Illumina 장비가 4-Dye system을 사용하는 것과 달리, NextSeq500 은 2-Dye

system을 사용한다. 기존의 Illumina SBS 케미스트리는 4종류의 염기마다 서로 다른 형광을

사용하지만, NextSeq500 은 C(Cytosine) 은 빨강, T(Tyrosine) 은 초록, A(Ademine)는 두 색깔의 혼합,

그리고 G(Guanine)는 형광이 없는 형태로 표지하여 맵핑한다. 사용하는 형광의 갯수를 절반으로

줄임으로써 기계가 검출하고 처리해야 할 이미지의 갯수 또한 절반으로 줄일 수 있으며, 따라서

광학 장비에 소요되는 원가를 절감할 수 있다.

(2) HiSeq X Ten – 인간 유전체의 대규모 분석을 위한 플랫폼

HiSeq X Ten은 인간 전장유전체의 대규모 분석을 위해 특수하게 제작된 플랫폼이다. 이

장비는 3일간의 작동으로 약 1.8 테라바이트(TB) 분량의 유전체 데이터를 해독할 수 있는데, 이는 약

16명의 인간 전장 유전체에 해당하는 양이다. 이는 HiSeq X Ten 을 이용하면 연간 18000명 가량의

전장 유전체를 30x coverage로 분석할 수 있다는 뜻이다. HiSeq X Ten은 현재 인간의 전장 유전체

분석만 가능하며, 대규모 유전체 분석 기관에 특화된 장비로 최초 주문 시 최소 10대의 기계를

주문해야 한다. 2014년 3분기 실적 발표에서 Illumina는 Broad Institute 등 15개의 대형 유전체

연구소에서 총 164대의 HiSeq X Ten을 도입하였다고 밝혔다 [8]. 국내에서도 마크로젠이 출시 당시

우선공급계약 체결로 10대를 주문했음을 발표한 바 있다. HiSeq X Ten의 상용화로 인해 현재

4천달러 수준인 인간 유전체 분석 비용을 천 달러 이하로 떨어뜨릴 수 있으리라 기대하고 있으며,

인간 유전체 연구 역시 가속도가 붙을 전망이다.

Page 5: 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 - BioIN · 2018. 7. 9. · 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향

최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 이수민 Page 5 / 15

HiSeq

X Ten

HiSeq 2500 NextSeq 500 MiSeq

Hiseq

v4

Truseq

v3

Rapid

v2

Rapid High-

output

Mid-

output

v3

Read

Length (bp)

2x150 2x125 2x100 2x250 2x150 2x150 2x150 2x300

Run Time 3일 6일 11일 60시간 40시간 29시간 26시간 ~65시간

Total Out-

put

1.8 Tb 1 Tb ~600

Gb

~300

Gb

~110

Gb

~100

Gb

~36

Gb

~ 5.5

Gb

단일 read

갯수

60억 40억 30억 12억 6억 4억 1.3억 2천5백만

Quality

Score

> 75%

above

Q30

> 80%

above

Q30

> 80%

above

Q30

> 75%

above

Q30

> 75%

above

Q30

> 75%

above

Q30

> 75%

above

Q30

> 70%

above

Q30

표 2. Illumina 플랫폼과 키트에 따른 사양 비교 (모든 항목은 Lead length의 최대값 기준).

(3) 진단장비로서의 NGS 플랫폼

유전체 검사를 통한 임상 의학에 사용될 NGS 플랫폼 경쟁에서도 역시 Illumina는 선두를

달리고 있다. 2013년 11월, 미국 FDA는 Illumina의 MiSeqDx 플랫폼을 NGS를 이용한 최초의 진단

장비로 승인했다 [9]. 이 날 승인을 받은 장비는 MiSeqDx와 Universal Kit reagents, 그리고

낭성섬유증 (Cystic fibrosis) 을 진단하는 두 가지 실험 기법인 “MiSeqDx Cystic Fibrosis 139-Variant

Assay” 와 “MiSeqDx Cystic Fibrosis Clinical Sequencing Assay” 이다. 이들 키트들은 낭성섬유증에

중요한 역할을 한다고 알려진 유전자인 CFTR (Cystic Fibrosis Transmembrane conductance Regulator

의 시퀀싱 및 유전자 변이를 분석한다. Illumina의 뒤를 이어 Thermo Fisher (Life Technologies) 사는

2014년 9월 Ion PGM Dx System을 미국 FDA의 Class II 의학 장비로 등재하였음을 발표하였다.

2.2 케미스트리의 변화

Illumina에서 2014년 11월부터 판매하기 시작한 HiSeq Rapid v2 Reagent Kit를 사용하면

rapid run mode에서 HiSeq2500의 lead length가 기존의 2x150 bp에서 2x250 bp 로 증가하며,

60시간의 작동 시간 동안 약 300 Gb의 데이터를 얻을 수 있게 된다 [10]. 이러한 성능 향상으로 de

novo assembly나 metagenomics에 더욱 적합한 규격을 갖추게 되었다. 역시나 11월 출시로 예정된

HiSeq X HD v2 Reagent Kit에서는 TruSeq DNA PCR-free sample preparation kit를 지원함으로써

시퀀싱에 필요한 라이브러리 제작 소요 시간을 단축시켰을 뿐만 아니라, PCR 증폭 과정을

생략함으로써 PCR로 인한 라이브러리 편중 현상을 감소시킴으로써 유전체 변이 검출의 민감도를

향상시켰다.

Thermo Fisher는 2014년 3분기에 새로운 DNA polymerase인 Hi-QTM 을 출시했다 [11]. Ion

Page 6: 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 - BioIN · 2018. 7. 9. · 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향

최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 이수민 Page 6 / 15

PGM용으로는 이미 출시되었으며 Ion Proton 용으로 2015년 상반기에 출시 예정인 이 효소는 Indel

(DNA 내 염기 삽입 또는 결실) 에러율을 최소화하기 위해 제작되었다. Thermo Fisher는 공식

발표에서 Hi-QTM 를 사용하였을 때 S.aureus 유전체의 indel 에러율이 94%, E.coli의 에러율이 80%

감소하였으며, 2,300개의 target PCR amplicon-based resequencing panel을 이용했을 때 indel

에러율이 43% 감소하였다고 보고하였다.

2.3 유전체 데이터 보관과 처리법의 변화

NGS를 이용한 유전체 분석의 걸림돌 중 하나는 분석 과정에서 생성되는 대용량의 유전체

데이터를 효율적으로 저장하는 방법의 문제이다. 미국의 Broad Institute나 중국의 BGI 등의 대규모

유전체 연구소에서 하루에 생성되는 데이터의 양은 수 백 테라바이트 급에 달하며, 최근 미 국립

암센터 (National Cancer Institute) 는 현재 저장된 2.6 페타바이트 (petabyte) 의 암 유전체 정보를

클라우드로 복사하는데 1,900만 달러를 지출할 것을 발표한 바 있다 [12]. NGS 분석이 대중화되면서

개별 연구실에서도 NGS를 이용한 분석을 수행할 수 있게 되었으나, 각 실험실에서 NGS 데이터를

저장하고 분석하는 데 필요한 컴퓨팅 파워까지 갖추기는 어렵다. 또한 텍스트로 제공되는 NGS의

실험 결과를 생물 정보학을 공부하지 않은 일반 연구자들이 분석하고 그 정확도를 판단하기

위해서는 정확한 분석 소프트웨어의 활용이 필수적이다.

이러한 문제들을 해결하기 위하여 NGS 기술 발달과 더불어 유전체 데이터를 클라우드에

저장하여 분석하는 서비스를 제공하는 기업들이 등장했는데, DNANexus, Globus Genomics, Tute Ge-

nomics, Seven Bridges, NextCode 등이 대표적인 예이다. 국내 기업인 KT도 2012년 GenomeCloud를

선보인 이후 현재까지 서비스를 제공하고 있다. 대부분의 서비스에서 클라우드 저장 용량 및

클러스터 컴퓨팅, 간단한 분석 도구 등을 사용하여 분석하는 기능을 제공한다. 대표적인 IT 기업인

구글도 최근 유전체 분석 분야에 뛰어들었다. 구글은 2014년 3월 Google genomics 프로젝트

(https://cloud.google.com/genomics/) 를 시작하며 유전체 분석에 필요한 다양한 API를 공개하기

시작한 것에 이어, 10월에는 테라바이트당 월 22달러의 비용의 Genomics Storage 서비스를

제공하겠다고 밝혔다 [12]. 인간 전장유전체를 30x coverage로 분석했을 때 생성되는 데이터의 양은

약 100Gb 정도로, 따라서 이는 한 사람의 유전체 정보를 년간 25달러에 구글 클라우드에 보관할 수

있다는 뜻이다.

유전체 클라우드 서비스의 가격은 앞으로 계속 하락할 것이라 예상되며, 따라서 연구실에

별도의 컴퓨팅 시설을 마련하지 않고 업체에서 제공하는 클라우드 서비스를 이용하는 연구자들의

비율은 점차 늘어날 것이라 예상된다. 또한 이러한 클라우드 서비스는 데이터의 보관 기능과 저장한

NGS 데이터를 분석할 수 있는 도구들을 함께 제공하는 경우가 대부분으로, 이러한 서비스를

효율적으로 이용함으로써 생명 정보학을 전공하지 않은 연구자들도 큰 진입장벽 없이 유전체

분석을 할 수 있게 될 것이다. 폭발적으로 증가하고 있는 NGS 사용자들이 어떤 서비스를

선택하느냐에 따라, 각 서비스의 향방이 크게 갈릴 것이라 예상된다.

Page 7: 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 - BioIN · 2018. 7. 9. · 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향

최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 이수민 Page 7 / 15

3. NGS를 이용한 최신 연구 동향

NGS는 매우 다양한 분야에서 응용되고 있다. Nature Review Genetics 등의 주요 유전학

저널에서는 NGS의 다양한 응용 방안에 대한 기획 리뷰를 지속적으로 싣고 있다.

(http://www.nature.com/nrg/series/nextgeneration/index.html/).

본 보고서에서는 NGS를 이용한 연구 동향을 분석 기법에 따라 분류한 뒤, 각 기법에 해당하는 세부

활용 방안에 대해 간략하게 소개하고자 한다.

3.1 Resequencing

Resequencing은 이미 레퍼런스 유전체가 완성된 생물종의 다양한 유전체를 분석하고 그

서열을 레퍼런스와 비교함으로써 특정 유전체 내 SNP, splicing variant 등의 변이를 발굴하고자 할

때 주로 쓰인다. 질병 유전자 등 유전체의 특정 부위만을 분석하여 비교하는 Targeted

resequencing도 이에 포함되며, NGS가 가장 널리 활용되고 있는 분야이기도 하다. 엑솜 시퀀싱,

유전자를 이용한 진단 검사 의학, Genome-wide association studies (GWAS) 등으로 응용된다.

- Whole exome sequencing (WES)

단백질을 코딩하고 있는 부분을 총망라하는 개념인 엑솜 (Exome) 은 전체 인간 유전체의 2%

정도 밖에 되지 않지만, 현재까지 알려진 질병 관련 유전자들의 85% 가량이 엑솜에 위치한다고

알려져 있다 [13]. 따라서 질병 관련 유전자 발굴 및 진단 검사에는 빠르고 효율적이면서 저비용의

분석이 가능한 엑솜 시퀀싱을 주로 활용한다. 엑솜만을 시퀀싱하기 위해서는 유전체 전체에서 엑솜

부분만을 가려내야 하는데, 엑솜에 해당하는 bait probe를 샘플에 섞어주는 solution-based

capture나 probe를 칩에 붙여서 추출해내는 array-based capture법, PCR을 이용한 방법 등이 있다.

Agilent, Illumina, Roche/NimbleGen 등의 주요 회사에서 다양한 엑솜 캡처용 제품을 출시하고 있다.

엑솜 시퀀싱의 주된 한계점은 바로 이 라이브러리 제작 단계인데, 엑솜 내 GC 함량의 차이 등으로

인하여 capture probe와 DNA 조각 간의 결합력의 차이가 발생하는 등 라이브러리의 편중화가

일어날 가능성이 있기 때문이다.

- 분자진단검사, 임상의학

기존의 생어 시퀀싱법으로는 분석 시간 및 비용의 문제로 특정 질환에 특이적인 소수의

유전자 검사만이 수행되었고 따라서 정확도가 낮았지만, NGS의 발전으로 인하여 하나의 샘플에서

다양한 질병 관련 유전자들을 동시에 분석할 수 있으므로, 유전체 분석을 통한 검사 및 분자 진단이

본격적으로 시작될 것이라 예측되고 있다.

앞서 소개한 대로 현재 미 FDA의 승인을 받은 NGS 진단검사 방법은 Illumina의 낭성섬유증

분석 키트가 유일하지만, 빠른 시일 안에 다양한 질환의 분석 패널이 추가로 개발되어 FDA의

승인을 받을 것이라 예상된다. Illumina는 2014년 7월 분자 진단과 (in vitro diagnostics) 맞춤 의학에

특화된 컨설팅 회사인 Myraqa를 인수한 데 이어, 2014년 8월에는 MiSeqDx 플랫폼을 이용하여

Page 8: 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 - BioIN · 2018. 7. 9. · 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향

최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 이수민 Page 8 / 15

다양한 암 관련 유전자들을 분석하는 패널을 AstraZeneca, Janssen Biotech, Inc., Sanofi 등의 제약

회사들과 공동으로 개발하고 있음을 발표하였다 [14]. 이러한 assay들이 다양하게 개발되고 진단

장비로 승인을 받게 되면 현재 주목 받고 있는 맞춤 의학 (companion diagnostics) 시장이

본격적으로 형성될 것이라 생각된다.

최근 희귀 유전 질환을 앓는 환자들을 대상으로 수행한 clinical exome sequencing (CES) 에

대한 연구가 잇달아 발표되고 있다. 2014년 발표된 연구에서는 유전 질환을 앓고 있다고 추정되는

814명의 환자의 엑솜을 분석함으로써 그 중 26% 에게 정확한 진단을 내릴 수 있었음을 밝혔다. 이

때 환자의 유전체만을 분석하는 proband-CES보다 환자와 그 부모의 유전체를 모두 분석함으로써

de novo variants와 compound heterozygous variants trio-CES의 성공률이 더 높다는 것도

보고하였다 [15].

NGS는 임상 의학에서도 다양하게 활용될 수 있다. 한 예로 장기 이식 환자의 혈액에서 장기

제공자의 유전체와 일치하는 cell-free DNA가 검출되는지의 여부를 NGS로 확인한 사례가

발표되었다 [16]. 또한 임산부의 혈액에도 태아의 cell-free DNA가 발견되는데, 이를 이용하여 태아의

비침투 산전 검사 (Non-invasive prenatal diagnoses) 를 수행한 연구가 발표되었다 [17]. 질병을

일으키는 대장균 등 다양한 세균들과 자궁경부암을 일으키는 HPV (Human Papilloma Virus) 등

바이러스의 체내 존재 여부 및 종 식별을 NGS로 빠르게 분석할 수 있으며, 특정 세균의 항생제

내성 여부와 그 변화 추이를 파악할 수 있다.

- Mapping-by-sequencing 법을 이용한 Forward genetic screening

전통적인 forward genetic screening 은 표준 개체와 돌연변이를 지속적으로 교배하며 유전자

마커를 기준으로 맵핑해야 했으므로 오랜 시간이 소요되었다. 그러나 NGS 분석 비용이 감소한

현재는 NGS를 이용하여 돌연변이체 (또는 backcross한 개체) 의 전장유전체를 분석하고 표준

유전체와 직접 비교함으로써 분석 시간을 단축할 수 있다 [18]. 전장유전체 분석 대신 WES, RAD-

Seq (Restriction-site-associated DNA-sequencing), RNA-Seq 등을 이용하면 NGS에 소요되는 비용을

절감할 수 있다. 이러한 전략은 미생물의 계대 배양을 반복했을 때 생물이 환경에 적응하면서

생기는 유전체 변이를 분석하는 등의 experimental evolution 연구에도 사용된다.

- GWAS (Genome-Wide Association Study)

GWAS란 각 개체의 유전체를 해독하여 비교, 분석함으로써 특정 질병과 연관된 유전적

요인을 찾고자 하는 연구이다. 1000 Genomes, HapMap Project 등을 통하여 구축된 dbSNP

(http://www.ncbi.nlm.nih.gov/snp/) 에는 2014년 10월 현재 (Human build 142) 1억 개 가량의 인간

SNP 정보가 등록되어 있는데, 이러한 정보를 바탕으로 특정 질환을 앓고 있는 환자와 그렇지 않은

사람의 유전체를 해독하고 SNP의 차이를 분석하여 환자 집단에서 차이를 보이는 SNP와 그에

해당하는 유전자를 추려냄으로써 질환과 연관된 유전자를 발굴해내는 것이 통상적인 GWAS의 연구

방법이다. SNP 외에도 CNV (Copy-Number Variation) 이나 Indel, SV (structural Variation) 등의

변이도 연구 대상에 포함된다. Nature Genetics 등 주요 유전학 저널에는 GWAS를 이용한 연구가

빈번하게 게재되고 있으며, 이러한 연구 결과들은 NHGRI에서 발표하는 “GWAS catalog” 에서

Page 9: 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 - BioIN · 2018. 7. 9. · 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향

최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 이수민 Page 9 / 15

파악할 수 있다 [19].

- 집단유전학

집단유전학에서 allele frequency 또는 polymorphism을 분석하는 연구에도 역시 NGS는

유용하게 사용된다. 집단유전학에서는 분석에 사용하는 유전체의 갯수를 늘리는 것이 무엇보다도

중요하므로, NGS를 이용한 전장유전체 분석 비용에 특히 민감하다. 최근 발표된 Pool-Seq은

유전체의 read 수를 늘리는 효과를 가져옴으로써 분석 비용을 감소시킴과 동시에 분석한 유전체

집단의 polymorphism을 빠르게 분석하고자 하는 목적으로 고안되었다 [20]. 그 외에도 sequencing

depth가 낮은 데이터의 불확실성을 예측하고 통계적으로 처리하고자 하는 목적으로 제작된

프로그램들이 발표되고 있다.

- 미생물의 종 식별 및 metagenomics

동, 식물에 비해 미생물의 유전체는 상대적으로 크기가 작기 때문에 유전체 해독이 상당히

진행되었다. 현재 미생물학계에서는 단일 생물종의 유전체 해독 연구를 넘어서서, 특정 환경에서

수집한 샘플에 함유된 유전체를 분석함으로써 각 환경의 미생물 군집을 파악하고자 하는 meta-

genomics 연구가 활발히 수행되고 있다 [21]. 한 샘플에 섞여있는 비슷한 유전체들을 효과적으로

구분하기 위해 16S rRNA나 18S rRNA 등의 종 식별 마커를 사용하는데, 이러한 마커들은 생명 공학

등에 다양하게 응용된다. 또한 이러한 연구 방법은 최근 주목 받고 있는 장내 미생물의 분포 및

관련된 임상 연구에도 널리 사용된다.

- Single-cell genomics

NGS 분석 기술이 발달함에 따라 미량의 DNA 시료의 전장유전체도 NGS로 성공적으로

분석할 수 있게 되었다. 이에 따라 단일 세포의 유전체를 분석하고자 하는 single-cell genomics

연구 역시 활력을 띠게 되었다. 세포 분열 시 DNA가 복제를 거듭하는 과정에서 돌연변이가 발생할

가능성이 항상 있기 때문에, 한 개체에 있는 세포라 하더라도 각각의 유전체에는 미묘한 변이 (so-

matic variation) 가 존재한다. 또한 이러한 돌연변이는 질환의 원인으로 작용할 수도 있는데, 최근

발표된 연구들에 따르면 정상 조직과 질환을 앓고 있는 조직의 유전체를 비교했을 때 변이율이

이론상 계산 결과보다 상당히 높다는 사실이 보고되었다. Single cell genomics를 통해 각 단일

세포의 유전체 서열을 분석함으로써 cell lineage tree를 구축할 수 있는데, 이러한 정보는 발달

생물학이나 암 생물학 연구에 유용하다 [22].

Single-cell genomics의 기술적 한계는 단일 세포의 정확한 분리와 미량 유전체의 증폭이다.

인간의 세포는 개당 약 7 pg 가량의 DNA를 갖고 있는데, 따라서 현재의 NGS 분석을 위해서는

유전체 증폭 (Whole genome amplification) 등의 과정이 필수적이다. NGS 플랫폼의 검출 감도가

향상되어 라이브러리 제작에 필요한 DNA의 양이 감소하는 등의 기술 발전과 더불어 single-cell ge-

nomics 연구는 더욱 활력을 얻을 것이라 예측된다.

- Forensic DNA profiling

Page 10: 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 - BioIN · 2018. 7. 9. · 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향

최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 이수민 Page 10 / 15

법 과학에서 사용하는 유전자 감식법 (DNA profiling) 은 유전체의 특정 부분에서 나타나는

반복서열 (Short-tandem repeat; STR) 의 조합이 개인마다 고유의 패턴을 갖고 있으며, 그 형질이

유전된다는 원리에 기반한다. 현재는 Multiplex PCR과 생어 시퀀싱법으로 유전체 내 특정 좌위의

반복 패턴을 분석하고 있으나, NGS의 발전과 분석 비용의 하락으로 인해 상염색체 및 성염색체,

미토콘드리아 DNA 등 인체의 모든 유전 정보를 한 번의 실험으로 동시에 분석할 수 있는 NGS의

장점이 부각되고 있다. 더불어 SNP (Single-nucleotide polymorphism) 이나 표현형 관련 마커

유전자를 이용하여 개인 식별력을 높이고자 하는 최근의 연구 추세에 NGS가 필수적으로 사용된다.

한 예로 현재의 분석 방법으로는 구별이 불가능한 일란성 쌍둥이의 유전형을 NGS로 구별한 연구가

2011년 발표된 바 있다 [23]. 이 분야에서는 앞으로 현재의 개인 식별 시스템과 호환 가능한 분석

패널 및 키트 개발에 관련된 연구가 뒤따를 것이라 예상된다.

3.2 de novo assembly

de novo assembly는 아직 전체 염기서열이 해독되지 않은 생명체의 염기서열을 NGS로

분석하여 맵핑함으로써 genome 또는 transcriptome을 구축하는 작업을 말한다. NGS 기술의 발전과

이를 뒷받침하는 생물 정보학의 발달로 주요 모델 생물에 이어 다양한 생물자원의 유전체 해독이

가능하게 되었다. 2010년 Illumina를 이용한 판다 유전체의 시퀀싱이 완료된 것을 시작으로,

2011년에는 NGS만으로 인간 유전체를 해독한 연구 결과가 발표되었다 [24]. 이러한 연구에서

제시한 시퀀싱 전략에 따라 수많은 동물 유전체들이 해독되었으며, 현재는 1만종 이상의 척추 동물

유전체를 해독하자는 목표로 Genome 10K 프로젝트 (https://genome10k.soe.ucsc.edu/) 가 추진되고

있다. NGS를 이용한 de novo assembly가 본격적으로 시작되기 전 이미 BAC 클론을 이용한 생어

시퀀싱으로 해독되고 있던 유전체들도 이제까지 얻은 결과와 NGS를 이용한 분석 결과를

조합함으로써 유전체 해독에 가속도를 붙일 수 있었다.

그러나 NGS 만으로 해독된 유전체 정보는 생어 시퀀싱만으로 제작된 유전체에 비해

전체적인 완성도가 낮다는 한계를 갖고 있다. 특히 식물 유전체 같이 내부의 반복 서열이 다수

존재하는 유전체의 경우는 NGS를 이용한 de novo assembly가 어렵다는 단점이 있다. 이제까지

발표된 식물 유전체는 lead length가 상대적으로 긴 454 플랫폼을 주로 이용하거나 454와

Illumina를 혼용하여 분석하곤 하였으나, 주로 배수체인 작물 유전체나 유전체의 크기가 매우 거대한

경우에는 lead length나 분석 비용의 문제가 여전히 존재한다 [25]. 그러나 현재 Illumina 플랫폼의

read length도 점차 길어지는 추세이며, 앞으로 더욱 긴 lead length를 갖는 플랫폼 및 시약이

개발될 것이라 전망되므로, NGS를 이용하여 분석한 전장유전체의 완성도도 점차 향상될 것이라

예측된다.

3.3 Transcriptome sequencing

2000년대 초까지 Microarray로 대표되었던 유전자 발현체 (mRNA) 분석법은 NGS 기술의

발달로 인하여 현재 대부분 RNA-Seq으로 대체되었다. Microarray로는 특정 mRNA의 증가 또는

Page 11: 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 - BioIN · 2018. 7. 9. · 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향

최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 이수민 Page 11 / 15

감소량 정도만 파악할 수 있었지만, NGS로 mRNA의 염기 서열을 직접 해독하게 됨으로써 (RNA

profiling) 그 전까지 불가능했던 RNA editing이나 allele-specific expression 등의 관찰이 가능하게

되었다. mRNA 뿐만 아니라 small RNA 등의 non-coding RNA의 분석도 가능하며, 엑손/인트론을

구별하기 위한 수단으로도 사용된다. 또한 염기서열이 완전히 해독되지 않았거나 transcript들의

서열 정보가 불충분한 생물에서도 분석이 가능하다 [26].

RNA-Seq의 기본적인 원리는 mRNA나 miRNA 등 원하는 RNA를 분리한 뒤, RNA를 DNA로

변환한 뒤 아답터를 붙여서 라이브러리를 제작하는 것이다. RNA는 유전체와 달리 세포 내에

존재하는 양이 그 특징에 따라 매우 다양하기 때문에, 극소량의 mRNA까지 성공적으로 검출해내기

위해서는 최대한 많은 read를 읽음으로써 sequencing depth를 올리는 것이 무엇보다도 중요하다.

또한 transcriptome의 대다수를 차지하는 rRNA 등을 효과적으로 제거하는 것이 도움이 된다. 그러나

miRNA 등 small RNA는 그 크기가 작기 때문에, 라이브러리 제작에 사용되는 아답터가 형성하는

아답터-이합체 (adapter-dimer) 와 구별하기 어렵다는 문제점이 존재한다. 이러한 한계점들을

종합해봤을 때 NGS를 이용한 transcriptome 분석법의 발전을 위해서는 고품질의 라이브러리

제작법에 대한 연구가 뒷받침되어야 할 것이라 생각된다.

3.4 DNA/RNA-protein interactions

ChIP (Chromatin immunoprecipitation) 은 크로마틴 결합 단백질이 유전체의 어떤 부분과

결합하는지 알아보기 위하여 고안된 실험법이다. NGS 기술의 발달로 인해 ChIP 실험으로 얻은

각각의 DNA 조각들을 곧바로 시퀀싱하여 그 염기 서열을 파악할 수 있게 되었는데, 이러한

시험법을 ChIP-Seq (Chromatin immunoprecipitation followed by sequencing) 이라고 한다. 또한

CLIP-Seq (Cross-linking immunoprecipitation sequencing) 이라는 방법도 개발되었는데, 이는 특정

단백질과 결합하는 RNA를 규명하기 위한 실험이다. RNA와 단백질을 crosslinking시키는 것은 ChIP-

Seq과 동일한 원리지만, CLIP-Seq에서는 염기서열 해독을 위해 RNA를 DNA로 변환하는 단계가

포함된다. 최근에는 특정한 화합물과 결합하는 DNA 조각의 염기 서열을 분석하는 Chem-Seq

(Chemical affinity capture and massively parallel DNA sequencing) 이라는 기법이 발표되었는데 [27],

이 방법을 이용하여 small molecule의 genomic target을 규명함으로써 신약 후보 물질 개발 등에

응용할 수 있다.

3.5 생명공학, 합성생물학과 NGS

산업계에서의 NGS 응용 가능성도 최근 다양한 측면으로 제시되고 있다. 대표적인 예가

세포주를 균일하게 유지하기 위한 유전체 분석이다. 특정 세포주를 세대를 반복하여 계대 배양하면

그 과정에서 유전체 또는 후성 유전학적 변이가 생길 가능성이 있는데, 각 세포주의 유전체를

NGS를 이용하여 빠르게 분석함으로써 각 단계에서의 돌연변이를 모니터링 하여 세포주의 품질을

유지할 수 있다.

또한 다양한 환경에서의 세포의 활성 변화 및 유전자 발현 패턴의 변화를 관찰하는 데에도

Page 12: 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 - BioIN · 2018. 7. 9. · 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향

최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 이수민 Page 12 / 15

NGS는 유용한 도구가 될 수 있다. 예를 들어 산업용 미생물에 다양한 생장 조건을 처리한 뒤 RNA-

Seq을 수행하여 특정 조건에서 발현량에 변화가 있는 유전자를 추출해낼 수 있다. 이러한 정보를

바탕으로 공정에 유용하게 사용할 수 있는 바이오 마커를 개발하는 데 응용할 수 있다.

4. 단일분자염기 서열분석법 (“Third-generation Sequencing”)

NGS 기술이 비약적으로 발전했음에도 불구하고 NGS의 개념 자체가 안고 있는 한계점들이

여전히 존재한다. 그 중 하나는 염기서열 분석 과정에서 발생하는 랜덤 에러에 취약하다는 것이다.

자동화된 생어 시퀀싱의 결과는 샘플 내 모든 DNA에 표지된 형광의 총합으로 나타나게 된다.

따라서 돌연변이나 오차가 생기더라도 다수의 DNA가 정확하게 분석되었다면 그 오류가 상쇄될 수

있다. 반면 NGS는 단일 가닥의 염기서열을 모두 분석하기 때문에, 증폭되는 과정에서 중합효소에

의해 발생하는 에러 등을 모두 검출해내게 된다. 따라서 NGS에서는 동일한 샘플을 반복적으로

분석하여 coverage depth를 증가시키는 등의 추가적인 노력이 필요하다 [28].

“Third-Generation Sequencing” 이라 불리는, 유전체의 증폭 없이 단일 가닥 DNA 시료의

염기서열을 분석하기 위한 기법들은 앞에서 제시한 NGS의 한계점을 극복할 수 있는 새로운

염기서열 분석법이 될 것이라 주목 받고 있다. NGS에 비해 read-length가 길고 극미량의 DNA

시료를 분석할 수 있다는 장점이 있다. 또한 NGS에서 필수적인 DNA 증폭 단계를 생략함으로써

PCR 과정에서 돌연변이 생성 등의 오류를 방지할 뿐만 아니라, coverage depth를 올리지 않더라도

low-abundance variant를 효과적으로 검출할 수 있음은 물론 PCR 단계 및 반복 실험의 생략으로

인한 비용 및 시간 절감 효과를 기대할 수 있다. 또한 “Programmable-real-time targeted sequenc-

ing” 의 개념도 제시되고 있는데, 이는 어떠한 전처리 과정 없이 특정 유전체 중 원하는 부분을

실시간으로 분석할 수 있는 기법을 말한다. 예를 들어, 어떤 유전체의 특정 유전자를 분석하고자

한다면, 이 유전체의 염기 서열을 곧바로 읽기 시작하고, 그 결과와 원하는 유전자의 서열을

실시간으로 align하여 원하는 유전자 서열이 나오는 순간까지 염기서열 분석을 수행하는 방식이다

[29].

최초의 단분자 염기서열 분석 장비인 Single-Molecule Real Time (SMRT) sequencer는 Pacific

Biolab에서 개발되었다. 현재 출시된 플랫폼인 PacBio RS II 은 lead length가 15kb에 달하며, 분석

속도도 2시간 정도로 매우 빠르다. 2014년 10월 발표한 케미스트리 업데이트에 따르면 PacBio RS

II의 최장 read는 현재 40kb에 달하는 것으로 보인다 [30]. 옥스포드 나노포어 (Oxford Nanopore)

사에서 개발한 염기서열 분석 방법은 “나노포어 (Nanopore)” 에 DNA 가닥이 들어갔을 때 염기의

크기에 따라 미세한 전위차가 발생하는 것에 착안했다. 옥스포드 나노포어는 2012년 발표한 Min-

IONTM과 GridIONTM에 이어, 2014년 10월 샌디에고에서 열린 ASHG 학회에서는 신제품인 PromethI-

ONTM을 발표했다 [29]. PromethIONTM은 타블렛 정도의 크기를 가진 benchtop 규격의 나노포어

시퀀서로, 15만개 이상의 나노포어로 구성되어 있으며, 분석 비용은 기가바이트당 30불 정도이다.

이 밖에도 수많은 기업들이 단분자 염기서열 분석법을 개발하기 위해 노력하고 있다.

2014년 6월 Roche는 반도체 기반 단분자 염기서열 분석 장비를 개발하는 스타트업인 Genia를

Page 13: 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 - BioIN · 2018. 7. 9. · 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향

최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 이수민 Page 13 / 15

인수하였음을 밝혔다 [31]. Roche는 앞서 2013년 10월 454 sequencing 사업을 2016년에 중단한

것을 발표한 바 있다. 이번 인수합병을 계기로 Roche는 단분자염기서열 분석 장비의 개발 및 시장

선점에 박차를 기할 것이라 예상할 수 있다. Quantum Biosystems 사도 역시 자체적으로 단분자

염기서열법을 개발하고 있으며, 최근 자사의 기술을 이용한 최초의 시퀀싱 결과를 공개하였다 [32].

그러나 현재까지 개발된 단분자 염기서열 분석법들은 모두 에러율이 매우 높다는 한계가

있다. NGS 플랫폼은 Illumina는 치환 (substitution), Ion Torrent는 Indel 에러 등의 주요 에러 모델이

이미 규명되어 있다. 이러한 에러들은 read 갯수를 늘리고 특수한 알고리즘을 적용하여 그 정확도를

향상시킬 수 있지만, 옥스포드 나노포어 등의 분석법들에서 발생하는 오차는 아직 그 에러 모델이

명확하게 규명되어 있지 않다.

5. 결론

차세대 염기서열분석법이 상용화된지 10년 째인 현재는 본격적인 유전체학의 시대라 해도

과언이 아닐 것이다. 불과 20년 전 유전자 하나를 클로닝하여 각 유전자의 기능을 연구하던

연구자들은 이제 특정 생명 현상과 관련된 모든 유전자들 사이의 상관 관계를 통합적으로 파악할

수 있게 되었다. 또한 transcriptome 연구 분야의 사례와 같이, NGS는 기존의 연구 방법을 완전히

새로운 기법으로 탈바꿈시키기도 한다. NGS 분석에 소요되는 비용은 해가 갈수록 하락하고 있으며,

향후 NGS는 현재 각 실험실에서 생어 시퀀싱을 사용하는 만큼이나 빈번하게 사용될 것이다.

연구자가 NGS를 활용하기 위해서는 먼저 NGS의 장점인 대규모 염기서열 분석을 어떻게

개인의 연구분야에 효과적으로 접목시킬 수 있을 것인지에 대해 고민해야 한다. 한 번의 NGS

분석으로도 상당히 많은 양의 데이터가 생성되기 때문에, 데이터를 어떻게 분석하여 그 중에서

유의미한 결과를 추출해낼 것인지에 대한 충분한 계획을 세우고 실험을 디자인해야 한다. NGS

기술은 최근 수 년 사이에 급격하게 변화해왔듯이 앞으로도 빠르게 진화할 것이고, 따라서

연구자들은 실시간으로 변하는 기술 동향을 빠르게 파악함으로써 각자의 연구에 가장 적절한

플랫폼 및 분석 방법을 선택하여 사용해야 할 것이다.

단분자 염기서열 분석법 역시 아직은 초기 개발 단계의 기술이지만, 현재의 NGS 기법이 10년

만에 괄목한 발전을 이뤄낸 것과 마찬가지로 향후 기술력이 비약적으로 상승할 것이라 예측된다. 이

분석법이 본격적으로 상용화된다면 DNA 염기서열 분석법과 유전체학 등 다양한 연구 분야에 또 한

번의 혁신을 가져올 것이다.

참고문헌

[1]. Brenner, S. et al. (2000) Gene expression analysis by massively parallel signature sequencing (MPSS) on mi-

crobead arrays. Nat. Biotechnol., 18, 630-634.

[2]. Margulies, M. et al. (2005) Genome sequencing in microfabricated highdensity picolitre reactors. Nature 437,

Page 14: 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 - BioIN · 2018. 7. 9. · 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향

최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 이수민 Page 14 / 15

376–380.

[3]. Schloss, J. A. (2008) How to get genomes at one ten-thousandth the cost. Nat. Biotechnol. 26, 1113–1115.

[4]. MarketsandMarkets, Sep 2014. http://www.marketsandmarkets.com/Market-Reports/next-generation-

sequencing-ngs-technologies-market-546.html

[5]. Drug Discovery Review, (Spring 2013) Andrew Szopa-Comley, DNA Sequencing: towards the third genera-

tion and beyond. http://www.ddw-online.com/2013-pdf-archive/p213559-spring-2013.html

[6]. 국가연구시설진흥센터. (May 07, 2014) PRISM POLISSUE, 7호, 유전체 연구와 NGS 장비.

[7]. Business Wire, Jan 14, 2014.

http://www.businesswire.com/multimedia/home/20140114006298/en/#.VIj2StKsUoE

[8]. Seeking Alpha, Oct 21, 2014 http://seekingalpha.com/article/2576965-illuminas-ilmn-ceo-jay-flatley-on-q3-

2014-results-earnings-call-transcript

[9]. FDA News & Events, Nov 19, 2013.

http://www.fda.gov/NewsEvents/Newsroom/PressAnnouncements/ucm375742.htm

[10]. Illumina Press Release, Oct 17, 2014 http://investor.illumina.com/phoenix.zhtml?c=121127&p=irol-

newsArticle&ID=1978870

[11]. Thermo Fisher Press Release, Oct 21, 2014 http://news.thermofisher.com/press-release/ampliseq/novel-

enzyme-enables-highest-ngs-accuracy-amplicon-sequencing

[12]. MIT Technology Review, Nov 6, 2014 http://www.technologyreview.com/news/532266/google-wants-to-

store-your-genome/

[13]. Choi, M. et al. (2009) Genetic diagnosis by whole exome capture and massively parallel DNA sequencing.

Proc. Natl. Acad. Sci. U.S.A. 106, 19096–19101.

[14]. Illumina Press Release, Aug 21, 2014 http://investor.illumina.com/phoenix.zhtml?c=121127&p=irol-

newsArticle&ID=1960007

[15]. Lee, H. et al. (2014) Clinical Exome Sequencing for Genetic Identification of Rare Mendelian Disorders.

JAMA 312, 1880-1887.

[16]. Snyder, T. M. et al. (2011) Universal noninvasive detection of solid organ transplant rejection. Proc Natl

Acad Sci U.S.A. 108, 6229-6234.

[17]. Fan, H.C. et al. (2012) Non-invasive prenatal measurement of the fetal genome. Nature 487, 320–324.

[18]. Schneeberger, K. (2014) Using next-generation sequencing to isolate mutant genes from forward genetic

screens. Nat. Rev. Genet. 15, 662–676.

[19]. Welter, D. et al. (2014) The NHGRI GWAS Catalog, a curated resource of SNP-trait associations. Nucleic

Acids Res. Vol. 42 (Database issue): D1001-D1006.

[20]. Schlötterer, C. et al. (2014) Sequencing pools of individuals — mining genome-wide polymorphism data

without big funding. Nat. Rev. Genet. 15, 749–763.

[21]. Faust, K. and Raes, J. (2012) Microbial interactions: from networks to models. Nat. Rev. Microbiol. 10, 538–

550.

[22]. Macaulay, I. C. and Voet, T. (2014) Single Cell Genomics: Advances and Future Perspectives. PLoS Genet. 10,

e1004126.

[23]. Weber-Lehmann, J. et al. (2014) Finding the needle in the haystack: differentiating ‘‘identical’’ twins in pa-

ternity testing and forensics by ultra-deep next generation sequencing. Forensic Sci. Int. Genet. 9, 42–46.

Page 15: 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 - BioIN · 2018. 7. 9. · 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향

최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향 이수민 Page 15 / 15

[24]. Gnerre, S. et al. (2011) High-quality draft assemblies of mammalian genomes from massively parallel se-

quence data. Proc Natl Acad Sci U.S.A. 108, 1513-1518.

[25]. 한국생화학분자생물학회 (May 2012) 한국생화학분자생물학회 웹진 TiBMB. 김남신, 정원형. NGS를 이용한

유전체 연구-드노보 어셈블리 및 희귀질환/암 유전체. http://ksbmb.or.kr/webzine3/index.php?CatNo=1421

[26]. Martin, J.A. and Wang, Z. (2011) Next-generation transcriptome assembly. Nat. Rev. Genet. 12, 671-682.

[27]. Rodriguez, R et al. (2014) Unravelling the genomic targets of small molecules using high-throughput se-

quencing. Nat. Rev. Genet. 15, 783-796.

[28]. Sims, D. et al. (2014) Sequencing depth and coverage: key considerations in genomic analyses. Nat. Rev.

Genet. 15, 121-132

[29]. Next Gen Seek, Oct 22, 2014 http://nextgenseek.com/2014/10/oxford-minion-at-ashg-2014-updates-on-

minion-and-promethion/

[30]. Parcific Biosciences Press Release, Oct 15, 2014

http://investor.pacificbiosciences.com/releasedetail.cfm?ReleaseID=876252

[31]. Roche Media Releases, Jun 02, 2014 http://www.roche.com/media/media_releases/med-cor-2014-06-

02.htm

[32]. Business Wire, Jan 27, 2014 http://www.businesswire.com/news/home/20140127005012/en/Quantum-

Biosystems-Demonstrates- Reads-Quantum-Single-Molecule/

The views and opinions expressed by its writers do not necessarily reflect those of the Biological Research Information Center.

이수민 (2014). 최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구 방향. BRIC View 2014-T05. Available from http://bric.postech.ac.kr/myboard/read.php?Board=review0&id=2278 (Dec 18, 2014)

Email: [email protected]