公共 NGS データから非モデル生物のデータをより...

1
神戸国際会議場 平成 25 9 4 日~5 NGS 現場の会 3 回研究会 Conclusions Backgrounds and motivations http://sra.dbcls.jp/ DBCLS SRA Corresponding NGS data Publications using NGS TOTAL 3660 22935 Illumina HiSeq 2000 Illumina GA II Roche 454 GS FLX TItanium ( 結果配列ファイル数 ) ( プロジェクト数 ) 文献からの検索 シーケンサー別 目的別 生物種別(Top 15イネ(とその亜種)の例 カイコ(とその上位、近縁)の例 (as of Sep 2, 2013) Statistics Data Visualization Results and Discussions 公共データベース SRA に登録された次世代シーケンサによるデータを生物種の切り口から整理した。 整理したデータは DBCLS SRA より閲覧可能。 http://sra.dbcls.jp/ ・非モデル生物について、上位概念、下位概念を検索ができるようにした。 @chalkless (チョウ目) (アゲハチョウ上科) (ドクチョウ亜科) (アゲハチョウ科) (カイコ) (クワコ) (カイコガ上科) DRA ENA SRA Next generation Sequencer (Sequence Read Archive) ここ最近、次世代シーケンサ (NGS) による成果が次々に発表されてい る。マイクロアレイのデータが GEO に登録されるのと同様に、 NGS データも公共データベースで ある Sequence Read Archive (SRA) に登録され、日米欧の 3 局でデー タ交換がなされている。その数は、 プロジェクト数で 23000 (2013 9 月現在 ) と前年の倍近くに及んで いる。DBCLS では、 DDBJ と連携し、 登録データに対して、目次作成、 データの傾向分析を行い、 NGS デー タの検索サイトである DBCLS SRA を構築、提供している。 Indexing, Trend analysis Public Database Illumina HiSeq 2000 Illumina HiSeq 1000 Illumina MiSeq Illumina HiScanSQ Illumina GA IIx Illumina GA II Illumina GA 454 GS FLX Titanium 454 GS FLX+ 454 GS FLX 454 GS 20 454 GS 454 GS Junior AB SOLiD 5500xl AB SOLiD 5500 AB 5500xl Genetic Analyzer AB 5500 Genetic Analyzer AB SOLiD 4hq System AB SOLiD 4 System AB SOLiD 3 Plus System AB SOLiD System 3.0 AB SOLiD System 2.0 AB SOLiD System Complete Genomics Helicos Heliscope PacBio RS Ion Torrent PGM unspecified Lepidoptera 37572 Papilionoidea 91 Papilionidae 26 Homo sapiens 2019 Mus musculus 1325 unidentified 867 Drosophila melanogaster 507 Caenorhabditis elegans 282 soil metagenome 271 [TaxonID] 248 Arabidopsis thaliana 243 marine metagenome 197 Saccharomyces cerevisiae 191 Escherichia coli str. K-12 substr. MG1655 174 Bacteria 106 human gut metagenome 93 Danio rerio 88 Zea mays 83 Total 25701 (studies) 公共 NGS データから非モデル生物のデータをより簡単に得るための検索 [email protected] 仲里 猛留 情報・システム研究機構 ライフサイエンス統合データベースセンター (DBCLS) 撮影 Creative Commons Licence ( 表示) のもと、再利用可 (Takeru Nakazato) データ交換 連携 イネなんですけど、 japonica とか indica とかもあって 探すの大変なんですよね。 カイコをやっているんですけど、 昆虫全体とかで見たいんですが。 Oryza sativa 64 39947 Oryza sativa japonica group 35 4530 120 39946 Oryza sativa indica group 19 1050722 Oryza sativa Indica Group x Oryza sativa Japonica Group 1 1080340 Oryza sativa Japonica Group x Oryza sativa Indica Group 1 7091 Bombyx mori 18 7092 Bombyx mandarina 3 40037 Heliconiiae 76 7088 153 現場の声 作ってみました (ざっくりですけど) 7143 6 Bombycoidea ... 37569 ... ... Taxonomy ID 入力 下位概念も検索するときはチェック イネそのものだけ だと 64 カイコだけだと 18 近縁も入れて 26 indica/japonica など 入れると 120 チョウ目全体だと 153 ※ 随時 アップデートするので、機能追加+インターフェースの変更もある予定 下位概念も 検索されるように (タバコスズメガ が 6 件)

Transcript of 公共 NGS データから非モデル生物のデータをより...

神戸国際会議場平成 25年 9月 4日~5日

NGS現場の会 第 3回研究会

Conclusions

Backgrounds and motivations

http://sra.dbcls.jp/

DBCLS SRA

Corresponding NGS dataPublications using NGS

TOTAL

3660

22935

IlluminaHiSeq 2000

IlluminaGA II

Roche454 GS FLXTItanium

( 結果配列ファイル数 )

( プロジェクト数 )

文献からの検索

シーケンサー別

目的別

生物種別(Top 15)

イネ(とその亜種)の例

カイコ(とその上位、近縁)の例

(as of Sep 2, 2013)Statistics

Data Visualization

Results and Discussions

・ 公共データベース SRAに登録された次世代シーケンサによるデータを生物種の切り口から整理した。

・ 整理したデータは DBCLS SRA より閲覧可能。 http://sra.dbcls.jp/

・非モデル生物について、上位概念、下位概念を検索ができるようにした。

@chalkless

(チョウ目)

(アゲハチョウ上科)

(ドクチョウ亜科)

(アゲハチョウ科)

(カイコ)

(クワコ)

(カイコガ上科)

DRA

ENASRA

Next generation Sequencer

(Sequence Read Archive)

ここ最近、次世代シーケンサ (NGS)

による成果が次々に発表されている。マイクロアレイのデータがGEOに登録されるのと同様に、NGSデータも公共データベースである Sequence Read Archive (SRA)

に登録され、日米欧の 3局でデータ交換がなされている。その数は、プロジェクト数で 23000 (2013年9月現在 )と前年の倍近くに及んでいる。DBCLSでは、DDBJ と連携し、登録データに対して、目次作成、データの傾向分析を行い、NGSデータの検索サイトである DBCLS SRA

を構築、提供している。

Indexing,Trend analysis

Public Database

Illumina HiSeq 2000Illumina HiSeq 1000Illumina MiSeqIllumina HiScanSQIllumina GA IIxIllumina GA IIIllumina GA454 GS FLX Titanium454 GS FLX+454 GS FLX454 GS 20454 GS454 GS JuniorAB SOLiD 5500xlAB SOLiD 5500AB 5500xl Genetic AnalyzerAB 5500 Genetic AnalyzerAB SOLiD 4hq SystemAB SOLiD 4 SystemAB SOLiD 3 Plus SystemAB SOLiD System 3.0AB SOLiD System 2.0AB SOLiD SystemComplete GenomicsHelicos HeliscopePacBio RSIon Torrent PGMunspecified Lepidoptera

37572 Papilionoidea

91Papilionidae

26

Homo sapiens 2019Mus musculus 1325

unidentified 867Drosophila melanogaster 507

Caenorhabditis elegans 282soil metagenome 271

[TaxonID] 248Arabidopsis thaliana 243marine metagenome 197

Saccharomyces cerevisiae 191Escherichia coli str. K-12 substr. MG1655 174

Bacteria 106human gut metagenome 93

Danio rerio 88Zea mays 83

Total 25701(studies)

公共 NGSデータから非モデル生物のデータをより簡単に得るための検索

[email protected]

仲里 猛留

情報・システム研究機構 ライフサイエンス統合データベースセンター (DBCLS)

撮影可Creative Commons Licence

(表示 ) のもと、再利用可

(Takeru Nakazato)

データ交換

連携

イネなんですけど、japonicaとか indicaとかもあって探すの大変なんですよね。

カイコをやっているんですけど、昆虫全体とかで見たいんですが。

Oryza sativa 64

39947 Oryza sativa japonica group 35

4530

12039946 Oryza sativa indica group 19

1050722 Oryza sativa Indica Group x Oryza sativa Japonica Group 1

1080340 Oryza sativa Japonica Group x Oryza sativa Indica Group 1

7091 Bombyx mori 18

7092 Bombyx mandarina 3

40037 Heliconiiae 76

7088

153

現場の声

作ってみました(ざっくりですけど)

7143 6

Bombycoidea

...

37569

...

...

Taxonomy ID入力 下位概念も検索するときはチェック

イネそのものだけだと 64 件

カイコだけだと 18 件 近縁も入れて

26 件

indica/japonicaなど入れると 120件

チョウ目全体だと153件

※ 随時 アップデートするので、機能追加+インターフェースの変更もある予定

下位概念も検索されるように

(タバコスズメガ が 6件)