Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AWSで挑むゲノム解析 : 普段使わない技術を知ろう

AWSで挑むゲノム解析 : 普段使わない技術を知ろう

普段の仕事では触れることのない技術やAWSサービスを知ってみませんか?
このセッションでは、ゲノム解析をAWSでどのように実現するのかを紹介します。
スパコンを使うイメージが強いゲノム解析ですが、AWSを活用する利点や、ゲノム解析に利用可能なAWSサービスについて、具体的な事例を交えて解説します。
明日からすぐに使わない技術にスポットをあてていきます。

Yasutaka OHMURA

July 08, 2024
Tweet

More Decks by Yasutaka OHMURA

Other Decks in Technology

Transcript

  1. ⾃⼰紹介 4 大村 保貴 クラスメソッド株式会社 AWS事業本部 コンサルティング部 ソリューションアーキテクト 仕事 •

    エンプラ企業を中心に技術支援 受賞 • 2024 Japan AWS Top Engineers • 2024 Japan AWS All Certifications Engineers 好きな公園 • 中島公園、モエレ沼公園
  2. 疑問 どうやってDNAをコンピュータで処理するの? 8 出典: DNA 二重らせん C © DBCLS TogoTV

    (CC-BY-4.0) 0111000001100010000 1110000101010001111 1000010101111110100 0001110101011110000
  3. この並びのことを塩基配列と呼びます 塩基配列 14 A T G C G A G

    ・Adenine (アデニン) ・Thymine (チミン) ・Guanine (グアニン) ・Cytosine (シトシン) 画像の左端のみ利用 出典: DNA 二重らせん C © DBCLS TogoTV (CC-BY-4.0)
  4. この並びを文字列情報として扱いたい ⽂字列データへ変換 17 A T G C G A G

    画像の左端のみ利用 出典: DNA 二重らせん C © DBCLS TogoTV (CC-BY-4.0)
  5. 文字列情報に変換できる専用マシンがある シーケンシング 18 A T G C G A G

    前処理 出典: 次世代シーケンサー8_1 © DBCLS TogoTV (CC-BY-4.0) 出典: ナノポアDNAシーケンシングの原理 © DBCLS TogoTV (CC-BY-4.0)
  6. DNAの塩基配列がテキストファイルになった ⽂字列データへ変換 22 A T G C G A G

    .fastq 画像の左端のみ利用 出典: DNA 二重らせん C © DBCLS TogoTV (CC-BY-4.0)
  7. ヒトゲノムの場合 36 A T G C G A G 出典:

    DNA 二重らせん C © DBCLS TogoTV (CC-BY-4.0) … 約30億文字続く
  8. AWSのサービス 41 AWS ParallelCluster AWS Batch AWS HealthOmics Amazon EC2

    ゲノム解析に使いやすいサービスは4つ
  9. AWSのサービス 47 AWS ParallelCluster AWS Batch AWS HealthOmics Amazon EC2

    Apptainer コンテナも動かせる Docker コンテナのみ対応
  10. AWSのサービス 51 AWS HealthOmics Pros ・研究者などの現場の方に優しい設計 ・AWSの学習コストを下げるために抽象化 Cons ・アプリは Docker

    コンテナ化必須 ・Apptainer 非対応 ・スポットインスタンス非対応 ・東京リージョン非対応 特化
  11. 55

  12. 58