AWS MarketplaceでDragenを使用してゲノムをアライメントする

目的

Dragenの性能、料金を実際に使ってみて確認する。

 

やること

AWS Marketplaceを使ったことがないので使い方を学ぶ。

どのように料金が発生->消滅するのか確認する。

 

実行日

2018年7月

 

AWS DRAGENのインストールガイドがあります。このガイドに簡単にDragenを使用できます。このブログはインストールガイドにしたがってDragenをインストールしていき、わからないことや突っかかったことをまとめた

edicogenome.com

 

 AWS Marketplace製品の起動方法はAWS コンソールからインスタンス起動時に、その製品を選べばよいとのことです。

AWS Marketplace を使用した製品のサブスクライブ

Amazon EC2 起動ウィザード: AMI を検索し、ウィザードからインスタンスを直接起動できます。詳細については、「AWS Marketplace インスタンスの起動」を参照してください。

インスタンス起動->AWS Marketplace->"Dragen"検索で出てきました。

 使用可能な3つのリージョンからオレゴンリージョンを選択しました。

 f:id:ken0-1n:20180827115751p:plain

 

Free TrielでDRAGENが1日タダで使えるようです。

AWSインスタンス料金はかかります。

 

価格の内訳がありました。

**Pricing Breakdown:

F1.2xlarge: $10.35 (DRAGEN) + $1.65 (Compute) = $12.00/hr

Per Genome: $12.00hr/0.8 genomes = $15

Per Exome:      $12.00hr/5.45 exomes = $2

F1.16xlarge: $22.10 (DRAGEN) + $13.20 (Compute) = $35.30/hr

Per Genome:  $35.30hr/1.76 genomes = $20

Per Exome:       $35.30hr/12 exomes = $3

 

 

Marketplaceを使用する権限がないためエラーになりました。 

User: arn:aws:iam::xxxxxxxxxx:user/kchiba-ci is not authorized to perform: aws-marketplace:ViewSubscriptions on resource: *

 

AWS Marketplace Full Accessを付与してエラーを解消しました。 

 

MarketplaceのHelpページをみてみました。 

AWS Marketplace: AWS Marketplace : Help

メモ:1

I started a free trial for a product I purchased on AWS Marketplace but never used the software during the trial period. Can I restart my trial since I didn’t get any use out of it?

 試用期間を確認しながらAMIを使用すれば、FreeTrialを超過しないように気をつけられそうです。

メモ:2

You can view your usage in the billing console. Billing will be recorded under the AWS Marketplace section: https://console.aws.amazon.com/billing/home#/ 

 Marketplaceの請求額はコンソールをみて確認すればよいとのことです。簡単です。

  

とりあえず動かしてみる

f:id:ken0-1n:20180827184243p:plain

 

こちらをcontinueします。

f:id:ken0-1n:20180827184339p:plain

使用するインスタンスを選択します。

f:id:ken0-1n:20180827184513p:plain

 S3からデータをストリーミングでインプットできるようにロールの設定をします。

f:id:ken0-1n:20180827184645p:plain

結果のBAMファイルとかはephemeralに置かれる。940GiBx4サイズがあれば十分。

f:id:ken0-1n:20180827184814p:plain

タグづけは任意とのことなので名前だけつけておく

f:id:ken0-1n:20180827184940p:plain

画面を開くとセキュリティーグループは新規が選択されていて、名前までデフォルトで入力済み。このままセキュリティーグループを作成する。

f:id:ken0-1n:20180827185130p:plain

警告はでてる(いつもの)。キーペアを使うので安全とする。

作成ボタン押下後にキーを設定する。

f:id:ken0-1n:20180827185454p:plain

キーペアを指定する画面がでてくる(いつもの)

既存のキーペアを指定して作成。

 

作成中の画面です。

f:id:ken0-1n:20180828092809p:plain

起動時間は通常のEC2を立ち上げるのと同じくらいすぐだけど、2/2チェックが15分くらいかかった。

 

ssh ログイン後 早速、不穏なログが出力される。

f:id:ken0-1n:20180828095350p:plain

 

立ち上げたらやること

AWS Cli のインストール

pip install awscli --upgrade --user

AWS Configure

 

リファレンスゲノムの設定。

とりあえずFASTAファイルをダウンロードする。

[centos@ip-172-31-18-26 GRCh37]$ pwd

/ephemeral/GRCh37

[centos@ip-172-31-18-26 GRCh37]$ ls -l GRCh37.fa 

-rw-rw-r-- 1 centos centos 3189752728  7月  6 03:58 GRCh37.fa

リファレンスゲノムのHashTableの作成

[centos@ip-172-31-18-26 GRCh37]$ time dragen --ht-reference GRCh37.fa --output-directory /ephemeral/GRCh37 --build-hash-table true

作成完了 13分くらいかかった

DRAGEN finished normally

 

real 13m18.982s

user 83m34.607s

sys 3m40.037s

 

 リファレンスゲノムのHashTableの作成 RNA version

[centos@ip-172-31-18-26 GRCh37_RNA]$ time dragen --ht-reference GRCh37.fa --output-directory /ephemeral/GRCh37_RNA --build-hash-table true --ht-build-rna-hashtable true

 作成完了 22分

DRAGEN finished normally

 

real 22m5.017s

user 128m6.781s

sys 6m34.592s