クライアントは創薬、臨床試験、ゲノム研究を専門に行う、米国バイオ製薬業界のリーディングカンパニーです。同社の使命は、ヘルスケアを改善し、革新的な医薬品とソリューションを提供することです。複雑な健康上の課題に取り組み、生活の質を大幅に高めることを業務としています。慢性疾患や複雑な疾患の治療薬の開発、製造、商品化に尽力しています。
課題
同社はAmazonクラウドサーバー上のサプライチェーン、品質データ、在庫、製造実行システム(MES)、CSデータ、購買データ、製造データ、研究データ処理インフラに関する課題に直面していました。Apache HadoopとApache Sparkを介したデータワークフローにAmazonインスタンスを活用していましたが、データ量の増大と処理の複雑化により、スケーラビリティ、パフォーマンス、コストの課題が生じていました。

- スケーラビリティの問題 - 既存のクラウドサーバー設定では、増加するゲノム、臨床試験、研究データの処理に苦戦し、パフォーマンスのボトルネックにつながっていた
- 高い運用コスト - 大規模なデータセットを処理するためのクラウドインスタンスの維持とスケーリングに、多くの運用コストがかかっていた
- 複雑な管理 - クラウドサーバー・インスタンスの管理と設定には多大な労力と技術的専門知識が必要であり、中核となる研究活動からのリソースの転用につながっていた
- データ処理の遅延 - 大規模データセットの処理に多くの時間を要し、臨床試験、ゲノム、創薬、サプライチェーン、品質、在庫、MES、CSデータ、購買、製造、研究プロセスの分析に影響した
目的
Amazonのクラウドサーバーでクライアントのデータ処理インフラを強化するには、増大するデータ量に対応するスケーラビリティの向上を図り、クラウドインスタンスの維持とスケーリングに伴う運用コストを削減し、クラウドサーバー・インスタンスの管理を簡素化して、データ処理の遅延を低減する必要がありました。その目的は、さまざまな種類のデータの分析を最適化し、中核となる研究活動の効率を高めることでした。


ソリューション/解決策
このソリューションは、さまざまなデータタイプのデータ処理インフラをAmazon EC2からAmazon EMRに移行するうえで役立ちました。ソリューションの目的は、Amazon EMRのスケーラビリティと費用対効果を生かして、クライアントの問題を解決することでした。これにより、創薬、臨床試験、ゲノム研究などの主要なビジネス機能の最適化を実現できました。
評価とプランニング
- ゲノム研究、臨床試験、創薬に特化した現在のEC2ベースのインフラとデータ処理ワークフローの徹底的な評価を実施
- ライフサイエンス分野におけるクライアントのデータ処理のニーズに特化した要件と制約を特定

環境のセットアップ
- ゲノミクス、臨床データ分析、バイオインフォマティクスにおけるクライアントのデータ処理要件に合わせたAmazon EMRクラスタを構成
- AWS Direct ConnectとAmazon VPCを使用して、クライアントのデータソースとEMR環境間のセキュアな接続を確立し、HIPAA(医療保険の携行性と責任に関する法律)やGDPR(一般データ保護規則)などの業界規制のコンプライアンスを徹底
データ移行
- 既存のデータセットをAmazon EC2からAmazon S3に移行し、Amazon EMRでの効率的なデータ処理を実現
- 継続的な臨床試験や研究活動において重要となる、移行中のデータの完全性とダウンタイムの最小化を徹底
最適化とテスト
- EMRクラスタ構成を最適化し、大規模ゲノムデータの処理と臨床試験分析におけるパフォーマンスとコスト効率を最大化
- 新しいセットアップのパフォーマンスと信頼性を検証する厳格なテストを実施し、研究プロトコルの正確性とコンプライアンスを確保
導入とモニタリング
- Amazon EMRにデータ処理ワークフローを導入し、ゲノムデータ、臨床試験結果、創薬データセットの合理的な分析を実現
- Amazon CloudWatchを使用してモニタリングとアラートメカニズムを実装し、円滑な運用と迅速な問題解決を徹底(これは研究の完全性とコンプライアンスの維持に不可欠)
インパクト/成果
Amazon EMRへの移行により、クライアントのデータ処理インフラが大幅に改善しました。この変革による成果は以下のとおりです。

- スケーラビリティの向上 - ゲノミクスや臨床試験において、より大規模なデータセットや処理要求の増加に対応できるよう、処理能力の拡張が可能に
- コスト削減 - Amazon EMRへの移行により、EMRの費用対効果の高い価格モデルを活用して運用コストを大幅に削減
- パフォーマンスの向上 - データ処理時間が大幅に短縮され、創薬や臨床試験において、より迅速なインサイトと意思決定が可能に
- 管理の簡素化 - Amazon EMRのマネージドサービスを利用することで、複雑さと運用コストが軽減され、研究者は中核となる科学的活動に専念
- 将来性を見据えたインフラ - 堅牢でスケーラブルなインフラにより、クライアントは将来の成長とデータ処理要件の進化に対応できるようになり、ライフサイエンス分野における継続的なイノベーションが可能に
- 作業時間の短縮 - クラスタ管理に費やす時間が、1週間あたり10時間からわずか2時間になり、80%の削減を実現
- プロセスの高速化 - ジョブの実行時間が8時間から3時間へと62.5%短縮され、データ処理の高速化を促進
- サイクルタイムの短縮 - ジョブ1件あたりのコストを$500から$200へと60%削減でき、全体的な運用コストの削減と効率性の向上にも貢献
- 信頼性の向上 - エラー率が5%から1%に減少し、エラー解決にかかる時間が大幅に短縮されたため、全体的な生産性と信頼性が向上
使用したAWSサービス
- Amazon EMR
- Amazon EC2
- Amazon EBS
- Amazon Machine Image
- AWS Identity and Access Management
- Amazon VPC
- Amazon S3