Genome web というゲノム関連のニュース配信にイルミナ社とアストラゼネカがAI(人工知能)を使った創薬に乗り出すという記事がありました。AIを使って、創薬開発の取り組みを強化し新薬の市場投入にかかる時間とコストを削減したいという製薬業界全体の期待は前からあるようです。
記事には、DNA プロファイル、遺伝子転写物、およびタンパク質発現などのオミクスデータとゲノム配列情報とを用いて、AIを使ってヒト疾患特有な遺伝子バリアントを特定したいとありました。ミスセンス変異から病原性を分類するためのニューラルネットワークでは、ヒトおよび 6 種の他の霊長類の約 380,000 の一般的なバリアントのデータセットで学習のトレーニングをしているそうです。プレmRNAのバリエーションを特定するディープラーニングツールもあるようです。
どのAIの方法でも、1)学習に用いる既知のデータを取得するときの誤差があまりに違いすぎないこと、2)このようなデータを用いて学習したAIが判断すべきデータに対して下した結果を、別のモデルから論理的に検証でき、結果の説明ができることなど、AIに教え込むデータの整備、結果を判断する方法の精緻さがAIによる予測の成否を左右すると言われています。
新規のシーケンサーによるリピートなどのゲノム構造データの新規取り込みなどデータの質の変化も今後起こることも予想され、また、新規の発見もまだまだ続くであろうゲノム科学の分野で、AIを応用するときのデータの準備や学習のさせ方等の上記の課題がどうクリアされるのか、当社も考えていかなければならない課題の解決に向けた今後の展開が楽しみです。