検索
Close this search box.
検索
Subscriber Log In

AIを解明する:自然言語処理(前編)

機械学習と人工知能は、製薬とバイオテクノロジーの分野でますます使われるようになっている流行語である。 しかし、そのブラックボックスには何が隠されているのか?

AIを解明する:自然言語処理(前編)。ブログを評価する

人工知能(AI)は、私たちの生活のほとんどすべての側面に入り込んでいるようだ。 アプリケーションによって、あるいはあなたの視点によって、これは時間、資源、コストを節約する素晴らしい革新であったり、サイボーグが支配するディストピア的な未来への恐ろしい一歩であったりする。

もちろん、真実はその中間だ。 しかし、当然のことながら、AIが医療に忍び寄るにつれ、人々は慎重さを欠くようになる。 しかし、AI(この言葉は嫌いだが、それはまた別の機会に)の役割は明らかになりつつあり、ある種のAIを製薬、ヘルスケア、ライフサイエンスの世界に応用することには大きな潜在的メリットがある。

最も確立された効果的なAIツールのひとつに自然言語処理(NLP)がある。 特に医療に関連している。 これは、膨大な量のテキストを、人間が同じタスクを完了するのにかかる時間の何分の一かの時間で、コンピュータが効果的に読み取り、理解できるようにするプロセスである。 しかし、医療データの約80%が非構造化データであることを考えると、医師のカルテや臨床ノートなど、明確なユースケースがある。

このシリーズの後のブログで、いくつかの応用例について詳しく見ていくことにするが、ブラックボックスの蓋を開けて、NLPがどのように機能するのかをほんの少し共有することは有益だと思った。 Evaluateで多く使用している技術なので、多少なりとも解明したいと思っている。

NLPは、計算言語学(人間の言語をルールに基づいてモデル化すること)と、統計学、機械学習、ディープラーニングのモデルを組み合わせたものである。 事実上、テキストを理解するための解像度やズームといった要素がある。 というのも、自然言語処理における重要な課題のひとつは、テキストの意味がよく局所化されていないことが多いという事実である。

では、その決意とは何か?

  1. 語彙:単語構造の分析
  2. 構文:単語の文法的分析(名詞なのか、動詞なのか?)
  3. 意味:文の文脈における単語の意味。
  4. 談話:どの文の意味も、その周りの文に依存する
  5. 実用的:テキスト全体を見て意味を理解する

典型的なユースケースでは、レベル3(データマイニングなど)、4(ナレッジグラフの生成など)、5(ドキュメントの分類など)に焦点を当てることになる。 NLPは、保険から市場調査、ライフサイエンスまで、あらゆるトピックに関するあらゆるタイプのテキストに適用できる。 しかし、NLPテクノロジーの各インスタンスは、扱うコンテンツの種類を理解するように訓練される必要がある。 なぜですか? 人間として、法的な契約はツイッターのつぶやきや生物医学的な研究とはまったく異なる言語であることは知っている。 単語も違えば、言葉のスタイルも違う。つまり、モデルはそれぞれのケースで単語がどのように使われるのか、語彙と統計を学ぶ必要がある。 しかし、それが終われば、言語の一般的な理解を得ることができ、特定の目的(新薬名の検出など)のために、より少ないデータで微調整することができる。 単一目的のモデルは、同じベースモデルから多くのユースケース用に作成することができる。

このブログの第2部では、機械学習の主な応用例について見ていきます。私たちEvaluateがどのように機械学習を利用して、お客様に最新で正確な洞察を提供できるようにしているのかも含めて見ていきます。

Share

Related Blogs

Understand the context. Data-driven news and analysis for the pharma, biotech and medtech sectors.