ブログBlog

AI inアナリティクス-NLQのBI活用
2019年12月9日
Sisense
TIPS

公開日 2019年12月9日　　最終更新日 2023年4月10日

Natural Language Query（NLQ、自然言語による照会）は最も古いAI分野のひとつですが、BIや分析と組み合わされるようになったのは最近のことです。

NLQは、時間の無いユーザーや、視覚化ツールまたはコードエディターを使用してデータをモデル化するスキルや権限を持たないユーザーにとって有効です。もし、データアクセスを「技術的なスキル」と「回答を得るための時間」の２つが必要なものとして捉えた場合、NLQは、それらを必要とせずユーザー自身で簡単に洞察を得ることができる最初の技術となります。

本記事では、このNLQに焦点をあて、AI技術を分析で活用する方法を考えていきます。

1つのNLQで2つの体験

通常、ユーザーがシステムやアプリを使用する際、2つの目的が想定されます。Spotifyを例に考えてみましょう。ユーザーは、アプリを最初に開いたとき、近所のカフェでかかっていた特定の曲を検索するかもしれません。または、Spotifyから今まで聴いたことがない革新的なイエメンのレゲエフォークの曲を聴き、驚きたいのかもしれません。

NLQなら、分析機能や探索モードを使用することで、この両方の体験を提供できます。理想としては、NLQエンジンがユーザーの意図を読み取り、最初の質問に基づいていずれかの体験を設定し、それに応じて答えを導くことです。分析を行うとき、ユーザーは特定の質問に対する答えを探しています。NLQは、「特定の質問をし、特定の回答を得る」プロセスで機能するものです。

一方、NLQによる体験の対極に、探索モードがあります。このモードを使用する時、ユーザーは探索したいものについて漠然とした考えしか持っていません。通常、このモードでは、ユーザーは一般的なトピックを検索し、中間結果を保存して、この結果からさらに色々な方向へ検索を行います。Spotifyの例に戻りましょう。たとえば、ユーザーが「フォークミュージック」などの大きなトピックから検索を始めたとします。そうすると、世界中のフォークミュージックが表示されます。ユーザーは、特定の曲を意識することなく、国、地域とドリルダウンしていき、最終的にイエメンレゲエのフォークアーティストのような特定の曲や歌手に行き着きます。このモードでは、ユーザーが特定の検索に過度な労力をかけるのを避けることができ、代わりに、NLQによるランダムな探索パスに検索を依存することになります。

NLQを起動して実行する際の課題

分析市場に参入したばかりのベンダーにとって、大きな課題の1つが過去データの欠如です。NLQ探索モードをサポートする推奨システムを作成するには、過去データが必要となります。過去データが無い場合、はじめのうちは探索モードでNLQを動かすと範囲が制限されます。

BIユーザーにとってのもう1つの課題は、そのツール固有の専門用語です。例えば、海運会社が、キャプテンクックのスラングを使用して、輸送される距離や重量、および商品の種類を表していたらどうでしょう。そもそも質問が正しく表現されていない場合、ユーザーはどのように正しい答えを得ることができるのでしょうか？このようなとき、NQLならユーザーによってカスタマイズされた辞書でも検索可能なので、特別な備えは必要ありません。

そして最後に、最も悩ませている課題は、ユーザーが基礎となるデータとデータモデルへ精通しているかということです。言い換えると、変数の名前の付け方、およびその値の粒度に精通しているかということです。最初の問題（変数の名前の付け方）を解決するには、同義語を定義すると良いでしょう。2番目の問題（値の粒度）を解決するには、複数の計算式と比較関数が役立ちます。両方の問題が解決されると、「2017年と比較して、2018年第1四半期の収入の80％を占めている顧客の数は何人ですか？」というユーザーの質問に対し、システムは「顧客」の情報を見て、「収益」（システム内の変数の名前）を計算し、2018年第1四半期と2017年第1四半期を比較することができます。

機械の意図VSユーザーの意図

もしユーザーが、2018年第1四半期と2017年全体を比較するつもりだったのに対し、NLQエンジンが誤って「2018年第1四半期の収入の80％を占めている顧客の数は2017年の第1四半期と比べてどのくらいか？」と解釈してしまった場合はどうでしょう？

ここで必要なのは、NLQによって検出された意図を編集し、ユーザーの意図に合わせる機能です。これは、NLQエンジン固有の「アクティブラーニング」機能と呼ばれ、固有表現の学習を高速で行います。

AIを最大限に活用する

NLQは、迅速な回答と使いやすさでビッグデータ分析ツールの分野で注目を集めています。NLQは、分析機能と探索モードという 2つの非常に異なる機能を使用することで、さまざまなクエリとスキルセットを提供する、多くのアナリストやビジネスユーザーにとって重要なAI技術となっています。分析でNLQを利用することに関しては、過去データに課題がありますが、一方で役立つソリューションもあります。たとえば、入力履歴を活用したテキストベースの推奨システムなどです。こうした機能を使い、AIが持つ潜在能力を分析に対して最大限に引き出す方法を考えていくのが次のステップとなります。

今日では、実験から実用されたユースケースまで、多くのアクティビティがAIで行われています。SisenseのAIグループでは、分析の準備からデータの読み込みまで、AIをBIのライフサイクルの各側面に統合できるよう、AIの未来に向けて大きく前進しています。

この投稿に記載されているすべてのデータは情報提供のみを目的としており、正確ではありません。前もってご了承ください。
本記事は、Sisense社の許諾のもと弊社独自で記事化しました。
https://www.sisense.com/blog/ai-in-analytics-the-nlq-use-case/

※ SisenseおよびSisense Hunchは、Sisense Inc の商標または登録商標です。
※“Spotify”および“Spotify”ロゴはSpotifyグループの商標です。
※ その他の会社名、製品名は各社の登録商標または商標です。
※ 記事の内容は記事公開時点での情報です。閲覧頂いた時点では異なる可能性がございます。