본문 바로가기
ニュース

Google この新しい AI ツールは、オンラインでの検索方法を変える可能性があります

by スティーブ・サポート 2023. 11. 20.

20 年以上にわたり、Google はウェブのインデックスを作成してきました。 現在は、人間の言葉のニュアンスを理解しようとしており、より優れた検索エクスペリエンスを提供できるようになっています。インターネット検索の未来はどのように見えますか? グーグルは、友人との何気ない会話のように見えると考えている。

Google の検索エンジンは 20 年以上オンラインになっていますが、それを支える技術は常に進化しています。最近、同社は MUM と呼ばれる新しい人工知能システムを発表しました。これは Multitask Unified Model の略です。MUM は、人間の言語の機微とニュアンスを地球規模で拾うように設計されており、ユーザーが検索する情報をより簡単に見つけたり、より抽象的な質問をしたりするのに役立ちます。 

グーグルはすでにMUMを独自のタスクで使用して、人々がCOVIDワクチンを参照するさまざまな方法について詳しく学んでいますが、新しい技術はまだ検索システムの一部ではないと述べています。 現在、この機能がライブ検索でいつ展開されるかについてタイムラインが設定されていませんが、チームは MUM が完了するための他の 1 回限りのタスクの開発に積極的に取り組んでいます。 

ここでは、MUM とは何か、以前のものとどう違うのかなどについて知っておくべきことを説明します。

Google この新しい AI ツールは、オンラインでの検索方法を変える可能性があります

COVIDワクチンのネームゲームを解く

今年初めにワクチンが利用可能になったとき、Google の検索担当副社長である Pandu Nayak と同僚は、COVID ワクチンに関する情報 (どこで入手でき、どのように機能し、どこで入手できるか) を人々に提供する「体験」を設計しました。ユーザーが検索しました。この経験により、これらすべての重要で関連性のある情報がパッチワークされ、検索結果の最初のページの上部に固定されました。しかし、最初に、チームはそれをプログラムして、クエリが COVID ワクチンに関するものである場合にのみポップアップするようにする必要がありました。世界中の人々がさまざまな方法で、さまざまな名前で COVID ワクチンを参照する可能性があるため、これが問題になる可能性があります。

昨年、チームは何百時間もかけてリソースをくまなく調べ、COVID 自体のさまざまな名前をすべて特定しました。しかし、今年は MUM がありました。「MUM を使った非常に単純な実験をセットアップすることができました。数秒で、17 の異なるワクチンの 800 を超える名前を 50 の異なる言語で生成することができました」と Nayak 氏は言います。「分類、ランキング、情報抽出など、解決しなければならない言語タスクがたくさんあります。短期的には、MUM を使用してそれぞれを改善する予定です。それが新しい機能や新しい体験につながるというわけではなく、既存の機能や既存の体験がよりうまく機能するだけです。」 

Google I/O で MUM に会う

MUM について初めて耳にしたのは、春の Google I/O 開発者会議で、Google のシニア バイス プレジデントである Prabhakar Raghavan が MUM を発表したときでした。

この新しい技術は、Google が過去 10 年間にわたって改良と修正を重ねてきた機械学習ベースの検索の自然な進化です。Google は、MUM が世界の深い知識を獲得し、言語を理解して生成し、75 の言語を一度にトレーニングできると自慢しています。マルチモーダル、つまり、テキスト、画像、ビデオなどのさまざまな形式の情報を同時に理解できるかどうかをテストする内部パイロットもあります。

この複雑さはすべて、会議ブログ投稿で提示された簡単な例で説明できます。Google に「アダムズ山をハイキングして、今度は秋に富士山をハイキングしたいのですが、何を準備すればよいですか?」と尋ねたとします。これは、オンラインで情報を検索する一般的な方法ではないことをユーザーが理解しているため、今日ほとんどの人がわざわざ入力することのないタイプの検索クエリです。 

Raghavan 氏は I/O で次のように説明しています。しかし、理想的には、2 つの山を比較しようとしていることを MUM が理解し、「準備」には、その地形に合わせたフィットネス トレーニングや秋の天候に備えたハイキング ギアなどを含めることができることを理解する必要があります。質問を分析して一連のクエリに分解し、問題の各側面について学び、それを元に戻すことができます。ユーザーはクリックして、質問の各側面に関連する検索結果の詳細を確認したり、元のクエリがどのように回答されたかを説明する包括的なテキストを取得したりできます。 

このような経験は MUM のエンジニアの長期的な目標であり、その目標に到達するまでにかかる時間はまだ明らかではありません。さかのぼって、中期的には、Google のエンジニアは言葉と画像の関係を認識できるように MUM をトレーニングしており、順調に進んでいます。Nayak 氏は、シベリアン ハスキーのように、MUM に新しいテキストの画像を生成するよう依頼したところ、「非常に素晴らしい仕事をした」と述べています。 

検索の簡単な歴史

Google 検索のインデックスは、本の巻末のインデックスのようなものと考えることができます。特定の単語が出現するすべてのページを示します。インターネットを除いて、2 つの重要な違いがあります。1 つは、1 冊の本が 300 ページから 1,000 ページになる可能性があることです。これは、Web の数兆ページに比べれば控えめです。2 つ目の重要な違いは、本の巻末の索引では一度に 1 つの単語を検索するのに対し、Web では単語の組み合わせを検索することです。「この規模と組み合わせ爆発のおかげで、世界中から毎日数十億件のクエリが寄せられています」と Nayak 氏は言います。「ここで驚くべき事実は、私たちが毎日取得する検索の 15% が、これまで見たことのないものであるということです。クエリ ストリームには信じられないほどの斬新さがあります。」

目新しさの一部は、単語のスペルミスの新しい方法に起因すると Nayak 氏は付け加えます。その一部は、世界が絶えず変化しており、人々が求める新しい (そして時には非常に具体的な) ものがあるためです。 

 

考えられるすべての Web 情報を、クエリに本当に関連するものに絞り込むために、Google はアルゴリズムを使用して、最新性や場所、さまざまなページのリンク方法などの要素を使用して、最も役立つと思われるページを上位にランク付けします。互いに。「これまでのところ、最も重要な要因は言語理解に関係しています」と Nayak 氏は言います。「言語理解はまさに検索の核心です。なぜなら、クエリが何を意味するのか、ドキュメントが何を意味するのか、そしてそれら 2 つがどのように一致するのかを理解する必要があるからです。」 

もちろん、ソフトウェアは私たちのように言語を真に理解することはできません。しかし、プログラマーは、私たちが言語をどのように理解しているかを近似しようとするさまざまな戦略を立てることができます。16 年以上前、Google は類義語システムの最初のバージョンを構築しました。これは、異なる単語が異なるコンテキストで異なる意味を持つという事実を説明するものでした。したがって、ラップトップの明るさについて話している場合、「変更」は「調整」を意味します。これを理解していないと、単語の選択のバリエーションが原因で、多くの関連ページが検索結果から除外されていたでしょう。 

その後、約 10 年前に、同社はナレッジ グラフを作成しました。その背後にある考え方は、クエリまたはドキュメント内の単語は単なる文字列ではなく、世界の人、場所、または物を指す場合に何かを意味する可能性があるというものでした。「特定の文字列が何を意味するのかを理解していない場合、その単語が何を意味するのかを完全には理解していません」と Nayak 氏は説明します。人、場所、物、企業などのエンティティがデータベースに入れられ、ナレッジ グラフはそれらの間の関係をリンクします。また、有名人やランドマークなどのエンティティについて、すぐに知っておくべき事実を簡単にまとめています。 

たとえば、「マリー キュリー」を検索すると、Google のナレッジ グラフから、彼女がいつどこで生まれたか、誰と結婚したか、子供は誰であるか、どこの大学に行ったか、彼女が何のために知られているかがわかります。これは、Google が検索後に表示するページ結果のリスト以外の情報を便利に表示する方法です。

機械学習が熱くなる

約 6 年前、Google は機械学習ベースの検索の最初のバージョンをリリースしました。その後、単語が使用されている文脈を調べてその意味を理解し、文脈のどの部分に注意を払うべきかを判断できる自然言語アルゴリズムに関する深層学習コミュニティでの研究の増加に基づいて、それを改善し続けました。2019 年、Googleは検索用にBERTアーキテクチャを導入しました。そのトレーニング アルゴリズムは、事実上、一連の「空白を埋める」演習でした。一般的なフレーズを使用し、ランダムな単語をブロックして、ネットワークにそれらの単語が何であるかを予測するように依頼します。マスク言語モデルとも呼ばれます。

以前は、「薬局で誰かのために薬を手に入れることができますか」などのクエリに対して、検索者は薬局で処方箋を受け取ることに関する結果を取得していました。BERT は、それが処方箋を受け取るだけでなく、友人や家族など、他の誰かのために処方箋を受け取ることであることを理解していました。「以前は処理できなかった問題の微妙な点を検出したため、より関連性の高い結果を表示することができました」と Nayak 氏は言います。  

今後、MUM は BERT のように言語を理解できるだけでなく、言語を生成することもできます。比較すると、MUM は BERT よりもはるかに大きく、より多くの機能を備えています (Google によると、BERT は約 1,000 倍強力です)。MUM は、Google がサービスを提供するさまざまな言語のパブリック ウェブ コーパスの高品質なサブセットでトレーニングされています。検索チームは、低品質のコンテンツ、アダルト コンテンツ、露骨なコンテンツ、ヘイト スピーチを削除します。そのため、MUM が学習する言語の種類は、ある意味では良いものです (願わくば)。すべての言語を同時にトレーニングすることで、大量のデータを含む言語からデータの少ない言語まで情報を一般化でき、トレーニングに使用できるデータが少ない場合のギャップを埋めることができます。

しかし Nayak 氏は、MUM のような大規模な言語モデルには確実に課題があり、チームが解決に向けて積極的に取り組んでいることを認めています。「たとえば、偏見の問題です。これは Web コーパスから訓練されているため、Web に存在するバイアスを反映または強化するかどうかという懸念があります」と Nayak 氏は言います。コーパスの高品質のサブセットでトレーニングされているという事実は、最もひどい偏見のいくつかを排除することを Nayak は望んでいます。Google は引き続き検索品質評価者やその他の評価プロセスを使用して、結果をチェックし、問題のパターンを探します。「すべての問題が解決するわけではありませんが、大幅な軽減にはなります。」

MUM は、検索を改善するために Google が実験してきた一連の革新的な機能を基に構築されています。「今日、人々が検索を行うとき、完全に形成されたクエリが頭の中にあるわけではありません。彼らは、自分たちの生活の中で起こっていることについて、幅広い意図を持って検索するようになります」と Nayak 氏は言います。「このあいまいなニーズを Google に発行できる 1 つまたは複数のクエリに変換し、問題のさまざまな側面について学び、それをまとめる必要があります。」

オートコンプリートなどの機能は、ある程度まで検索プロセスを簡単にしようとしてきましたが、MUM は新たな可能性を開く可能性があります。「すべての検索ツールについて私が考える本当の問題は、それらがツールであるためです。完璧でなくても、役に立つかどうかです」と Nayak 氏は言います。

コメント