• トップページ
  • 特集
  • アップルの「Siri(シリ)」を支える自然言語インターフェース開発者
  • トップページ
  • 特集
  • アップルの「Siri(シリ)」を支える自然言語インターフェース開発者
The papers behind Apple’s Siri

アップルの「Siri(シリ)」を支える自然言語インターフェース開発者

ババク・ホジャット氏はアップルの音声アシスタント「Siri」を支える自然言語技術開発の第一人者として知られています。自然言語インターフェースに対する独自のアプローチによって、AIは言語全体を理解する必要なくコマンドを「聞く」ことが可能になりました。

1997年にホジャット氏は雨宮真人教授(現:名誉教授、以下同)の指導の下、自然言語インターフェース技術の重要な側面である適応型エージェント指向ソフトウェアアーキテクチャ(AAOSA)と呼ばれる画期的な論文を発表しました。この重要な研究は、ホジャット氏が九州大学の友人とともに立ち上げたスタートアップ企業Dejima社の基盤となりました。 2012年には、センティエント・インベストメント・マネジメント社と新たなベンチャーを立ち上げ、世界最大の進化型AIを活用した先駆的なプロジェクトとして世界初AIが運用するヘッジファンドを導入しました。

現在、ホジャット氏はコグニザント社でAIの研究開発に従事。気候危機に対する解決策など、地球規模の緊急課題に立ち向かうため、人工生命の可能性を探っています。コグニザント社での取り組みを通じて、世界の問題について革新的な解決策を見出すとともに、AI技術発展の貢献に努めています。

※本内容は海外広報誌CONNECT Issue 5に掲載されたものを翻訳したものです。

ホジャット氏の研究はSiriの開発にどのようにつながったのでしょうか。

アップルのSiri開発に結果的につながった「CALO」プロジェクトにおいて、Dejima社の経験が重要な役割を果たしました。CALOとは 「Cognitive Assistant that Learns and Organizes(学習して整理する認知アシスタント)」 の略で、数多くあるAI技術を一つの認知アシスタントに統合しようというプロジェクトでした。

私たちはAAOSAシステムを開発し、その第一発明者が私でした。このシステムは、音声波形から変換されたテキストを、機能やユーザーインタラクションにマッピングするものでした。このアプローチでは「エージェント」が、ラジオの音量調節、テレビのチャンネル操作、番組の再生など、特定の機能を持ちます。これらのエージェントがユーザーからの言語コマンドを「聞き取り」、どのエージェントがそのコマンドに対応できるかを判断し、最終的にユーザーの意図に沿った行動を行うというものです。

このアプローチが従来の方法と異なっていた点は、システムが言語全体を完全に理解する必要がないことでした。AAOSAシステムは、初代Siriの自然言語理解コンポーネントとして採用され、自然言語コマンドをSiriの機能に効果的にマッピングしたのです。

九州大学で印象に残っていることは何でしょうか。

九州大学で書道を練習するババク・ホジャット氏(右)

私が九州大学に来たのは1997年4月で、素晴らしい経験でした。最初の半年間は、日本語コースに在籍し、箱崎キャンパスまで自転車で通学していました。授業では日本語を教わっただけでなく、優れた先生方を通じて日本の生活や文化についても貴重な見識を得ることもできました。

日本語を学び、新しい国に慣れることは難しかったですか。

日本人は驚くほど親切で寛容であると知られていますが、初めての人にとっては、繊細な文化的サインを読むのは少し難しいかもしれません。言語は学べるものですが、文化的サインの微妙なニュアンスを理解することは時に難しく、滑稽な誤解を招くこともあります。とはいえ、私は友人たちや先生方、そして雨宮真人教授といった心強いサポートネットワークに恵まれ、私を導いてくれました。

雨宮教授との研究について詳しく教えてください。

来日前から、分散型AIの第一人者である雨宮教授とやりとりを重ねていました。まだ私が日本語を勉強中だった身であるにもかかわらず、彼は快く私を研究室に受け入れてくれました。AI技術をより多くの人が利用できるよう拡大させるという明確なビジョンを持っていた私に、雨宮教授は挑戦的で斬新な手法を試すことを後押してくれました。彼のサポートがなければ、私はもっと保守的になっていたかもしれません。私はもともと、実践型の科学者でしたが、雨宮教授が数学と証明の健全性にこだわってくださったおかげで、私の仕事の強い基盤ができました。

Siri開発に携わった後は、他にどのようなプロジェクトを開拓したのでしょうか。

Siriの後、私は自然言語処理を超えた新たな道を探りたいと強く感じるようになりました。ある同僚が提案してきた株式取引にAIを使うというアイデアに興味を持ちました。2007年から2008年にかけてジェネティック・ファイナンス社を立ち上げ、世界最大の進化型AIシステムを構築しました。世界中のインターネットカフェやゲームセンターの予備のコンピューティングリソースを活用してシミュレーションを行い、アルゴリズム論的アプローチを開発しました。

2009年には実際の資金を使った取引を開始し、後にヘッジファンドを立ち上げて成功を収めました。しかし、私たちはテクノロジー主導の企業であり続けることを決断し、センティエント・インベストメント・マネジメント社を分社化しました。もう一つの重要な別会社であるEvolv.ai社は、ウェブサイトの最適化に注力し、今日広く利用されています。

ホジャット氏にとって「総合知」はどれほど重要でしょうか。

総合知は、異なる学問分野を橋渡しし、多様な視点を活用する上で極めて重要です。私は世界経済フォーラム主催のAI科学者と神経科学者を集めたワークショップを進行役を務める機会がありました。このような小規模で学問分野の垣根を越えた交流は、非常に成果を上げており、アイデアの交換と、革新的な共同研究を生み出しています。さまざまな分野の専門知識を組み合わせることで、貴重な知見が得られ、AIの複雑さに責任を持って取り組めます。