無料プレスリリース配信なら、プレスリリースゼロ

Studio Ousia開発AIモデルSōseki、Facebook、Naver等の世界トップ企業が参戦した質問応答コンペNeurIPS EfficientQAにて準優勝

株式会社Studio Ousiaのプレスリリース2020年 12月 17日

Facebook、Naver等の世界トップ企業が参戦
NeurIPS EfficientQA コンペティションにて準優勝
———
新モデルSōsekiの質問応答精度の高さを証明
====

株式会社Studio Ousia(本社:東京都千代田区、代表取締役:渡邉安弘・山田育矢、以下当社)は、東北大学と開発した新モデルSōsekiが、機械学習に関するトップ国際会議であるConference on Neural Information Processing Systems(NeurIPS)で開催されたEfficient Open-Domain Question Answering Competition において、Systems Under 6GB Track ではFacebook社についで2位、Unrestricted TrackではMicrosoft社・Facebook社についで3位にランクインしたことを発表した。2020年12月12日のNeurIPS内のセッションで最終結果が発表され、第三者の人手による評価で回答精度62%であったことが明らかとなった。
参考:コンペティション概要 https://efficientqa.github.io/

■Efficient Open-Domain Question Answering Competition の結果
Restricted under 6GB track:当社はFacebook社に次いで2位
Unrestricted track:当社はMicrosoft社、Facebook社についで3位

■Efficient Open-Domain Question Answering Competition 概要

このコンペティションは、Googleで実際に検索された1,800問の質問に対して解答を文字列で返して正解率を競うコンペティションです。Systems under 6GBトラックは、実用的なシステムを対象としたトラックで、質問応答に用いる全てのモデルやデータを含むシステム全体のイメージサイズを6GB以内におさめる必要があります。また、システムはインターネットへのアクセスを禁止されるため、必要なデータは全て6GBのイメージ内に格納する必要があります。Unrestrictedトラックはそうした制約のないものになっています。

■日本発スタートアップが高成績を記録する意義

ディープラーニングを用いる近年の自然言語処理分野では、計算資源と保持する学習データがモデルの性能を大きく左右します。このため、GAFAMに代表される大手IT企業が有利になりやすく、資源が限られているスタートアップは台頭しにくい分野とされています。当社では創業より自然言語処理の研究開発に注力することで得られた技術とノウハウを活用し、このハンディを乗り越えて参りました。弊社が最先端技術を開発し、アジア言語を含んだ多言語への応用を迅速に行うことで、多くの言語圏のユーザや企業が最先端自然言語処理技術を早期に活用できるようになると考えます。

■今後の展開

Sōsekiは検索を行うモデル(Retriever)と解答を抽出するモデル(Reader)の2つのニューラルネットワークのモデルで構成されており、質問に対して解答を含みそうなWikipediaのパッセージを検索し、そのパッセージから該当する解答を高精度に抜き出すシステムです。
今後、弊社ではSōsekiの技術をマニュアルや社内の文書等に適用し新プロダクトとしてリリースする予定です。

本製品に関する問い合わせは https://soseki.ai/ または  info@ousia.jp  まで。

【 株式会社Studio Ousia会社概要 】
Studio Ousiaはディープラーニングを用いた賢い言葉のAIの開発を行っています。複数の国際コンペティションで優勝した世界最先端のAIが、企業のビジネスを加速します。
社名 : 株式会社Studio Ousia
所在地 : 東京都千代田区大手町1丁目6番1号大手町ビル4階 FINOLAB内
代表 : 代表取締役 渡邉安弘 山田育矢
設立 : 2007年2月5日
URL : https://www.ousia.jp/ja/

リリース概要: https://www.ousia.jp/ja/page/ja/2020/12/16/neurips/

ジャンル
調査・研究結果
業界
IT・通信[エンタープライズ]
掲載日
2020年 12月 17日
タグ
AI 自然言語処理技術 GAFA

月別掲載数

お知らせ