プレスリリース
日本語に特化した大規模言語モデル--高い精度でテキストの分析・生成・要約を実現
株式会社ジーピーオンライン(本社:東京都渋谷区、代表取締役社長:豊永 豊、以下ジーピーオンライン)は、AIサービス開発事業を展開する株式会社アノテテ(本社:大阪府大阪市、代表取締役社長:岸本 渉、以下アノテテ)と共同で人間が日常使用する言語(自然言語)を処理し、抽出・分析・分類する言語モデルを独自に開発しました。
自然言語処理モデルとは
自然言語処理モデルとは、人間が日常的に使っている言葉(自然言語)をコンピュータに処理させる技術のことです。具体的には、人間の脳の神経回路を模した「ニューラルネットワーク」という機械学習アルゴリズムが使われています。人間には言葉の曖昧な表現を理解する能力が備わっているため、ニューラルネットワークを用いて人間が理解できる言葉を機械に教えてあげることで、意味のある言語処理ができるようになります。これが自然言語処理モデルの基本的な仕組みです。 ディープラーニングによる自然言語処理では、大量のデータを学習することでそのデータからある特徴量を抽出し認識精度の向上を図ります。
※この「自然言語処理モデルとは」本文はアノテテ開発の自然言語処理モデルが生成したものとなります。
独自開発モデル「Yachiyo」
アノテテは、加速度的に発展している自然言語処理分野の中でも、日本語に特化した質の高いデータのみに絞り、約650億文字を事前学習させた高度な自然言語理解AIモデル「Yachiyo」を独自開発しました。この技術を活用することでAIによるテキストの分析や生成、要約などを高い精度で実現することが可能になります。
高度なスペックを有する言語モデル
- 13億パラメータの日本語特化大規模言語モデル
- 120GB日本語テキストで事前学習
- テストセット(5GB)でのPerplexity(※1)評価結果は10.23
- プロンプトテキスト20セットでの平均PLLスコア(※2)は-1.293
- ファインチューニングにより様々なタスクを実行可能
※1 Perplexityとは予測性能を表しGPT-2を凌駕するレベルとなります。
※2 PLLスコアとは前後の単語から隠された単語を予測する性能を表し高く安定した平均スコアを出しています。
活用事例
事例1:大量の文章中から必要な情報を抽出・分析・分類
お客さまの声から寄せられるアンケートや問い合わせ内容の中から重要語句を抽出することや感情分析することも可能です。対象となるデータは営業日報やWebページなど多岐にわたります。
事例2:定型的な文章の作成・校正支援
契約書やカルテなどのある程度定型化された文章を学習・理解させることで新規文章の作成や校正作業を可能にします。また、広告文やブログ記事なども法則を学習することで自動作成可能です。
事例3:膨大なテキスト量を要する文章の要約
ニュース記事や議事録、レポートなどのテキスト量の多い文章から重要語句を抽出・再構成し要約文章を出力することが可能です。元の文章からの言い換えを出力するといった活用もできます。
デモを公開中
独自開発の自然言語処理モデル「Yachiyo」のデモを限定公開しています。また、開発者様向けにAPIの提供も可能です。
■お問い合わせ先
https://anotete.co.jp/#contact-sect
※デモの一般公開は現在行っていないため、限定公開となります。
※弊社営業時間(平日10時〜19時)以外はデモは稼働していません。
※デモは予告なく稼働を停止することがあります。
会社概要
■株式会社ジーピーオンライン
会社名:株式会社ジーピーオンライン
URL:https://www.gpol.co.jp/
代表取締役:豊永 豊
所在地:東京都渋谷区道玄坂1丁目10番5号 渋谷プレイス8F
事業内容:Webサイト総合プロデュース、Webシステム総合プロデュース、Webパッケージ商品のプロデュース、Webマーケティングコンサルティング、企業情報システムコンサルティング
■株式会社アノテテ
会社名:株式会社アノテテ
URL:https://anotete.co.jp/
代表取締役:岸本 渉
所在地:大阪府大阪市北区堂島浜2丁目2-28 堂島アクシスビル3F
事業内容:AI研究及び開発、AIを用いた各種ソリューションサービスの提供
本リリースに関してのお問い合わせ先
株式会社ジーピーオンライン
Mail : pr@gpol.co.jp
担当:広報担当
プレスリリース提供:PR TIMES