• トップ
  • リリース
  • 東大発AIスタートアップLightblue、国内公開モデル最大規模の日本語LLMを一般公開

プレスリリース

  • 記事画像1
  • 記事画像2

株式会社Lightblue Technology

東大発AIスタートアップLightblue、国内公開モデル最大規模の日本語LLMを一般公開

(PR TIMES) 2023年07月19日(水)17時45分配信 PR TIMES

セキュリティと透明性に優れたLLMモデルのオープンソース化で、AI活用の幅を拡大

AIの民主化を目指すスタートアップLightblue(代表取締役:園田亜斗夢、本社:東京都千代田区、以下「Lightblue」)は、生成AI・LLM(Large Language Model/大規模言語モデル)の新たな可能性を切り開くため、研究開発チーム「LLab(エルラボ)」を設立し、公開モデルとしては国内最大規模の67億パラメータの日本語LLMを開発、およびオープンソースで公開したことを発表いたします。このモデルの最大の特長は、透明性とセキュリティです。
[画像1: https://prtimes.jp/i/38247/47/resize/d38247-47-e55a23abdb287ca906c6-0.png ]

Lightblueは、最先端AIの最速実装を通じて、AIが安全に民主化された世界の実現を目指しています。
2018年にOpenAI社が発表したGPTは、自己教師あり学習とTransformer構造を利用して文章生成に革新的な進歩を与え、続いて進化したChatGPTは、ユーザーの対話指示と人間の評価を反映した強化学習により構築され、現在広く普及するに至っています。 このように主要LLMは英語モデルが主となっている一方で、日本語に特化したLLMは国内大手ベンダーを中心に開発が進められています。しかし具体的な学習方法が不透明であったり、クラウド運用前提など、セキュリティ面での懸念も多く、特に企業における実運用には課題がある状況が続いていました。Lightblueはこの度、実用における利活用の幅を広げるべく、国内で公開されているモデルとしては最大規模となる67億パラメータを有するLLMを、オープンソースで公開いたします。

Lightblueの70億規模パラメータ汎用GPT言語モデル(Hugging Faceリンク):
https://huggingface.co/lightblue/japanese-mpt-7b


提供背景
AIの利用は広がりつつあるものの、ビジネスシーンでの活用はまだ途上です。通常の言語モデルはごく一般的な質問にしか対応できないため、我々は主として法人向けに独自LLMを提供していきます。各社の専門用語や特殊ケースに対応可能なだけでなく、セキュリティ対策や透明性を担保することによって、企業内の業務効率化を全面的にサポートします。

【LLM活用の3パターン】 企業でのLLM活用には大きく分けて以下の3種類があります。
 1. プロンプトエンジニアリング
 2. Vector store
 3. ファインチューニング
LLMを活用した業務効率化の例は多く公開されていますが、デモを超えたプロダクション環境まで実装されている例は限定的です。

【独自開発のメリット】
 1. 各法人や各部署の特定ニーズへの対応
 2. セキュリティ
 3. 透明性
LLM導入にあたり、以上3つの独自開発メリットを十分に発揮できるよう、Lightblueは以下のようなソリューションを提供します。

・各法人や各部署の特定ニーズへの対応:
LightblueはLLM導入にあたって、業界用語や部署特有の専門用語、あるいは慣習などに合わせてLLMの調整・訓練を行います。例えばIT関連の部署では、LLMはコーディング用語や最新の技術トレンドなどの専門用語を理解するために訓練されます。これにより、LLMはソフトウェア開発の文書化、バグレポートの分析、テクニカルサポートの提供など、特定のタスクに特化した支援を提供することが可能となります。
・セキュリティ:
LightblueのLLMはオンプレミス環境で利用可能な構成を備えており、ユーザー個別のニーズ・環境に応じた安全な専用環境を提供します。また、パブリッククラウドとの連携も強化し、情報漏洩リスクへの対策を強化します。
・透明性:
学習データや学習方法がわかっているモデルを用いることで、生成AI・LLMの運用に関する透明性を担保します。 さらに、Lightblueでは学習済みモデルやAPIの評価ができる監査機能を提供します。具体的には、モデル全体の重みの分布の比較、生成結果の精度評価、生成結果と学習データの関係の評価などについて、より深い理解と信頼の獲得を可能にします。 これは、医療情報や歴史事実などの情報精度、生成結果が誹謗中傷を発しないかなど、社内のLLM活用における情報監査に利用可能な重要な技術です。

【独自開発が有効な現場】
 1. 専門性が高い現場:
  建設、製薬など、業界・法人ごとの専門用語が多い
 2. 情報セキュリティレベルが高い現場:
  金融、医療など、高レベルのデータ侵害対策が必要
 3. インターネットにアクセスしづらい現場:
  工場や建設現場など、通信環境の整備が難しい

Lightblueの生成AI特化開発チーム「LLab」では、こうした活用を目指す現場において真に実用的なLLM実装をサポートします。 「LLab」では、オンプレミスで個社に合わせた独自モデルを提供することはもちろん、DXコンサルティングおよび受託開発で培ったノウハウをフル活用し、各社・各部署・現場ごとの業務理解を基盤としたカスタマイズを実施します。 また、公開モデルを用いた自社サービスの提供も予定しています。
Lightblueは生成AIの実装による社会課題の解決を加速させ、AIの民主化を具現化していきます。

[画像2: https://prtimes.jp/i/38247/47/resize/d38247-47-b4db01855380f2fa68c4-1.png ]


生成AI実装チーム「LLab」がLLMのサービス化と提供を進めることで、生成AIの大胆な社会実装が一層加速します。企業はAIの力を借りてビジネス変革を容易に実現でき、新たなAI活用の時代を切り開くことが可能となります。「LLab」の取り組みは、AIの民主化を具現化し、社会課題の解決に大いに貢献します。

「LLab」および本モデルを用いた企業内でのAI活用推進に興味のある方は、以下のリンクからお問い合わせください。
http://lightblue-tech.hubspotpagebuilder.com/lightblue-llab

【Lightblueについて】
株式会社Lightblueは、AIの民主化を目指すスタートアップ企業です。生成AI・LLMの研究開発に特化したチーム「LLab」を設立し、安全性と透明性を重視したAIモデルの開発に取り組んでいます。AI技術の活用範囲を広げ、社会にポジティブな変革をもたらすことを目指しています。

※文中の社名、商品名などは各社の商標または登録商標である場合があります。



プレスリリース提供:PR TIMES

このページの先頭へ戻る