プレスリリース
AI開発でボトルネックになるデータの収集、アノテーションを効率的に行えるプラットフォーム「harBest」を提供している株式会社APTO(本社:東京都渋谷区、代表取締役:高品良)は、LLM(Large Language Model)開発に必要なデータセットを権利クリアな状態で2週間限定89%オフでの提供を開始いたします。
5月14日にOpenAIからGPT-4oが発表され、音声認識や画像認識を含むマルチモーダル機能の強化や、処理速度、画像解析機能の向上など多くのアップデートがあり、世間を賑わせています。
[画像1: https://prcdn.freetls.fastly.net/release_image/53927/62/53927-62-cb4e06a6cacbf7d9d02265e80adb0aef-1920x1080.jpg ]
■ LLM開発用データセット提供の背景
ChatGPTが2022年にリリースされて以来、大規模言語モデル(LLM)の開発が急速に進んでいます。これらのモデルは、人間のように言語を理解し、テキストを生成する能力を持ち、ビジネス、教育、エンターテイメントといった多岐にわたる分野での応用が期待されています。これらのモデルを効率的にトレーニングするためには、大量かつ高品質で多様なテキストデータセットが不可欠です。2024年現在、質の高いデータセットの提供は、より正確で信頼性の高いモデルを生み出すための鍵とされており、LLM開発に携わる各企業は高品質なデータセット作成に注力しています。
企業が自社でテキスト関連のAIを開発する際に直面する主な課題は、「高品質なテキストデータの不足」と「社内の制作リソースの不足」です。これらを解決するために、どのようにして「権利クリアで高品質なテキストデータセット」を確保できるかが、LLM開発の重要な要素となっています。これはテクノロジーの進化と社会的要求に応じた戦略的なアプローチが求められる分野です。
■提供するデータセットの特徴
[画像2: https://prcdn.freetls.fastly.net/release_image/53927/62/53927-62-dede6f3b2adfa4bf52e4eebca195e623-1920x1080.jpg ]
【多様性】当社のデータセットは幅広い業界、トピック、および、言語にわたり、LLMの多様性に対応します。
【権利クリアな保証】 すべてのデータは最大限に権利クリアな処理が施され、法的リスクを最小限に抑えます。
【高品質】 提供するデータは高品質で、誤りや不正確な情報を排除するための品質管理プロセスが導入されています。
【カスタマイズ可能】 開発者のニーズに合わせてデータセットをカスタマイズできます。これにより、プロジェクトの独自性を保ちながらトレーニングデータを増やすことが可能です。(別途追加料金)
LLMデータセットの内容
2週間限定 89%オフ 3000件データセット 10万円(税抜き)
(幅広い分野における質問と回答をセットにして、合計3000件分のデータセットが含まれています)
■データセットの詳細
【数量】質問・回答1往復を1件とし、3,000件
【ジャンル】1.一般2.社会3.生活4.人物5.数学6.国語7.科学8.文学9.歴史10.語学11.地理12.経済13.金融14.政治15.法律 16.テクノロジー17.健康18.教育19.レシピ20.交通
【記述方式】1.定義2.要約3.抽出4.例示5.分類6.選択7.穴埋め8.書き換え9.校正10.翻訳11.数学
【例文】(ジャンル)生活 (記述方式)計算、文章
Q. いま、職場まで電車とバスで通勤しています。3月まで電車とバスを合わせた片道料金は780円なんですけど、4月から運賃の値上がりにより片道890円となりました。月20日くらい出社するんですけど、月々どれくらい通勤費って増えそうでしょうか?
A:ご質問の内容から、4月以降、月々の通勤費がどのくらい増えそうか計算します。
3月までと4月以降の通勤片道料金差額は120円です。そのため、1日の出勤で往復240円の値上がりと言えます。
20日の出社による値上がりの総額は、これを20倍することで求められます。計算の結果は、合計4,800円です。
よって、月々4,800円ほど通勤費が増えると計算されます。
人件費やエネルギー価格が世界中で高騰する昨今ですが、公共交通機関にもその影響は大きく及んでいるようですね。
■LLMデータセットの購入およびサンプルデータの確認方法
ご購入またはお見積り、サンプルデータをご希望のお客様は、以下のURLからご確認ください。
https://data.harbest.io/ja
[画像3: https://prtimes.jp/i/53927/62/resize/6d49d0c7e0b59bee386c915395b8a696.gif ]
■カスタマイズデータセットの依頼方法
下記のURLからお問い合わせください。
https://share.hsforms.com/1dfTf60rFQruhQ1_LPKf0gA561p2
■ データセット事業について
当社はデータセット事業を行う上で、以下の三点を重要視しています。
1) プライバシーの保護: 提供するデータセットには、プライバシー保護に対して細心の注意を払っており、法的なリスクを可能な限り回避できるようにします。
2) コンサルティング: AI開発者が最適なデータセットを選択し、開発できるようにデータ使用に関する質問や疑念に対するサポートを提供します。
3) データセットマネジメント: 新たなデータ要件に合わせてデータセットを継続的に更新し、開発者が最新のデータを利用できるようにします。
■ 展望
AI技術は我々の未来において重要な役割を果たすことが期待されています。それに伴って、当社はその未来を共に築いていくためにデータ収集やアノテーション、モデル開発の面で組織の皆様をサポートして参ります。権利クリアなデータセットの提供に限らず、アナログな方法でのデータ収集やあらゆるデータ形式に対応した自動アノテーション機能の開発、また、最新のモデル開発環境を構築することで開発者コミュニティを支援し、AIの進化を促進するサポートをさせていただきます。
■ 本プロダクトに関するお問い合わせ先
https://harbest.io/contact/
【株式会社APTO 会社概要】
社名 :株式会社APTO
所在地 :〒150-0041 東京都渋谷区神南1丁目5番14号 三船ビル4階
代表者 :代表取締役社長 高品 良
設立 :2020年1月20日
事業内容 :AI開発でボトルネックになるデータ作成作業を素早く低コスト・高品質に実施できる「harBest」を提供。
企業URL :https://apto.co.jp/
サービスサイトURL :https://harbest.io/
プレスリリース提供:PR TIMES