日本のAIの“今”と“未来”をキャッチアップせよ──著名なAI関連スタートアップ6社の動向

関連タグ

Chat GPTの台頭以降、生成AIへの世間の関心は高まるばかりである。この風潮に伴い、FastGrowでも直近2回に分けてスタートアップのAI関連事業を紹介してきた。(前編後編

今回は番外編。長年AIを専門としてきた著名スタートアップの“今”と“未来”をお伝えしたい。今回紹介する企業が日本の、いや世界のAIの未来を握ると言っても過言ではない。

  • TEXT BY REI ICHINOSE
SECTION
/

ChatGPT、Transformer、LLaMAなど存在する生成AI・LLMを自社用にカスタムして活用──PKSHA Technology

まずはPKSHA Technology(以下、PKSHA)。同社広報によると、「2022年11月のChatGPT公開以降、問い合わせや取材・登壇のご依頼が増え、全体的に忙しくなっている」とのこと。代表取締役の上野山氏を目にする機会も確かに多く感じられる。

同社2023年9月期第3四半期決算説明資料から引用

PKSHAはFastGrowにも過去何度も登場しているが、念のため概要に触れておこう。先述の上野山氏はAI系スタートアップを数多く輩出する東京大学松尾研究室出身で、2012年に同社を設立。自然言語処理や機械学習等を用いたアルゴリズムの研究開発と、プロダクト・ソリューション開発を同時に進めることで、人と共進化する未来のソフトウエアの社会実装を目指す。すでに東京海上ホールディングスや三菱UFJニコスなどと共同でAIを用いたサービスの実装を進めている最中だ。

そんな日本を代表するAIスタートアップとしてPKSHAは今後どんな展開を見せてくれるのか。そのヒントは、2023年2月のリリースに見つかる。

米OpenAIのGPT-3、GPT-4、ChatGPT、米GoogleのPaLM、米Meta社のLLaMAなど、大規模言語モデルは様々存在する。どんな生成AI・LLMを使用しようとも、PKSHAの持つアルゴリズムと組み合わせられる機能等を備えた『PKSHA LLMS(パークシャ エルエルエムズ)』のローンチを発表した。様々な企業と連携し、大規模言語モデルの社会実装を一層加速すべく、PKSHAの各種LLM関連技術を『PKSHA LLMS』として拡販する予定だ。

PKSHA LLMSは、いわば“オリジナルなネジ”になるという。すなわち、「クライアント企業が持つソリューションやプロダクトを、すでに存在する生成AI・LLMと的確な形で結びつけ、これまでにない提供価値を新たに生み出す」のである。

なお、生成AI・LLMを自社で新たに開発する企業も存在するなか、同社は敢えて既存のものを活用する方針だ。

すでにPKSHA LLMSによる象徴的な生成AI活用事例は生まれている。三井住友トラスト・ホールディングスと共に、LLMを活用したコンタクトセンターDXに着手した。

多くのコンタクトセンターを運用している三井住友トラストHDは最新のAI技術の進歩を受けて、顧客対応やオペレーターの効率化など全体の効率向上、そして、データ活用を推進する経営判断を行う意思を示し、PKSHAとの取り組みが始まった。

三井住友トラストHDが持つコンタクトセンターでは、日々顧客の個々人の詳細な情報が飛び交う重要な部分だ。そこにAIを深く組み込もうという決断の速さや規模感に、同社の熱意が伺える。

そもそも、事業が成長すればするほど、コンタクトセンターの稼働工数は増すというのが従来の常識だった。つまり、その機能を維持・増強させていくためには人員がカギとなる。しかし、複雑な問い合わせに対応できるほどの高度なスキルを持つ人材の採用は難しく、スキルアップのための教育にも時間がかかる。そんな「マンパワーでは限界がある課題」を解消するソリューションとして、PKSHAは次の5つの領域でのAI活用を提案し、開発していこうとしている。

  1. コール量の予測
    為替や法改正などの外部要因で増減する受電量を、AIが最大半年先まで予測。
  2. オペレーターのシフト最適化
    個の要望や特定のオペレーターへのシフトの偏りなどを考慮しAIが作成。
  3. ChatGPTを活用した滑らかな対話体験
    オペレーターが回答を的確に行うための情報検索をサポート。
  4. ChatGPTを活用した回答例の作成
    複雑な規約や個人情報が絡み合う回答も、ChatGPTがその例を作成することで効率化。
  5. 生成型音声要約を通じた受電後の事務作業の効率化
    社内報告やお客様の声(VoC)活用のための情報を整理・集約し、サービス内容の改善へ活用。

なお、3と4と5は生成AIによるものだが、ほかの2件は別のAIを活用したものとなっている。なぜなら、コンタクトセンターの生成AI活用が目的というわけではないからだ。あくまでも目的はコンタクトセンターのDXで、さらなる事業成長や企業価値向上を図ることである。目的達成のため、AIを使用するべきところ、不要であるところを確実に見極め、必要なソリューションを提供できるのがPKSHAの強みだ。この強みが遺憾なく発揮されるプロジェクトとなるだろう。

プレスリリースから引用

現在はまだ一部が開発中で、2023年中に全体の検証を進めていき、2025年中に三井住友トラストHDが保有するすべてのコールセンターに導入を完了させる予定だ。

これまでもコンタクトセンターの最適化に取り組んだ実績があるPKSHAだが、今回ほどの大規模を手掛けるのはこれが初めて。やはりAI技術の発展に伴い、より大きなソリューション提供をいち早く進めていけることこそ、PKSHAの強みと言えそうだ。掲げるビジョン「人とソフトウエアの共進化」が、コンタクトセンターという領域でどのように進んでいくのか、注目だ。

SECTION
/

「エンタープライズのAI利用」で先駆的な取り組みを続ける──エクサウィザーズ

次は、「AIを用いた社会課題解決を通じて幸せな社会を実現する」をミッションに掲げるエクサウィザーズ

同社も相次いで生成AI関連のリリースを行った。2023年4月にリリースされた『exaBase 生成AI built with GPT-4』は、Chat GPTを企業が安心して利用できる機能を備えたサービスだ。

企業がChat GPTを利用する際大きな課題となるのは、セキュリティの確保、コンプライアンスの遵守だろう。exaBaseを使えば、ユーザー企業独自のルールを反映した状態でChat GPTが使用できる。具体的には、入力したプロンプトはAIに学習されず、利用者が機密情報を入力しないよう禁止ワードの設定や誤って入力した場合も検知してデータを検索がかけられないようになる。ログインIDごとの管理やプロンプトの蓄積もできるという。

さらに、ユーザー企業の産業ごとにプロンプトのテンプレートも用意されており、exaBaseはかゆいところに手が届く日本企業向けChat GPTである。

エンタープライズ企業を多く顧客として抱え、多くの課題解決を進めてきたエクサウィザーズならではのサービスというわけだ。

もうひとつ、エンタープライズ企業が嬉しいサービスが2023年5月にリリースされた。『exaBase IRアシスタント powered by ChatGPT』だ。決算短信、説明資料、社内データなどを読み込ませると、株主総会や決算説明において想定される質問とその回答が自動生成される。当然、未開示情報も収容することが想定されており、強固なセキュリティおよびコンプライアンスを重視した環境が保証されている。

最近のFastGrowの取材で、代表取締役社長の春田氏は次のように述べた。 「これまでエンジニアばかりが企業でのAIの活用に注目してきたが、ChatGPTの台頭により、企業全体でこれを重視する風潮が強まった。」

マーケットが急激に盛り上がる今、生成AI関連のサービス開発を加速させるべく、同社は2023年10月に新たな子会社Exa Enterprise AIを設立した(プレスリリースはこちら)。代表取締役社長には常務取締役の大植氏が就任した。

同社が得意とするエンタープライズ向けの生成AIサービスを増やし、エンタープライズ企業の生産性を向上に寄与していきたいとのことだ。エクサウィザーズ代表取締役社長の春田氏と日本のAI産業を牽引してきた大植氏の対談もぜひチェックしてほしい。

SECTION
/

画像AI開発プロセスを“アノテーション”から一気通貫で支える──FastLabel

アノテーションで高効率で高品質なAI開発を支えるFastLabel。聞き慣れない方のために補足しよう、アノテーションを一言でいうと「教師データ(AIが機械学習に利用するデータ)の自動作成を行うこと」を指す。

以前FastGrowで代表取締役CEOの上田氏に取材を行った際にいただいたアノテーションの説明も掲載しておく。

AI開発ではDeep Learningなどのアルゴリズムに教師(正解)データを与え、学習させることで開発されます。つまり、こういった簡単な式で表すことが可能です。

AI=アルゴリズム+教師データ

(中略)

例えば、「街中の写真からクルマや人をAIに検知させるサービスを作ろう」と考えたとき、“これがクルマ”、“これが人間”といったように、データ一つひとつにタグを付けて、AIに学習させる必要があるのです。

アノテーションに間違いがあれば(例えば、クルマを人間と認識させてしまうなどすると)、AIに間違ったデータを学習させることになり、期待する精度が出なかったり、意図しない振る舞いをしたりします。なので、質の高いアノテーションが、AI開発・活用において不可欠な要素です。

一般的にAI開発において、例えば画像解析だと、教師データは最低でも数万枚〜数十万枚の画像データが必要になることが多い上、運用フェーズを見据えた規模が大きいプロジェクトともなると数十万枚〜数百万枚にもなることもあります。そのため、アノテーションを数人〜数十人規模の体制で行う必要が出てきます。

アノテーションは、AI開発プロセスの最初の基点となるもので、AI開発業務全体の約8割を占めているともいわれています。

──FastGrow<アルゴリズムだけでは、もはや差別化できない──AI戦争の鍵を握る“もう半分”の市場「アノテーション」。先駆者FastLabel代表上田氏が描く緻密な事業戦略に迫る>から引用

また同取材によると、AI開発全体の80%の時間がアノテーションに割かれているという。この“アノテーション”にイノベーションをもたらしたのがFastLabelというわけだ。

これらの点から、FastLabelはリリース後1年半という速さで国内最大手の企業であるソニーグループやトヨタグループを含む多くの大手企業に導入されている。

2020年の創業以来、わずかな期間でこれほどの実績を上げてきたFastLabelは、2023年1月に「AIインフラを創造し、日本を再び『世界レベル』へ」というパーパスを制定。

このパーパスで加速させたかのように、2023年3月、大規模言語モデルにより教師データ作成を自動化するとリリース。以降、相次いで教師データの公開を発表している。

以前FastGrowが行った取材で語られた、医療業界の例を紹介しよう。

梶野 一例を挙げると、医療系AIサービスにおいて注目されるスタートアップ企業、ユビー様に対し、医師と患者の会話からカルテを自動生成する新サービスの精度向上に資する会話コーパス作成支援をさせていただきました。

医療系AIは個人情報を多く含むデータを扱うため、法的な観点をクリアするハードルが高いだけでなく、現場の医療従事者の方々にアノテーションの作業をお願いすることはコスト観点から現実的ではありません。こういった業界ならではのペインに対し解決策を提示できたことは、他の医療業界の皆様への営業においても高く評価いただいている部分です。

──FastGrow<「ぶっちゃけAIスタートアップってどう?」──時代を先取りする希少なキャリアの選び方、その本音をFastLabelの現場中核メンバーに訊く>から引用

その他、様々な業界向けの教師データや、「感情音声セット」、「権利クリアな日本人画像データセット」等の販売を開始している。

さらに2023年6月には画像生成AI機能のα版をリリース。一言で言えば、「AIがこれまで学習したデータに基づき、画像を生成する機能」だ。

これにより、プラットフォーム『FastLabel』は、教師データ作成からファインチューニング(これまでの学習を踏まえ結論を出すこと)までを一気通貫して支援するソリューションとなった。

このプラットフォームはAWSなどを利用したプライベートクラウドの環境に構築することができるため、クローズドなネットワーク環境下で企業内部のデータと統合できる。そしてオープンソースのモデルと統合できるため、透明性を確保しつつ動作の仕組みを正確に把握できる。

AIによる画像生成に関して、十分な機能を有し、企業内で使用する上で欲しい機能を備えた、かゆいところにまで手の届くプラットフォームができたと言える。

AI開発に必要不可欠なアノテーション市場を押さえた独自の戦略で突き進むAIスタートアップが、FastLabelなのだ。

SECTION
/

独自のLLMを早期に開発。「AIによる新たな職種」を創出し、人類の進化を描く──AI inside

「AIで、人類の進化と人々の幸福に貢献する」をパーパスに掲げるAI inside

同社は2023年6月に140億パラメータの日本語LLMサービス「PolySphere-1(ポリスフィア-ワン)」α版の利用受付を開始した。実はこのLLM、驚くほどのスピードで開発・提供に至っている。

AI inside CEO 渡久地氏のブログ『T Notes』に詳細が記されているので紹介しよう。

米国では、イノベーションやバイアス、プライバシーに関する話題が増えていましたが、日本では「日本はどうすべきか」や「ChatGPTを活用することが日本の成功への道だ」という議論が主流、というかほぼ全てでした。これに対して私自身は、正直なところ、負け犬のような惨めな感情を抱きつつ、日本がまだGPTを生み出せていない上に、誰も米国企業に勝ちに行かない現状に悔しさを感じていました。

(中略)

しかし、ただ悔しさを感じるだけで終わるわけにはいきませんでした。個人的に開発と調査を進め、試行錯誤を重ねていました。

──T Notes(渡久地氏のブログ)<Technology & StrategyAI inside CEO 渡久地択が語る、LLM(大規模言語モデル)開発への道のり>から引用

FastGrowは同社に取材を行い、さらに詳しい話を伺うことができた。これまで培ってきた基礎技術をベースに、2023年6月には他社に先駆けて独自に日本語LLMを開発し、α版のリリースに至ったのだ。PolySphere-1は渡久地氏の、そしてAI insideの執念で作られたといえよう。

もちろん、「執念」に加え、パーパスから逆算した戦略もある。自社開発のLLMを使えば、データの加速度的な蓄積と活用が進んでいくため、目指す「グローバルNo.1のAIプラットフォーマー」という姿への近道になると読む。また、国内企業と共に生成AIを活用していくにあたっては「海外へのデータ流出」という懸念を払拭することも重要だ。こうした観点で、同社にとってはLLMの自社開発が「必然」だったわけだ。

先ほど紹介した渡久地氏のブログでの紹介によると、PolySphere-1のパラメータ数は140億。この数値はGPT-3の1/10くらいの規模だという。ただ、パラメータ数は「多ければ頭が良い」という単純なものではなく、ビジネスとして最適なパフォーマンスを発揮するための数であるべきとしている。

PolySphere-1を活用した象徴的な事例も、ここで紹介しよう。

2023年8月にクローズドβ版がリリースされた同社開発のAIエージェント『Heylix(ヘイリックス)』。目の前のタスクを機械的にこなすだけでなく、クリエイティブな試行錯誤も含めたアウトプットを創出できる自律的な“Buddy(バディ)”を生成できる。併せて、Buddy”を作成・共有する“Buddyアーキテクト”という職業を誕生させようとしている。

同社プレスリリースから引用

たとえば、Buddyアーキテクトが銀行向けに財務諸表から融資可能額を予測できるBuddyを作った場合、これをHeylixを使う銀行間でシェアすることができ、産業・業界全体で効率化や標準化が加速度的に進むという仕組みがこの社会に実装されることとなる。

Heylixの正式提供後は、Buddyをシェアし合えるマーケットプレイスを構築する予定だ。Buddyアーキテクトという存在も実際に増やしていくべく、生成AI・LLMの伴走型リスキリングプログラムのなかで育成講座を実施。今期中に1,000人以上の創出を目指すとしている。まずはAIテクノロジーとビジネスへの知見が深いコンサルティングファームやソフトウェアベンダーなどのパートナーを増やし、Buddyアーキテクトとして活躍してもらう。こうして、さまざまなBuddyをすぐに利用できる環境を整え、ユーザーをより広い範囲で増やしていく未来を描く。

参考画像:https://inside.ai/wp-content/themes/ai-inside/assets/img/about/sustainability/cycle.png

ちなみに、先行提供しているある企業の中ではすでに300ものBuddyのアイデアが生まれている。AIがついに、あらゆる業務を実際に次々と効率化する、そんな理想の状態がいよいよ目前に迫っていることが、この取り組みから強く感じられ、展開が楽しみだ。

SECTION
/

国内NO.1”日本語AI”スタートアップELYZA、独自LLMを提供

先述のPKSHAと同じく、東京大学松尾研究室が生んだAIスタートアップELYZA。2018年創業、2020年に国内最大の日本語に特化した日本語AIエンジン『ELYZA Brain』を開発した。大量の日本語文章データを学習したことで、文書作成はもちろん、東大レベルの穴埋め問題も正解できる精度を誇る。

同社はこれまで、ELYZA Brainをベースに次のサービスをリリースしてきた。2021年には長文を3行に要約する文章要約AI『ELYZA DIGEST』、2022年にはキーワードを入力するだけで文章を執筆する『ELYZA Pencil』を発表している。

これらサービスを用いてマイナビと共同研究を行った結果、求人原稿の作成業務が平均30%、時間にして毎月約600時間ほど短縮できたとリリース。

https://speakerdeck.com/elyza/elyza-5th-anniversary-suraido-20230830?slide=38

これは、「未踏の領域で、あたりまえを創る」をミッションに掲げ、言語生成AIの社会実装を推進してきた同社の大きな成果といえよう。

また、同社は自社サービスの提供のほかに、GPTシリーズを活用したDXを支援している。2023年7月のリリースによると、独自のLLM開発支援にも踏み切った。

さらに、2023年8月には同社も日本語LLM「ELYZA-japanese-Llama-2-7b」を発表。これは米・Meta社が開発したLLMである「Llama 2」に日本語による追加事前学習を行ない、完成した。同社公式noteではコードや同モデルの評価に関して詳細が記載されている。これによると、性能は「GPT-3.5 (text-davinci-003)」に匹敵するという。デモ版も触ることができるので、気になる方はトライしてみてはいかがだろうか。ちなみに、デモ版とあって、本来の性能を発揮しない点にご注意を。

SECTION
/

国内のユニコーン企業トップに君臨し続けるPreferred Networks。LLM開発で世界一速いAIスパコン実現へ

日本経済新聞の2022年12月の調査によると、Preferred Networksの企業価値は3,526億円にも上る。上場企業で言えば富士フィルム社やユニ・チャーム社に匹敵する規模だ。(2023年9月15日時点の日本経済新聞社の発表より)自動運転に関する技術開発、血液によるがんの早期発見技術開発、自宅用片付けロボットの開発など、2014年の創業以来AIを活用して様々なプロダクトを世界中で展開。同社が保有する深層学習用スパコン「MN-3」は省電力性能ランキングGreen500*において3度世界一を記録している。

これらの実績ゆえに、同社の功績は海外でも広く知られている。

機械学習と深層学習──。機械学習はコンピューターにデータを使ってルールやパターンを学ばせる方法。(写真を見て犬か猫かを判断するなど)深層学習は機械学習の一部で、特に大きなニューラルネットワークを使って複雑なタスクを学ぶ方法。(写真を見て人の顔の違いを認識するなど)AI関連で耳にすることが多いのは前者だろう。しかし、同社が特に強みを持っているのは後者である点も押さえておきたい。

「現実世界を計算可能にする。自分たちの手で革新的かつ本質的な技術を開発し、未知なる領域にチャレンジしていく。」というビジョンを掲げる同社。生成AIがかつてなく盛り上がる今、何を進めているのか。

実は、日本のユニコーン企業の代名詞とも言えるPreferred Networksもまた、LLM開発に踏み切った。CEOの西川氏は「既存のモデルを再現するのは面白くない」とし、秋までに70億〜130億ほどのパラメーター数で実証実験を開始、2024年には1,000億まで伸長させたモデルを商用化する予定だ。

また、LLM開発への取り組みが急増し、必要な半導体(GPU)が世界的に不足しているが、同社は自社で保有しているハードウェアを活用することができるそうだ。自社LLMにより、多種多様なデータを高速で学習・推論できる、世界一速いAIスパコンの実現を目指している。

このスパコンが完成したら世界にどんな影響があるのだろう。自社LLMの開発により、同社はまた一歩、未知の領域へ歩みを進めた。

AI関連スタートアップと一口に言っても、LLMの扱い、ターゲットやポジショニングは様々だ。国内のAI関連情報を知りたいならば、ここに挙げた6社の動きは押さえていきたい。ぜひ各社のリリースやFastGrowの次報をチェックしてほしい。

こちらの記事は2023年11月13日に公開しており、
記載されている情報が現在と異なる場合がございます。

記事を共有する
記事をいいねする

執筆

いちのせ れい

おすすめの関連記事

会員登録/ログインすると
以下の機能を利用することが可能です。

新規会員登録/ログイン