連載FastLabel

アルゴリズムだけでは、もはや差別化できない──AI戦争の鍵を握る“もう半分”の市場「アノテーション」。先駆者FastLabel代表上田氏が描く緻密な事業戦略に迫る

Sponsored
インタビュイー
上田 英介

九州大学理学部物理学科情報理学出身。株式会社ワークスアプリケーションズでソフトウェアエンジニアとして会計製品の開発に2年間従事。3年目にエンジニアとして初となるロサンゼルス支社へ赴任。アメリカの商習慣に合わせたAI-OCR請求書管理サービスを設計・開発。その後、イギリスのAIベンチャーでMLOpsのアーキテクチャ設計や開発を行い、大手銀行のDXプロジェクトを推進。AIの社会実装をする中で感じた原体験をもとにFastLabelを創業。

関連タグ

AIは、ここ数年で急速に社会に浸透しつつある。特に直近では、OpenAIがリリースしたオリジナルテキスト生成ツール『ChatGPT』や、画像生成モデル『DALL·E2』などが各種サービスの機能として導入され、その精度の高さは各業界に激震を与えた。

おそらくトレンドに敏感な読者の多くが『ChatGPT』を実際に手に取ってみたのではなかろうか。そして、その性能の高さに驚くとともに、既に積極的に自身の業務に活用し、効率化を成し遂げた猛者もいることだろう。

この背景には、GAFAMを中心とする外資系大手IT企業の巨額の投資と、苛烈な市場競争がある。中でも“マイクロソフトvsGoogle”という構図で繰り広げられる、大規模言語モデルの覇権争いは連日世界を興奮の渦に包み込んでいる。特に、2019年より数回にわたってOpenAIに対して最大100憶ドル規模の投資を実施してきたMicrosoftの熱量は、AI市場が持つ潜在的価値の高さを裏付けていることだろう。

しかし、ここであえて問いを投げかけたい。『ChatGPT』を上手く使いこなしたり、ビックテックの動向を注意深く観察するだけで、AIについて全てわかった気にはなってはいないか、と。

その証拠に、「アノテーション」という言葉を耳にしたことがあるだろうか。おそらく一部の専門的なAIエンジニアを除き、ほとんどの読者にとっては耳馴染みのないキーワードであろう。しかし、この「アノテーション」こそが、今後のAIの発展を、そして世界を舞台とした熾烈なAI戦争の行方を左右する“重要ファクター”であるのだ。

「まずい、知らなった!」という読者もご安心を。今日から「AI知ったかぶり」を卒業できるよう、今回、今後のAI活用の肝となる「アノテーション」を軸にした事業を、国内でどこよりも先駆けて提供するFastLabelの代表取締役CEO 上田 英介氏にインタビューを実施。

今はまだ“マニアックな知識”として扱われがちなアノテーション。しかし、事業を司るビジネスパーソンならば、知らないではいられない必要不可欠なAI開発プロセスの1つだ。今、時代に先駆けてその重要性を理解しよう。

本記事は、初歩的なAIの知識やマクロ環境の解説に始まり、「アノテーション」の理解を深め、AIを取り巻く最新トレンドをまるっと網羅的に知ることができる内容となっている。

AI業界が抱える課題、そして「アノテーション」という技術領域の可能性、とくとご覧あれ。

  • TEXT BY YUKI YADORIGI
  • PHOTO BY SHINICHIRO FUJITA
SECTION
/

わずか6年で40倍以上のマーケットに。
AI市場を取り巻くトレンドを“まるッと”理解せよ

冒頭にも紹介した通り、GAFAMを中心とする外資系大手IT企業の巨額の投資と、市場競争は苛烈さを極めつつある。

2023年2月、Microsoftが検索エンジン『Bing』とWebブラウザ『Edge』に、『ChatGPT』を搭載すると発表したことは記憶に新しいことだろう。このニュースはインターネット検索領域で不動の王者であったAlphabet(Google)に放たれた一矢として注目を集めている。

現に、『ChatGPT』が公開されたことを受け、Alphabetは「コードレッド(緊急事態)」を発動し、AI製品の開発に集中するよう指示したと言われている。

そして、何より2019年から数回にわたって『ChatGPT』を開発するOpenAIに対して最大100憶ドル規模の投資を実施してきたMicrosoftの熱量は、AI市場が持つ潜在的価値の高さを裏付けている。これらの取り組みは今後もさらに継続され、AI技術の進化の流れはもはや不可逆と言えよう。

そんな市況感を踏まえ、まずはFastLabel上田氏にAIを取り巻く環境とその可能性について尋ねてみた。

上田この30年は、皆さんもご存知の通り、まさにソフトウェアの進化が産業界に大きな変化をもたらしました。そして、今後の30年間で世界を席巻する技術は何か。その答えがAI技術である、ということは既に自明になりつつあるように思えます。

AI技術は、2012年のImageNetを使ったCNNの登場を皮切りに急速に進化し、特定の領域で人間と同等の性能を発揮するようになりました。昨年(2022年)末に公開されたOpenAIの『ChatGPT』は、これまでのAIチャットボットを凌駕する会話の質の高さから、わずか1週間で100万人のユーザーを獲得しました。Microsoftから1.3兆円の大型投資を受けたことも、AI技術への期待感がより一層高まっていることを示唆していますよね。

また、過去にはテキスト入力や音声書き起こしなどの単純作業に使われることが多かったAIですが、近年の大規模言語モデルの発展によって、知的労働の相当な部分を自動化できる可能性がでてきています。また、生成AI(Generative AI)の発展によって、クリエイティブな領域にもAIが適応され始め、アニメーションやアート作品などの作成が可能となってきていますよね。

これらAIの進展を受け、「Software Ate The World, Now AI Is Eating Software」と言われるようになり、今後の30年間であらゆるソフトウェアにAI技術が使われると考えられます。

企業は、AIを中心としたユーザー体験を設計することが、世界で勝ち残る上で必要不可欠になるでしょう。

思い返せば、2000年代初頭のITバブル期には、「ドットコム」という名前がつく企業の株価が急騰し、事業内容に関わらず投資家の注目を集めていた。同様に、「このAIブームも一過性のものではないのか?」と感じる読者も多いかもしれない。

しかし、上田氏はそんな疑問を一蹴する。

上田AIがあらゆる事業を大きく進化させていくポテンシャルは、これまでのビジネストレンドとは一線を画す大きなものです。研究と実用化のサイクルが短く、現在のAI市場の興隆へと結びついていることに加え、活用できる領域が極めて広いという特徴があります。

例えば、自動運転の実現や医療現場における検診の最適化、農業における収穫予測、ドローンとカメラを組み合わせた画像解析による現場業務の効率化など……社会課題の解決に直結する幅広い活用方法がすでにいくつも実現していますし、これから全世界に広がろうとしています。まさに社会変革です。

また、先ほども述べた通り、単純作業やルーティンワークが置き換わるだけではありません。アニメーションの作成、アート作品の創造など、クリエイティブ部分にまでAI技術はついにその裾野を広げていきます。ホワイトカラーが担う知的労働の相当な部分が自動化、リプレイスされる可能性があります。

AIの市場規模は急速に拡大しており、とある調査では2027年までにAI市場の規模が2669.2億ドルに達すると予測されています。これは2021年の市場規模(67.3億ドル)の40倍以上に相当します。

これらの事実からも、AIが一過性のトレンドではなく、実用化に向けて今後ますます注目を集める技術領域であることが明らかです。

AIのアルゴリズムは、深層学習やニューラルネットワーク、大規模言語モデルなどの技術の発展によって飛躍的に進化している。これにより、既にいくつかの領域で、人間と同等以上の精度を出せる高度な認識・推論能力を備えるに至った。

だが、AIの発展を見据えた時、上田氏は「しかし」という言葉を皮切りに、今後の発展のボトルネックとなる、とあるキーワードを投げかけた。そう、ここで登場するのがFastLabelの事業領域である「アノテーション」だ。

おそらく多くの読者がこの「アノテーション」という言葉を耳にしたことはないのではないのであろうか。それもそのはず、国内でこの「アノテーション」を軸に事業を展開するスタートアップはほとんど存在していない。

もちろん、国内でも著名な“AIスタートアップ”は存在する。しかしFastLabelの事業領域「アノテーション」はそれらのアプローチとは全く別のアプローチである。いや正確には、“AIスタートアップ”が勃興する今だからこそ、新たに生まれつつある、人類が避けて通れない“最優先事項”なのだ。

そのポテンシャルは、FastLabelが創業後わずか数年というスピードで、シリーズAラウンドにて4.6億円の資金調達を実施、そしてソニーやNTTグループをはじめとした国内最大手の企業に導入実績があることが証明している。

AIを取り巻く市況感が理解できたところで、いよいよ今後の時代を生きていく上で知らないと“まずい”「アノテーション」について、国内のアノテーション市場を第一人者として切り拓く上田氏に解説願おう。

SECTION
/

エンジニア300人に対して、アノテーション部隊は1000人?今後“アルゴリズム”よりも“アノテーション”が注目される理由とは

早速、当記事の最重要キーワードである「アノテーション」について、上田氏に訊いてみた。

上田AI開発ではDeep Learningなどのアルゴリズムに教師(正解)データを与え、学習させることで開発されます。つまり、こういった簡単な式で表すことが可能です。

AI=アルゴリズム+教師データ

アノテーションとは一言でいうと、「AIに学習させるための教師(正解)データを作成する作業」のことを指します。

例えば、「街中の写真からクルマや人をAIに検知させるサービスを作ろう」と考えたとき、“これがクルマ”、“これが人間”といったように、データ一つひとつにタグを付けて、AIに学習させる必要があるのです。

アノテーションに間違いがあれば(例えば、クルマを人間と認識させてしまうなどすると)、AIに間違ったデータを学習させることになり、期待する精度が出なかったり、意図しない振る舞いをしたりします。なので、質の高いアノテーションが、AI開発・活用において不可欠な要素です。

一般的にAI開発において、例えば画像解析だと、教師データは最低でも数万枚〜数十万枚の画像データが必要になることが多い上、運用フェーズを見据えた規模が大きいプロジェクトともなると数十万枚〜数百万枚にもなることもあります。そのため、アノテーションを数人〜数十人規模の体制で行う必要が出てきます。

アノテーションは、AI開発プロセスの最初の基点となるもので、AI開発業務全体の約8割を占めているともいわれています。

なるほど。アノテーションとは、テキスト、音声、画像、動画といったデータに対してタグをつけていく作業を指すようだ。そして、AI開発のプロセスにおいて、AIが機械学習を進めるための「教師データ」は、このアノテーションを通じて生成される。

つまり、AIの精度を高めるためには、大量かつ適切な教師データを学習させなければならないため、アノテーションはAI開発にとって必要不可欠なプロセスであり、今後ますますニーズが急増するであろう領域ということだ。

しかし、このアノテーションにも大きな課題が残っているという。

上田現状のアノテーションの抱える課題は主に二つだと考えています。

一つに、アノテーションには専門性が必要である場合が多いということ。これは意外に思われる方も多いでしょう。対象のデータにタグ付けをするだけなら、高度な専門知識を必要とせずに誰でもできる単純な作業に見えるかもしれません。

しかし、例えば、道路標識に合わせて自動車の走行可否や速度調整を判断するAIを作りたい場合に、以下のようなケースではどのようにアノテーションしたら良いでしょうか?

(上田氏のnote:「これからのAI開発はアルゴリズムよりもデータの質が鍵になる」より)

上田一番右の標識に関しては数式を解かないといけなく、極めてレアケースですが、こういうデータが混じっていたとして、そもそも教師データとして含めるのか、含めないのか。

含めるとしたらどのようにアノテーションするのが最適なのか、含めないならこのようなケースに他の手段でどうやって対応するのか、など都度エンジニアや事業ドメインの専門家による判断が必要になってきます。

なるほど、AIの精度を担保するためには、上記のようなイレギュラーなデータも含めた大量のデータをアノテーションするに際して、専門的な判断の下、統一の基準が求められるというわけだ。

そして上田氏は第二に、アノテーションに求められる専門性の高さや発生する工数に対して、既存の手法では非効率な部分が多いことが課題であると続ける。

上田第二に、アノテーションに必要な工数に対して、非常に労働集約アプローチになっていることが多いことが挙げられます。

先ほども申し上げたとおり、一般的なAI開発においては、教師データ量が数万〜数十万規模に及ぶことが多くなります。

テスラを例にとってみると、自動運転AIの開発を、エンジニア300人に対して、アノテーションチームが1,000人という体制で進めようとしていたこともありました。

テスラのように、キャッシュリッチな企業であれば、教師データを作成できる専門性の高い人員を多数抱えることが可能であるが、多くの企業がそうではない。上田氏曰く「アルゴリズム開発とアノテーションはエンジニアの中では全く違うスキルを必要とする」というのだ。

また、例えば、製造業の現場で不良品判別のAIを作ろうとしたとき、現場経験のないAIエンジニアでは良品と不良品の区別がつかないであろう。これまでのアノテーションでは、その業務に特化した専門家でなければアノテーション作業を行うことができず、それに付随する人員不足、コスト高などの問題によりAI開発が思うように進まない事態に陥ってしまっていたのだ。

現状これほどAI市場が成長し、アルゴリズムの進化に注目が集まる一方、その開発プロセスで必要不可欠で精度向上の肝になるアノテーションの認知はそれほど広まっていない。この秘めたる可能性に注目したのが、FastLabelというわけだ。

上田Deep Learningが登場したばかりの時点では、各企業はビジネスユースケース(文書分類、OCRなど)に合わせてDeep Learningのアルゴリズムを拡張、実装していく必要がありました。

しかし、様々なDeep Learningのアルゴリズムが、GitHubなどのソースコードの共有サイト上にて徐々に公開されるようになり、幅広いユースケースをカバーするようになってきました。

それにより、多くの開発現場ではアルゴリズムをゼロから開発するというよりは、公開されている最先端のアルゴリズムから適したものを選び、それを利用して開発を進めるようになりました。

一方で、先ほども申し上げた通り、アノテーションに関しては、未だにアナログに行われているのが現状です。

このように、アルゴリズムが利用しやすくなった反面、アノテーションはいまだに多くの企業でシステム基盤がなく、さらにはアノテーション専門人材が不在なため、高品質な教師データを大量に作ることができない。これが、AIの実用化をうまく進められない大きな理由です。

そこで、我々はAIが浸透する社会において、アノテーションを代替することで新たなインフラになれると見込み、AI開発の基礎となるデータの準備、作成、管理ができるプラットフォーム『FastLabel』の提供を始めました。

国内の”AIスタートアップ”のほとんどが「AI=アルゴリズム+教師データ」の考えにおける「アルゴリズム」に特化している。しかし、GitHubなどのソースコードの共有サイト上に「アルゴリズム」が共有され、その技術が広く民主化されたことにより、AI開発のうちの“半分”は効率化が進んだ。

一方で、もう“半分”の「教師データ」を作成するアノテーションはまだまだアナログ。そこに注目したのがFastLabelというわけだ。

アノテーション領域における課題と、そのポテンシャルが十分と理解できたところで、いよいよFastLabelが仕掛ける事業内容にスポットライトを当てていこう。

SECTION
/

AI後進国の日本。
アノテーションは“SaaS単体”だけでは解決できない

2020年に創業したFastLabelは、アノテーションサービスを主軸とした企業向けのソリューションを開発・提供している。AI市場拡大の裏側で膨らんでいた「データ不足」と「教師データ作成リソース不足」という課題に焦点をあて、AIのドメイン知識を有するアノテーション専門会社として事業展開を進めてきた。

そんな同社が掲げるパーパスは「AIインフラを創造し、日本を再び『世界レベル』へ」。AIの社会実装のアキレス腱となっているデータ課題を解決し、日本企業、ひいては産業全体を世界レベルへ押し上げることを目指している。

ここで「日本企業、産業を世界レベルへ」という言葉に引っかかった読者も多いのではないだろうか?そう、日本ではまだまだAIの活用が進んでおらず、世界、特に欧米諸国と比較すると遅れをとっている現状がある。

上田先ほど、世界的なマクロトレンドのお話をさせていただきましたが、このようなAI技術の急速な発展があるにも関わらず、世界の企業と比較して、いまだ日本企業、既存の産業ではAIの活用が進んでいない、またはその本来の強力なポテンシャルを発揮出来ていないのが現状です。

その理由としては、アノテーション代行のようなAIの社会実装を支援するための周辺サービスが充実していないことが原因にあると思っています。

海外ではアノテーション専門の企業が既に数多く存在していますが、日本ではいまだにエンジニアや事業会社の社員の方が自らアノテーションするのが主流です。大きく遅れているんです。アノテーションの外注もなくはないのですが、「BPO企業が作業リソースを提供しているだけ」で、肝心なデータ品質の課題が解決せず、なかなか企業のAI活用が進んでいません。

例えるなら、どんなに良いエンジンを積んでいる車でも良い燃料がないと動かないのと同じ。最先端のアルゴリズムを搭載したAIを導入したものの、結局手作業で処理をしている、そのアウトプットの精度が低いなど、非効率的な運用にとどまっているんです。

企業のAI活用におけるボトルネックは、主に開発リソースの不足やリテラシーの問題である。また、それに加えて、日本特有の権利関係や法規制、機密情報の扱いなども課題であるという。

上田企業が機械学習に必要なデータを扱う際、特に重視するのはデータの透明性です。具体的には、権利関係や法規制をクリアした質の高いデータを大量に取得し、そこから教師データを作るプロセスは、AI開発において企業がつまずきやすいポイントですね。

データをラベリングする際に、そのデータには個人情報などの機密性の高い情報が含まれることがあります。そのため、アノテーション作業を行う際には、情報漏洩やデータ改ざんなどのセキュリティ上のリスクが存在します。

例えば、医療分野で使用される病歴データなどの場合、患者の個人情報や機微情報が含まれているため、その情報が外部に漏れ出ることは許されません。また、企業の業務に関わる機密情報が含まれるデータを扱う場合にも、情報の漏洩や不正アクセスが発生すると、企業の信頼性が損なわれたり、法的な問題が生じることがあります。

さらに、アノテーションは人手によって行われることが多いため、作業者のミスや不正行為が原因でセキュリティ上の問題が発生することもあります。

上記のような日本企業が抱える課題に対して、FastLabelはどのようなアプローチを試みているのだろうか?

上田ビジネスモデルとしては、専門教育を積んだアノテーターによるアノテーション代行と、SaaS型AIデータプラットフォーム『FastLabel』の提供の両輪で回しています。

アノテーションの効率を向上させる仕組みとして、「自動アノテーション」機能を提供しています。これは、最初の100件ほどのデータを手作業で分類したあとは、残り数万件のデータをAIが自動的に学習し、振り分けていくことができるものです。

実際に企業のアノテーションにかかる費用と期間を70%削減することに成功しています。データ不足をあっという間に解消することができ、スピーディーかつ本質的なAIの開発・実装・運用が実現できます。

また、BPO的に提供されるアノテーション代行業で蓄積したデータから新しくモデルを生成し、そのモデルをアノテーションのQCDを上げるのに活かすこともあります。

やはり、精度の高いデータを集めることがアノテーションにおいては何よりも重要です。クライアントの現場から取得できるデータは最も精度が高いので、実際の案件ではお客様の生データをお借りすることが多いです。

ただし、そのデータには知的財産に触れるものや個人情報を含むものもありますから、ツールを活用して効率的にデータを加工したり、モデルを利用した新規撮影を行ったりすることもあります。

『FastLabel』では権利クリアな100万件を超えるデータを利用することも可能です。機械学習に必要な素材データとアノテーションデータをパッケージで提供しています。

このように、「実用的なAIの開発」というゴールから逆算した細かなソリューションを検討・提供できることも我々の強みですね。

アノテーションという軸にSaaSとBPOの事業を掛け合わせ、それぞれで生まれた価値が循環する極めて美しいビジネスモデルが作られている印象が持てる。一方で、「なぜSaaSビジネスだけに注力しないのか」といった声も聞こえてきそうなところ。

その背景には、前述した日本特有の課題に加え、日本企業のアノテーションに対するテック人材の不足とリテラシー不足が影響しているのだ。

上田確かに、海外の先行企業の多くはSaaSに特化しており、BPOサービスは範囲外としています。中国や米国では、市場の大きいSaaSの方から仕掛ける戦略のほうが妥当だからです。

一方、日本市場の競争優位性の鍵となるのは、BPOサービスだと私は考えています。多くの日本企業はいまだにテック人材が不足しており、かつAIリテラシーが十分でなく、そもそも多くの企業がAI開発においてAI開発プロセスの入り口であるアノテーションにつまずくことが多く、アウトソーシングしたいというニーズが明確に顕在化しているんです。

あらゆる業界・業種にAIが浸透する前に、アノテーション領域を我々が独占することによって、事業としての勝ち筋を見出しています。

AIが浸透する前にアノテーション領域を独占する──。

実に強かな戦略ではあるものの、そんなことをこのパブリックな場で公言してしまって大丈夫なものなのだろうか?競合もまだ少ないがゆえ、すぐこのマーケットに競合が押し寄せてくるのではないか?模倣されてしまうのではないか?

様々な疑問が浮かび上がる取材陣に対して、上田氏は「それでも負けない理由がある」と語彙を強めて語る。次章から、その心を問うていこう。

SECTION
/

国内のアノテーション市場を第一人者として切り拓くFastLabel。
その強かな事業戦略を詳らかに

アノテーション領域、国内市場の高まりという大きなトレンドのもとに必要不可欠なポジションを取っていく戦略は手堅い。事実、同社は国内でもまだ競合が少ないマーケットにて、クライアントから圧倒的な支持を獲得している。

一方で、今後AI開発とデータへの需要が高まれば高まるほど、同領域への新規参入も増えてくるだろう。国内の新たな競合に対しては、どのような打ち手を考えているのだろうか。

上田新規参入する企業と比較した場合、我々は資金調達とデータ量という側面において圧倒的なプレゼンスを誇っています。国内スタートアップがこれからアノテーション市場に挑戦し、これらの優位性を覆すことはまず難しいでしょう。

事実、FastLabel社は国内最大手のベンチャーキャピタルであるジャフコ グループをリード投資家とし、NTTドコモ・ベンチャーズ、Sony Innovation Fund、ジェネシア・ベンチャーズなどの国内有力VC、CVCから、シリーズAラウンドで総額4.6億円の資金調達を実施している。AI投資に積極的な、国内屈指の大手企業のCVCから支援を受けていることは、大企業の事業を大きく進化させるポテンシャルが認められている、期待が集まっている、そういう証左でもある。

また、データ量という観点では、日本最大級のストックフォト事業を運営する「ビジュアル権利の総合カンパニー」アマナイメージズとの事業連携により、100万件を超える“権利クリアなデータ”を抑えているのだ。

アノテーションにおいては、やはり教師データの元となるデータを数多く保有していることは大きなアドバンテージだ。新興企業がデータを0から蓄積していくには、多大な時間、そして資金を必要とすることは言うまでもない。その点、FastLabelは国内最大級のフォトストック会社で、権利に非常に強みを有する会社といち早く提携することで、権利クリアなデータをどこよりも早く手にしたのだ。まさに“強かさ”という言葉が適切だろう。

もちろん、国内の既存のAI企業との差別化に対しても余念はない。

上田先ほども申し上げた通り、国内のAI領域に主軸を置くスタートアップは、アノテーションではなくアルゴリズムに強みを持つ企業がほとんどです。コンサルティング的な価値提供を通じて企業のDXにアプローチする彼らの戦略は、私たちの戦略とは似て非なるものです。

海外で類似の事業を展開する企業を見ても、求められるエンジニアのスキルが別物ですから、アルゴリズムとアノテーションはそれぞれすみ分けるほうが一般的です。

こういった競合との差別化に加え、同社は処理能力の高いGPU製品を取り扱う菱洋エレクトロと連携し、企業のAI開発環境構築に対してハードウエアの観点から踏み込んだソリューション提供を始めた。

あらゆる観点からアノテーションにまつわる課題解決の糸口を提示する盤石な戦略により、急速に市場が拡大しつつあるアノテーション領域で唯一圧倒的なポジショニングを確立しているのだ。

事実、足元のトラクションは目を見張るものがある。2021年10月に正式サービスリリースし、2022年売上高は前年比475%成長となっており、他に類を見ないスピードで事業を拡大させている。

創業わずか3年足らずで、国内を代表する大企業、スタートアップ、並びに大学・研究機関まで、実に幅広い導入実績を誇っているのだ。

アノテーションを取り巻く包括的なサービスの提供を通じて、あらゆる業界を横断して多様なデータを扱うFastLabel。とはいえ、まだまだ同社が実際に世の中に与えるインパクトを計り兼ねる読者も多いだろう。次章では、高度なアノテーション技術が我々の身近な場所にもたらす影響を見ていこう。

SECTION
/

データ保有量だけでは、競合優位性にはなり得ない!?
必要なのは無機質なデータに命を吹き込む、高度なアノテーション技術

日頃よりAIに携わっていないビジネスパーソンにとって、FastLabelのアノテーションがもたらす社会的な変化はイメージしづらい。では、『FastLabel』によってデータの量と質が満たされたとき、そこにはどのような変革が起こるのだろうか。

上田とあるコンビニエンスストアにて、AIを活用して最適な揚げ物の調理法を可視化し、商品の質の向上を図ろうとした案件があります。この事例から、社会変革をイメージしやすいかもしれません。

ご存知の通り、揚げ物はメニューによって最適な揚げる時間、油の種類、油を入れ替えるタイミングが異なりますよね。

その作業の映像をカメラで撮影し、各メニューに最適な調理法の検討を自動化するというのがプロジェクトの要件でした。

まず初めに、調理中の揚げ物の画像に対してのみアノテーションを施し、コロッケやフランクフルト、唐揚げといった識別を行った場合、その精度は50〜60%程度に止まりました。

そこで、揚げる前、揚げた後といった工程ごとのアノテーションを追加すると、メニュー識別の精度は90%まで高まったんです。

このように、AIの精度を向上させるためには、ただ単に教師データの数を増やせば良いというわけではない。「どんな教師データが必要なのか」という試行錯誤を重ね、目的に合わせてそのデータの特徴を捉えることが肝となるのだ。

上田揚げ物の事例は「データの捉え方」で識別の精度を高めた事例ですが、一方で場合によっては「データを取得する手法」も工夫しなければなりません。

例えば、店舗レジの無人化のために、顧客の動きをAIで識別したいケースを考えてみましょう。誰がどの商品を手に取ったか正しく把握するためには、カメラで商品を認識する必要があるわけですが。そのカメラの画角のわずかな違いにより、AIの認識の精度が20~30%も変わってしまうんです。

こうしたケースの場合では、手作業でデータをチューニングせねばならず、やはり多大な労力を要するんです。

そして面白いことに、かといって「画質を良くすること」が必ずしも正しいとは限らないんです。

例えば、日々の食事の写真からカロリー計算を自動で行うスマホアプリを開発するといったケースですと、美しい画角で撮られた高画質な写真は、実は良い教師データにならないんです。料理を食べる人の目線そのままの、それほど画質の高くない写真のほうが、精度向上に役立つんです。

教師データの準備、そしてアノテーションには画一的なアプローチは存在しないのだ。データをどのように扱うか、そしてデータをどのように取得するのか多角的な試行錯誤を経て、初めて質の高いデータを得ることができるというわけだ。

このアノテーションの難度の高さ故に、これまで日本の企業はなかなかAI開発に踏み切れなかった。しかし、FastLabelがこれまで蓄積した独自のノウハウを活かしその複雑なプロセスを一手に担うことで、企業のAI活用を促進できるのだ。

もちろんそのインパクトは「ただ、揚げ物を上手く揚げられるようになった」「カロリー計算が正しくできるようになった」というミクロな部分に終始することはない。アノテーションの効率化により、AIの精度が向上がもたらす恩恵は計り知れない。

前述した「ホワイトカラーが担う知的労働の相当な部分が自動化、リプレイスされること」であり、さらにいえば、その先の変革まで含めた壮大な話である。想像しやすいものだけでも、自動運転車の普及、医療診断の向上、災害対策の強化、スマート農業の発展、教育のパーソナライズ......などなど(これでもほんの一例を列挙したに過ぎない)。我々の生活を支えるインフラや、基盤システム、これまでの慣習などを根幹から覆してしまうだろう。

また、少しドライに“アノテーションの市場規模”という観点でも、そのポテンシャルは凄まじい。AIという市場は間違いなく拡大していく。それでいて「AI=アルゴリズム+教師データ」のうち、「教師データ」の市場が国内ではまだまだアナログ、つまりガラ空きなのだ。

どこよりも早く市場の歪みに目をつけ、アノテーション領域に飛び込んだFastLabel。近い将来、私たちの社会をより良くしていくさまざまなAI改革の根幹には、共通してFastLabelの技術と知見が活かされているかもしれない。

ここまでで既に「お腹いっぱい」という読者もいるかもしれないが、せっかくの機会なので、これだけ革新的な事業をこのスピード感で作り上げた上田氏という起業家が、一体どのような経験を経て生まれたのかについても見ていこう。

SECTION
/

海外では既にユニコーン、
しかし日本では未だ圧倒的ブルーオーシャン

「AIの興隆を見据え、国内市場におけるアノテーション領域を取る」というすぐれた戦略には、経営者のセンスと先見性が垣間見えるところ。そんな上田氏のバックグラウンドとはいかなるものなのか。

上田大学では物理学を学んでいたため、機械学習に触れる機会がありました。その経験を踏まえつつ、ソフトウェアエンジニアとしてワークスアプリケーションズに入社したのがはじめのキャリアです。

2016年ごろ、ワークスアプリケーションズは『HUE』というERPを発表したのですが、今振り返ってみればERPというコンセプトは5年ほど早かった印象があります。当時のサービス自体はそれほど成功しませんでしたが、そこで5年先のプロダクトづくりに携われたことや、BtoB領域の面白さに触れられたことは、現在につながる経験のひとつかもしれません。

入社2年後には米ロサンゼルス支社に赴任し、米国の商習慣に合わせたAI-OCR請求書管理サービスの設計や開発に携わりました。

その後、縁あって英AIベンチャーNexus Frontier Tech Ltd.に転職することとなり、英国の大手金融機関向けに、住宅ローン審査の簡略化を図るDXソリューションの提供などを経験しました。

英AIベンチャーに勤めて1年ほど経った頃、上田氏はワークスアプリケーションズ時代の仲間であり、後の共同創業者となる鈴木氏と再会する。鈴木氏は自身の起業と事業撤退を経験し、新たな一歩を踏み出そうとしているところだったという。

上田すでに一度起業していた鈴木と、新しい事業を何か始めたい、と話す機会があり、「一緒にビジネスを探そう」と立ち上がりました。

私は元々、起業家になりたいというタイプではありません。「課題が見つかったから起業に至った」という流れです。解決できるサービスを展開している企業が、国内にはなかったんです。

そう、その「見つかった課題」こそが、アノテーションだったのだ。

上田私自身がもともとAIエンジニアでしたので、ワークスアプリケーション時代からソフトウェア開発を担当する中で、手動でデータ作成をする際に、原体験として非効率な部分に課題感を持っていました。

そしてその課題感がより明確になったのが、海外で働くようになってからです。イギリスをはじめ欧州の企業と接する中で、日本よりAI活用がずっと進んでいることを実感しました。費用対効果をどう出していくかを考えている会社が多く、そこでボトルネックになっていたのがデータ作成の煩雑さとAI精度の担保でした。

海外では、その課題に着目し、アノテーション領域でビジネス展開しているユニコーン企業がいくつもあり「日本にもこの流れが確実に来るだろう」と感じました。

そんな折に、アノテーションの苦しさを前回の起業時に再三経験した鈴木と意気投合しまして、「じゃあ、自分たちで自動化システムを作ろう!」と事業構想が決まったんです。

AIエンジニアとしてアノテーションの非効率さを身にしみて体感していた上田氏。そして、同じく、前回の起業時にアノテーションに懲り懲りしていた鈴木氏。互いが抱える課題感と時流が上手く一致したタイミングで、FastLabelが誕生したというわけだ。

SECTION
/

パーパス制定に込められた想い
「日本を再び“世界レベル”へ」

そんなFastLabelは創業3年目となる2023年1月、新たにパーパスを掲げた。「AIインフラを創造し、日本を再び『世界レベル』へ」。創業時から『AI革命のインフラになる』というミッションを掲げてきた同社が改めてパーパスを制定した背景には、きたるAI革命を迎えた社会に対し、同社がどのように貢献できるのか明確にしたいという想いがあった。

上田AI革命のインフラになる、AI開発の速度を10倍にする。こうしたミッションに向かって突き進む数年を個人的には楽しめていましたが、その結果お客様や社会に対してどんな価値を提供できるのか、私たちの存在意義は何であるかを伝えるには、言葉が不足していたと感じています。

私たちは、最終的に何をしたいのか。その問いに向き合って生まれたのが、『AIインフラを創造し、日本を再び「世界レベル」へ』というパーパスです。

ここまで再三アノテーションについてお話ししてきましたが、実は決してアノテーションそのものを目的としているわけではありません。本質的には、日本産業や企業群が、世界に通用するサービスやプロダクトを開発できるよう貢献することが、私たちのやりたいことです。

そして今後、その核となるのは間違いなくAIです。だからこそ私たちは、今後アノテーションにとどまらず、AI開発のプロセス全体をどのように設計するのか考える企業へと進化していきたいと考えています。

データをどう集めるのか、教師データをどう作るか。データをどう学習させて、システムに組み込んだあとはどのように運用・改善していくか。このような、AI開発に関わる一連の流れを支援する基盤を提供することが、当社の長期的な目標です。

同社の現メンバーは約30名。着実に成果を上げているアノテーション領域のビジネスを引き続き展開しつつも、今後は新しい価値創出にも注力していく。それぞれの役割に応じて組織は分けられるものの、双方がシームレスにつながるような体制で運営していく予定だ。では、FastLabel社が次なる進化を遂げるために必要とするのは、どのような人材なのだろうか。

上田お客様にとってのバリューがどこにあるのか、突き詰めて考えられる人に来てほしいです。そのためにお客様と仲良くなり、事業に対する理解を深め、業務の現状をしっかり把握する。さらにその積み重ねを経て、当社のソリューションによって何を解決でき、実現できるのかを整理できる人であれば、きっと活躍できるでしょう。

特に業務の性質上、コンサルティングファームなどでハンズオン型コンサルティングをしてきた方は非常に相性がいいでしょう。実際社内でも、PwCコンサルティングや日本アイ・ビー・エムの出身者が前職の経験を活かして大活躍しています。

また、上流のコンサルタント経験を通じて現場で手を動かしたいと感じた方も歓迎します。業界という観点では、私たちは多種多様な業界のお客様と向き合う必要があるため、どのような業界を経験してきた方でも、これまでの知見を活かせると思います。

在籍するメンバーからは、お客様の反応をダイレクトに感じながら、変革に対して前向きな方々と共に業界を横断して仕事できることが楽しい、という声を聞きます。私自身、新しいことに挑戦しようとする企業の支援をできる今の仕事に、やりがいを感じていますね。

これから当社にジョインする方は、AIデータ管理の基盤をつくる瞬間に立ち合うことができます。そしてAIの社会実装が進めば進むほど、私たちの展開するビジネスは必然的に伸びるということもお伝えしたいです。

AIインフラというデファクトスタンダードをゼロから創れるのは、今だけです。ぜひ私たちと共に未知なる挑戦を始めましょう。

社会を激変させるAI革命。その鍵を握るアノテーションの先駆者として、FastLabelは急成長を続けてきた。確かな勝ち筋を見出しつつ競合不在のポジションを確立してきた同社は、その勢いのまま新たなパーパスを掲げ、日本の未来を変える一歩を踏み出す。

AI革命と日本産業の再興。この両方に携わり、自らが貢献できる。またとないチャンスを拡げ、FastLabelはあなたの挑戦を待っている。

こちらの記事は2023年04月17日に公開しており、
記載されている情報が現在と異なる場合がございます。

次の記事

連載FastLabel
記事を共有する
記事をいいねする

執筆

宿木 雪樹

写真

藤田 慎一郎

おすすめの関連記事

会員登録/ログインすると
以下の機能を利用することが可能です。

新規会員登録/ログイン