現在、業界ではAIエージェントの定義は、環境を感知し、その環境に応じた行動を取ることができるインテリジェントシステムを指します。これは、センサーを通じて環境情報を取得し、処理を経てアクチュエーターを使って環境に影響を与えるものです(Stuart Russell & Peter Norvig, 2020)。私たちは、AIエージェントをLLM、RAG、メモリ、タスクプランニング、ツール使用能力を統合したアシスタントと考えています。それは単なる情報提供だけでなく、計画、タスクの分解、そして実際に実行することもできます。
AIエージェントはWeb3+AIの発展の重要な推進力となることができるか
AIエージェントはWeb3+AIの救世主になり得るか?
AIエージェントプロジェクトは、Web2の起業において人気があり成熟したタイプは主に企業向けサービスですが、Web3の分野では、エコシステム構築における重要な役割のために、モデル訓練やプラットフォーム統合型プロジェクトが主流となっています。
現在のWeb3のAIエージェントプロジェクトは数が少なく8%を占めていますが、AI分野における時価総額の割合は23%にも達しており、強力な市場競争力を示しています。技術の成熟と市場の認知度の向上に伴い、今後10億ドルを超える評価のプロジェクトがいくつか現れると予想しています。
Web3プロジェクトにとって、非AIコアのアプリケーション製品にAI技術を導入することは戦略的な優位性になる可能性があります。AIエージェントプロジェクトの統合方法は、全体のエコシステム構築とトークン経済モデルの設計に注力し、分散化とネットワーク効果を促進することに重点を置くべきです。
AIの波:プロジェクトの続出と評価の上昇の現状
ChatGPTが2022年11月に登場して以来、わずか2ヶ月で1億人以上のユーザーを惹きつけ、2024年5月にはChatGPTの月収は驚異的な2030万ドルに達しました。また、OpenAIはChatGPTのリリース後、迅速にGPT-4やGP4-4oなどのバージョンを発表しました。このような急速な動きにより、各大手テクノロジー企業はLLMなどの最前線のAIモデルアプリケーションの重要性を認識し、次々と自社のAIモデルやアプリケーションを発表しています。たとえば、Googleは大規模言語モデルPaLM2を発表し、MetaはLlama3をリリースし、中国の企業は文心一言や智谱清言などの大規模モデルを発表しました。明らかにAI分野は争奪の激しい場所となっています。
各大テクノロジー企業の競争はビジネスアプリケーションの発展を促進するだけでなく、オープンソースAI研究の調査統計から、2024年のAI IndexレポートはGitHub上のAI関連プロジェクトの数が2011年の845から2023年には約180万に急増したことを示しています。特にGPTが発表された2023年には、プロジェクト数が前年同期比で59.3%増加し、世界の開発者コミュニティのAI研究への熱意を反映しています。
AI技術への熱意は、投資市場に直接反映されています。AI投資市場は強い成長を示しており、2024年第2四半期には爆発的な成長を見せています。世界には16件の1.5億ドルを超えるAI関連の投資があり、これは第1四半期の2倍です。AIスタートアップの資金調達総額は240億ドルに急増し、前年同期比で2倍以上の成長を遂げました。その中で、マスク氏のxAIは60億ドルを調達し、評価額は240億ドルとなり、OpenAIに次いで評価額が2番目に高いAIスタートアップとなりました。
AI技術の急速な発展は、かつてない速度でテクノロジー分野の地図を再構築しています。テクノロジーの巨人たちの激しい競争から、オープンソースコミュニティプロジェクトの活発な発展、さらには資本市場によるAI概念への熱烈な追い風まで、プロジェクトは次々と生まれ、投資額は新たな高を更新し、評価もそれに伴って上昇しています。全体的に見て、AI市場は急成長の黄金時代にあり、大型言語モデルと検索強化生成技術は言語処理分野で重要な進展を遂げています。それにもかかわらず、これらのモデルは技術的な利点を実際の製品に転換する際に課題に直面しています。例えば、モデル出力の不確実性、生成された不正確な情報による幻想リスク、そしてモデルの透明性の問題などです。これらの問題は、信頼性が非常に重要なアプリケーションシーンでは特に重要です。
この背景の中で、私たちはAIエージェントの研究を始めました。なぜなら、AIエージェントは実際の問題解決と環境との相互作用の包括性を強調しているからです。この転換は、AI技術が純粋な言語モデルから、実際の問題を理解し、学び、解決することができる知能システムへと進化することを示しています。私たちはAIエージェントの発展に希望を見出しており、AI技術と実際の問題解決との間のギャップを徐々に埋めているのです。AI技術の進化は生産力の構造を絶えず再形成しており、Web3技術はデジタル経済の生産関係を再構築しています。AIの三大要素:データ、モデル、計算力が、Web3の非中央集権、トークン経済、スマートコントラクトなどの核心理念と融合するとき、私たちは一連の革新的なアプリケーションが生まれることを予見します。この可能性に満ちた交差領域において、AIエージェントは自律的にタスクを実行する能力を持ち、大規模な応用を実現するための巨大な潜在能力を示しています。
そのため、私たちはWeb3におけるAIエージェントの多様な応用を深く研究し始めました。Web3のインフラストラクチャー、ミドルウェア、アプリケーションレイヤー、データおよびモデル市場などのさまざまな次元から、最も有望なプロジェクトタイプとアプリケーションシナリオを特定し評価することを目指しています。AIとWeb3の深い統合を深く理解するためです。
! AIエージェントはWeb3+AIの命の恩人になれるか?
概念の明確化:AIエージェントの紹介と分類の概要
基本的な紹介
AIエージェントについて紹介する前に、読者がその定義とモデル自体の違いをよりよく理解できるように、実際のシーンを例に挙げてみましょう:あなたが旅行を計画していると仮定します。従来の大型言語モデルは目的地の情報や旅行の提案を提供します。検索強化生成技術は、より豊かで具体的な目的地の内容を提供できます。一方、AIエージェントはアイアンマン映画のジャービスのようなもので、ニーズを理解し、一言でフライトやホテルを自主的に検索し、予約を実行し、スケジュールに行程を追加することができます。
現在、業界ではAIエージェントの定義は、環境を感知し、その環境に応じた行動を取ることができるインテリジェントシステムを指します。これは、センサーを通じて環境情報を取得し、処理を経てアクチュエーターを使って環境に影響を与えるものです(Stuart Russell & Peter Norvig, 2020)。私たちは、AIエージェントをLLM、RAG、メモリ、タスクプランニング、ツール使用能力を統合したアシスタントと考えています。それは単なる情報提供だけでなく、計画、タスクの分解、そして実際に実行することもできます。
この定義と特性に基づいて、AIエージェントはすでに私たちの生活に溶け込んでおり、さまざまなシーンで応用されています。例えば、AlphaGo、Siri、テスラのL5レベル以上の自動運転などはすべてAIエージェントの例と見なすことができます。これらのシステムの共通の特質は、外部のユーザー入力を感知し、それに基づいて現実の環境に影響を与えることができる点です。
ChatGPTを例にとって概念を明確にするために、TransformerがAIモデルを構成する技術アーキテクチャであることを明確にする必要があります。GPTはこのアーキテクチャに基づいて発展したモデルシリーズであり、GPT-1、GPT-4、GPT-4oはそれぞれ異なる発展段階におけるモデルのバージョンを表します。ChatGPはGPTモデルに基づいて進化したAIエージェントです。
! AIエージェントはWeb3+AIの命の恩人になれるか?
カテゴリ概要
現在、AIエージェント市場は統一された分類基準を形成していません。私たちは、Web2+Web3市場における204のAIエージェントプロジェクトにラベルを付ける方法を通じて、各プロジェクトに対応する顕著なラベルに基づいて、一次分類と二次分類に分けました。その中で、一次分類は基盤インフラ、コンテンツ生成、ユーザーインタラクションの3つのカテゴリーであり、さらに実際のユースケースに基づいて細分化されています。
基盤インフラストラクチャ:このタイプは、エージェント分野の基盤となるコンテンツの構築に焦点を当てており、プラットフォーム、モデル、データ、開発ツール、および比較的成熟したベースレベルのアプリケーションのB端サービスを含みます。
インタラクティブタイプ:コンテンツ生成タイプと似ていますが、持続的な双方向のインタラクションがある点が異なります。インタラクティブエージェントは、ユーザーのニーズを受け入れ理解するだけでなく、自然言語処理(NLP)などの技術を通じてフィードバックを提供し、ユーザーとの双方向のインタラクションを実現します。
コンテンツ生成型:このタイプのプロジェクトは、ユーザーの指示に基づいてさまざまな形式のコンテンツを生成するために、大規模モデル技術を利用してコンテンツを創造することに焦点を当てています。文書生成、画像生成、動画生成、音声生成の4つのカテゴリに分かれています。
! AIエージェントはWeb3+AIの命の恩人になれるか?
Web2 AI Agentの開発状況の分析
私たちの統計によると、Web2の従来のインターネットにおけるAIエージェントの開発は、明らかなセクター集中の傾向を示しています。具体的には、約3分の2のプロジェクトがインフラストラクチャ関連に集中しており、その中でも主にB2Bサービスと開発ツールが多く見られます。この現象についてもいくつかの分析を行いました。
技術の成熟度の影響:インフラプロジェクトが主導的な地位を占めるのは、まずその技術の成熟度に起因します。これらのプロジェクトは通常、時間によって検証された技術やフレームワークの上に構築されており、開発の難易度とリスクを低減しています。AI分野における「シャベル」に相当し、AIエージェントの開発と応用に堅固な基盤を提供します。
市場の需要の推進:もう一つの重要な要因は市場の需要です。消費者市場と比較して、企業市場はAI技術に対する需要がより切実であり、特に運用効率を向上させ、コストを削減するソリューションを求めています。同時に、開発者にとって企業からのキャッシュフローは比較的安定しており、次のプロジェクトの開発に役立ちます。
アプリケーションシーンの制限:同時に、我々はコンテンツ生成型AIのB2B市場におけるアプリケーションシーンが比較的限られていることに気づきました。その出力の不安定性のため、企業は生産性を安定して向上させることができるアプリケーションを好む傾向があります。これにより、コンテンツ生成型AIのプロジェクトライブラリにおける占有率は比較的小さいです。
このトレンドは、技術の成熟度、市場の需要、そしてアプリケーションシーンの実際の考慮を反映しています。AI技術の進歩と市場の需要のさらなる明確化に伴い、この構造が調整される可能性があると予測していますが、基盤インフラは依然としてAIエージェントの発展の堅実な基盤となるでしょう。
! AIエージェントはWeb3+AIの命の恩人になれるか?
Web2のAIエージェントリーダープロジェクト分析
私たちは現在のWeb2市場におけるAIエージェントプロジェクトを深く掘り下げ、分析を行います。Character AI、Perplexity AI、Midjourneyの3つのプロジェクトを例にとります。
キャラクターAI:
製品紹介:Character.AIは、人工知能に基づく対話システムと仮想キャラクター作成ツールを提供します。このプラットフォームでは、ユーザーが仮想キャラクターを作成、トレーニングし、自然言語で対話し、特定のタスクを実行することができます。
データ分析:Character.AIの5月の訪問者数は2.77億人で、プラットフォームは350万人以上のデイリーアクティブユーザーを持ち、その大部分は18歳から34歳の間で、若いユーザー層の特徴を示しています。Character AIは資本市場で優れたパフォーマンスを示し、1.5億ドルの資金調達を完了し、評価額は10億ドルに達し、a16zが主導しました。
技術分析:Character AIは、Googleの親会社であるAlphabetと、その大規模言語モデルを非独占的に使用するライセンス契約を締結しました。これは、Character AIが独自の技術を採用していることを示しています。注目すべきは、同社の創業者であるNoam ShazeerとDaniel De Freitasが、Googleの対話型言語モデルLlamaの開発に関与していたことです。
パープレキシティAI:
製品紹介:Perplexityはインターネットから情報を取得し、詳細な回答を提供することができます。引用や参考リンクを通じて情報の信頼性と正確性を確保し、ユーザーに追加の質問やキーワード検索を教育し、導くことで、ユーザーの多様なクエリニーズに応えます。
データ分析:Perplexityの月間アクティブユーザー数は1,000万人に達し、2月にはモバイルおよびデスクトップアプリケーションのアクセス数が8.6%増加し、約5,000万人のユーザーを引き付けました。資本市場では、Perplexity AIが最近6,270万ドルの資金調達を発表し、評価額は10.4億ドルに達しました。リード投資家はダニエル・グロスで、参加者にはスタン・ドルケンミラーやNVIDIAが含まれています。
テクニカル分析:Perplexityが使用する主要なモデルは、微調整されたGPT-3.5およびオープンソースの大規模モデルを微調整した2つの大規模モデル:pplx-7b-onlineとpplx-70b-onlineです。モデルは専門的な学術研究に適しています。