AI セクター: 最近のテクノロジーのハイライトと投資機会

出典: 36Kr 神翻訳局

画像ソース: Unbounded AI によって生成‌

編集後記:人工知能技術は急速に発展しており、人工知能分野では多くのスタートアップ企業が目覚ましいものとなっています。この記事では、Sequoia Capital や Kleiner Perkins Caufield & Byers などの投資家によってどの有望な AI スタートアップが選ばれたかを見てみましょう。この記事は編集したものであり、あなたにインスピレーションを与えることができれば幸いです。

ほんの数分しか時間がない場合は、投資家、経営者、創業者が知っておくべき、人工知能に関する最もエキサイティングなスタートアップをここでご紹介します。

  • 人間の健康を改善します。新興企業は人工知能テクノロジーを利用して医療成果を改善し、新しい治療法を設計しています。たとえば、Alife 社は人工知能を使用して体外受精治療を改善し、患者に妊娠の可能性を高めています。時間が経つにつれて、同社のアプローチは業界のコスト構造を根本的に変える可能性がある。 NewLimit も、AI テクノロジーを活用したヘルスケア スタートアップです。同社のチームは、これまで治療が困難だった頑固な病気を治療するためのより良い方法を模索している。
  • 人工知能を企業に役立てましょう。生成 AI の製品のほとんどは消費者向けです。一般のインターネット ユーザーは、複雑なモデルで遊んだり、テキストや画像を作成したりできるようになりました。いくつかの有望な企業は、企業のニーズに直接対応し、企業のガイドラインに従って内部データを組み込んだ製品を構築しています。 Glean、Lamini、Dust、Lance はこの傾向の代表格です。
  • AIを使用してAIを制限します。 AI 革命は多くの新たな機会をもたらすかもしれませんが、同時に多くの脅威ももたらします。特に、生成 AI により本物のような文章メッセージの作成が容易になり、受信者から個人情報を取得することを目的とした「スピア フィッシング」詐欺の数と巧妙さが増加しています。 Abnormal Security のような企業は、人工知能を使用して悪意のある AI メッセージを検出し、そのような攻撃を防ぐことができます。 ※AIスタートアップは世界中に広がっています。米国には OpenAI や Google などの業界の巨人が数多くありますが、有望なスタートアップ企業が世界中で台頭しています。 Mistral はパリ本社でオープンソースの大規模言語モデルを構築しており、創設者の 1 人は OpenAI に匹敵すると信じています。ドイツの会社 Sereact も優れた人工知能ロボット製品を開発し、産業大手と契約を締結しました。

人工知能は、今年のテクノロジーの物語の中心です。前回の「AI で注目すべきこと」シリーズ以来、この分野は資本、人材、注目を集め続けています。もちろん、すべての注目がポジティブなわけではありません。この技術の機能に対する広範な興奮にもかかわらず、過去 4 か月にわたって業界の重鎮が懸念を表明し、規制当局はいくつかの安全策を考案し始めました。今後数カ月、数年で、人工知能は私たちの生活に大きな影響を与え、世界中で新たな勝者と敗者を生み出すことになるでしょう。

私たちの「What to Watch」シリーズは、読者がこれからの時代に備え、未来をより明確に想像できるように設計されています。これは、人工知能の最前線で出現しているテクノロジーを理解し、起こっている変化を活用したいと考えている人にとって、優れた出発点となります。これを行うために、私たちは人工知能の分野で最も印象的な投資家や創設者を招待し、彼らが最も有望だと考えるスタートアップを紹介してもらいました。

1. アライフ

人工知能を使用して体外受精技術を向上させる

どのような生殖プロセスにおいても人間の意思決定が必要となる瞬間があり、体外受精に最も関連する 2 つのリンクは「卵巣刺激」と「胚の選択」です。

「卵巣刺激」とは、卵巣内の卵胞の成長を刺激するために患者が受ける薬剤の用量と、卵胞を刺激して卵子を放出するためのトリガー注射をいつ行うかを決定することを指します。トリガーショットのタイミングは非常に重要で、早すぎると未熟な卵が得られる可能性があり、遅すぎると成熟しすぎた卵が得られるか、可能な限り多くの卵が得られない可能性があります。

「胚の選択」とは、どの受精卵を使用して移植するかを選択することを指します。現在、臨床医や発生学者は、ほとんどの医療専門家と同様に、自身の経験とトレーニング、形態学的等級付けシステム、試行錯誤の組み合わせに基づいて決定を下しています。あるサイクルで用量やタイミングが正しくない場合は、次のサイクルで調整します。これには医師の非常に高い専門的能力が要求されますが、現時点では医師の技術レベルはさまざまであり、医師の技術は結果にとって非常に重要です。供給が厳しく制限されている市場である生殖医療の場合、特に最適な結果を得たい場合には、高額な値札がかかることを意味します。

Alife は、体外受精 (IVF) の結果を改善するための人工知能ツールを構築しています。同社は人工知能ツールを使用して、膨大な入力と結果のデータセットを活用することで意思決定の精度を高める「スーパーパワー」を実務者に提供しています。現在、医師はシンプルなインターフェースを介して患者の特徴を入力し、過去数千回の周期の結果に基づいて妊孕性の過程の重要な瞬間に正確な推奨事項を受け取ることができます。これらのデータセットは、既存の膨大な患者情報から得られており、各患者が Alife 製品を使用するにつれて改善されます。

これらのツールは不妊治療業界の性質を変えるでしょう。 Alife の研究によると、同社の機械学習モデルは医師がトリガータイミングの 50% を最適化し、平均して成熟卵 3 個、受精卵 2 個、胚を 1 個多く回収するのに役立つことが示されています。 Alife の製品は、不妊治療へのアクセスを大幅に広げ、必要な薬剤の投与量を減らし、体外受精サイクルの成功率を高めることで患者あたりのコストを削減します。また、医師の競争の場が平等になり、直接の経験が不足している医師がより幅広い知識や情報にアクセスできるようになります。

最終的には、Alife のツールがプロセスにおける判断の瞬間にすべての情報を提供し、医師以外の開業医が操作できるようになり、業界のコスト構造と可用性が大幅に変化することが想像できます。さらに、個人の判断を個別の推奨事項で強化する (または最終的には置き換える) データ駆動型の精密医療は、体外受精の世界に特有のものではありません。医療全体ではこのような瞬間が何千もあり、データを使用して結果を劇的に変え、重要な手順や治療へのアクセスを得る機会があります。

—Rebecca Kaden、ゼネラルパートナー、Union Square Ventures

2. 落ち穂拾い

エンタープライズ検索

職場では、必要なときに必要な情報をすばやく簡単に見つけることができる必要があります。誰もが仕事を遂行するために多くのアプリケーションを使用し、その結果、大量のデータやドキュメントが生成されるため、これが常に当てはまるわけではありません。 「知識」が飛躍的に増大し、仕事の性質がますます分散するにつれて、既存の知識を見つけるのにますます時間がかかります。つまり、仕事中に「ネタ探し」をするのはなかなか難しいのです。

雇用主がこの問題を解決できるよう支援するために、Arvind Jain と彼のチームは、AI を活用した統合職場検索プラットフォームである Glean を構築しました。これにより、従業員は直感的な作業アシスタントを利用して、必要なものを正確に見つけ、知るべきことを積極的に発見できるようになります。

同社の使命は当初からシンプルで、人々がイライラや時間の無駄を減らし、職場でのすべての質問に対する答えをより早く見つけられるようにすることです。しかし、同社の業績はその後、検索をはるかに超えて拡大しました。たとえば、Glean は職場のすべてのアプリケーションとナレッジ ベース (Slack、Teams、Google Drive、Figma、Dropbox、Coda など) を検索するだけでなく、人々の役割や社内/社外の人間関係に基づいて自然言語とコンテキストを理解してユーザーをパーソナライズします。相互作用。会社で最も人気のある検証済みの情報をインテリジェントに表示し、チームが知っていることを発見し、一貫性を保つのに役立ちます。すべて許可された方法で行われます。

組織の分散化が進み、知識の断片化が進むにつれ、Glean のような直観的な作業アシスタントは、あれば便利なものではなく、従業員の生産性を向上させるための重要なツールとなっています。会社の成長は進歩を妨げる障壁を打ち破り、より前向きで生産的な仕事体験を生み出すでしょう。

さらに、Glean の検索テクノロジーにより、企業の厳格な許可とデータ管理要件を遵守しながら、職場に生成 AI を導入することができます。現在、企業が AI アプリケーションを本番環境に導入することを妨げる主な障害の 1 つは、適切なガバナンス制御を実装できないことです。 Glean は、企業のオンプレミス環境にリアルタイムのデータ権限を挿入することにより、企業がガバナンスの問題を大規模に解決できるように支援し、企業が自信を持ってモデルのトレーニングと推論に内部データを活用できるようにする理想的なソリューションとなりました。 AIデータプラットフォーム/ベクトルストレージの役割。

時間の経過とともに、すべての企業がビジネスと従業員の微妙な違いを理解する独自のバージョンの AI を所有するようになるだろうと私たちは考えています。私たちは、Glean がこの機会を捉えていると信じています。 —Josh Coyne、Kleiner Perkins パートナー

##3.ランス

マルチモーダル データの保存と管理

私たちは皆、Midjourney をプレイしたことがあり、ほとんどの人が GPT-4 のデモを見たことがあるでしょう。 Midjourney (テキストから画像へ) と GPT-4 (画像からテキスト/コードへ) は、モデルがマルチモーダルになり、テキスト、画像、オーディオなどのさまざまな形式のメディア間を橋渡しする可能性を示しています。現在の AI ブームの多くはテキストベースのモデルを中心に展開していますが、マルチモーダル モデルは世界のより正確な表現を構築するための鍵となります。

ロボティクス、ヘルスケア、製造、エンターテイメント、広告などの業界で AI アプリケーションの次の波に乗り出すにつれ、ますます多くの企業がマルチモーダル モデルに基づいて構築することになります。 Runway や Flair.ai などの企業は、自社製品に対するユーザーの需要が大きく、その分野で新たなリーダーとなっている好例ですが、Google などの既存企業も同様のマルチモーダル機能をリリースし始めています。

ただし、マルチモーダル モデルを使用すると、データをどのように保存して管理するかという課題が生じます。 Parquet などの従来のストレージ形式は非構造化データ用に最適化されていないため、大規模な言語モデル チームはデータの読み込み、分析、評価、デバッグ時にパフォーマンスの低下を経験します。さらに、大規模な言語モデルのワークフローでは、信頼できる唯一の情報源が欠如しているため、微妙なエラーが発生しやすくなります。 Lance は、この課題に取り組むために登場した最新の企業です。 Midjourney や WeRide などの企業は、ペタバイト規模のデータ セットを Lance 形式に変換しています。これにより、Parquet や TFRecords などの従来の形式と比較して、パフォーマンスが大幅に向上し、ストレージの追加コストが大幅に削減されます。

Lance はストレージにとどまらず、非構造化マルチモーダル データが企業の最も価値のある資産になるという、私たちが目指している世界に合わせてデータ管理スタック全体を再構築する必要性を認識しています。同社の最初のプラットフォーム製品である LanceDB (現在プライベート ベータ版) は、アプリケーションにマルチモーダル機能を組み込もうとしている開発者にシームレスな組み込みエクスペリエンスを提供します。

ランスは、企業がどのようにして開発者をマルチモーダルな未来に導いているのかを示す一例にすぎません。私は、マルチモーダル アプリケーションを進歩させるために他のテクノロジーが登場するのを見るのを非常に楽しみにしています。人工知能の発展により、そのような未来が現実になるのもそう遠くないでしょう。 ——Saar Gur氏、CRVゼネラルパートナー

4. 異常なセキュリティ

AI を活用したサイバー攻撃の波を阻止

私は生成 AI に関しては恥ずかしがることのない楽観主義者ですが、このテーマに関しては世間知らずではありません。たとえば、機密情報を抽出するために電子メールを使用することが多いスピア フィッシングなどの「ソーシャル エンジニアリング」攻撃の蔓延を懸念しています。 ChatGPT が昨年普及して以来、このような攻撃の発生率は劇的に増加しました。

Abnormal Security によると、過去 1 年間で人口 1,000 人あたりの攻撃件数は 500 件未満から 2,500 件以上に急増しました。攻撃の洗練度も飛躍的に高まっています。学生が ChatGPT を使用して完璧なエッセイを書くことができるのと同じように、ChatGPT は文法的に完璧で、危険なほど個人化された詐欺メッセージを送信するためにも使用できます。

FBI によると、このような標的を絞った「ビジネスメール侵害」攻撃により、2013 年以来 500 億ドル以上の損失が発生しています。そして事態はさらに悪化するだろう。毎日、無数のサイバー犯罪者やその他の悪質な攻撃者が、最も説得力のある大規模な詐欺キャンペーンを組織するためにマルウェア データをマイニングするように設計されたチャットボット「WormGPT」などのブラック ハット ツールを悪用して、詐欺行為を行っています。

幸いなことに、Abnormal の共同創設者である Evan Reiser 氏と Sanjay Jeakumar 氏は、人工知能を使用してこの脅威と戦うために懸命に取り組んでいます。これは、AI を使用して AI と戦うと考えることができます。これまで、電子メール セキュリティ システムは、特定の IP アドレスや個人を特定できる情報 (PII) へのアクセスの試みなど、既知の不正行為の署名をスキャンしていました。

アブノーマルは人工知能の力を利用して、これらすべてを覆します。多くの攻撃は人工知能のおかげで正当であるように見えるため、アブノーマルのアプローチは、既知の良好な動作を完全に理解して、微妙な逸脱さえも認識できるようにすることです。同社は大規模な言語モデルを使用して、通常誰と会話するのか、どのようなコンテンツをやり取りする可能性があるのかなど、デジタルの内部および外部の仕組みの詳細な表現を構築しています。私のパートナーであるリード・ホフマンが私にメールを送ってきて、「ねえ、Inflection.AI の最新情報を送ってください。」と言ったら、Abnormal の AI エンジンはすぐにそれを見つけます。リードが「ねえ」で始まることはめったになく、一文も送信することはめったにありません。そして彼は私に Inflection.AI に関するファイルを送ってほしいと頼んだことは一度もありません。 (会社の共同創設者および取締役として、彼は私よりもこれらの文書にアクセスできました!)。

当然のことながら、生成 AI に関するセキュリティ上の懸念が増大し続ける中、Abnormal の企業顧客の需要が加速しています。 Abnormal の成功は非常に喜ばしいことだと思います。なぜなら、同社は AI によって加速されている問題に迅速に AI を活用できたからです。破壊的な技術変化の時期には、悪意のある者が長期にわたる先行者利益を享受することがよくあります。結局のところ、製品の品質、安全性、またはまだ新しい法律を制定していない規制当局について心配することなく、イノベーションを活用することができます。

同時に、当然のことながら、テクノロジー系スタートアップ企業は、違法または破壊的なイノベーションを阻止することよりも、自社のイノベーションのための強力な新しいユースケースの開発に重点を置いています。しかし、人工知能に関連するすべての問題と同様、人工知能の悪用が引き起こす可能性のあるサイバー被害は驚くべきものです。アブノーマル チームの先見性のおかげで、サイバー犯罪の新たな常態が少なくとも発生する可能性は低くなる可能性があります。 —Sam Motamedi、Greylock パートナー

5.ほこり

ナレッジワーカーを強化

大規模な言語モデルが知識労働者の効率を向上させることは明らかです。しかし、それがどのように行われるのかは正確には不明です。ダストはそれを理解しようとしています。社内データにアクセスできない場合、ナレッジ マネージャーは企業内ではほとんど役に立ちません。そこで Dust は、企業の内部データ (Notion、Slack、Drive、GitHub) にリアルタイムでインデックス付け、埋め込み、更新を行い、それを大規模な言語モデルを利用した製品に公開するプラットフォームを構築しました。

Dust の共同創設者である Gabriel Hubert と Stanislas Polu は、会社を Stripe に売却し、そこで 5 年間働きました。彼らは、急成長する企業が規模の拡大にいかに苦労しているかを直接見てきました。彼らは「情報負債」と呼ばれるものを直接目の当たりにしており、現在はそれに関連する主要な問題点のいくつかを解決するために大規模な言語モデルを適用することに重点を置いています。現在、Dust はプラットフォーム上で次のアプリケーションを検討しています。

  • 応答エンジン。これが広く採用されるための鍵であるため、事実に重点が置かれています。
  • アシスタントを生成します。コンテンツ作成時にテンプレート化されたヘルプを提供します。たとえば、内部データに基づいて欠落している段落を生成します。 ※ドキュメントは自動更新されます。社内でドキュメントを更新する必要がある情報が発生すると、ドキュメントの所有者は通知と提案を受け取ります。
  • 構造化されたイベントの抽出。ユーザーは、事前定義されたテンプレートに基づいて、非構造化データ (Slack スレッドなど) から構造化イベントを生成できます。
  • 内部データ監視。スマートなルールで企業データを監視します。たとえば、個人を特定できる情報 (PII) が、表示されるべきではない場所に誤って表示された場合、アラートを受け取ります。

これは多くのコンテンツですが、Dust の創設者は、これらのデータ ストリームのほとんどが最終的には統合された製品に収束すると信じています。彼らはまだ探査の初期段階にあり、ダストの最終的な全体像を形成しているところです。最初の反復に基づいて、彼らは核となる仮説を確認できたと信じています。つまり、ナレッジ ワーカーの能力は大規模な言語モデルによって (置き換えるのではなく) 強化でき、その上に新しい「チーム オペレーティング システム」を構築できるということです。これ。 ——コンスタンティン・ビューラー氏、Sequoia Capital パートナー

6. ラベルボックス

ビジネスデータのリリース

「ビッグデータの台頭」は 20 年以上続いており、企業はこれまで以上に多くのデータを継続的に取り込んでいますが、多くの企業は依然としてこのデータを使用して人工知能モデルから洞察を得るのに苦労しています。データの処理と解釈は依然として AI プロセスの中で最も面倒でコストがかかる部分ですが、高品質の結果を得るために最も重要でもあります。事前トレーニングされた大規模な言語モデルが増加したとしても、企業は依然として独自のデータを (複数のモダリティにわたって) 使用して、差別化されたサービスと洞察を提供する独自の位置にある生成 AI を作成し、運用効率を向上させることに注力する必要があります。

Labelbox は、企業がデータセットを AI モデルにフィードする方法を簡素化することで、この課題を解決します。これは、データおよび機械学習チームが適切なデータを見つけ、それを処理および解釈し、モデルをアプリケーションにプッシュし、パフォーマンスを継続的に測定および改善するのに役立ちます。

Labelbox の新しいプラットフォームは、生成人工知能を活用しています。 Model Foundry を使用すると、チームはすべての主要なクローズド ソース プロバイダーとオープン ソース プロバイダーの AI 基盤モデルを迅速に実験できるため、データに事前にラベルを付けて、数回クリックするだけで迅速に実験できるようになります。こうすることで、どのモデルがデータに対して最も優れたパフォーマンスを発揮するかを理解できます。 Model Foundry は、結果をバージョン管理しながら、実行される実験ごとに詳細なパフォーマンス メトリクスを自動的に生成します。

その影響は広範囲に及ぶ可能性があります。従来、人間は、複数の段落のテキストを含む電子商取引リストの分類など、単純ではあるが時間のかかるタスクを完了するのに何日も費やしてきました。 GPT-4 を使用すると、このタスクは数時間以内に完了できます。 Model Foundry を使用すると、企業はこれらの効率的な方法を自分で見つけることができます。

これは唯一の例ではありません。初期の結果は、ラベル付けタスクの 88% 以上が 1 つ以上の基本モデルによって高速化できることを示しています。 Labelbox を使用すると、コードを作成したりモデルにデータを入力したりする必要がなく、誰でも数回クリックするだけでデータに事前にラベルを付けることができます。このツールは、チームが協力して作業し、部門を超えた専門知識を活用してデータ品質保証の手動監視を維持できるように設計されています。この機能により、言語モデルの専門家や中小企業がモデルを簡単に評価し、データセットを強化し、共同してインテリジェントなアプリケーションを構築できるようになり、人工知能へのアクセスが民主化されます。

Labelbox は、Walmart、P&G、Genentech、Adobe などの世界最大規模の企業のコストを大幅に削減し、モデルの品質を向上させることが実証されています。

企業は現在、ビジネス上の問題を解決するために独自のデータに基づいてこれらの基礎となるモデルの力を解き放つ競争になっています。私たちは、Labelbox が企業がデータを解放して、より優れた製品をより効率的に提供できるようどのように支援するかを楽しみにしています。 ——ロバート・カプラン氏、ソフトバンク社パートナー

7. 滑走路

新しいクリエイティブスイート

人工知能はあらゆる場所に存在し、ますます商品化しています。ほとんどの場合、企業は AI をチャットボットとして使用して、既存のアプリケーションを強化します。 Google の検索エンジンがインターネットの閲覧方法を変えたり、Instagram が携帯電話からの写真の共有方法を変えたりするのと同じように、テクノロジーを使用して製品エクスペリエンスを再発明し、製品との関わり方を根本的に変えている AI アプリケーションはほとんどありません。これらの AI アプリケーションには、既存のユーザー エクスペリエンス、先見的な製品思考、最先端のテクノロジーに対する深い理解が必要です。

Runway は、応用 AI 研究を利用してクリエイティブ エクスペリエンスを再考し、まったく新しいクリエイティブ スイートを構築している企業の代表的な例です。

  • ユーザーエクスペリエンスに対する深い理解。創設者のクリストバル・ヴァレンズエラ、アナスタシス・ゲルマニディス、アレハンドロ・マタマラ・オルティス アレハンドロ・マタマラ・オルティスは、ニューヨーク大学でインタラクティブ電気通信を専攻する研究者で、長年の設計経験があります。 Runway のチームは、直接の経験と大量導入の障壁からクリエイティブ ツールのエコシステムを理解しています。たとえば、クリエイティブな映画制作には、多くの場合、高価な機械、ソフトウェア リソース、および高度なトレーニングが必要です。その結果、創造的な映画制作は歴史的に大規模なスタジオに集中してきました。 Runway は、必要なクリエイティブ ツールのアクセシビリティを拡張および改善する機会を捉えました。
  • 先見の明のある製品思考。 Runway は、人工知能の変曲点がユーザー エクスペリエンスを劇的に向上させ、既存のクリエイティブ ツールを強化するだけでなく、それらのツールの動作方法を根本的に変える可能性があることを早くから認識していました。たとえば、ユーザーは単純なテキスト プロンプトを使用して、まったく新しいビデオ コンテンツを最初から作成できます。重要なのは、このビデオはプロ仕様であり、デスクトップまたはモバイル デバイス経由で共有できることです。スキル レベル、背景、リソースに関係なく、Runway を使用すると、数時間または数日間の編集作業を節約できます。これは、シンプルなリマインダーを鮮やかで感動的な生活に変える、先見の明のある製品です。
  • 人工知能技術の第一人者。 Runway は、先見の明のある製品で問題を解決しただけではなく、基礎となる研究とテクノロジーのインフラストラクチャを再考しました。 Runway の社内研究組織は、画像とビデオの合成のためのディープ ニューラル ネットワークの分野をリードしています。同社は、現在市場にあるものよりも強力なマルチモーダル人工知能ビデオ モデルである Gen-2 を開発しました。これは、テキストをビデオに変換できる初の公開モデルです。これに先立ち、Runway は高品質の出力を生成するビデオ生成ツールのパラダイムシフトにつながるモデルである Gen-1 をリリースしました。滑走路の研究者は、テキストから画像へのモデルである安定拡散も開発しました。

2022 年 10 月以来、ランウェイはビデオ、画像、3D、テキストをカバーする 30 以上の AI「マジック ツール」を開発し、プリプロダクションからポストプロダクションまでクリエイティブ プロセスのあらゆる側面に対応しています。同社の顧客ベースには、CBS の The Late Show with Stephen Colbert、New Balance、Harbor Picture Video、Publicis、Google など、フォーチュン 500 企業やグローバル 2000 企業が含まれています。このプラットフォームは、ハリウッドのヒット作『Everything Everywhere All at Once』など、オスカーにノミネートされた映画の編集にも使用されています。

最もエキサイティングな AI アプリケーションは、既存の製品エクスペリエンスを変革し、ユーザーが製品と対話する方法を再考します。 Runway を使用すると、ユーザーは初めてビデオを撮影する場合でも、プロとしてスタジオにいる場合でも、数秒で新しいビデオの作成を完了できます。これは革命的な変化であり、人工知能がさまざまな業界をどのように再構築しているかを示す一例です。 —Grace Isford、Lux Capital パートナー

8. 新しい制限

細胞の運命を再構築する

細胞は地球上で最も複雑なコンピューター システムです。コンピューター チップと同様に、DNA は複雑な機能を生み出す基本単位で構成されています。ビットベースのコードとは異なり、アトムベースのコードはランダムで階層的です。あるシステムは別のシステムに依存し、さらにそのシステムは他の物理システムに依存し、それぞれが熱、酸性度、細胞の微小環境内の分子の影響を受けます。

これらの相互依存性にもかかわらず、セルラー マシン コード (DNA) はさまざまなプログラムを効率的に実行できます。肝細胞と皮膚細胞は同じゲノムを含んでいますが、これらの細胞タイプは見た目、感触、機能が異なります。なぜ?なぜなら、彼らは異なるエピジェネティックプログラムを実行しているからです。

2006 年、Takaは、4 つの転写因子 (TF) タンパク質の組み合わせを使用して、成熟細胞を幹細胞に再プログラムし、エピジェネティックな再プログラムの分野を開拓しました。転写因子は遺伝子を調節するタンパク質であり、本質的に実行されている「プログラム」を変更します。高橋氏と山中氏の発見は人工多能性幹細胞(iPSC)の作製につながり、ノーベル賞を受賞した。それ以来、多くの研究グループが、細胞の状態を変化させ、損傷した細胞を若返らせ、若々しい細胞表現型を回復するために、独自の TF の組み合わせを適用し始めました。

エピジェネティックな再プログラミングはより扱いやすくなってきていますが、それでも簡単な問題ではありません。チームは、セルを状態 A から目的の状態 B に移行させるのに効果的な TF の組み合わせを識別する必要がありました。たとえば、将来の TF の組み合わせにより、病気の細胞を健康な細胞に変換できるようになり、それによって新しい種類の薬剤が開発される可能性があります。多くのアプリケーション分野では TF の正確な組み合わせが不明であるため、非常に大規模な再プログラミング画面が必要になります。人間のネイティブ TF は 1,500 を超えるため、より効率的な検索方法が必要です。 NewLimit はそのようなアプローチを設計していると信じています。

NewLimit は、単一細胞シークエンシングと機械学習テクノロジーの進歩を活用して、これまで手作業で行われていた分野をデータ駆動型の科学に変革しています。同社は、分子生物学者と計算生物学者の間で健全な分業を行っており、ますます効率性の高いクローズドループ プラットフォームを構築するために必要な文化的基盤を築いています。 NewLimit は、専門知識とマルチモーダルな読み取り (scRNA-Seq、scATAC-Seq など) を組み合わせて、これまで難治性の疾患を治療するための治療的リモデラーを発見することを目指しています。

実験の各ラウンドで、NewLimit は機械語テクノロジーを使用して次のことを行います。

  • 複数の検出読み取り値を組み合わせて、セルの現在の状態 A と望ましい状態 B を含む低次元の最適化空間に圧縮します。
  • ユニットを望ましい状態に押し上げる可能性のある最適化空間に沿った新しい TF の組み合わせを列挙します。
  • どのような種類のデータがモデルの改善に役立つのか、より高価でスループットの低い実験手法をいつ、どこに適用するかを推奨します。
  • 費やした金額ごとに生成される有用な情報を最大化するために、プラットフォームに加えるべき変更を提案します。

NewLimit の優れたチーム、技術力、野心的なビジョンに加えて、私たちは NewLimit の実用的な精神も高く評価しています。同社は当初の事業戦略の詳細を公表していないが、このアプローチは創造的であり、合理的にリスクを軽減し、人類に変革をもたらす可能性があると考えている。設立チームは、プラットフォームバイオテクノロジーは、短期的な資産を生み出さない高価な科学プロジェクトに例えられるかもしれないことに同意している。この目的を達成するために、NewLimit は設立以来、透明性を保ち、その技術的進歩をカタログ化してきました。

私たちは自然の複雑さに謙虚になるべきです。確かに、生物学は私たちが自分たちで設計するシリコンデバイスよりもプログラムするのが難しいです。ディメンションの目標は、NewLimit のような起業家精神にあふれた先駆者に、テクノロジーと生物学の接点における可能性の限界を探求できるようにすることです。 —サイモン・バーネット氏、ディメンション社リサーチディレクター

9. プールサイド

ソフトウェア開発のための基本的な人工知能

OpenAI は一般的な人工知能に重点を置き、DeepMind は科学的発見に重点を置き、人工知能の 3 番目の基本的な使用例はソフトウェアの理解と作成です。

GPT-4 は、経験豊富な開発者と初心者の開発者の両方のワークフローに組み込まれています。しかし、このパラダイムシフトはまだ初期段階にあります。過去数か月から推定すると、AI 支援プログラミングは間もなく普及するでしょう。この傾向がさらに進むと、自然言語がソフトウェアを構築するための抽象的な基盤になるでしょう。

他の企業も StarCoder のような大規模な純粋なコード モデルをリリースしていますが、GPT-4 のパフォーマンスに近づく方法はまだありません。これは、コードのみで訓練されたモデルでは、強力なソフトウェア開発能力を生み出すことができないためだと思います。それがプールサイドとの出会いでした。同社は、GitHub の元最高技術責任者である Jason Warner と、世界初のリサーチ コード人工知能会社である Source{d} の元創設者である Eiso Kant によって設立されたスマート企業です。

Poolside は、OpenAI 基本モデルのアプローチを採用しながらも、コード生成という 1 つの機能のみに焦点を当てているという点で独特です。彼らのテクノロジー戦略は、コードを実行できるという事実にかかっており、学習プロセス中に即時かつ自動的にフィードバックが可能になります。これにより、人間のフィードバックに基づく強化学習 (RLHF) に代わる強力な代替手段であるコード実行による強化学習が可能になります。これは、Esso が 2017 年の初めから検討し始めたことです。

汎用人工知能 (AGI) が人類に利益をもたらす可能性は否定できませんが、その実現はまだ遠いです。では、なぜ AGI を待つ必要があるのでしょうか?ソフトウェア開発など、AI を進化させる特定の分野に焦点を当てることで、創造性に対する障壁をさらに取り除くことができます。プールサイド チームが専用のソフトウェア インフラストラクチャ モデルを構築するというビジョンを実現する日を楽しみにしています。 ——Matan Grinberg、Factory 共同創設者兼 CEO

10. ミストラル

フランスの OpenAI 競合他社

最近、パリは生成人工知能の分野におけるプロジェクトの爆発的な増加によって明るくなりました。たぶんあなたは理由を尋ねるでしょう?私の考えでは、パリには OpenAI のイベント範囲外にある生成 AI における世界クラスの人材が最も多く集まっていると考えています。これらのプロジェクトの中で、最も大胆なのは間違いなくミストラルです。 Mistral は、最高のオープンソース言語モデルを構築するという使命を持って、Guillaume Lample、Arthur Mensch、Timothe Lacroix によって設立され、その目標は、これらのモデルを中心に繁栄したエコシステムを構築することです。

私は Guillaume と 4 年来の付き合いで、二人とも数学、特に形式数学の分野に大規模な言語モデルを適用することに深く関わってきました。 OpenAI と Meta で働いている間、私たちは友好的な競争関係を築きました。ギョーム氏は、私がこれまで一緒に仕事をさせていただいた中で最も才能のある研究者の一人であり、私は彼がメタ社での研究からミストラル社の設立に至るまでを見守る特権に恵まれました。その過程で、アーサー・メンシュにも出会いました。私は常に彼の作品、特に大規模な言語モデルを効率的にトレーニングすることが何を意味するかを再定義した Chinchilla と、検索強化型言語モデリングへのアプローチである RETRO に常に感銘を受けていますが、これはまだ十分に研究されていないと言えます。

では、ミストラルをミストラルたらしめているものを掘り下げてみましょう。このスタートアップのビジョンは、クラス最高のオープンソース モデルに基づいたエコシステムを構築することです。このエコシステムは、プロジェクト、チーム、企業の出発点として機能し、大規模な言語モデルのイノベーションと創造的な使用のペースを加速します。

ヒューマンフィードバックに基づく強化学習 (RLHF) を例に挙げます。通常、RLHF の実行には時間がかかるため、コストがかかります。これには、AI アクションに対する手動の「フラグ設定」が含まれ、多大な作業が必要となる場合があります。 AI モデルの期待が十分に優れている場合にのみ、この努力は価値があります。 OpenAI のような大企業にとって、このプロセスへの投資は理にかなっており、同社にはそれを実現するためのリソースがあります。しかし、従来のオープンソース コミュニティには通常、前に出てこの重要な責任を引き受ける「リーダー」が必要です。

ミストラルには、RLHF のオープンソース モデルに投資することで、まさにそれを実現する機会があります。そうすることで、ミストラルはカンブリア紀のイノベーションの爆発への扉を開くでしょう。オープンソース開発者は、さまざまなニーズに合わせて適応およびカスタマイズできる、明確にラベル付けされたモデルにアクセスできるようになります。最終的な勝者はより広範な市場となり、私たちは 1 つの閉鎖的な企業が単独で生み出すことのできるより具体的で説得力のあるユースケースにアクセスできるようになります。

最も優れたオープンソース モデルを持っている人が、より多くの関心と価値を集めるでしょう。チームは効率性とパフォーマンスの最前線を積極的に推進しているため、私はミストラルに対して強気です。同時に、この分野におけるミストラルの才能は世界最高です。

ミストラルは、この初期ビジョンを実行するためのチームとリソースを確保しました。同社は、エンタープライズレベルのユースケースでこれらのモデルを評価するパートナーも見つけました。ミストラルに注目してください。彼らは OpenAI に対抗する準備ができています。 ——スタニスラス・ポルー、Dust 共同創設者

11. セレアクト

よりスマートな産業用ロボット

長期的には、人工知能とロボット工学が人間のタスクを強化または自動化するだろうという予測をよく聞きます。今日、これはビジネス上ますます緊急の義務となっています。

2030年までに欧州の生産年齢人口は1,350万人減少すると予想されており、人件費は過去20年以上で最も速いペースで上昇している。電子商取引の台頭により、倉庫はこれまで以上に大きなプレッシャーにさらされており、企業が競争力を維持することがますます困難になっています。

倉庫運営費の 55% は注文ピッキングから発生していますが、自動化システムへの移行を検討している企業にとって状況は楽観的ではありません。 AI 主導の SaaS (サービスとしてのソフトウェア) でよく知られている派手なアプリケーションや、エコシステムの他の部分で見られる多数のオープンソース製品は、まだロボット工学に適用されていません。

その代わりに、ピッキングと梱包の自動化を検討している企業は、高価で柔軟性に欠けるロボット ソリューションの選択に直面しています。膨大なプログラミング時間と専門知識を必要とする独自のインターフェイスのホストを操作する必要があります。これらのシステムは、製品構成の変化に対処するのにも苦労し、定期的な人間の介入が必要で、極端な状況に対処する場合にはパフォーマンスが低下します。

Secret はこれらの問題を解決します。そのソフトウェアは強力なシミュレート環境に基づいており、潜在的な現実世界の環境の空間的および物理的ニュアンスを理解できるようにロボット アームをトレーニングします。導入後は、実世界のデータから継続的に学習することでシステムが最適化されます。これは、電子機器、繊維製品、果物、タイル、木材など、従来困難だった品目を手に入れるという課題にも対処できることを意味します。

最も興味深いのは、同社のロボット工学スタックは大規模な言語モデルを使用して、ロボットの直感的な自然言語制御を可能にしていることです。彼らは、ユーザーが音声またはテキストを通じてロボットに指示やフィードバックを与えることができる「PickGPT」と呼ばれるコンバーターモデルを開発しました。これにより、技術的知識のレベルに関係なく、誰でもロボットに希望のタスクの実行を依頼できます。

Secret は、共同創設者の 2 つの専門分野を組み合わせたものです。 CEO の Ralf Gulde は人工知能とロボット工学の交差点で働いており、CTO の Marc Tusher はディープラーニングを専門としています。二人は、オートメーションと工業製造においてドイツで最も権威のある大学の 1 つであるシュトゥットガルト大学で、これらのテーマに関する査読付き研究を実施しました。

Sereact は若い企業であるにもかかわらず、すでに Daimler Truck、Schmalz、Zenfulfillment、Zimmer Group 、および Materials Bank などの優れたパートナーのリストを引きつけています。これは、ピッキングおよび梱包業界に大きな潜在的な市場機会があることを示しています。

電子商取引倉庫では、注文のピッキングや箱の開梱といった明らかな使用例以外にも、さまざまな使用例があります。例えば、従来の製造業では、組み立てに必要な繊細な部品を手間をかけて集めて組み立てるという、時間のかかるプロセスがあります。ロボットアームはこれまで、雑然とした環境で小さな部品を掴んだり、個々の部品を分類したりするのに苦労してきました。 Sereact のソフトウェアはこれらの部品を識別し、それらを取り出すための適切なグリッパーを選択できます。

Sereact チームは高度なスキルを持っているだけでなく、クライアントの労働環境を深く理解しており、クライアントが労働力不足を克服し、効率的で持続可能な運営を達成できるよう支援したいという純粋な願望を持っています。大規模な言語モデルとピックアップ パッケージの組み合わせを学術的な可能性から現実世界への影響へと移行させた最初の企業として、私は真のロボット工学の挑戦者を実行し拡張する彼らの能力に全幅の信頼を置いています。 —Nathan Benaich、Air Street Capital ゼネラルパートナー

##12.ラミニ

オーダーメイドの大規模言語モデル エンジン

現在、あらゆる企業が自社のビジネスに人工知能を組み込もうとしています。世界最大手の企業は人工知能の可能性を認識しており、S&P 500 企業の CEO の 20% が第 1 四半期の決算会見で AI について言及しています。大規模な言語モデルは、カスタマー サポート、アウトバウンド販売、コーディングなどのコア機能を高速化することで、ビジネス効率を大幅に向上させることができます。大規模な言語モデルでは、AI ベースのアシスタントで顧客の質問に答えたり、顧客を満足させる新しい生成型 AI ワークフローを作成したりすることで、中核となる製品エクスペリエンスを向上させることもできます。

大企業は新しいテクノロジーの導入が遅い傾向があることを考えると、企業がいかに早く AI を使用した構築を始めたかには驚きました。当然のことながら、多くの企業が独自の AI モデルとソリューションを社内で構築したいと考えています。どの企業も、多くの場合、中核となるビジネス堀の一部として、独自の顧客データの宝庫を持っています。これらの企業は、信頼性が不確実な基盤となるモデル API や新興企業に最も貴重なデータを送信することにリスクがあると考えています。データ プライバシーの問題に関係なく、GPT-4 や Claude などの公開されている大規模言語モデルは完全にオープン データでトレーニングされているため、企業固有のユースケースや顧客セグメントに合わせたカスタマイズ機能がありません。

ShopifyやCanvaなどの一部のテクノロジー企業は、社内に「AIタイガーチーム」を結成し、既製のオープンソースモデルを使用して人工知能をビジネスのあらゆる部分に統合しています。しかし、ほとんどの企業には、自社のデータに基づいて独自の大規模言語モデルを構築して展開するためのリソースや経験豊富な AI 研究者がいません。彼らは、この AI の波が自社のビジネスの将来にとって変革の瞬間となる可能性があることを認識していますが、これまでのところ、自社の AI 開発を活用したり制御したりすることができていません。

だからこそ私たちは、シャロン・チョウとグレッグ・ディアモス、そして彼らのチームがLaminiで何をしているかにとても興奮しています。 Lamini は大規模な言語モデル エンジンであり、開発者が人間のフィードバックを受けて独自のモデルを簡単に迅速にトレーニング、微調整、展開、改善できるようにします。このツールは、AI モデルの複雑さを抽象化する楽しい開発エクスペリエンスを提供し、さらに重要なことに、企業は AI 研究者を雇用することなく、あるいはデータ漏洩のリスクを負うことなく、自社のデータに基づいて AI ソリューションを構築できるようになります。私たちは昨年の秋に初めてシャロンとグレッグと仕事をしました。それ以来、私たちは、企業が AI を導入する方法を変革するという野心的なビジョンを実現する、技術的に熟練した顧客重視の創業チームをサポートする機会に恵まれてきました。

特に、Lamini を使用してプライベートの大規模言語モデルを展開すると、パブリック ソリューションを使用する場合と比較して幅広い利点が得られます。社内のエンジニアリング チームが構築プロセスを処理することで、データのプライバシーが確保され、モデルの選択、コンピューティングおよびデータ スタック全体の柔軟性が向上します。 Lamini を使用して作成されたモデルは、既製の API と比較してアーティファクトを削減し、レイテンシを削減し、信頼性の高い実行時間を保証し、コストを削減します。これらのパフォーマンスの強化は、Lamini チームが AI モデルと GPU 最適化に関する数十年にわたる研究と業界の経験に基づいて製品に組み込んだ、核となる技術的洞察に基づいています。

有名な新興企業や大企業はすでに Lamini を使用して大規模な言語モデルを社内および顧客とデプロイしており、セットアップの速度、パフォーマンス、信頼性に興奮しています。将来的には、すべての企業が自社のビジネスや製品に AI を使用すると考えられますが、専任の AI チームを抱える企業はわずかです。 Lamini は競争条件を平等にし、すべての企業にこの革新的なテクノロジーを活用する機会を提供するスタートアップです。最近の Databricks とのパートナーシップのおかげで、企業は既存の Databricks データ レイクとコンピューティング クラスター上に Lamini を直接セットアップすることで、AI ソリューションを立ち上げて実行することがこれまでより簡単になりました。 ——James Wu、First Round Capital 投資家、Todd Jackson、First Round Capital パートナー

13. 工場

あなたのコーディング「ロボット」

今日、コンピューターに何かをしてもらいたい場合は、自分の考えを「コンピューター言語」、つまりコンパイラーが理解できるハイパーテキスト コードに翻訳する必要があります。エンジニアになるには、機械のように頭をひねる必要があります。しかし、私たちは AI が人間の言語をコードに変えることができる転換点に達しつつあります。人間のエンジニアからデジタル エンジニアへの移行は、私たちの生活の中で最も重要なテクノロジーの転換点の 1 つになる可能性があります。

私たちはまだこの変革の初期段階にいます。 BabyAGI や AutoGPT などの人工知能ツールは、人々の想像力を魅了してきました。しかし、Github Copilot のようなコーディング アシスタントは改善を示していますが、まだ非常に限定的であり、主に既にコードに実装されているアイデアの自動補完として機能します。

工場が違います。同社は元弦理論学者のマタン・グリンバーグ氏と機械学習エンジニアのイーノ・レイエス氏によって2023年に設立された。 Mattan に会ったとき、私はすぐに彼のビジョンに惹かれました。それは、エンジニアが煩わしいタスクを委任し、困難な問題に集中することで、ものづくりを楽しくできる未来です。これを行うために、マタンとイーノは自律コーディング「ロボット」を作成しました。

ボットは、コード レビュー、デバッグ、リファクタリングなどの日常タスクを処理する人工知能エンジニアです。既存の製品とは異なり、Factory のボットはユーザーが何もする必要がなく、独自にコードをレビューし、エラーを処理し、質問に答えることができます。また、ジュニア開発者と同じようにボットを使用して、機能に関するブレインストーミングや共有を行うこともできます。ロボットには強力な保護メカニズムがあり、ロボットの知能はユーザーのニーズに焦点を合わせているため、間違った答えを「幻覚」させることが困難になります。

コード生成は AI 革命の最も変革的な分野の 1 つであり、Factory には成功するために必要なツールがすべて揃っています。

*チーム。 Factory の CEO であるマッタンは、プリンストン大学の弦理論の研究者であり、そこでブラック ホールの特異点を想像しました。イーノは、Hugging Face で機械学習エンジニアとして働き、退屈なエンジニアリング プロセスを個人的に処理していました。ユニークなチームです。 *実用性。ロボットはまだ人間のエンジニアのようにタスクを実行することはできませんが、エンジニアが嫌がるタスクを実行することはできます。エンジニアは退屈で反復的な作業を工場に任せることができます。

  • スピード。 Factory はわずか数か月で驚くべきことを達成しました。他の人がまだ人工知能エンジニアを想像している間、マタンとイーノはすでに人工知能を開発していました。彼らはこのすでに優れた製品を急速に改良しています。

人間の成長の物語は、繰り返しの作業を軽減し、より複雑な作業に移れるようにするというものです。人間が農業を発明したとき、彼らは本質的に都市を建設する能力を解放しました。産業革命の後、私たちは人類を月に連れて行くロケットを製造しました。次世代は、人間をオンラインの単調な仕事から解放し、テクノロジーのフロンティアをさらに押し上げるという使命を担っています。

人間の想像力だけが限界であるとき、私たちは次に何を構築するのでしょうか? — マーキー・ワグナー、Delphi Labs 創設者兼 CEO

翻訳者: ジェーン

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)