Сектор штучного інтелекту: найновіші технології та інвестиційні можливості

Джерело: Бюро перекладів 36Kr God

Джерело зображення: створено Unbounded AI‌

Примітка редактора: технологія штучного інтелекту розвивається швидкими темпами, і є багато компаній-початківців у сфері штучного інтелекту, які виділяються. У цій статті давайте розглянемо, які багатообіцяючі стартапи штучного інтелекту були підібрані інвесторами, такими як Sequoia Capital і Kleiner Perkins Caufield & Byers. Ця стаття є компіляцією, і я сподіваюся, що вона надихне вас.

Якщо у вас є лише кілька вільних хвилин, ось найцікавіші стартапи про штучний інтелект, про які повинні знати інвестори, оператори та засновники.

  • Поліпшення здоров'я людини. Стартапи використовують технологію штучного інтелекту для покращення результатів лікування та розробки нових методів лікування. Наприклад, компанія Alife використовує штучний інтелект, щоб удосконалити лікування екстракорпорального запліднення та забезпечити пацієнткам кращі шанси завагітніти. З часом підхід компанії може кардинально змінити структуру витрат галузі. NewLimit — ще один стартап у галузі охорони здоров’я, який використовує технологію ШІ. Команда компанії шукає кращі способи лікування впертих хвороб, які раніше було важко лікувати.
  • Нехай штучний інтелект служить підприємствам. Більшість продуктів генеративного ШІ призначені для споживачів. Звичайні користувачі Інтернету тепер можуть грати зі складними моделями та створювати текст і зображення. Кілька багатообіцяючих компаній більш безпосередньо задовольняють потреби підприємства, створюючи продукти, які містять внутрішні дані відповідно до інструкцій підприємства. Glean, Lamini, Dust і Lance – представники цього напрямку.
  • Використовуйте ШІ, щоб обмежити ШІ. Революція AI може принести багато нових можливостей, але вона також принесе багато загроз. Зокрема, генеративний штучний інтелект полегшує створення реалістичних письмових повідомлень, збільшуючи кількість і витонченість шахрайських шахраїв, спрямованих на отримання особистої інформації від одержувачів. Такі компанії, як Abnormal Security, можуть використовувати штучний інтелект для виявлення зловмисних повідомлень ШІ, щоб запобігти таким атакам.
  • Стартапи ШІ поширені по всьому світу. Хоча Сполучені Штати є домом для багатьох галузевих гігантів, таких як OpenAI і Google, багатообіцяючі стартапи з’являються по всьому світу. Mistral будує широкомасштабну модель мови з відкритим кодом у своїй паризькій штаб-квартирі, і один із її засновників вважає, що вони будуть конкурувати з OpenAI. Німецька компанія Sereact також розробила вражаючі роботи зі штучним інтелектом і підписала контракти з промисловими гігантами.

Штучний інтелект – головна тема цьогорічної історії технологій. З часу останньої серії «Що дивитися в штучному інтелекті» сфера продовжує привертати капітал, таланти та увагу. Звичайно, не вся увага позитивна. Незважаючи на широке хвилювання щодо можливостей цієї технології, за останні чотири місяці лідери галузі висловили свою стурбованість, а регулятори почали розробляти певні запобіжні заходи. У найближчі місяці та роки штучний інтелект матиме приголомшливий вплив на наше життя та створюватиме нових переможців та переможених по всьому світу.

Наша серія «Що подивитись» розроблена, щоб допомогти читачам підготуватися до майбутніх часів і чіткіше уявити майбутнє. Це чудова відправна точка для тих, хто хоче зрозуміти технології, що з’являються на кордоні штучного інтелекту, і скористатися перевагами змін, що відбуваються. Для цього ми запросили найбільш вражаючих інвесторів і засновників у сфері штучного інтелекту, щоб представити стартапи, які вони вважають найперспективнішими.

1. Життя

Використання штучного інтелекту для вдосконалення технології ЕКЗ

У будь-якому репродуктивному процесі є моменти, які вимагають прийняття рішень людиною, і два найбільш відповідних зв’язку з ЕКЗ – це «стимуляція яєчників» і «відбір ембріона».

«Стимуляція яєчників» означає визначення дози ліків, які отримує пацієнтка для стимуляції росту фолікулів в яєчниках, а також визначення часу проведення ін’єкції, щоб стимулювати вивільнення яйцеклітин з фолікулів. Вирішальне значення має час спускового пострілу; якщо занадто рано, ви можете отримати незрілі яйця; якщо занадто пізно, ви можете отримати яйця, які є занадто зрілими, або ви можете отримати не стільки яєць, скільки можливо.

«Вибір ембріона» означає вибір заплідненої яйцеклітини для використання та імплантації. Зараз клініцисти та ембріологи, як і більшість медичних працівників, приймають рішення на основі власного досвіду та навчання, морфологічних систем класифікації та методу проб і помилок. Якщо в одному циклі доза або час не є правильними, їх відрегулюють у наступному циклі. Це вимагає дуже високої професійної компетентності лікарів, а на даний момент лікарі мають різний рівень кваліфікації, і їх навички дуже важливі для результату. Для народжуваності, ринок із серйозними обмеженнями пропозиції, це означає високу ціну, особливо якщо ви хочете побачити оптимальні результати.

Alife створює інструменти штучного інтелекту для покращення результатів екстракорпорального запліднення (ЕКЗ). Компанія використовує інструменти штучного інтелекту, щоб надати практикам «надздібності» для підвищення точності прийняття рішень шляхом використання масивних наборів вхідних і кінцевих даних. Тепер за допомогою простого інтерфейсу лікарі можуть вводити характеристики пацієнта та отримувати точні рекомендації в ключових моментах подорожі до фертильності, отримані на основі результатів тисяч попередніх циклів. Ці набори даних отримані з величезної кількості інформації про пацієнтів, яка вже існує, і вони стають кращими, коли кожен пацієнт використовує продукти Alife.

Ці інструменти змінять природу індустрії народжуваності. Дослідження Alife показують, що їх модель машинного навчання може допомогти лікарям оптимізувати 50% часу запуску та допомогти отримати в середньому ще три зрілі яйцеклітини, дві запліднені яйцеклітини та ще один ембріон. Продукція Alife може значно розширити доступ до лікування безпліддя, зменшивши витрати на одного пацієнта за рахунок зменшення дозування необхідних ліків і підвищивши рівень успішності циклів ЕКЗ. Це також вирівняло б умови для лікарів, надаючи тим, кому бракує безпосереднього досвіду, доступ до ширшого спектру знань та інформації.

Зрештою, ви можете собі уявити, що інструменти Alife надають всю інформацію для оцінювання моментів процесу та дозволяють практикуючим лікарям, крім лікарів, працювати, суттєво змінюючи структуру витрат і доступність галузі. Більше того, точна медицина на основі даних, яка доповнює (або зрештою замінює) судження людини персоналізованими рекомендаціями, не є унікальною для світу ЕКЗ. У медицині є тисячі подібних моментів, коли ми маємо можливість використовувати дані, щоб кардинально змінити результати та доступ до важливих процедур і методів лікування.

— Ребекка Каден, генеральний партнер Union Square Ventures

2. Збирати

Enterprise Search

На роботі пошук саме тієї інформації, яка вам потрібна, має бути швидким і легким. Оскільки кожен використовує багато програм для виконання своєї роботи, і в результаті створює багато даних і документів, це не завжди так. Оскільки «знання» зростають експоненціально, а характер роботи стає все більш розподіленим, пошук наявних знань займає все більше часу. Іншими словами, «шукати речі» на роботі досить складно.

Щоб допомогти роботодавцям вирішити цю проблему, Арвінд Джайн і його команда створили Glean, уніфіковану платформу пошуку на робочому місці на основі штучного інтелекту. Він надає співробітникам інтуїтивно зрозумілий робочий помічник, який допомагає їм знаходити саме те, що їм потрібно, і завчасно відкривати те, що вони повинні знати.

Місія компанії була простою з самого початку: допомогти людям знайти відповіді на всі їхні робочі питання швидше, з меншим розчаруванням і втраченим часом. Але згодом результати компанії вийшли далеко за межі пошуку. Наприклад, Glean не тільки здійснює пошук у всіх робочих програмах і базах знань (Slack, Teams, Google Drive, Figma, Dropbox, Coda тощо), але також розуміє природну мову та контекст на основі ролей людей і внутрішніх/зовнішніх стосунків компанії персоналізує користувача взаємодії. Він інтелектуально відображає найпопулярнішу та перевірену інформацію вашої компанії, допомагаючи вам дізнатися, що знає ваша команда, і залишатися послідовними, все дозволеним способом.

Оскільки організації стають більш розподіленими, а знання стають більш фрагментованими, такі інтуїтивно зрозумілі робочі помічники, як Glean, перестають бути приємним, а критично важливим інструментом для підвищення продуктивності співробітників. Зростання компанії зруйнує бар’єри, які заважають прогресу, і створить більш позитивний, продуктивний досвід роботи.

Крім того, пошукова технологія Glean дозволяє запроваджувати генеративний штучний інтелект на робочому місці, дотримуючись суворих дозволів і вимог щодо керування даними підприємства. Сьогодні одна з головних перешкод, яка заважає компаніям розробляти додатки штучного інтелекту у виробництво, полягає в їх нездатності запровадити відповідні засоби контролю. Завдяки введенню дозволів на дані в реальному часі в локальне середовище підприємства Glean став ідеальним рішенням, яке допомагає підприємствам вирішувати проблеми управління в масштабі та дає можливість підприємствам впевнено використовувати свої внутрішні дані для навчання моделі та висновків, таким чином використовуючи корпоративний рівень Платформа даних AI / Роль векторного зберігання.

Ми вважаємо, що з часом кожна компанія матиме власну версію ШІ, яка буде розуміти нюанси бізнесу та його співробітників. Ми віримо, що Глін скористався цією можливістю. — Джош Койн, партнер Kleiner Perkins

3. Ленс

Зберігання та керування мультимодальними даними

Ми всі грали в Midjourney, і більшість з нас бачили демоверсію GPT-4. Midjourney (текст в зображення) і GPT-4 (зображення в текст/код) ілюструють можливості, коли моделі стають мультимодальними, створюючи мости між різними формами медіа, такими як текст, зображення та аудіо. Хоча нинішнє захоплення ШІ обертається навколо текстових моделей, мультимодальні моделі є ключовими для побудови точніших уявлень про світ.

Оскільки ми розпочинаємо наступну хвилю застосувань штучного інтелекту в таких галузях, як робототехніка, охорона здоров’я, виробництво, розваги та реклама, все більше компаній будуватимуть мультимодальні моделі. Такі компанії, як Runway і Flair.ai, є гарними прикладами нових лідерів у своїх галузях, які спостерігають величезний попит користувачів на їхні продукти, тоді як існуючі компанії, такі як Google, почали випускати подібні мультимодальні можливості.

Однак використання мультимодальних моделей створює проблему: як зберігати та керувати даними? Традиційні формати зберігання, як-от Parquet, не оптимізовані для неструктурованих даних, тому великі групи мовних моделей мають низьку продуктивність під час завантаження, аналізу, оцінювання та налагодження даних. Крім того, робочі процеси великої мовної моделі більш схильні до непомітних помилок через відсутність єдиного джерела правди. Lance — остання компанія, яка вирішила цю проблему. Такі компанії, як Midjourney і WeRide, перетворюють набори даних у петабайтному масштабі у формат Lance, який забезпечує суттєві покращення продуктивності та на порядок менші додаткові витрати на зберігання порівняно з традиційними форматами, такими як Parquet і TFRecords.

Lance не зупиняється на сховищі, вони визнали необхідність перебудувати весь стек керування даними, щоб краще відповідати світові, до якого ми рухаємося, де неструктуровані мультимодальні дані стануть найціннішим активом підприємства. Їхній перший платформний продукт, LanceDB (наразі в приватній бета-версії), забезпечує бездоганний вбудований досвід для розробників, які прагнуть створити мультимодальну функціональність у своїх програмах.

Lance є лише одним із прикладів того, як компанії залучають розробників до мультимодального майбутнього, і я дуже радий бачити, як з’являються інші технології для просування мультимодальних програм. З розвитком штучного інтелекту невдовзі таке майбутнє стане реальністю. ——Саар Гур, генеральний партнер CRV

4. Ненормальна безпека

Стримування хвилі кібератак, розширених ШІ

Я беззаперечний оптиміст, коли мова заходить про генеративний ШІ, але я не наївний у цьому питанні. Наприклад, я стурбований поширенням атак «соціальної інженерії», таких як фішинг, які часто використовують електронну пошту для отримання конфіденційної інформації. Оскільки ChatGPT став популярним минулого року, кількість таких атак різко зросла.

Згідно з даними Abnormal Security, минулого року кількість атак на 1000 осіб зросла з менш ніж 500 до понад 2500. Витонченість атак також різко зростає. Подібно до того, як будь-який студент може використовувати ChatGPT для написання ідеального есе, ChatGPT також можна використовувати для надсилання граматично ідеальних, небезпечно персоналізованих шахрайських повідомлень.

За даними ФБР, такі цілеспрямовані атаки «компрометації ділової електронної пошти» завдали збитків на суму понад 50 мільярдів доларів з 2013 року. І буде ставати гірше. Щодня незліченна кількість кіберзлочинців та інших зловмисників використовують такі інструменти «чорного капелюха», як «WormGPT», чат-бот, призначений для видобутку даних про зловмисне програмне забезпечення, щоб організувати найпереконливіші та масштабні шахрайські кампанії, щоб проводити шахрайські дії.

На щастя, співзасновники Abnormal Еван Рейзер і Санджай Джеякумар наполегливо працюють над використанням штучного інтелекту для боротьби з цією загрозою. Ви можете думати про це як про використання ШІ для боротьби з ШІ. Історично склалося так, що системи захисту електронної пошти перевіряли ознаки відомої поганої поведінки, як-от конкретні IP-адреси або спроби отримати доступ до особистої інформації (PII).

Використовуючи потужність штучного інтелекту, Abnormal руйнує все це. Оскільки багато атак здаються легітимними завдяки штучному інтелекту, підхід Abnormal полягає в повному розумінні відомої правильної поведінки, щоб навіть незначні відхилення були помічені. Компанія використовує широкомасштабні мовні моделі для побудови детальних представлень своїх цифрових внутрішніх і зовнішніх процесів, наприклад, хто зазвичай розмовляє один з одним і з яким вмістом вони, ймовірно, взаємодіють. Якби мій партнер Рейд Хоффман надіслав мені електронний лист і сказав: «Привіт, будь ласка, надішліть мені останню інформацію про Inflection.AI.» Механізм ШІ Abnormal швидко дізнався б про це. Рід рідко починається з «привіт», рідко надсилає одне речення, і він ніколи не просив мене надіслати йому файл про Inflection.AI. (Як співзасновник і член правління компанії, він мав більше доступу до цих документів, ніж я!).

Не дивно, що оскільки занепокоєння щодо безпеки навколо генеративного ШІ продовжує зростати, попит корпоративних клієнтів на Abnormal прискорився. Я вважаю, що успіх Abnormal дуже приємний, тому що він зміг так швидко використати ШІ для вирішення проблем, які пришвидшуються ШІ. У періоди руйнівних технологічних змін погані актори часто користуються тривалими перевагами першопрохідців. Зрештою, вони можуть скористатися перевагами інновацій, не турбуючись про якість продукції, безпеку чи регулятори, які ще мають прийняти нові закони.

У той же час, технологічні стартапи, зрозуміло, зосереджуються на розробці нових ефективних варіантів використання своїх інновацій, а не на блокуванні незаконних або руйнівних інновацій. Але, як і всі проблеми, пов’язані зі штучним інтелектом, кіберзбиток, який може завдати неправильне використання штучного інтелекту, є вражаючим. Завдяки передбачливості команди Abnormal, нова норма кіберзлочинності може принаймні стати менш імовірною. —Сем Мотамеді, партнер Greylock

5. Пил

Розширення можливостей інтелектуальних працівників

Зрозуміло, що великі мовні моделі підвищать ефективність інтелектуальних працівників. Але незрозуміло, як саме це буде зроблено. Даст намагається це зрозуміти. Менеджери знань мало допоможуть підприємству, якщо вони не мають доступу до внутрішніх даних. Тож Dust створив платформу, яка індексує, вбудовує та оновлює в режимі реального часу внутрішні дані підприємства (Notion, Slack, Drive, GitHub) і надає їх продуктам, що працюють на основі великих мовних моделей.

Співзасновники Dust Габріель Губерт і Станіслас Полу продали компанію Stripe і пропрацювали в ній п’ять років. Вони на власні очі бачили, як компанії, що швидко розвиваються, борються з масштабом. Вони на власні очі побачили те, що називається «інформаційним боргом», і тепер вони зосереджені на застосуванні великих мовних моделей для вирішення деяких головних проблем, пов’язаних із цим. Наразі Dust вивчає такі програми на своїй платформі:

  • Система відповідей. Акцент робиться на фактичності, оскільки це є ключем до широкого впровадження.
  • Створення помічника. Надає шаблонну довідку під час створення вмісту. Наприклад, генерувати відсутні абзаци на основі внутрішніх даних. *Документи оновлюються автоматично. Щоразу, коли в компанії з’являється інформація, яка повинна оновити документ, власник документа отримує сповіщення та пропозиції.
  • Структуроване вилучення подій. Користувачі можуть генерувати структуровані події з неструктурованих даних (таких як потоки Slack) на основі попередньо визначених шаблонів.
  • Внутрішній моніторинг даних. Відстежуйте корпоративні дані за допомогою розумних правил. Наприклад, отримуйте сповіщення, якщо ідентифікаційна інформація (PII) випадково з’являється там, де вона не повинна бути.

Хоча це багато вмісту, засновники Dust вважають, що більшість із цих потоків даних згодом об’єднаються в єдиний продукт. Вони все ще знаходяться на ранніх стадіях дослідження і формують остаточну картину Пил. Ґрунтуючись на початкових ітераціях, вони вважають, що вони підтвердили свою основну гіпотезу: що можливості працівників інформаційних технологій можна розширити (а не замінити) великомасштабними мовними моделями, і що нова «командна операційна система» може бути побудована на основі це. ——Константін Бюлер, партнер Sequoia Capital

6. Labelbox

Оприлюднити бізнес-дані

«Зростання великих даних» триває вже більше 20 років, і хоча компанії постійно отримують більше даних, ніж будь-коли раніше, багатьом компаніям все ще важко використовувати ці дані для отримання інформації з моделей штучного інтелекту. Обробка та інтерпретація даних залишаються найбільш виснажливими та дорогими частинами процесу AI, але також найважливішими для високоякісних результатів. Навіть зі збільшенням кількості попередньо підготовлених великих мовних моделей компаніям все одно доведеться зосереджуватися на використанні власних власних даних (у різних модальностях) для створення унікально розташованого генеративного штучного інтелекту для надання диференційованих послуг і розуміння, а також підвищення ефективності роботи.

Labelbox вирішує цю проблему, спрощуючи те, як компанії передають набори даних у моделі ШІ. Це допомагає командам обробки даних і машинного навчання знаходити правильні дані, обробляти й інтерпретувати їх, надсилати моделі додаткам, а також постійно вимірювати й покращувати продуктивність.

Нова платформа Labelbox використовує переваги генеративного штучного інтелекту. Model Foundry дозволяє командам швидко експериментувати з базовими моделями штучного інтелекту від усіх основних постачальників закритих і відкритих кодів, дозволяючи їм попередньо позначати дані та швидко експериментувати лише кількома клацаннями миші. Таким чином вони можуть зрозуміти, яка модель найкраще працює з їхніми даними. Model Foundry автоматично генерує детальні показники ефективності для кожного запуску експерименту під час версії результатів.

Вплив може бути далекосяжним. Традиційно люди витрачали дні на виконання простого, але трудомісткого завдання, такого як класифікація списку електронної комерції, що містить кілька абзаців тексту. З GPT-4 це завдання можна виконати за кілька годин. Model Foundry дозволяє компаніям відкрити для себе ці ефективні шляхи.

Це не єдиний приклад. Перші результати показують, що понад 88% завдань маркування можна прискорити за допомогою однієї або кількох базових моделей. Labelbox дозволяє будь-кому попередньо позначати дані лише кількома клацаннями миші, без необхідності кодування та введення даних у модель. Цей інструмент розроблено для того, щоб надати командам можливість працювати разом і використовувати міжфункціональний досвід для ручного контролю за забезпеченням якості даних. Ця можливість демократизує доступ до штучного інтелекту, дозволяючи експертам з мовних моделей і малим і середнім підприємствам легко оцінювати моделі, збагачувати набори даних і співпрацювати для створення інтелектуальних програм.

Доведено, що Labelbox значно знижує витрати та покращує якість моделей для найбільших компаній світу, зокрема Walmart, Procter & Gamble, Genentech та Adobe.

Зараз підприємства змагаються за те, щоб розкрити потужність цих базових моделей на своїх власних даних для вирішення бізнес-проблем. Ми з нетерпінням чекаємо, як Labelbox допоможе компаніям розблокувати дані, щоб надавати кращі продукти з більшою ефективністю. ——Роберт Каплан, партнер SoftBank

7. Злітно-посадкова смуга

Новий Creative Suite

Штучний інтелект є скрізь і все більше стає товаром. У більшості випадків компанії використовують штучний інтелект як чат-ботів для покращення існуючих програм. Небагато додатків штучного інтелекту переосмислюють роботу з продуктами, використовуючи цю технологію, щоб докорінно змінити спосіб нашої взаємодії з продуктами, подібно до того, як пошукова система Google змінила спосіб перегляду веб-сторінок або Instagram змінив спосіб обміну фотографіями з наших телефонів. Ці додатки штучного інтелекту вимагають глибокого розуміння існуючого досвіду користувача, далекоглядного мислення про продукт і передових технологій.

Runway є провідним прикладом компанії, яка використовує прикладні дослідження штучного інтелекту, щоб переосмислити творчий досвід і створити абсолютно новий творчий пакет.

  • Глибоке розуміння досвіду користувача. Засновники Крістобаль Валенсуела, Анастасіс Германідіс та Алехандро Матамара-Ортіс Алехандро Матамала-Ортіс є дослідником у галузі інтерактивних телекомунікацій у Нью-Йоркському університеті та має багаторічний досвід проектування. Команда Runway розуміє екосистему творчих інструментів на основі безпосереднього досвіду та бар’єри для масового впровадження. Наприклад, творче кіновиробництво часто потребує дорогого обладнання, ресурсів програмного забезпечення та високого рівня підготовки. У результаті творче кіновиробництво історично було зосереджено на великих студіях. Runway побачив можливість розширити та покращити доступність необхідних творчих інструментів.
  • Далекоглядне продуктове мислення. Runway на ранній стадії зрозумів, що точка перегину в штучному інтелекті може значно покращити взаємодію з користувачем, не лише покращуючи існуючі творчі інструменти, але й кардинально змінюючи спосіб роботи цих інструментів. Наприклад, користувачі можуть створювати абсолютно новий відеоконтент з нуля, використовуючи прості текстові підказки. Важливо, що це відео є професійним, і ним можна ділитися за допомогою комп’ютера чи мобільного пристрою. Незалежно від рівня кваліфікації, досвіду чи ресурсів, Runway може заощадити години або дні роботи на редагування. Це далекоглядний продукт, який перетворює прості нагадування на яскраве та зворушливе життя.
  • Провідний експерт із технологій штучного інтелекту. Runway не просто вирішив проблему за допомогою далекоглядного продукту, вони переосмислили основну дослідницьку та технологічну інфраструктуру. Внутрішня дослідницька організація Runway є лідером у розробці глибоких нейронних мереж для синтезу зображень і відео. Компанія розробила Gen-2, мультимодальну відеомодель зі штучним інтелектом, яка є потужнішою за будь-що на ринку. Це перша публічна модель, здатна конвертувати текст у відео. До цього Runway випустила Gen-1, модель, яка веде до зміни парадигми в інструментах генерації відео, що створює високоякісний вихід. Дослідники злітно-посадкової смуги також першими запровадили модель перетворення тексту в зображення Stable Diffusion.

З жовтня 2022 року Runway розробила понад 30 «чарівних інструментів» штучного інтелекту, які охоплюють відео, зображення, 3D і текст, обслуговуючи всі аспекти творчого процесу, від попереднього виробництва до пост-продакшу. Їхня клієнтська база включає компанії зі списку Fortune 500 і Global 2000, такі як The Late Show зі Стівеном Колбертом на CBS, New Balance, Harbour Picture Video, Publicis ) і Google. Платформа також використовувалася для монтажу фільмів, номінованих на «Оскар», таких як голлівудський хіт «Все скрізь і відразу».

Найцікавіші додатки штучного інтелекту перетворюють наявний досвід роботи з продуктами та переосмислюють те, як користувачі взаємодіють із продуктами. За допомогою Runway користувачі можуть створювати нове відео за лічені секунди, незалежно від того, чи знімають вони відео вперше, чи працюють у студії професійно. Це революційний зсув і приклад того, як штучний інтелект змінює різні галузі. —Грейс Ісфорд, партнер Lux Capital

8. Новий ліміт

Зміна долі клітини

Клітини є найскладнішими комп'ютерними системами на Землі. Подібно до комп’ютерних чіпів, ДНК складається з базових одиниць, які виконують складні функції. На відміну від бітових кодів, атомні коди є випадковими та ієрархічними. Одна система залежить від іншої, яка, у свою чергу, залежить від інших фізичних систем, на кожну з яких впливають тепло, кислотність і молекули мікрооточення клітини.

Незважаючи на ці взаємозалежності, клітинний машинний код (ДНК) може ефективно запускати різні програми. Хоча ваші клітини печінки та клітини шкіри містять однаковий геном, ці типи клітин виглядають, почуваються та функціонують по-різному. чому Тому що вони виконують різні епігенетичні програми.

У 2006 році Такахаші та інші використали комбінацію чотирьох білків факторів транскрипції (TF) для перепрограмування зрілих клітин у стовбурові клітини, ставши піонером у галузі епігенетичного перепрограмування. Фактори транскрипції - це білки, які регулюють гени, істотно змінюючи "програму", яка виконується. Відкриття Такахасі та Яманаки призвело до створення індукованих плюрипотентних стовбурових клітин (iPSC) і принесло їм Нобелівську премію. З тих пір багато дослідницьких груп почали застосовувати унікальні комбінації TF для зміни стану клітин, омолодження пошкоджених клітин і відновлення фенотипів молодих клітин.

Хоча епігенетичне перепрограмування стає більш піддатливим, це все ще не тривіальна справа. Команда повинна була розрізнити, яка комбінація TFs була ефективною для переходу клітин зі стану A в бажаний стан B. Наприклад, майбутні комбінації TF можуть дозволити нам перетворювати хворі клітини на здорові, таким чином розробляючи новий клас ліків. Нам потрібні дуже масштабні екрани перепрограмування, оскільки точна комбінація TF невідома для багатьох областей застосування. Існує понад 1500 рідних людських TF, тому потрібен більш ефективний метод пошуку. Ми вважаємо, що NewLimit розробляє такий підхід.

Завдяки прогресу в технологіях одноклітинного секвенування та машинного навчання NewLimit перетворює дисципліну, яка раніше була ручною, у науку, керовану даними. Компанія має здоровий розподіл праці між молекулярними біологами та комп’ютерними біологами, закладаючи культурну основу, необхідну для побудови все більш ефективної платформи замкнутого циклу. Поєднуючи досвід і мультимодальні зчитування (scRNA-Seq, scATAC-Seq тощо), NewLimit прагне виявити терапевтичні ремоделери для лікування хвороб, які раніше не піддавалися лікуванню.

У кожному раунді експериментів NewLimit використовує технологію машинної мови, щоб:

  • Об’єднайте та стисніть кілька показань виявлення в низькорозмірний простір оптимізації, що містить поточний стан A та бажаний стан B комірки.
  • Перелічіть нові комбінації TF вздовж простору оптимізації, які можуть привести пристрій до бажаного стану.
  • Рекомендуйте, які типи даних допоможуть покращити моделі та коли/де застосовувати дорожчі експериментальні методи з меншою пропускною здатністю.
  • Запропонуйте зміни, які слід внести на платформу, щоб максимізувати корисну інформацію, отриману за кожен витрачений долар.

Окрім видатної команди, технічної майстерності та амбітного бачення, ми також захоплюємося прагматичним духом NewLimit. Хоча компанія не оприлюднила подробиці своєї початкової бізнес-стратегії, ми вважаємо, що цей підхід є креативним, обґрунтовано знижує ризик і має потенціал для трансформації людства. Команда засновників погоджується, що біотехнології платформи можна порівняти з дорогими науковими проектами без створення короткострокових активів. З цією метою NewLimit був прозорим і каталогізував свій технологічний прогрес з моменту свого створення.

Ми повинні бути приниженими перед складністю природи. Правда, біологію важче програмувати, ніж кремнієві пристрої, які ми розробляємо самі. Метою Dimension є надання можливості піонерам підприємництва, таким як NewLimit, досліджувати межі можливостей на стику технологій і біології. —Саймон Барнетт, директор з досліджень, Dimension

9. Біля басейну

Базовий штучний інтелект для розробки програмного забезпечення

OpenAI зосереджується на загальному штучному інтелекті, DeepMind — на наукових відкриттях, а третій фундаментальний варіант використання штучного інтелекту — це розуміння та створення програмного забезпечення.

GPT-4 укорінився в робочих процесах як досвідчених, так і початківців розробників. Але ця зміна парадигми все ще перебуває в зародковому стані. Екстраполюючи дані за останні кілька місяців, програмування за допомогою ШІ скоро стане повсюдним. У міру подальшого розвитку цієї тенденції природна мова стане абстрактною основою, на якій будується програмне забезпечення.

Хоча інші компанії випустили масштабні моделі чистого коду, такі як StarCoder, жоден метод ще не наблизився до продуктивності GPT-4. Я думаю, це тому, що модель, навчена лише на коді, не може створити сильні можливості розробки програмного забезпечення. Так я познайомився з Пулсайдом. Компанію заснували Джейсон Уорнер, колишній головний технічний директор GitHub, і Ейсо Кант, колишній засновник source{d}, першої в світі компанії штучного інтелекту з дослідницькими кодами. Smart company.

Poolside унікальний тим, що вони використовують підхід базової моделі OpenAI, але зосереджуються лише на одній функції: генерації коду. Їхня технологічна стратегія базується на тому, що код може бути виконаний, що забезпечує негайний і автоматичний зворотний зв’язок під час процесу навчання. Це дозволяє навчати з підкріпленням за допомогою виконання коду, що є переконливою альтернативою навчанню з підкріпленням на основі зворотного зв’язку людини (RLHF). Це те, що Esso почала досліджувати ще в 2017 році.

Хоча потенціал загального штучного інтелекту (AGI) принести користь людству незаперечний, до його реалізації ще далеко. То навіщо чекати AGI? Зосереджуючись на конкретних сферах розвитку штучного інтелекту, таких як розробка програмного забезпечення, ми можемо усунути більше бар’єрів для творчості. Я з нетерпінням чекаю того дня, коли команда Poolside реалізує своє бачення створення спеціальної моделі програмної інфраструктури. ——Матан Грінберг, співзасновник і генеральний директор Factory

10. Містраль

Конкуренти OpenAI у Франції

Останнім часом Париж осяяний вибухом проектів у сфері генеративного штучного інтелекту. Можливо, ви запитаєте чому? На мою думку, у Парижі є найбільший пул талантів світового рівня в галузі генеративного штучного інтелекту, який знаходиться за межами горизонту подій OpenAI. З цих проектів найсміливішим, безсумнівно, є «Містраль». Компанія Mistral була заснована Гійомом Лемплем, Артуром Меншем і Тімотем Лакруа з метою створення найкращих мовних моделей з відкритим кодом. Мета полягає в тому, щоб побудувати процвітаючу екосистему навколо цих моделей.

Я знав Ґійома чотири роки, і ми обидва були глибоко залучені до застосування великих мовних моделей до галузей математики, особливо до формальної математики. Працюючи в OpenAI і Meta, ми розвинули дружні конкурентні відносини. Ґійом є одним із найталановитіших дослідників, з якими я коли-небудь мав задоволення працювати, і я мав честь спостерігати, як він пройшов шлях від досліджень у Meta до заснування Mistral. У процесі я також зустрів Артура Менша. Мене завжди вражала його робота, особливо Chinchilla, яка по-новому визначила, що означає ефективне навчання великих мовних моделей, і RETRO, підхід до пошуково-розширеного мовного моделювання, який, я б сказав, ще не повністю вивчений.

Тепер давайте розберемося, що робить Mistral Mistral. Бачення стартапу полягає в тому, щоб побудувати екосистему на основі найкращої у своєму класі моделі з відкритим кодом. Ця екосистема слугуватиме стартовим майданчиком для проектів, команд і компаній, прискорюючи інновації та творче використання великих мовних моделей.

Візьмемо для прикладу навчання з підкріпленням на основі зворотного зв’язку людини (RLHF). Як правило, виконання RLHF займає багато часу і, отже, дорого. Він передбачає ручне «позначення» дій ШІ, що може вимагати багато роботи. Зусилля будуть того варті лише в тому випадку, якщо перспективи моделі штучного інтелекту достатньо хороші. Для такого великого підприємства, як OpenAI, інвестиції в цей процес мають сенс, і компанія має ресурси, щоб це зробити. Але традиційним спільнотам з відкритим кодом зазвичай потрібен «лідер», щоб зробити крок вперед і взяти на себе цю важливу відповідальність.

Mistral має можливість зробити саме це, інвестуючи в модель з відкритим кодом для RLHF. Таким чином, Mistral відкриє двері кембрійському вибуху інновацій. Розробники з відкритим кодом матимуть доступ до чітко позначених моделей, які вони зможуть адаптувати та налаштовувати для різних потреб. Остаточним переможцем стане ширший ринок, і ми матимемо доступ до більш конкретних і переконливих варіантів використання, ніж одна закрита компанія могла б створити сама.

Той, хто має найкращу модель з відкритим кодом, приверне більше інтересу та цінності. Я налаштований на Mistral, тому що команда активно просуває межу ефективності/продуктивності. При цьому талант «Містраля» в цій сфері безперечно найкращий у світі.

Mistral забезпечив команду та ресурси для реалізації цього початкового бачення. Компанія також знайшла партнерів для оцінки цих моделей на корпоративному рівні. Слідкуйте за Mistral, вони готові протистояти OpenAI. ——Станіслас Полу, співзасновник Dust

11. Sereact

Розумніші промислові роботи

Ми часто чуємо прогнози, що в довгостроковій перспективі штучний інтелект і робототехніка розширять або автоматизують людські завдання. Сьогодні це все більше стає невідкладним бізнес-імперативом.

Очікується, що до 2030 року працездатне населення Європи скоротиться на 13,5 мільйонів, а вартість робочої сили зростатиме найшвидшими темпами за понад 20 років. З розвитком електронної комерції склади перебувають під більшим тиском, ніж будь-коли, і підприємствам стає все складніше залишатися конкурентоспроможними.

55% операційних витрат складу припадає на комплектування замовлень, але ситуація не є оптимістичною для компаній, які хочуть перейти на автоматизовані системи. Жодна з яскравих програм, які ми знайомі в SaaS (програмне забезпечення як послуга) на основі штучного інтелекту, або безліч продуктів з відкритим кодом, які ми бачимо в інших частинах екосистеми, ще не застосовані в робототехніці.

Натомість компанії, які прагнуть автоматизувати збір і пакування, стикаються з вибором дорогих, негнучких роботизованих рішень. Вони повинні орієнтуватися в безлічі власних інтерфейсів, які потребують значного часу та досвіду програмування. Ці системи також важко справляються зі зміною асортименту продуктів, вимагають регулярного втручання людини та погано працюють у екстремальних ситуаціях.

Секрет вирішує ці проблеми. Його програмне забезпечення базується на потужних змодельованих середовищах, які навчають роботів розуміти просторові та фізичні нюанси будь-якого потенційного середовища реального світу. Після розгортання система буде оптимізована шляхом постійного вивчення реальних даних. Це також означає, що вони можуть впоратися з викликом захоплення традиційно складних предметів, таких як електроніка, текстиль, фрукти, плитка та дерево.

Найбільш захоплюючим є те, що їхній стек робототехніки використовує великі мовні моделі, щоб забезпечити інтуїтивне керування роботами природною мовою. Вони розробили модель конвертера під назвою «PickGPT», яка дозволяє користувачам давати інструкції та відгуки роботу за допомогою голосу або тексту. Таким чином, кожен може попросити робота виконати потрібне завдання, незалежно від рівня його технічних знань.

Secret поєднує в собі дві сфери досвіду своїх співзасновників. Генеральний директор Ральф Гулде працював на стику штучного інтелекту та робототехніки, а технічний директор Марк Ташер спеціалізується на глибокому навчанні. Пара провела рецензоване дослідження з цих тем в Університеті Штутгарта, одному з найпрестижніших університетів Німеччини з автоматизації та промислового виробництва.

Незважаючи на те, що Sereact є молодою компанією, вона вже залучила вражаючий список партнерів, включаючи Daimler Truck, Schmalz, Zenfulfillment, Zimmer Group ) і Material Bank. Це вказує на наявність величезних потенційних ринкових можливостей у галузі комплектування та пакування.

Крім очевидних випадків використання на складах електронної комерції, будь то підбір замовлень чи розпакування коробок, існує низка інших випадків використання. Наприклад, у традиційному виробництві існує трудомісткий процес, який називається складанням, який включає копітку збір тонких деталей, необхідних для складання. Роботизовані руки історично намагалися схопити дрібні деталі та сортувати окремі частини в захаращеному середовищі. Програмне забезпечення Sereact може ідентифікувати ці деталі та вибрати правильний захват для їх вибору.

Команда Sereact є не тільки висококваліфікованою, але й має глибоке розуміння робочого середовища клієнта та щире бажання допомогти клієнтам подолати нестачу робочої сили та досягти ефективної та сталої діяльності. Будучи першою компанією, яка перевела поєднання великих мовних моделей і упаковки пікапів з академічних можливостей на реальний вплив, я повністю впевнений у їхній здатності втілити та масштабувати справжню робототехніку. —Натан Бенаїч, генеральний партнер Air Street Capital

12. Ламіні

Індивідуальний двигун великомасштабної мовної моделі

Зараз кожна компанія намагається інтегрувати штучний інтелект у свій бізнес. Найбільші компанії світу визнають потенціал штучного інтелекту: 20% генеральних директорів S&P 500 згадали ШІ під час своїх дзвінків щодо прибутків за перший квартал. Великі мовні моделі можуть значно підвищити ефективність бізнесу шляхом прискорення основних функцій, таких як підтримка клієнтів, вихідні продажі та кодування. Великі мовні моделі також можуть покращити роботу основного продукту, відповідаючи на запитання клієнтів за допомогою помічників на основі штучного інтелекту, або створювати нові генеративні робочі процеси ШІ, щоб порадувати клієнтів.

Враховуючи, що великі компанії, як правило, повільно впроваджують нові технології, ми були здивовані тим, як швидко підприємства почали будувати за допомогою ШІ. Не дивно, що багато компаній хочуть створювати власні моделі штучного інтелекту та рішення власними силами. Кожен бізнес має власну скарбницю даних про клієнтів, часто як частину свого основного бізнесу. Ці компанії бачать ризики в надсиланні своїх найцінніших даних API базової моделі або стартапам, надійність яких невизначена. Навіть незважаючи на проблеми конфіденційності даних, загальнодоступні великомасштабні мовні моделі, такі як GPT-4 або Claude, навчаються виключно на відкритих даних і тому не мають можливостей налаштування для конкретних випадків використання підприємства та сегментів клієнтів.

Деякі технологічні компанії, такі як Shopify і Canva, сформували внутрішні «AI Tiger Teams» для використання готових моделей з відкритим кодом для інтеграції штучного інтелекту в усі частини бізнесу. Однак у більшості компаній немає ресурсів або досвідчених дослідників штучного інтелекту для створення та розгортання власних великомасштабних мовних моделей на основі власних даних. Вони усвідомлюють, що ця хвиля штучного інтелекту може стати трансформаційним моментом для майбутнього їхнього бізнесу, але наразі не можуть використовувати чи контролювати свій власний розвиток ШІ.

Ось чому ми в захваті від того, що Шерон Чжоу та Грег Діамос та їх команда роблять у Lamini. Lamini — це механізм широкомасштабної мовної моделі, який полегшує розробникам швидке навчання, налагодження, розгортання та покращення власних моделей за допомогою людського відгуку. Цей інструмент забезпечує приємний досвід розробки, який абстрагується від складності моделей штучного інтелекту і, що важливіше, дозволяє підприємствам створювати рішення штучного інтелекту на основі власних даних без необхідності наймати дослідників штучного інтелекту або ризику витоку даних. Ми вперше працювали з Шерон і Грегом минулої осені. Відтоді у нас була можливість підтримати цю технічно досвідчену, орієнтовану на клієнта команду засновників, оскільки вони реалізовували своє амбітне бачення змінити спосіб впровадження ШІ в бізнес.

Зокрема, розгортання приватних великих мовних моделей за допомогою Lamini пропонує широкий спектр переваг порівняно з використанням публічних рішень. Наявність внутрішньої команди інженерів, яка займається процесом створення, забезпечує конфіденційність даних і забезпечує більшу гнучкість у виборі моделі та всього стеку обчислень і даних. Моделі, створені за допомогою Lamini, також зменшують артефакти, зменшують затримку, забезпечують надійну роботу та нижчі витрати порівняно зі стандартними API. Ці покращення продуктивності випливають із основних технічних ідей, які команда Lamini вбудовує в продукт на основі десятиліть досліджень і досвіду галузі щодо моделей ШІ та оптимізації GPU.

Відомі стартапи та великі підприємства вже використовують Lamini для внутрішнього розгортання великих мовних моделей і з клієнтами, і вони в захваті від швидкості налаштування, продуктивності та надійності. Ми віримо, що в майбутньому кожне підприємство використовуватиме штучний інтелект у своєму бізнесі та продуктах, але лише деякі підприємства матимуть спеціальні команди штучного інтелекту. Lamini — це стартап, який вирівнює умови гри та дає всім компаніям шанс скористатися перевагами цієї трансформаційної технології. Завдяки недавньому партнерству з Databricks підприємствам тепер легше, ніж будь-коли, запустити та запустити свої рішення ШІ, налаштувавши Lamini безпосередньо на існуючих озерах даних і обчислювальних кластерах Databricks. ——Джеймс Ву, інвестор First Round Capital; Тодд Джексон, партнер First Round Capital

13. Фабрика

Ваш «Робот» кодування

Сьогодні, якщо ви хочете, щоб комп’ютер щось робив за вас, ви повинні перекласти свої думки на «комп’ютерну мову», гіпертекстовий код, який може зрозуміти компілятор. Щоб стати інженером, треба крутити мозком, як машиною. Однак ми досягаємо переломного моменту, коли штучний інтелект може перетворити людську мову на код. Перехід від інженерів-людей до цифрових інженерів, ймовірно, стане однією з найважливіших технологічних точок перелому в нашому житті.

Ми все ще перебуваємо на ранніх етапах цієї трансформації. Такі інструменти штучного інтелекту, як BabyAGI та AutoGPT, захопили уяву громадськості. Але хоча такі помічники кодування, як Github Copilot, є покращенням, вони все ще дуже обмежені, слугуючи в основному для автоматичного завершення ідей, уже реалізованих у коді.

Фабрика різна. Компанію заснували у 2023 році колишній теоретик струн Матан Грінберг та інженер машинного навчання Іно Рейес. Коли я познайомився з Меттаном, мене одразу привернуло його бачення: майбутнє, де інженери зможуть зробити будівництво цікавим, делегуючи надокучливі завдання та зосереджуючись на складних проблемах. Для цього Матан і Іно створили автономних кодуючих «роботів».

Боти — це інженери штучного інтелекту, які виконують щоденні завдання, такі як перегляд коду, налагодження та рефакторинг. На відміну від існуючих продуктів, боти Factory не вимагають від вас жодних дій, вони можуть самостійно переглядати код, обробляти помилки та відповідати на запитання. Ви також можете використовувати ботів, як молодших розробників, використовуючи їх для мозкового штурму та обміну функціями. Роботи мають потужні механізми захисту, а їхній інтелект орієнтований на потреби користувачів, тому їм важко «галюцинувати» неправильні відповіді.

Генерація коду стане однією з найбільш трансформаційних областей революції ШІ, і Factory має всі необхідні інструменти для досягнення успіху.

*Команда. Меттан, генеральний директор Factory, є теоретиком струн у Прінстонському університеті, де він уявив сингулярності чорних дір. Іно працював інженером з машинного навчання в Hugging Face і особисто керував виснажливим процесом розробки. Це унікальна команда.

  • Практичність. Хоча роботи ще не можуть виконувати завдання так добре, як інженери-люди, вони все ще можуть виконувати завдання, які інженери ненавидять. Інженери можуть залишити нудну та повторювану роботу заводу.
  • швидкість. Лише за кілька місяців Factory зробила щось визначне. У той час як інші тільки уявляли собі інженерів зі штучного інтелекту, Матан і Іно вже їх розробляли. Вони швидко вдосконалюють цей і без того чудовий продукт.

Історія розвитку людини — це розвантаження повторюваних завдань, що дозволяє нам переходити до більш складних завдань. Коли люди винайшли сільське господарство, вони фактично розв’язали нашу здатність будувати міста. Після промислової революції ми побудували ракети, які доставили людей на Місяць. Наступне покоління бере на себе місію звільнити людей від важкої роботи в Інтернеті та просунути технологічний рубіж далі.

Коли єдиною межею є людська уява, що ми будемо будувати далі? — Маркі Вагнер, засновник і генеральний директор Delphi Labs

Перекладач: Джейн

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити