Lĩnh vực AI: Những điểm nổi bật về công nghệ và cơ hội đầu tư gần đây

Nguồn: Văn phòng dịch thuật thần thánh 36Kr

Nguồn hình ảnh: Được tạo bởi AI‌ không giới hạn

Ghi chú của biên tập viên: Công nghệ trí tuệ nhân tạo đang phát triển với tốc độ chóng mặt và có rất nhiều công ty khởi nghiệp trong lĩnh vực trí tuệ nhân tạo đã nổi bật. Trong bài viết này, chúng ta hãy cùng xem những công ty khởi nghiệp AI đầy hứa hẹn nào đã được các nhà đầu tư như Sequoia Capital và Kleiner Perkins Caufield & Byers săn đón. Bài viết này được tổng hợp và tôi hy vọng nó có thể truyền cảm hứng cho bạn.

Nếu bạn chỉ có vài phút rảnh rỗi thì đây là những công ty khởi nghiệp thú vị nhất về trí tuệ nhân tạo mà các nhà đầu tư, nhà điều hành và người sáng lập nên biết.

  • Cải thiện sức khỏe con người. Các công ty khởi nghiệp đang sử dụng công nghệ trí tuệ nhân tạo để cải thiện kết quả y tế và thiết kế các phương pháp điều trị mới. Ví dụ, công ty Alife sử dụng trí tuệ nhân tạo để cải thiện phương pháp điều trị thụ tinh trong ống nghiệm và mang đến cho bệnh nhân cơ hội thụ thai tốt hơn. Theo thời gian, cách tiếp cận của công ty về cơ bản có thể làm thay đổi cơ cấu chi phí của ngành. NewLimit là một công ty khởi nghiệp chăm sóc sức khỏe khác tận dụng công nghệ AI. Nhóm của công ty đang tìm kiếm những cách tốt hơn để điều trị những căn bệnh cứng đầu mà trước đây rất khó điều trị.
  • Hãy để trí tuệ nhân tạo phục vụ doanh nghiệp. Hầu hết các sản phẩm của AI tạo ra đều dành cho người tiêu dùng. Người dùng internet thông thường giờ đây có thể chơi với các mô hình phức tạp và tạo văn bản và hình ảnh. Một số công ty đầy triển vọng đang giải quyết các nhu cầu của doanh nghiệp một cách trực tiếp hơn, xây dựng các sản phẩm kết hợp dữ liệu nội bộ theo hướng dẫn của doanh nghiệp. Glean, Lamini, Dust và Lance là những đại diện cho xu hướng này.
  • Sử dụng AI để hạn chế AI. Cuộc cách mạng AI có thể mang đến nhiều cơ hội mới nhưng cũng sẽ mang đến nhiều mối đe dọa. Đặc biệt, AI tổng hợp giúp dễ dàng tạo các tin nhắn bằng văn bản giống như thật, tăng số lượng và mức độ phức tạp của các trò lừa đảo "lừa đảo giáo", được thiết kế để lấy thông tin cá nhân từ người nhận. Các công ty như Abnormal Security có thể sử dụng trí tuệ nhân tạo để phát hiện các tin nhắn AI độc hại nhằm ngăn chặn các cuộc tấn công như vậy. *Các công ty khởi nghiệp AI đang lan rộng khắp thế giới. Trong khi Hoa Kỳ là quê hương của nhiều gã khổng lồ trong ngành như OpenAI và Google, thì các công ty khởi nghiệp đầy triển vọng đang nổi lên trên khắp thế giới. Mistral đang xây dựng một mô hình ngôn ngữ quy mô lớn nguồn mở tại trụ sở chính ở Paris và một trong những người sáng lập của nó tin rằng họ sẽ cạnh tranh với OpenAI. Công ty Sereact của Đức cũng đã phát triển các sản phẩm robot trí tuệ nhân tạo ấn tượng và ký hợp đồng với các gã khổng lồ công nghiệp.

Trí tuệ nhân tạo là chủ đề chính của câu chuyện công nghệ năm nay. Kể từ loạt bài “Xem gì trong AI” gần đây nhất, lĩnh vực này đã tiếp tục thu hút vốn, nhân tài và sự chú ý. Tất nhiên, không phải mọi sự chú ý đều tích cực. Bất chấp sự phấn khích rộng rãi về khả năng của công nghệ, trong bốn tháng qua, các đối thủ nặng ký trong ngành đã bày tỏ mối lo ngại của họ và các cơ quan quản lý đã bắt đầu nghĩ ra một số biện pháp bảo vệ. Trong những tháng và năm tới, trí tuệ nhân tạo sẽ có tác động sâu rộng đến cuộc sống của chúng ta và tạo ra những người chiến thắng và kẻ thua cuộc mới trên toàn cầu.

Loạt bài "Xem gì" của chúng tôi được thiết kế để giúp độc giả chuẩn bị cho thời gian sắp tới và hình dung tương lai rõ ràng hơn. Đây là điểm khởi đầu tuyệt vời cho những ai muốn tìm hiểu các công nghệ mới nổi trên lĩnh vực trí tuệ nhân tạo và tận dụng những thay đổi đang diễn ra. Để làm được điều này, chúng tôi đã mời những nhà đầu tư và nhà sáng lập ấn tượng nhất trong lĩnh vực trí tuệ nhân tạo để giới thiệu những công ty khởi nghiệp mà họ tin là có triển vọng nhất.

##1. Cuộc sống

Sử dụng trí tuệ nhân tạo để cải tiến công nghệ IVF

Trong bất kỳ quá trình sinh sản nào, đều có những thời điểm đòi hỏi sự ra quyết định của con người và hai mối liên hệ phù hợp nhất với IVF là "kích thích buồng trứng" và "chọn lọc phôi".

"Kích thích buồng trứng" đề cập đến việc xác định liều lượng thuốc mà bệnh nhân nhận được để kích thích sự phát triển của nang trứng trong buồng trứng và thời điểm tiêm thuốc kích hoạt để kích thích nang trứng giải phóng trứng. Thời điểm kích hoạt là rất quan trọng; nếu quá sớm, bạn có thể nhận được trứng chưa trưởng thành; nếu quá muộn, bạn có thể nhận được trứng quá trưởng thành hoặc có thể không nhận được nhiều trứng nhất có thể.

"Lựa chọn phôi" đề cập đến việc chọn trứng đã thụ tinh nào để sử dụng và cấy ghép. Hiện tại, các bác sĩ lâm sàng và nhà phôi học, giống như hầu hết các chuyên gia y tế, đưa ra quyết định dựa trên sự kết hợp giữa kinh nghiệm và đào tạo của chính họ, hệ thống phân loại hình thái cũng như thử và sai. Nếu liều lượng hoặc thời gian không đúng trong một chu kỳ, họ sẽ điều chỉnh trong chu kỳ tiếp theo. Điều này đòi hỏi năng lực chuyên môn rất cao của bác sĩ, và tại thời điểm này, các bác sĩ có trình độ kỹ năng khác nhau và kỹ năng của họ rất quan trọng đối với kết quả. Đối với khả năng sinh sản, một thị trường bị hạn chế về nguồn cung nghiêm trọng, điều đó có nghĩa là một mức giá đắt đỏ, đặc biệt nếu bạn muốn thấy kết quả tối ưu.

Alife đang xây dựng các công cụ trí tuệ nhân tạo để cải thiện kết quả thụ tinh trong ống nghiệm (IVF). Công ty sử dụng các công cụ trí tuệ nhân tạo để cung cấp cho những người thực hành "siêu năng lực" nhằm nâng cao độ chính xác trong việc ra quyết định của họ bằng cách tận dụng các bộ dữ liệu đầu vào và kết quả khổng lồ. Giờ đây, thông qua một giao diện đơn giản, các bác sĩ có thể nhập các đặc điểm của bệnh nhân và nhận được khuyến nghị chính xác vào những thời điểm quan trọng trong hành trình sinh sản, dựa trên kết quả của hàng nghìn chu kỳ trước đó. Những bộ dữ liệu này đến từ lượng lớn thông tin bệnh nhân đã tồn tại và chúng sẽ trở nên tốt hơn khi mỗi bệnh nhân sử dụng sản phẩm của Alife.

Những công cụ này sẽ thay đổi bản chất của ngành sinh sản. Nghiên cứu của Alife cho thấy mô hình học máy của họ có thể giúp các bác sĩ tối ưu hóa 50% thời gian kích hoạt và giúp lấy lại trung bình thêm 3 quả trứng trưởng thành, 2 quả trứng đã thụ tinh và 1 phôi nữa. Các sản phẩm của Alife có thể mở rộng đáng kể khả năng tiếp cận các phương pháp điều trị vô sinh, giảm chi phí cho mỗi bệnh nhân bằng cách giảm liều lượng thuốc cần thiết và tăng tỷ lệ thành công của chu kỳ IVF. Nó cũng sẽ tạo sân chơi bình đẳng cho các bác sĩ, giúp những người thiếu kinh nghiệm trực tiếp tiếp cận được nhiều kiến thức và thông tin hơn.

Cuối cùng, bạn có thể tưởng tượng các công cụ của Alife cung cấp tất cả thông tin cho những khoảnh khắc phán xét trong một quy trình và cho phép những người hành nghề không phải bác sĩ hoạt động, thay đổi đáng kể cơ cấu chi phí và tính sẵn có của ngành. Hơn nữa, y học chính xác dựa trên dữ liệu, giúp tăng cường (hoặc cuối cùng thay thế) phán đoán của một người bằng các khuyến nghị được cá nhân hóa, không phải chỉ có trong thế giới IVF. Có hàng nghìn khoảnh khắc như thế này trong y học, nơi chúng ta có cơ hội sử dụng dữ liệu để thay đổi đáng kể kết quả và tiếp cận các quy trình và phương pháp điều trị quan trọng.

—Rebecca Kaden, đối tác chung, Union Square Ventures

##2. Lượm lặt

Tìm kiếm doanh nghiệp

Tại nơi làm việc, việc tìm kiếm chính xác thông tin bạn cần khi cần sẽ nhanh chóng và dễ dàng. Vì mọi người sử dụng nhiều ứng dụng để hoàn thành công việc của mình và kết quả là tạo ra nhiều dữ liệu và tài liệu nên điều này không phải lúc nào cũng đúng. Khi “kiến thức” phát triển theo cấp số nhân và tính chất công việc ngày càng được phân bổ rộng rãi, việc tìm kiếm kiến thức hiện có sẽ ngày càng mất nhiều thời gian hơn. Nói cách khác, việc “tìm đồ” ở nơi làm việc khá khó khăn.

Để giúp nhà tuyển dụng giải quyết vấn đề này, Arvind Jain và nhóm của ông đã xây dựng Glean, một nền tảng tìm kiếm nơi làm việc hợp nhất được hỗ trợ bởi AI. Nó trang bị cho nhân viên một trợ lý làm việc trực quan giúp họ tìm thấy chính xác những gì họ cần và chủ động khám phá những gì họ nên biết.

Sứ mệnh của công ty ngay từ đầu đã rất đơn giản: giúp mọi người tìm ra câu trả lời cho tất cả các câu hỏi tại nơi làm việc của họ nhanh hơn, ít thất vọng và lãng phí thời gian hơn. Nhưng kết quả của công ty sau đó đã mở rộng vượt xa lĩnh vực tìm kiếm. Ví dụ: Glean không chỉ tìm kiếm tất cả các ứng dụng và cơ sở kiến thức tại nơi làm việc (Slack, Teams, Google Drive, Figma, Dropbox, Coda, v.v.) mà còn hiểu ngôn ngữ và ngữ cảnh tự nhiên, dựa trên vai trò của mọi người và mối quan hệ nội bộ/bên ngoài công ty cá nhân hóa người dùng tương tác. Nó hiển thị thông tin phổ biến và được xác minh nhất của công ty bạn một cách thông minh, giúp bạn khám phá những gì nhóm của bạn biết và luôn nhất quán, tất cả đều theo cách được phép.

Khi các tổ chức trở nên phân tán hơn và kiến thức trở nên rời rạc hơn, các trợ lý làm việc trực quan như Glean không còn là một công cụ hữu dụng mà là một công cụ quan trọng để cải thiện năng suất của nhân viên. Sự tăng trưởng của công ty sẽ phá bỏ các rào cản cản trở sự tiến bộ và tạo ra trải nghiệm làm việc tích cực, hiệu quả hơn.

Ngoài ra, công nghệ tìm kiếm của Glean cho phép nó đưa AI tổng hợp vào nơi làm việc đồng thời tuân thủ các yêu cầu quản lý dữ liệu và quyền nghiêm ngặt của doanh nghiệp. Ngày nay, một trong những trở ngại chính ngăn cản các công ty đưa ứng dụng AI vào sản xuất là họ không có khả năng thực hiện các biện pháp kiểm soát quản trị phù hợp. Bằng cách chèn quyền truy cập dữ liệu theo thời gian thực vào môi trường tại chỗ của doanh nghiệp, Glean đã trở thành giải pháp lý tưởng giúp doanh nghiệp giải quyết các vấn đề quản trị trên quy mô lớn và cho phép doanh nghiệp tự tin tận dụng dữ liệu nội bộ của mình để đào tạo và suy luận mô hình, từ đó tận dụng môi trường cấp doanh nghiệp. Nền tảng dữ liệu AI/Vai trò của việc lưu trữ vector.

Theo thời gian, chúng tôi tin rằng mỗi công ty sẽ có phiên bản AI riêng có thể hiểu được các sắc thái của doanh nghiệp và nhân viên của mình. Chúng tôi tin rằng Glean đang nắm bắt cơ hội này. —Josh Coyne, Đối tác, Kleiner Perkins

3. Cây thương

Lưu trữ và quản lý dữ liệu đa phương thức

Tất cả chúng ta đều đã chơi Midjourney và hầu hết chúng ta đều đã xem bản demo của GPT-4. Midjourney (văn bản thành hình ảnh) và GPT-4 (hình ảnh thành văn bản/mã) minh họa các khả năng khi mô hình trở thành đa phương thức, kết nối giữa các dạng phương tiện khác nhau như văn bản, hình ảnh và âm thanh. Trong khi phần lớn cơn sốt AI hiện nay xoay quanh các mô hình dựa trên văn bản, thì các mô hình đa phương thức lại là chìa khóa để xây dựng những cách thể hiện chính xác hơn về thế giới.

Khi chúng ta bắt tay vào làn sóng ứng dụng AI tiếp theo trong các ngành như robot, chăm sóc sức khỏe, sản xuất, giải trí và quảng cáo, ngày càng có nhiều công ty sẽ xây dựng trên các mô hình đa phương thức. Các công ty như Runway và Flair.ai là những ví dụ điển hình về những công ty dẫn đầu mới nổi trong lĩnh vực của họ đã nhận thấy nhu cầu lớn của người dùng đối với sản phẩm của họ, trong khi các công ty hiện tại như Google đã bắt đầu phát hành các khả năng đa phương thức tương tự.

Tuy nhiên, sử dụng mô hình đa phương thức đặt ra một thách thức: làm thế nào để lưu trữ và quản lý dữ liệu? Các định dạng lưu trữ truyền thống như Parquet không được tối ưu hóa cho dữ liệu phi cấu trúc, do đó, các nhóm mô hình ngôn ngữ lớn gặp phải hiệu suất chậm khi tải, phân tích, đánh giá và gỡ lỗi dữ liệu. Ngoài ra, quy trình làm việc của mô hình ngôn ngữ lớn dễ mắc lỗi hơn do thiếu một nguồn thông tin chính xác duy nhất. Lance là công ty mới nhất ra đời để giải quyết thách thức này. Các công ty như Midjourney và WeRide đang chuyển đổi các tập dữ liệu có quy mô petabyte sang định dạng Lance, mang lại những cải tiến đáng kể về hiệu suất và chi phí lưu trữ gia tăng thấp hơn nhiều so với các định dạng truyền thống như Parquet và TFRecords.

Lance không dừng lại ở việc lưu trữ, họ nhận thấy nhu cầu xây dựng lại toàn bộ hệ thống quản lý dữ liệu của mình để phù hợp hơn với thế giới mà chúng ta đang hướng tới, nơi dữ liệu đa phương thức, phi cấu trúc sẽ trở thành tài sản quý giá nhất của doanh nghiệp. Sản phẩm nền tảng đầu tiên của họ, LanceDB (hiện đang ở giai đoạn thử nghiệm riêng tư), cung cấp trải nghiệm nhúng liền mạch cho các nhà phát triển muốn xây dựng chức năng đa phương thức vào ứng dụng của họ.

Lance chỉ là một ví dụ về cách các công ty đưa các nhà phát triển vào một tương lai đa phương thức và tôi rất vui mừng khi thấy các công nghệ khác xuất hiện để thúc đẩy các ứng dụng đa phương thức. Với sự phát triển của trí tuệ nhân tạo, sẽ không lâu nữa, tương lai như vậy sẽ trở thành hiện thực. --Saar Gur, Đối tác chung, CRV

4. Bảo mật bất thường

Chứa làn sóng tấn công mạng được tăng cường bởi AI

Tôi là một người lạc quan không hề nao núng khi nói đến AI sáng tạo, nhưng tôi không hề ngây thơ về chủ đề này. Ví dụ: tôi lo ngại về sự gia tăng của các cuộc tấn công "kỹ thuật xã hội" như lừa đảo trực tuyến, thường sử dụng email để trích xuất thông tin nhạy cảm. Kể từ khi ChatGPT trở nên phổ biến vào năm ngoái, tỷ lệ các cuộc tấn công như vậy đã tăng lên đáng kể.

Trong năm qua, số vụ tấn công trên 1.000 người đã tăng từ dưới 500 lên hơn 2.500, theo Abnormal Security. Mức độ tinh vi của các cuộc tấn công cũng tăng lên đáng kể. Giống như bất kỳ học sinh nào cũng có thể sử dụng ChatGPT để viết một bài luận hoàn hảo, ChatGPT cũng có thể được sử dụng để gửi các tin nhắn lừa đảo được cá nhân hóa một cách nguy hiểm, hoàn hảo về mặt ngữ pháp.

Theo FBI, các cuộc tấn công "thỏa hiệp email doanh nghiệp" có chủ đích như vậy đã gây thiệt hại hơn 50 tỷ USD kể từ năm 2013. Và nó sẽ trở nên tồi tệ hơn. Hàng ngày, vô số tội phạm mạng và những kẻ xấu khác khai thác các công cụ mũ đen như “WormGPT”, một chatbot được thiết kế để khai thác dữ liệu phần mềm độc hại nhằm dàn dựng các chiến dịch lừa đảo quy mô lớn và thuyết phục nhất để tiến hành các hoạt động lừa đảo.

May mắn thay, những người đồng sáng lập Abnormal Evan Reiser và Sanjay Jeyakumar đang nỗ lực sử dụng trí tuệ nhân tạo để chống lại mối đe dọa này. Bạn có thể coi đây là việc sử dụng AI để chống lại AI. Trước đây, các hệ thống bảo mật email đã quét các dấu hiệu của hành vi xấu đã biết, chẳng hạn như địa chỉ IP cụ thể hoặc các nỗ lực truy cập thông tin nhận dạng cá nhân (PII).

Khai thác sức mạnh của trí tuệ nhân tạo, Abnormal lật đổ tất cả những điều này. Bởi vì nhiều cuộc tấn công có vẻ hợp pháp nhờ trí tuệ nhân tạo, nên cách tiếp cận của Abnormal là hiểu đầy đủ về hành vi tốt đã biết để thậm chí có thể nhận thấy những sai lệch nhỏ nhất. Công ty sử dụng các mô hình ngôn ngữ quy mô lớn để xây dựng các mô tả chi tiết về hoạt động bên trong và bên ngoài kỹ thuật số của mình, chẳng hạn như ai thường nói chuyện với nhau và nội dung nào họ có khả năng tương tác xung quanh. Nếu đối tác Reid Hoffman của tôi gửi cho tôi một email và nói: "Này, vui lòng gửi cho tôi thông tin mới nhất về Inflection.AI." Công cụ AI của Abnormal sẽ nhanh chóng tìm ra. , Reed hiếm khi bắt đầu bằng "hey", hiếm khi gửi một câu nào, và anh ấy chưa bao giờ yêu cầu tôi gửi cho anh ấy một tập tin về Inflection.AI. (Là người đồng sáng lập và thành viên hội đồng quản trị của công ty, anh ấy có nhiều quyền truy cập vào những tài liệu này hơn tôi!).

Không có gì đáng ngạc nhiên khi mối lo ngại về bảo mật xung quanh AI tiếp tục gia tăng, nhu cầu khách hàng doanh nghiệp của Abnormal cũng tăng nhanh. Tôi nghĩ rằng thành công của Abnormal rất đáng hài lòng vì nó có thể tận dụng AI một cách nhanh chóng để giải quyết các vấn đề đang được AI đẩy nhanh. Trong thời kỳ thay đổi công nghệ mang tính đột phá, những kẻ xấu thường có được lợi thế lâu dài của người đi đầu. Suy cho cùng, họ có thể tận dụng sự đổi mới mà không cần phải lo lắng về chất lượng sản phẩm, độ an toàn hay các cơ quan quản lý vẫn chưa ban hành luật mới.

Đồng thời, dễ hiểu là các công ty khởi nghiệp công nghệ đang tập trung vào việc phát triển những trường hợp sử dụng mới hiệu quả cho những đổi mới của họ thay vì ngăn chặn những đổi mới bất hợp pháp hoặc mang tính đột phá. Nhưng giống như tất cả các vấn đề liên quan đến trí tuệ nhân tạo, thiệt hại mạng mà việc lạm dụng trí tuệ nhân tạo có thể gây ra là rất đáng kinh ngạc. Nhờ tầm nhìn xa của nhóm Abnormal, tình trạng bình thường mới của tội phạm mạng ít nhất có thể ít xảy ra hơn. —Sam Motamedi, Đối tác, Greylock

##5. Bụi

Trao quyền cho người lao động tri thức

Rõ ràng là các mô hình ngôn ngữ lớn sẽ nâng cao hiệu quả làm việc của người lao động tri thức. Nhưng không rõ chính xác điều đó sẽ được thực hiện như thế nào. Dust đang cố gắng tìm ra điều đó. Người quản lý tri thức sẽ không giúp được gì nhiều trong doanh nghiệp nếu họ không thể truy cập dữ liệu nội bộ. Vì vậy, Dust đã xây dựng một nền tảng lập chỉ mục, nhúng và cập nhật dữ liệu nội bộ của doanh nghiệp theo thời gian thực (Notion, Slack, Drive, GitHub) và hiển thị dữ liệu đó cho các sản phẩm được cung cấp bởi các mô hình ngôn ngữ lớn.

Những người đồng sáng lập Dust là Gabriel Hubert và Stanislas Polu đã bán công ty cho Stripe và làm việc ở đó trong 5 năm. Họ đã tận mắt chứng kiến các công ty đang phát triển nhanh chóng phải vật lộn với quy mô như thế nào. Họ đã tận mắt chứng kiến cái gọi là "nợ thông tin" và hiện họ đang tập trung vào việc áp dụng các mô hình ngôn ngữ lớn để giải quyết một số điểm yếu chính liên quan đến nó. Hiện tại, Dust đang khám phá các ứng dụng sau trên nền tảng của mình:

  • Công cụ trả lời. Sự nhấn mạnh là tính thực tế vì đây là chìa khóa để áp dụng rộng rãi.
  • Tạo trợ lý. Cung cấp trợ giúp theo mẫu khi tạo nội dung. Ví dụ: tạo các đoạn văn bị thiếu dựa trên dữ liệu nội bộ. *Tài liệu được cập nhật tự động. Bất cứ khi nào có thông tin trong công ty cần cập nhật tài liệu, chủ sở hữu tài liệu sẽ nhận được thông báo và đề xuất.
  • Trích xuất sự kiện có cấu trúc. Người dùng có thể tạo các sự kiện có cấu trúc từ dữ liệu phi cấu trúc (chẳng hạn như các luồng Slack) dựa trên các mẫu được xác định trước.
  • Giám sát dữ liệu nội bộ. Giám sát dữ liệu doanh nghiệp bằng các quy tắc thông minh. Ví dụ: nhận cảnh báo nếu thông tin nhận dạng cá nhân (PII) vô tình xuất hiện ở nơi không nên xuất hiện.

Mặc dù có rất nhiều nội dung nhưng những người sáng lập Dust tin rằng hầu hết các luồng dữ liệu này cuối cùng sẽ hội tụ thành một sản phẩm thống nhất. Họ vẫn đang trong giai đoạn đầu khám phá và đang hình thành bức tranh cuối cùng về Bụi. Dựa trên những lần lặp lại ban đầu, họ tin rằng họ đã xác nhận được giả thuyết cốt lõi của mình: rằng khả năng của những người lao động tri thức có thể được tăng cường (chứ không phải bị thay thế) bằng các mô hình ngôn ngữ quy mô lớn và rằng một 'hệ điều hành nhóm' mới có thể được xây dựng dựa trên cái này. --Konstantine Buhler, đối tác tại Sequoia Capital

6. Hộp nhãn

Cung cấp dữ liệu kinh doanh

“Sự trỗi dậy của dữ liệu lớn” đã diễn ra trong hơn 20 năm và mặc dù các công ty liên tục thu thập nhiều dữ liệu hơn bao giờ hết, nhiều công ty vẫn gặp khó khăn trong việc sử dụng dữ liệu này để hiểu rõ hơn về các mô hình trí tuệ nhân tạo. Xử lý và giải thích dữ liệu vẫn là phần tẻ nhạt và tốn kém nhất của quy trình AI, nhưng cũng là phần quan trọng nhất để mang lại kết quả chất lượng cao. Ngay cả với sự gia tăng của các mô hình ngôn ngữ lớn được đào tạo trước, các công ty vẫn sẽ cần tập trung vào việc sử dụng dữ liệu độc quyền của riêng họ (trên nhiều phương thức) để tạo ra AI tổng hợp có vị trí độc đáo nhằm cung cấp các dịch vụ và hiểu biết khác biệt, đồng thời cải thiện hiệu quả hoạt động.

Hộp nhãn giải quyết thách thức này bằng cách đơn giản hóa cách doanh nghiệp cung cấp bộ dữ liệu vào mô hình AI. Nó giúp các nhóm dữ liệu và máy học tìm thấy dữ liệu phù hợp, xử lý và diễn giải dữ liệu đó, đưa mô hình vào ứng dụng, đồng thời liên tục đo lường và cải thiện hiệu suất.

Nền tảng mới của Labelbox tận dụng trí tuệ nhân tạo tổng hợp. Model Foundry cho phép các nhóm thử nghiệm nhanh chóng các mô hình nền tảng AI từ tất cả các nhà cung cấp nguồn mở và đóng lớn, cho phép họ gắn nhãn trước cho dữ liệu và thử nghiệm nhanh chóng chỉ bằng vài cú nhấp chuột. Bằng cách này, họ có thể hiểu mô hình nào hoạt động tốt nhất trên dữ liệu của họ. Model Foundry tự động tạo số liệu hiệu suất chi tiết cho mỗi lần chạy thử nghiệm trong khi lập phiên bản kết quả.

Tác động có thể sâu rộng. Theo truyền thống, con người phải mất nhiều ngày để hoàn thành một nhiệm vụ đơn giản nhưng tốn thời gian, chẳng hạn như phân loại danh sách thương mại điện tử chứa nhiều đoạn văn bản. Với GPT-4, nhiệm vụ này có thể được hoàn thành trong vòng vài giờ. Model Foundry cho phép các công ty tự khám phá những cách hiệu quả này.

Đây không phải là ví dụ duy nhất. Kết quả ban đầu cho thấy hơn 88% nhiệm vụ ghi nhãn có thể được tăng tốc bằng một hoặc nhiều mô hình cơ sở. Hộp nhãn cho phép mọi người gắn nhãn trước dữ liệu chỉ bằng vài cú nhấp chuột mà không cần mã hóa và nhập dữ liệu vào mô hình. Công cụ này được thiết kế để trao quyền cho các nhóm cộng tác làm việc và tận dụng kiến thức chuyên môn đa chức năng để duy trì việc giám sát thủ công việc đảm bảo chất lượng dữ liệu. Khả năng này dân chủ hóa quyền truy cập vào trí tuệ nhân tạo bằng cách cho phép các chuyên gia mô hình ngôn ngữ và các doanh nghiệp vừa và nhỏ dễ dàng đánh giá các mô hình, làm phong phú bộ dữ liệu và cộng tác để xây dựng các ứng dụng thông minh.

Labelbox được chứng minh là giúp giảm đáng kể chi phí và cải thiện chất lượng mô hình cho các công ty lớn nhất thế giới, bao gồm Walmart, Procter & Gamble, Genentech và Adobe.

Hiện nay, các doanh nghiệp đang cạnh tranh để giải phóng sức mạnh của các mô hình cơ bản này trên dữ liệu độc quyền của mình nhằm giải quyết các vấn đề kinh doanh. Chúng tôi mong muốn được xem Labelbox sẽ giúp các doanh nghiệp khai thác dữ liệu như thế nào để cung cấp những sản phẩm tốt hơn với hiệu quả cao hơn. --Robert Kaplan, Đối tác, SoftBank

##7. Đường băng

Bộ sáng tạo mới

Trí tuệ nhân tạo có mặt ở khắp mọi nơi và ngày càng trở thành một loại hàng hóa. Trong hầu hết các trường hợp, các công ty sử dụng AI làm chatbot để làm phong phú thêm các ứng dụng hiện có. Rất ít ứng dụng AI đang đổi mới trải nghiệm sản phẩm, sử dụng công nghệ này để thay đổi căn bản cách chúng ta tương tác với sản phẩm, giống như công cụ tìm kiếm của Google đã thay đổi cách chúng ta duyệt Internet hoặc Instagram đã thay đổi cách chúng ta chia sẻ ảnh từ điện thoại. Những ứng dụng AI này đòi hỏi sự hiểu biết sâu sắc về trải nghiệm người dùng hiện tại, tư duy sản phẩm có tầm nhìn xa và công nghệ tiên tiến.

Runway là ví dụ điển hình về một công ty sử dụng nghiên cứu ứng dụng AI để hình dung lại trải nghiệm sáng tạo và xây dựng bộ sản phẩm sáng tạo hoàn toàn mới.

  • Hiểu biết sâu sắc về trải nghiệm người dùng. Người sáng lập Cristobal Valenzuela, Anastocation Germanidis và Alejandro Matamara-Ortiz Alejandro Matamala-Ortiz là nhà nghiên cứu chuyên ngành viễn thông tương tác tại Đại học New York và có nhiều năm kinh nghiệm thiết kế. Nhóm tại Runway hiểu hệ sinh thái công cụ sáng tạo từ trải nghiệm trực tiếp và những rào cản đối với việc áp dụng đại trà. Ví dụ, sản xuất phim sáng tạo thường đòi hỏi máy móc đắt tiền, tài nguyên phần mềm và trình độ đào tạo cao. Kết quả là, việc làm phim sáng tạo trước đây thường tập trung ở các hãng phim lớn. Runway nhận thấy cơ hội mở rộng và cải thiện khả năng tiếp cận của các công cụ sáng tạo cần thiết.
  • Tư duy sản phẩm có tầm nhìn xa. Runway đã sớm nhận ra rằng một bước ngoặt trong trí tuệ nhân tạo có thể cải thiện đáng kể trải nghiệm người dùng, không chỉ nâng cao các công cụ sáng tạo hiện có mà còn thay đổi căn bản cách thức hoạt động của các công cụ đó. Ví dụ: người dùng có thể tạo nội dung video hoàn toàn mới từ đầu bằng cách sử dụng lời nhắc văn bản đơn giản. Điều quan trọng là video này ở cấp độ chuyên nghiệp và có thể được chia sẻ qua máy tính để bàn hoặc thiết bị di động. Bất kể trình độ kỹ năng, nền tảng hoặc tài nguyên, Runway có thể tiết kiệm hàng giờ hoặc hàng ngày công sức chỉnh sửa. Đây là một sản phẩm có tầm nhìn xa giúp biến những lời nhắc nhở đơn giản thành cuộc sống sống động và cảm động.
  • Chuyên gia công nghệ trí tuệ nhân tạo hàng đầu. Runway không chỉ giải quyết vấn đề bằng một sản phẩm có tầm nhìn xa, họ còn tái tạo lại cơ sở hạ tầng nghiên cứu và công nghệ cơ bản. Tổ chức nghiên cứu nội bộ của Runway đang dẫn đầu về mạng lưới thần kinh sâu để tổng hợp hình ảnh và video. Công ty đã phát triển Gen-2, một mô hình video trí tuệ nhân tạo đa phương thức mạnh hơn bất kỳ mô hình nào hiện có trên thị trường. Đây là mô hình đại chúng đầu tiên có khả năng chuyển đổi văn bản thành video. Trước đó, Runway đã phát hành Gen-1, một mô hình dẫn đến sự thay đổi mô hình trong các công cụ tạo video tạo ra đầu ra chất lượng cao. Các nhà nghiên cứu của Runway cũng đi tiên phong trong mô hình Chuyển văn bản thành hình ảnh Ổn định.

Kể từ tháng 10 năm 2022, Runway đã phát triển hơn 30 “công cụ thần kỳ” AI bao gồm video, hình ảnh, 3D và văn bản, phục vụ mọi khía cạnh của quá trình sáng tạo, từ tiền sản xuất đến hậu sản xuất. Cơ sở khách hàng của họ bao gồm các công ty Fortune 500 và Global 2000 như The Late Show with Stephen Colbert của CBS, New Balance, Harbor Picture Video, Publicis) và Google. Nền tảng này cũng đã được sử dụng để chỉnh sửa các bộ phim được đề cử giải Oscar như bộ phim đình đám của Hollywood Everything Everywhere All at Once.

Các ứng dụng AI thú vị nhất sẽ biến đổi trải nghiệm sản phẩm hiện có và suy nghĩ lại cách người dùng tương tác với sản phẩm. Với Runway, người dùng có thể hoàn thành việc tạo video mới trong vài giây, cho dù họ đang quay video lần đầu hay đang ở trong studio một cách chuyên nghiệp. Đây là một sự thay đổi mang tính cách mạng và là một ví dụ về cách trí tuệ nhân tạo đang định hình lại các ngành công nghiệp khác nhau. —Grace Isford, đối tác tại Lux Capital

8. Giới hạn mới

Định hình lại số phận tế bào

Tế bào là hệ thống máy tính phức tạp nhất trên Trái đất. Giống như chip máy tính, DNA bao gồm các đơn vị cơ bản tạo ra các chức năng phức tạp. Không giống như mã dựa trên bit, mã dựa trên nguyên tử là ngẫu nhiên và có thứ bậc. Hệ thống này phụ thuộc vào hệ thống khác, hệ thống này lại phụ thuộc vào hệ thống vật lý khác, mỗi hệ thống bị ảnh hưởng bởi nhiệt, tính axit và các phân tử trong môi trường vi mô của tế bào.

Bất chấp sự phụ thuộc lẫn nhau này, mã máy di động (DNA) vẫn có thể chạy các chương trình khác nhau một cách hiệu quả. Mặc dù tế bào gan và tế bào da của bạn chứa cùng một bộ gen, nhưng các loại tế bào này trông, cảm nhận và hoạt động khác nhau. Tại sao? Bởi vì họ đang thực hiện các chương trình biểu sinh khác nhau.

Năm 2006, Takahashi và cộng sự đã sử dụng sự kết hợp của bốn protein yếu tố phiên mã (TF) để tái lập trình các tế bào trưởng thành thành tế bào gốc, đi tiên phong trong lĩnh vực tái lập trình biểu sinh. Các yếu tố phiên mã là các protein điều hòa gen, về cơ bản làm thay đổi “chương trình” đang chạy. Khám phá của Takahashi và Yamanaka đã dẫn đến việc tạo ra các tế bào gốc đa năng cảm ứng (iPSC) và mang lại cho chúng giải thưởng Nobel. Kể từ đó, nhiều nhóm nghiên cứu đã bắt đầu áp dụng các kết hợp TF độc đáo để thay đổi trạng thái tế bào, trẻ hóa các tế bào bị tổn thương và khôi phục các kiểu hình tế bào trẻ trung.

Mặc dù việc lập trình lại biểu sinh ngày càng trở nên dễ thực hiện hơn nhưng đó vẫn không phải là vấn đề tầm thường. Nhóm nghiên cứu phải phân biệt sự kết hợp TF nào có hiệu quả trong việc chuyển các tế bào từ trạng thái A sang trạng thái B mong muốn. Ví dụ, sự kết hợp TF trong tương lai có thể cho phép chúng ta chuyển đổi tế bào bệnh thành tế bào khỏe mạnh, từ đó phát triển một nhóm thuốc mới. Chúng ta cần các màn hình lập trình lại quy mô rất lớn vì sự kết hợp chính xác của các TF không được biết đến trong nhiều lĩnh vực ứng dụng. Có hơn 1.500 TF của con người bản địa, vì vậy cần có một phương pháp tìm kiếm hiệu quả hơn. Chúng tôi tin rằng NewLimit đang thiết kế một cách tiếp cận như vậy.

Được hỗ trợ bởi những tiến bộ trong công nghệ giải trình tự tế bào đơn và máy học, NewLimit đang chuyển đổi kỷ luật thủ công trước đây thành khoa học dựa trên dữ liệu. Công ty có sự phân công lao động lành mạnh giữa các nhà sinh học phân tử và nhà sinh học tính toán, đặt nền tảng văn hóa cần thiết để xây dựng một nền tảng khép kín ngày càng hiệu quả. Kết hợp kiến thức chuyên môn và các chỉ số đa phương thức (scRNA-Seq, scATAC-Seq, v.v.), NewLimit nhằm mục đích khám phá các công cụ tái tạo trị liệu để điều trị các bệnh khó chữa trước đây.

Trong mỗi vòng thử nghiệm, NewLimit sử dụng công nghệ ngôn ngữ máy để:

  • Kết hợp và nén nhiều chỉ số phát hiện vào không gian tối ưu hóa chiều thấp chứa trạng thái hiện tại A và trạng thái B mong muốn của ô.
  • Liệt kê các kết hợp TF mới dọc theo không gian tối ưu hóa có thể đẩy đơn vị đến trạng thái mong muốn.
  • Đề xuất loại dữ liệu nào sẽ giúp cải thiện mô hình và thời điểm/ở đâu áp dụng các phương pháp thử nghiệm đắt tiền hơn, thông lượng thấp hơn.
  • Đề xuất những thay đổi cần thực hiện đối với nền tảng để tối đa hóa thông tin hữu ích được tạo ra cho mỗi đô la chi tiêu.

Ngoài đội ngũ xuất sắc, năng lực kỹ thuật và tầm nhìn đầy tham vọng, chúng tôi còn ngưỡng mộ tinh thần thực dụng của NewLimit. Mặc dù công ty chưa chia sẻ công khai thông tin chi tiết về chiến lược kinh doanh ban đầu của mình nhưng chúng tôi tin rằng cách tiếp cận này là sáng tạo, giảm thiểu rủi ro một cách hợp lý và có tiềm năng mang lại sự biến đổi cho nhân loại. Nhóm sáng lập đồng ý rằng công nghệ sinh học nền tảng có thể được ví như các dự án khoa học tốn kém mà không tạo ra tài sản ngắn hạn. Để đạt được mục tiêu này, NewLimit đã minh bạch và lập danh mục tiến bộ công nghệ của mình kể từ khi thành lập.

Chúng ta nên khiêm tốn trước sự phức tạp của thiên nhiên. Chắc chắn là sinh học khó lập trình hơn các thiết bị silicon mà chúng ta tự thiết kế. Mục tiêu của Dimension là trao quyền cho những doanh nhân tiên phong như NewLimit khám phá ranh giới khả năng ở giao diện giữa công nghệ và sinh học. —Simon Barnett, Giám đốc nghiên cứu, Dimension

##9. Bên hồ bơi

Trí tuệ nhân tạo cơ bản để phát triển phần mềm

OpenAI tập trung vào trí tuệ nhân tạo nói chung, DeepMind tập trung vào khám phá khoa học và trường hợp sử dụng cơ bản thứ ba của trí tuệ nhân tạo là hiểu và tạo ra phần mềm.

GPT-4 đã ăn sâu vào quy trình làm việc của cả nhà phát triển có kinh nghiệm và người mới làm quen. Nhưng sự thay đổi mô hình này vẫn còn ở giai đoạn sơ khai. Ngoại suy từ vài tháng qua, lập trình được hỗ trợ bởi AI sẽ sớm trở nên phổ biến. Khi xu hướng này phát triển hơn nữa, ngôn ngữ tự nhiên sẽ trở thành nền tảng trừu tượng để xây dựng phần mềm.

Mặc dù các công ty khác đã phát hành các mô hình mã thuần túy quy mô lớn như StarCoder, nhưng vẫn chưa có phương pháp nào đạt được hiệu suất của GPT-4. Tôi nghĩ điều này là do một mô hình chỉ được đào tạo về mã không thể tạo ra khả năng phát triển phần mềm mạnh mẽ. Đó là cách tôi gặp Poolside. Công ty được thành lập bởi Jason Warner, cựu giám đốc công nghệ của GitHub và Eiso Kant, cựu sáng lập của source{d}, công ty nghiên cứu mã trí tuệ nhân tạo đầu tiên trên thế giới.

Poolside độc đáo ở chỗ họ áp dụng cách tiếp cận mô hình cơ sở OpenAI nhưng chỉ tập trung vào một chức năng: tạo mã. Chiến lược công nghệ của họ xoay quanh thực tế là mã có thể được thực thi, cho phép phản hồi ngay lập tức và tự động trong quá trình học tập. Điều này cho phép học tăng cường thông qua thực thi mã, một giải pháp thay thế hấp dẫn cho học tăng cường dựa trên phản hồi của con người (RLHF). Đây là điều mà Esso bắt đầu khám phá từ đầu năm 2017.

Mặc dù tiềm năng của trí tuệ nhân tạo tổng hợp (AGI) mang lại lợi ích cho nhân loại là không thể phủ nhận, nhưng việc hiện thực hóa nó vẫn còn rất xa. Vậy tại sao phải đợi AGI? Bằng cách tập trung vào các lĩnh vực cụ thể để phát triển AI, chẳng hạn như phát triển phần mềm, chúng ta có thể dỡ bỏ nhiều rào cản hơn đối với sự sáng tạo. Tôi mong chờ ngày nhóm Poolside hiện thực hóa tầm nhìn của mình về việc xây dựng mô hình cơ sở hạ tầng phần mềm chuyên dụng. --Matan Grinberg, đồng sáng lập và CEO của Factory

##10. Mistral

Đối thủ của OpenAI ở Pháp

Gần đây, Paris đã được chiếu sáng bởi sự bùng nổ của các dự án trong lĩnh vực trí tuệ nhân tạo sáng tạo. Có lẽ bạn sẽ hỏi tại sao? Tôi nghĩ rằng Paris có nguồn tài năng đẳng cấp thế giới lớn nhất về AI sáng tạo nằm ngoài phạm vi sự kiện của OpenAI. Trong số những dự án này, táo bạo nhất chắc chắn là Mistral. Mistral được thành lập bởi Guillaume Lample, Arthur Mensch và Timothe Lacroix với sứ mệnh xây dựng các mô hình ngôn ngữ nguồn mở tốt nhất, mục tiêu là xây dựng một hệ sinh thái thịnh vượng xung quanh các mô hình này.

Tôi đã biết Guillaume được bốn năm và cả hai chúng tôi đều quan tâm sâu sắc đến việc áp dụng các mô hình ngôn ngữ lớn vào các lĩnh vực toán học, đặc biệt là toán hình thức. Khi làm việc tại OpenAI và Meta, chúng tôi đã phát triển mối quan hệ cạnh tranh thân thiện. Guillaume là một trong những nhà nghiên cứu tài năng nhất mà tôi từng hân hạnh được làm việc cùng và tôi có vinh dự được chứng kiến anh ấy đi từ nghiên cứu tại Meta đến thành lập Mistral. Trong quá trình đó, tôi cũng đã gặp Arthur Mensch. Tôi luôn bị ấn tượng bởi công việc của anh ấy, đặc biệt là Chinchilla, công trình đã xác định lại ý nghĩa của việc đào tạo các mô hình ngôn ngữ lớn một cách hiệu quả và RETRO, một cách tiếp cận mô hình hóa ngôn ngữ tăng cường truy xuất mà tôi có thể nói là vẫn chưa được khám phá đầy đủ.

Bây giờ, hãy cùng tìm hiểu xem điều gì tạo nên Mistral Mistral. Tầm nhìn của công ty khởi nghiệp là xây dựng một hệ sinh thái dựa trên mô hình nguồn mở tốt nhất. Hệ sinh thái này sẽ đóng vai trò là bệ phóng cho các dự án, nhóm và công ty, đẩy nhanh tốc độ đổi mới và sử dụng sáng tạo các mô hình ngôn ngữ lớn.

Lấy học tập tăng cường dựa trên phản hồi của con người (RLHF) làm ví dụ. Thông thường, việc thực hiện RLHF tốn nhiều thời gian và do đó tốn kém. Nó liên quan đến việc "gắn cờ" thủ công các hành động AI, có thể đòi hỏi nhiều công sức. Nỗ lực sẽ chỉ có giá trị nếu hứa hẹn về một mô hình AI đủ tốt. Đối với một doanh nghiệp lớn như OpenAI, việc đầu tư vào quy trình này là điều hợp lý và công ty có đủ nguồn lực để biến điều đó thành hiện thực. Nhưng các cộng đồng nguồn mở truyền thống thường cần một “người lãnh đạo” đứng ra đảm nhận trách nhiệm quan trọng này.

Mistral có cơ hội làm điều đó bằng cách đầu tư vào mô hình nguồn mở cho RLHF. Khi làm như vậy, Mistral sẽ mở ra cánh cửa cho sự bùng nổ đổi mới trong kỷ Cambri. Các nhà phát triển nguồn mở sẽ có quyền truy cập vào các mô hình được gắn nhãn rõ ràng mà họ có thể điều chỉnh và tùy chỉnh cho các nhu cầu khác nhau. Người chiến thắng cuối cùng sẽ là thị trường rộng lớn hơn và chúng tôi sẽ có quyền truy cập vào các trường hợp sử dụng cụ thể và hấp dẫn hơn so với việc một công ty đóng cửa có thể sản xuất một mình.

Ai có mô hình nguồn mở tốt nhất sẽ thu hút được nhiều sự quan tâm và giá trị hơn. Tôi lạc quan về Mistral vì nhóm đang tích cực nâng cao giới hạn hiệu quả/hiệu suất. Đồng thời, tài năng của Mistral trong lĩnh vực này cho đến nay là tốt nhất thế giới.

Mistral đã đảm bảo được đội ngũ và nguồn lực để thực hiện tầm nhìn ban đầu này. Công ty cũng đã tìm được đối tác để đánh giá các mô hình này trong các trường hợp sử dụng ở cấp doanh nghiệp. Hãy để mắt tới Mistral, họ đã sẵn sàng đối đầu với OpenAI. --Stanislas Polu, người đồng sáng lập Dust

##11. Sereact

Robot công nghiệp thông minh hơn

Chúng ta thường nghe những dự đoán rằng về lâu dài, trí tuệ nhân tạo và robot sẽ tăng cường hoặc tự động hóa các nhiệm vụ của con người. Ngày nay, điều này ngày càng trở thành một yêu cầu cấp thiết trong kinh doanh.

Đến năm 2030, dân số trong độ tuổi lao động của châu Âu dự kiến sẽ giảm 13,5 triệu người và chi phí lao động đang tăng với tốc độ nhanh nhất trong hơn 20 năm. Với sự phát triển của thương mại điện tử, kho hàng chịu nhiều áp lực hơn bao giờ hết và việc duy trì tính cạnh tranh của các doanh nghiệp ngày càng trở nên thách thức.

55% chi phí vận hành kho đến từ việc chọn đơn hàng, nhưng tình hình không mấy lạc quan đối với các công ty đang muốn chuyển sang hệ thống tự động. Không có ứng dụng hào nhoáng nào mà chúng tôi quen thuộc trong SaaS (phần mềm dưới dạng dịch vụ) do AI dẫn đầu hoặc vô số sản phẩm nguồn mở mà chúng tôi thấy trong các phần khác của hệ sinh thái, vẫn chưa được áp dụng cho chế tạo robot.

Thay vào đó, các doanh nghiệp muốn tự động hóa việc lấy hàng và đóng gói phải đối mặt với việc lựa chọn các giải pháp robot kém linh hoạt, đắt tiền. Họ phải điều hướng một loạt các giao diện độc quyền đòi hỏi thời gian và chuyên môn lập trình đáng kể. Các hệ thống này cũng gặp khó khăn trong việc đối phó với việc thay đổi tổ hợp sản phẩm, yêu cầu sự can thiệp thường xuyên của con người và hoạt động kém khi xử lý các tình huống khắc nghiệt.

Bí mật giải quyết những vấn đề này. Phần mềm của nó dựa trên môi trường mô phỏng mạnh mẽ, huấn luyện cánh tay robot để hiểu được các sắc thái không gian và vật lý của bất kỳ môi trường thực tế tiềm năng nào. Sau khi triển khai, hệ thống sẽ được tối ưu hóa bằng cách liên tục học hỏi từ dữ liệu trong thế giới thực. Điều đó cũng có nghĩa là họ có thể giải quyết thách thức trong việc lấy các mặt hàng truyền thống khó khăn như đồ điện tử, dệt may, trái cây, gạch ngói và gỗ.

Điều thú vị nhất là hệ thống robot của họ sử dụng các mô hình ngôn ngữ lớn để cho phép robot điều khiển ngôn ngữ tự nhiên một cách trực quan. Họ đã phát triển một mô hình chuyển đổi có tên "PickGPT" cho phép người dùng đưa ra hướng dẫn và phản hồi cho robot thông qua giọng nói hoặc văn bản. Bằng cách này, bất kỳ ai cũng có thể yêu cầu robot thực hiện một nhiệm vụ mong muốn, bất kể trình độ hiểu biết kỹ thuật của họ như thế nào.

Secret kết hợp hai lĩnh vực chuyên môn của những người đồng sáng lập. Giám đốc điều hành Ralf Gulde đã làm việc ở lĩnh vực giao thoa giữa trí tuệ nhân tạo và robot, trong khi CTO Marc Tusher chuyên về học sâu. Cặp đôi này đã tiến hành nghiên cứu được bình duyệt về các chủ đề này tại Đại học Stuttgart, một trong những trường đại học danh tiếng nhất của Đức về tự động hóa và sản xuất công nghiệp.

Mặc dù là một công ty trẻ nhưng Sereact đã thu hút được một danh sách đối tác ấn tượng, bao gồm Daimler Truck, Schmalz, Zenfulfillment, Zimmer Group) và Material Bank. Điều này chỉ ra rằng có một cơ hội thị trường tiềm năng rất lớn trong ngành chọn lọc và đóng gói.

Ngoài các trường hợp sử dụng rõ ràng trong kho thương mại điện tử, cho dù là lấy đơn hàng hay mở hộp, còn có nhiều trường hợp sử dụng khác. Ví dụ, trong sản xuất truyền thống, có một quy trình tốn nhiều thời gian gọi là lắp ráp, bao gồm việc thu thập các bộ phận tinh vi cần thiết để lắp ráp một cách tỉ mỉ. Cánh tay robot trong lịch sử đã gặp khó khăn trong việc nắm bắt các bộ phận nhỏ và phân loại các bộ phận riêng lẻ trong môi trường lộn xộn. Phần mềm của Sereact có thể xác định các bộ phận này và chọn đúng dụng cụ kẹp để gắp chúng ra.

Đội ngũ Sereact không chỉ có tay nghề cao mà còn có sự hiểu biết sâu sắc về môi trường làm việc của khách hàng và mong muốn thực sự giúp khách hàng khắc phục tình trạng thiếu lao động và đạt được hoạt động hiệu quả, bền vững. Là công ty đầu tiên chuyển sự kết hợp giữa các mô hình ngôn ngữ lớn và bao bì bán tải từ khả năng học thuật sang tác động trong thế giới thực, tôi hoàn toàn tin tưởng vào khả năng của họ trong việc thực hiện và mở rộng quy mô của một kẻ thách thức chế tạo robot thực sự. —Nathan Benaich, đối tác chung tại Air Street Capital

##12. Tấm nền

Công cụ mô hình ngôn ngữ quy mô lớn được thiết kế riêng

Giờ đây, mọi công ty đều cố gắng tích hợp trí tuệ nhân tạo vào hoạt động kinh doanh của mình. Các công ty lớn nhất thế giới nhận ra tiềm năng của trí tuệ nhân tạo, với 20% CEO trong S&P 500 đề cập đến AI trong các cuộc gọi báo cáo kết quả kinh doanh quý đầu tiên của họ. Các mô hình ngôn ngữ lớn có thể cải thiện đáng kể hiệu quả kinh doanh bằng cách tăng tốc các chức năng cốt lõi như hỗ trợ khách hàng, bán hàng ra nước ngoài và mã hóa. Các mô hình ngôn ngữ lớn cũng có thể cải thiện trải nghiệm sản phẩm cốt lõi bằng cách trả lời các câu hỏi của khách hàng bằng trợ lý dựa trên AI hoặc tạo quy trình làm việc AI mới để làm hài lòng khách hàng.

Do các công ty lớn có xu hướng chậm áp dụng công nghệ mới, chúng tôi rất ngạc nhiên về tốc độ bắt đầu xây dựng AI của các doanh nghiệp. Không có gì đáng ngạc nhiên khi nhiều doanh nghiệp muốn xây dựng các mô hình và giải pháp AI của riêng mình. Mỗi doanh nghiệp đều có một kho dữ liệu khách hàng độc quyền, thường là một phần của hào kinh doanh cốt lõi của doanh nghiệp. Các doanh nghiệp này nhận thấy rủi ro khi gửi dữ liệu có giá trị nhất của họ đến các API mô hình cơ bản hoặc các công ty khởi nghiệp có độ tin cậy không chắc chắn. Ngay cả khi bất kể vấn đề về quyền riêng tư dữ liệu, các mô hình ngôn ngữ quy mô lớn công khai như GPT-4 hay Claude đều được đào tạo hoàn toàn về dữ liệu mở và do đó thiếu khả năng tùy chỉnh cho các trường hợp sử dụng và phân khúc khách hàng cụ thể của doanh nghiệp.

Một số công ty công nghệ, chẳng hạn như Shopify và Canva, đã thành lập "Nhóm AI Tiger" nội bộ để sử dụng các mô hình nguồn mở có sẵn nhằm tích hợp trí tuệ nhân tạo vào tất cả các bộ phận của doanh nghiệp. Tuy nhiên, hầu hết các công ty không có đủ nguồn lực hoặc các nhà nghiên cứu AI có kinh nghiệm để xây dựng và triển khai các mô hình ngôn ngữ quy mô lớn độc quyền dựa trên dữ liệu của chính họ. Họ nhận ra rằng làn sóng AI này có thể là thời điểm chuyển đổi cho tương lai doanh nghiệp của họ, nhưng cho đến nay họ vẫn chưa thể thúc đẩy hoặc kiểm soát sự phát triển AI của chính mình.

Đó là lý do tại sao chúng tôi rất vui mừng về những gì Sharon Chu và Greg Diamos cùng nhóm của họ đang làm tại Lamini. Lamini là một công cụ mô hình ngôn ngữ quy mô lớn giúp các nhà phát triển dễ dàng nhanh chóng đào tạo, tinh chỉnh, triển khai và cải thiện các mô hình của riêng họ bằng phản hồi của con người. Công cụ này mang đến trải nghiệm phát triển thú vị giúp loại bỏ sự phức tạp của các mô hình AI và quan trọng hơn là cho phép doanh nghiệp xây dựng các giải pháp AI dựa trên dữ liệu của riêng họ mà không cần phải thuê nhà nghiên cứu AI hoặc có nguy cơ rò rỉ dữ liệu. Chúng tôi đã làm việc với Sharon và Greg lần đầu tiên vào mùa thu năm ngoái. Kể từ đó, chúng tôi đã có cơ hội hỗ trợ nhóm sáng lập tập trung vào khách hàng và thành thạo về mặt kỹ thuật này khi họ hiện thực hóa tầm nhìn đầy tham vọng của mình nhằm thay đổi cách các doanh nghiệp áp dụng AI.

Cụ thể, việc triển khai các mô hình ngôn ngữ lớn riêng tư với Lamini mang lại rất nhiều lợi ích so với việc sử dụng giải pháp công cộng. Việc có một nhóm kỹ thuật nội bộ xử lý quá trình xây dựng sẽ đảm bảo quyền riêng tư của dữ liệu và cho phép linh hoạt hơn trong việc lựa chọn mô hình cũng như toàn bộ hệ thống tính toán và dữ liệu. Các mô hình được tạo bằng Lamini cũng giảm hiện vật, giảm độ trễ, đảm bảo thời gian chạy đáng tin cậy và giảm chi phí so với các API có sẵn. Những cải tiến hiệu suất này đến từ những hiểu biết kỹ thuật cốt lõi mà nhóm Lamini tích hợp vào sản phẩm dựa trên kinh nghiệm nghiên cứu và kinh nghiệm trong ngành hàng thập kỷ về các mô hình AI và tối ưu hóa GPU.

Các công ty khởi nghiệp nổi tiếng và doanh nghiệp lớn đã sử dụng Lamini để triển khai các mô hình ngôn ngữ lớn trong nội bộ và với khách hàng, đồng thời họ rất vui mừng về tốc độ thiết lập, hiệu suất và độ tin cậy. Trong tương lai, chúng tôi tin rằng mọi doanh nghiệp sẽ sử dụng AI trong hoạt động kinh doanh và sản phẩm của mình, nhưng chỉ một số ít doanh nghiệp có đội ngũ AI chuyên trách. Lamini là một công ty khởi nghiệp đang tạo ra một sân chơi bình đẳng và tạo cơ hội cho tất cả các công ty tận dụng công nghệ biến đổi này. Nhờ mối quan hệ hợp tác gần đây với Databricks, giờ đây các doanh nghiệp có thể thiết lập và vận hành các giải pháp AI của mình dễ dàng hơn bao giờ hết bằng cách thiết lập Lamini trực tiếp trên các hồ dữ liệu và cụm điện toán Databricks hiện có. --James Wu, nhà đầu tư vòng đầu tiên; Todd Jackson, đối tác vòng đầu tiên của vòng vốn

##13. Nhà máy

Mã hóa “Robot” của bạn

Ngày nay, nếu bạn muốn máy tính làm việc gì đó cho mình, bạn phải dịch suy nghĩ của mình sang "ngôn ngữ máy tính", một mã siêu văn bản mà trình biên dịch có thể hiểu được. Để trở thành kỹ sư, bạn phải vặn xoắn bộ não của mình như một cái máy. Tuy nhiên, chúng ta đang đạt đến điểm bùng phát khi AI có thể biến ngôn ngữ của con người thành mã. Quá trình chuyển đổi từ kỹ sư con người sang kỹ sư kỹ thuật số có thể sẽ trở thành một trong những bước ngoặt công nghệ quan trọng nhất trong cuộc sống của chúng ta.

Chúng ta vẫn đang ở giai đoạn đầu của quá trình chuyển đổi này. Các công cụ trí tuệ nhân tạo như BabyAGI và AutoGPT đã thu hút được trí tưởng tượng của công chúng. Nhưng mặc dù các trợ lý mã hóa như Github Copilot thể hiện sự cải tiến nhưng chúng vẫn còn rất hạn chế, chủ yếu phục vụ chức năng tự động hoàn thành các ý tưởng đã được triển khai trong mã.

Nhà máy thì khác. Công ty được thành lập vào năm 2023 bởi cựu nhà lý thuyết dây Matan Grinberg và kỹ sư máy học Eno Reyes. Khi gặp Mattan, tôi ngay lập tức bị thu hút bởi tầm nhìn của anh ấy: một tương lai nơi các kỹ sư có thể khiến việc xây dựng trở nên thú vị bằng cách giao phó những nhiệm vụ khó chịu và tập trung vào những vấn đề khó khăn. Để làm được điều này, Matan và Eno đã tạo ra các “robot” mã hóa tự động.

Bot là các kỹ sư trí tuệ nhân tạo xử lý các công việc hàng ngày như xem xét mã, gỡ lỗi và tái cấu trúc. Không giống như các sản phẩm hiện có, bot của Factory không yêu cầu bạn làm bất cứ điều gì; chúng có thể xem xét mã một cách độc lập, xử lý lỗi và trả lời các câu hỏi. Bạn cũng có thể sử dụng bot như các nhà phát triển cấp dưới, sử dụng chúng để động não và chia sẻ công việc về tính năng. Robot có cơ chế bảo vệ mạnh mẽ và trí thông minh của chúng nhắm vào nhu cầu của người dùng, khiến chúng khó “ảo giác” những câu trả lời sai.

Tạo mã sẽ là một trong những lĩnh vực mang tính biến đổi nhất của cuộc cách mạng AI và Factory có tất cả các công cụ cần thiết để thành công.

*Đội. Mattan, Giám đốc điều hành của Factory, là nhà lý thuyết dây tại Đại học Princeton, nơi ông tưởng tượng ra các điểm kỳ dị của lỗ đen. Eno làm kỹ sư máy học tại Hugging Face và đích thân xử lý quy trình kỹ thuật tẻ nhạt. Đây là một đội độc đáo.

  • Tính thực tế. Mặc dù robot chưa thể thực hiện các nhiệm vụ tốt như kỹ sư con người nhưng chúng vẫn có thể thực hiện các nhiệm vụ mà các kỹ sư ghét. Các kỹ sư có thể để lại công việc nhàm chán và lặp đi lặp lại cho Nhà máy.
  • tốc độ. Nhà máy đã đạt được điều gì đó đáng chú ý chỉ trong vài tháng. Trong khi những người khác vẫn đang tưởng tượng về các kỹ sư trí tuệ nhân tạo thì Matan và Eno đã phát triển chúng. Họ đang nhanh chóng cải thiện sản phẩm vốn đã xuất sắc này.

Câu chuyện về sự phát triển của con người là một trong những công việc giảm bớt gánh nặng lặp đi lặp lại, cho phép chúng ta chuyển sang những công việc phức tạp hơn. Khi con người phát minh ra nông nghiệp, về cơ bản họ đã giải phóng khả năng xây dựng thành phố của chúng ta. Sau Cách mạng Công nghiệp, chúng ta chế tạo tên lửa đưa con người lên mặt trăng. Thế hệ tiếp theo đang thực hiện sứ mệnh giải phóng con người khỏi sự vất vả trực tuyến và đẩy biên giới công nghệ đi xa hơn.

Khi giới hạn duy nhất là trí tưởng tượng của con người, chúng ta sẽ xây dựng điều gì tiếp theo? — Markie Wagner, người sáng lập và CEO của Delphi Labs

Người phiên dịch: Jane

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)