Làm thế nào mô hình trí tuệ nhân tạo lớn và Web3 cùng tồn tại? |All Creation Camp AI+Crypto Studio

Trung cấp1/31/2024, 3:56:38 PM
Bài viết này giải thích cách công nghệ blockchain có thể giải quyết các hạn chế hiện tại trong việc huấn luyện các mô hình AI lớn, bao gồm: cân bằng giữa khối lượng dữ liệu và quyền riêng tư, chi phí và sức mạnh tính toán, vv., và khám phá mối quan hệ tương tác giữa AI và Xã hội.

Là công nghệ công nghệ cao phát triển nhanh nhất trong lịch sử nhân loại, mô hình lớn đã thu hút sự chú ý của mọi người. Web3, một thứ chỉ mới xuất hiện hôm qua, ngày càng bị thách thức về mặt pháp lý. Nhưng với hai công nghệ hoàn toàn khác biệt, không có sự thay thế giữa hai công nghệ này. Người đứng đầu “AI+Crypto Studio” trên Đảo Mọi Thứ - Ông Tiến Hồng Phi, sẽ thảo luận với bạn về các vấn đề gặp phải trong quá trình phát triển mô hình lớn và cách các công ty trong lĩnh vực web3 cam kết giải quyết những vấn đề này.

Vấn đề trong ngành Mô hình lớn và Cách tích hợp Web3 để giải quyết chúng

Như chúng ta đã biết, ngành công nghiệp Internet đã bước vào giai đoạn độc quyền sau năm 2015, và các quốc gia trên thế giới đã tiến hành kiểm tra chống độc quyền đối với các công ty nền tảng. Sự xuất hiện của các mô hình lớn tiếp tục làm tăng cường vị thế độc quyền của các oligopolies. Các mô hình lớn bao gồm thuật toán, sức mạnh tính toán và dữ liệu:

  • Trong lĩnh vực của các thuật toán, mặc dù có một mức độ độc quyền, các thuật toán vẫn có thể duy trì mở rộng do sức mạnh mã nguồn mở và sự cạnh tranh của các trường đại học nghiên cứu, cũng như sự không tin tưởng của mọi người đối với các oligarch;
  • Về sức mạnh tính toán, do chi phí rất cao để huấn luyện các mô hình lớn, sức mạnh tính toán chỉ có thể được đáp ứng bởi các doanh nghiệp lớn, do đó điều này dẫn đến việc sản xuất thuật toán hoàn toàn được kiểm soát bởi các doanh nghiệp lớn;
  • Về mặt dữ liệu, trong khi việc huấn luyện các mô hình lớn phụ thuộc vào dữ liệu công cộng, dữ liệu công cộng sẽ sớm cạn kiệt dựa trên sự tăng trưởng của các tham số của các mô hình lớn, và do đó sự tiếp tục tăng trưởng của các mô hình lớn phụ thuộc vào dữ liệu riêng. Trong khi lượng dữ liệu tuyệt đối do một số lượng lớn các doanh nghiệp nhỏ sở hữu là lớn, nhưng khó khăn trong việc sử dụng một cách đơn lẻ, vì vậy các doanh nghiệp lớn vẫn chiếm độc quyền dữ liệu.

Kết quả là, thời đại Mô hình Lớn hiện đang được kiểm soát tập trung hơn bao giờ hết, và thế giới trong tương lai có thể sẽ được kiểm soát bởi một số ít hoặc thậm chí là một máy tính duy nhất. (Ngay cả trong thế giới Web3 phi tập trung, Cuộc chơi Cuối cùng do Vitalik đề xuất cho Ethereum sẽ được thực hiện bởi một cỗ máy khổng lồ ngoài khối.)

Ngoài ra, công ty OpenAI phát triển ChatGPT chỉ có hơn 20 nhân sự chính. Do nhiều lý do khác nhau, thuật toán của ChatGPT chưa được công bố mã nguồn mở cho đến nay. Bản chất doanh nghiệp phi lợi nhuận ban đầu đã được thay đổi thành lợi nhuận hạn chế. Khi các ứng dụng khác nhau phụ thuộc vào ChatGPT đã thay đổi cuộc sống con người, một số sửa đổi cho mô hình ChatGPT sẽ có tác động lớn đến con người. So với nguyên tắc không làm điều ác của Google, ChatGPT có tác động sâu sắc hơn đối với con người.

Do đó, tính minh bạch tính toán của mô hình sẽ trở thành một vấn đề quan trọng. Mặc dù OpenAI có thể hoạt động như một tổ chức phi lợi nhuận, việc kiểm soát quyền lực bởi một số người vẫn sẽ có nhiều hậu quả tiêu cực. (Ngược lại, mặc dù Ethereum End Game được đề xuất bởi Vitalik là do máy móc sản xuất, nó sẽ duy trì tính minh bạch thông qua việc xác minh rất dễ dàng bởi công chúng.)

Đồng thời, vẫn còn những vấn đề trong ngành công nghiệp mô hình lớn: thiếu sức mạnh tính toán, dữ liệu đào tạo có sẵn sắp bị tiêu thụ hết, và chia sẻ mô hình. Theo thống kê, trước năm 2021, vấn đề trong ngành trí tuệ nhân tạo là thiếu dữ liệu, và tất cả các công ty học sâu đang tìm kiếm dữ liệu trong các ngành công nghiệp theo chiều dọc; và sau các mô hình lớn, sự thiếu hụt sức mạnh tính toán trở thành một trở ngại.

Việc phát triển mô hình lớn được chia thành một số giai đoạn: thu thập dữ liệu, tiền xử lý dữ liệu, huấn luyện mô hình, điều chỉnh mô hình, và triển khai truy vấn suy luận. Từ những giai đoạn này, hãy mô tả ngắn gọn đóng góp của blockchain vào các mô hình lớn và cách chống lại hại của sự tập trung quá mức của các mô hình lớn.

  • Về dữ liệu, khi dữ liệu công cộng sẽ bị tiêu thụ sau năm 2030, cần sử dụng lượng dữ liệu riêng có giá trị và lớn hơn trong khi bảo vệ sự riêng tư thông qua công nghệ blockchain;
  • Trong thuật ngữ gán nhãn dữ liệu, các token có thể được sử dụng để khuyến khích việc gán nhãn quy mô lớn hơn và xác minh dữ liệu;
  • Trong giai đoạn huấn luyện mô hình, sức mạnh tính toán được chia sẻ thông qua việc chia sẻ mô hình và huấn luyện cộng tác;
  • Trong giai đoạn điều chỉnh mô hình, sự tham gia của cộng đồng có thể được khuyến khích thông qua token;
  • Trong giai đoạn truy vấn người dùng và tính toán lý do, blockchain có thể bảo vệ quyền riêng tư dữ liệu người dùng.

Cụ thể:

1) Sức mạnh tính toán khan hiếm

Sức mạnh tính toán là một yếu tố sản xuất cần thiết cho các mô hình lớn, và đó là yếu tố sản xuất đắt đỏ nhất hiện nay, đến nỗi các công ty khởi nghiệp vừa huy động vốn đã phải chuyển 80% vốn của họ cho NVIDIA để mua GPU. Các công ty sản xuất mô hình lớn của riêng họ phải tiêu ít nhất 50 triệu đô la để xây dựng trung tâm dữ liệu riêng của họ, trong khi các công ty khởi nghiệp nhỏ phải mua dịch vụ máy chủ đám mây đắt tiền.

Tuy nhiên, sự phổ biến ngắn hạn của các mô hình lớn và lượng tài nguyên máy tính mà chính các mô hình lớn tiêu thụ đã vượt quá khả năng cung cấp của NVIDIA một cách lớn. Theo thống kê, nhu cầu về sức mạnh tính toán của các mô hình lớn tăng gấp đôi mỗi vài tháng. Từ năm 2012 đến năm 2018, nhu cầu về sức mạnh tính toán đã tăng 300.000 lần, và chi phí tính toán mô hình lớn đã tăng 31 lần mỗi năm.

Đối với các công ty Internet Trung Quốc, họ cũng phải đối mặt với lệnh cấm của Mỹ đối với GPU cao cấp. Có thể nói rằng chi phí đào tạo lớn là lý do chính tại sao công nghệ mô hình lớn được kiểm soát bởi một số ít người.

Vậy làm thế nào để giải quyết vấn đề sức mạnh tính toán của các mô hình lớn thông qua blockchain?

Xem xét về việc sản xuất các mô hình lớn, nó chủ yếu được chia thành việc đào tạo mô hình lớn, điều chỉnh tinh chỉnh và tính toán truy vấn người dùng. Mặc dù việc đào tạo các mô hình lớn rất đắt đỏ, một phiên bản của một mô hình lớn chỉ cần được tạo ra một lần. Hầu hết thời gian, đối với người dùng dịch vụ mô hình lớn, chỉ cần tính toán suy luận. Theo thống kê của AWS, điều này cũng được xác nhận, 80% công suất tính toán thực sự được tiêu thụ trong các tính toán suy luận.

Mặc dù việc huấn luyện các mô hình lớn đòi hỏi khả năng truyền thông tốc độ cao giữa các GPU, nhưng không thể hoàn thành trên mạng (trừ khi bạn chọn trao đổi thời gian mở rộng cho chi phí thấp). Nhưng tính toán suy luận có thể được thực hiện trên một GPU duy nhất. Việc điều chỉnh tinh chỉnh dựa trên mô hình lớn đã được tạo ra và cung cấp dữ liệu chuyên nghiệp, vì vậy nó yêu cầu ít tài nguyên máy tính hơn so với việc huấn luyện mô hình lớn.

Khi nói đến việc xử lý đồ họa, rõ ràng là GPU dành cho người tiêu dùng hoạt động tốt hơn so với GPU doanh nghiệp và thường trống rảnh. Kể từ khi Đại học California, Berkeley ra mắt SETI để tìm kiếm người ngoài hành tinh vào năm 1999, và Grid Computing trở nên phổ biến vào năm 2000, đã có một số kiến ​​trúc kỹ thuật sử dụng tài nguyên máy tính không hoạt động để hợp tác hoàn thành một số nhiệm vụ tính toán lớn. Trước sự xuất hiện của blockchain, những hợp tác này thường tập trung vào các nhiệm vụ khoa học và phụ thuộc vào sự nhiệt tình và sự tham gia vì cộng đồng của các thành viên, hạn chế phạm vi tác động. Bây giờ, sử dụng công nghệ blockchain, các ứng dụng rộng lớn của nó có thể được khuyến khích thông qua token.

Tương tự như dự án điện toán đám mây phi tập trung Akash, một mạng lưới tính toán chung đã được thiết lập, và người dùng có thể triển khai các mô hình học máy để tính toán lý luận và kết xuất hình ảnh. Cũng có các dự án trí tuệ nhân tạo dựa trên blockchain như Bittensor, Modulus Lab, Giza và ChainML, tất cả đều nhằm mục đích tính toán suy diễn truy vấn.

Các giao thức tính toán trí tuệ AI trên blockchain Gensyn và nền tảng trí tuệ AI sinh học mã nguồn mở Together quyết tâm xây dựng một mạng lưới tính toán phi tập trung phục vụ việc huấn luyện mô hình lớn.

Thách thức: Đối với các mạng tính toán phi tập trung, khó khăn không chỉ nằm ở việc mạng truyền thông chậm và không đáng tin cậy, không thể đồng bộ trạng thái tính toán, xử lý nhiều loại môi trường tính toán GPU, mà còn phải đối mặt với kích thước kinh tế, gian lận của người tham gia, chứng minh khối lượng công việc, an ninh, bảo vệ quyền riêng tư và chống lại các cuộc tấn công rác.

2) Dữ liệu khan hiếm và sửa dữ liệu

Thuật toán cốt lõi của mô hình lớn, Reinforcement Learning from Human Feedback (RLHF), yêu cầu sự tham gia của con người trong việc điều chỉnh huấn luyện để sửa lỗi và loại bỏ sai lệch và thông tin có hại. OpenAI đã sử dụng RLHF để điều chỉnh GPT3 để tạo ra ChatGPT. Trong quá trình này, OpenAI đã tìm thấy các chuyên gia từ Nhóm Facebook và trả công nhân lao động Kenya 2 đô la mỗi giờ. Huấn luyện tối ưu hóa thường đòi hỏi sự tham gia của các chuyên gia con người trên dữ liệu từ các lĩnh vực chuyên ngành, và việc triển khai có thể hoàn toàn kết hợp với cách thức khuyến khích sự tham gia của cộng đồng thông qua mã thông báo.

Ngành Cơ sở hạ tầng Vật lý Phi tập trung (DePINs) sử dụng token để khuyến khích mọi người chia sẻ dữ liệu thời gian thực từ thế giới vật lý theo cảm biến cho việc huấn luyện mô hình khác nhau. Bao gồm: React thu thập dữ liệu sử dụng năng lượng, DIMO thu thập dữ liệu lái xe, WeatherXM thu thập dữ liệu thời tiết và Hivemapper thu thập dữ liệu bản đồ thông qua sự khích lệ bằng token để khuyến khích mọi người đánh dấu biển báo giao thông và giúp thuật toán học máy RLHF cải thiện độ chính xác.

Vào cùng một thời điểm, khi các thông số của các mô hình lớn tăng lên, dữ liệu công khai hiện có sẽ bị cạn kiệt vào năm 2030, và sự tiến triển liên tục của các mô hình lớn sẽ phải dựa vào dữ liệu riêng. Lượng dữ liệu riêng tư là 10 lần dữ liệu công khai, nhưng nó phân tán trong tay các doanh nghiệp và cá nhân, và có tính chất riêng tư và bí mật, làm cho việc khai thác trở nên khó khăn. Một tình thế kép phát sinh. Một mặt, mô hình lớn cần dữ liệu, nhưng mặc dù bên có dữ liệu cần mô hình lớn, nhưng họ không muốn giao dữ liệu cho mô hình lớn. Vấn đề kép này cũng có thể được giải quyết thông qua công nghệ trong lĩnh vực blockchain.

Đối với các mô hình suy luận mã nguồn mở, vì chúng yêu cầu ít tài nguyên máy tính hơn, mô hình có thể được tải xuống phân đoạn dữ liệu để thực thi; đối với các mô hình không công cộng hoặc mô hình lớn, dữ liệu cần được làm mờ và tải lên cuối mô hình. Các phương pháp làm mờ bao gồm dữ liệu tổng hợp và chứng minh kiến thức không.

Dù mô hình được tải xuống phía dữ liệu hay dữ liệu được tải lên phía mô hình, vấn đề quyền hạn cần được giải quyết để ngăn chặn gian lận mô hình hoặc dữ liệu.

Thách thức: Mặc dù ưu đãi token của Web3 có thể giúp giải quyết vấn đề này, vấn đề gian lận cũng cần phải được giải quyết.

3) Hợp tác mô hình

Trong cộng đồng Civitai, nền tảng chia sẻ mô hình vẽ AI lớn nhất thế giới, mọi người chia sẻ các mô hình và có thể dễ dàng sao chép một mô hình và chỉnh sửa để tạo ra một mô hình phù hợp với yêu cầu của riêng họ.

Bittensor, một dự án blockchain chứng thực song phương và nhà mới vào lĩnh vực trí tuệ nhân tạo mã nguồn mở, đã thiết kế một bộ mô hình phân quyền khuyến khích token. Dựa trên cơ chế hợp tác của một hỗn hợp chuyên gia, nó cùng nhau tạo ra một mô hình giải quyết vấn đề và hỗ trợ rút trích kiến thức, có thể được chia sẻ giữa các mô hình. Thông tin, đào tạo tăng tốc, cung cấp cơ hội cho nhiều startup tham gia vào các mô hình lớn.

Với vai trò là mạng lưới thống nhất cho các dịch vụ ngoại chuỗi như tự động hóa, oracles và trí tuệ nhân tạo chia sẻ, Autonolas đã thiết kế một khung cộng tác cho các đại lý đạt được sự đồng thuận thông qua Tendermint.

Thách thức: Việc huấn luyện nhiều mô hình vẫn đòi hỏi rất nhiều sự giao tiếp, và tính đáng tin cậy cũng như hiệu quả về thời gian của việc huấn luyện phân tán vẫn là những rào cản lớn;

Mô hình lớn và sáng tạo trong Web3

Kết hợp với những gì đã được thảo luận ở trên là làm thế nào Web3 có thể được sử dụng để giải quyết một số vấn đề trong ngành công nghiệp mô hình lớn. Sự kết hợp của hai lực lượng quan trọng sẽ dẫn đến một số ứng dụng sáng tạo.

1) Sử dụng ChatGPT để viết hợp đồng thông minh

Gần đây, một nghệ sĩ NFT đã sử dụng các gợi ý để vận hành ChatGPT mà không cần kiến thức lập trình để phát hành hợp đồng thông minh của mình và phát hành token Turboner. Nghệ sĩ đã sử dụng YouTube để ghi lại quá trình sáng tạo của mình trong một tuần, truyền cảm hứng cho mọi người sử dụng ChatGPT. Tham gia vào quá trình tạo hợp đồng thông minh.

2) Thanh toán Tiền điện tử giúp quản lý thông minh

Sự phát triển của các mô hình lớn đã cải thiện đáng kể trí thông minh của trợ lý thông minh và kết hợp với thanh toán được mã hóa, trợ lý thông minh sẽ có thể phối hợp nhiều tài nguyên hơn và cộng tác trên nhiều nhiệm vụ hơn trong thị trường trợ lý thông minh. AutoGPT thể hiện sự phụ thuộc vào thẻ tín dụng do người dùng cung cấp và anh ta có thể giúp người dùng tự động hóa việc mua tài nguyên điện toán đám mây và đặt chuyến bay, nhưng bị giới hạn bởi đăng nhập tự động hoặc xác thực bảo mật khác và khả năng của AutoGPT bị hạn chế nghiêm trọng bởi đăng nhập tự động hoặc xác thực bảo mật khác. Thiết kế Hệ thống đa tác nhân (MAS), bao gồm Giao thức mạng hợp đồng, bao gồm sự hợp tác của nhiều trợ lý thông minh trong một thị trường mở và nếu được hỗ trợ bởi các mã thông báo, sự hợp tác như vậy sẽ phá vỡ sự hợp tác hạn chế dựa trên sự tin tưởng và trở thành một sự hợp tác quy mô lớn hơn dựa trên nền kinh tế thị trường, giống như xã hội loài người chuyển từ xã hội nguyên thủy sang xã hội tiền tệ.

3) zkML(Zero Knowledge Machine Learning)

Việc áp dụng công nghệ zkp (Zero Knowledge Proof) trong blockchain được chia thành hai loại. Một loại là giải quyết vấn đề về hiệu suất của blockchain bằng cách chuyển yêu cầu tính toán ra khỏi chuỗi, sau đó chứng thực trên chuỗi thông qua zkp; loại thứ hai được sử dụng để bảo vệ quyền riêng tư giao dịch. Các ứng dụng của zkp trong các mô hình lớn bao gồm việc tính toán đáng tin cậy của mô hình (để chứng minh tính nhất quán và xác thực của các tính toán mô hình) và tính toán quyền riêng tư của dữ liệu đào tạo. Trong môi trường phi tập trung, nhà cung cấp dịch vụ của mô hình cần chứng minh cho khách hàng rằng mô hình bán là mô hình đã hứa cho khách hàng, không cắt giảm; đối với các đối tác dữ liệu đào tạo, họ cần tham gia vào quá trình đào tạo hoặc sử dụng mô hình trên cơ sở bảo vệ quyền riêng tư của mình. Mặc dù zkp mở ra một số khả năng, nhưng vẫn còn nhiều thách thức, và các giải pháp như tính toán homomorphic và tính toán quyền riêng tư liên minh vẫn còn non trẻ.

Giải pháp dựa trên kiến trúc BEC (Blockchain Edge Client)

Ngoài các trường hữu trên, có một trường học khác chưa nhận được sự chú ý rồi do thiết hết ý thức token và việc sử dụng các ứng dụng blockchain tích cực.

Kiến trúc dựa trên BEC có nhiều điểm tương đồng với các khái niệm về Web5 được đề cập bởi Jack Dorsey và Solid bởi Tim Berners-Lee ở nhiều khía cạnh.

Họ đều nghĩ:

  • Mỗi người có một nút cạnh kiểm soát tương ứng;
  • Các kịch bản ứng dụng trong hầu hết các trường hợp nên được xử lý tại các nút cạnh;
  • Sự hợp tác giữa các nút cá nhân được hoàn thành thông qua blockchain;
  • Giao tiếp giữa các nút được hoàn thành thông qua P2P;
  • Cá nhân có thể hoàn toàn kiểm soát các nút của mình một mình hoặc ủy quyền cho những người tin cậy để quản lý các nút (được gọi là máy chủ truyền tải trong một số kịch bản);
  • Đạt được sự phân quyền tối đa có thể;

Khi nút này tương ứng với từng người và được kiểm soát bởi cá nhân lưu trữ dữ liệu cá nhân và tải mô hình lớn, một tác nhân thông minh cá nhân (Tác nhân) được cá nhân hóa hoàn toàn, được bảo vệ 100% quyền riêng tư có thể được đào tạo. Đối tác sáng lập Trung Quốc của SIG, Tiến sĩ Gong Ting đã so sánh một cách lãng mạn nút cá nhân trong tương lai với đám mây cá nhân trên đầu Olaf trong "Frozen" luôn theo dõi anh ta.

Theo cách này, Avatar trong Thế giới ảo sẽ không còn là một hình ảnh được điều khiển bởi bàn phím, mà là một đại lý có tâm hồn. Anh ta có thể học tin tức trực tuyến, xử lý email, và thậm chí tự động trả lời các tin nhắn trò chuyện xã hội của bạn thay mặt chúng tôi 24 giờ mỗi ngày. (Chú ý, các bạn gái hay gây rối, bạn có thể cần một cách để phát hiện xem bạn trai của bạn có đang sử dụng một đại lý để xử lý vấn đề với bạn trong tương lai). Khi đại lý của bạn cần kỹ năng mới, giống như việc cài đặt ứng dụng trên điện thoại di động, bạn có thể cài đặt một ứng dụng mới trong nút của bạn.

Tóm tắt

Trong lịch sử, với sự nền tảng hóa liên tục của sự phát triển của Internet, mặc dù thời gian ra đời của các công ty kỳ lân ngày càng ngắn lại, nhưng nó ngày càng trở nên bất lợi cho sự phát triển của các ngôi sao.

Với nền tảng phân phối nội dung hiệu quả do Google và Facebook cung cấp, Youtube, ra đời vào năm 2005, đã bị Google mua lại chỉ sau một năm với giá 1,6 tỷ đô la Mỹ.

Cùng với nền tảng phân phối ứng dụng hiệu quả của Apple App Store, Instagram được thành lập vào năm 2012 bởi hơn 10 người và đã được Facebook mua lại với giá 1 tỷ đô la Mỹ vào năm 2012.

Với sự hỗ trợ của mô hình lớn ChatGPT, Midjourney, chỉ có 11 người, kiếm được 100 triệu đô la Mỹ mỗi năm. Và OpenAI, chỉ có không quá 100 người, được định giá hơn 20 tỷ đô la Mỹ.

Các công ty nền tảng Internet ngày càng mạnh mẽ hơn, và sự xuất hiện của các mô hình lớn không thay đổi mô hình hiện tại của Internet bị độc quyền bởi các doanh nghiệp lớn. Ba yếu tố của các mô hình lớn, thuật toán, dữ liệu và sức mạnh tính toán vẫn đang bị độc quyền bởi các doanh nghiệp lớn. Các công ty khởi nghiệp không có khả năng sáng tạo các mô hình lớn và không có sức mạnh tài chính để huấn luyện các mô hình lớn. Họ chỉ có thể tập trung vào ứng dụng của các mô hình lớn trong các lĩnh vực dọc. Mặc dù các mô hình lớn dường như thúc đẩy việc phổ biến kiến thức, quyền lực thực sự đang được kiểm soát bởi không quá 100 người trên thế giới có khả năng tạo ra các mô hình.

Nếu các mô hình lớn thâm nhập vào tất cả các khía cạnh của cuộc sống của mọi người trong tương lai và bạn hỏi ChatGPT về chế độ ăn uống hàng ngày, sức khỏe, email công việc và thư của luật sư, thì về lý thuyết, những người thành thạo các mô hình lớn chỉ cần bí mật thay đổi một số thông số. Nó có thể ảnh hưởng lớn đến cuộc sống của vô số người. Một số thất nghiệp gây ra bởi mô hình lớn có thể được giải quyết thông qua UBI hoặc Worldcoin, nhưng hậu quả của khả năng xấu xa gây ra bởi mô hình lớn bị kiểm soát bởi một vài người nghiêm trọng hơn. Đây là ý định ban đầu của OpenAI. Mặc dù OpenAI giải quyết các vấn đề hướng đến lợi nhuận thông qua các phương pháp phi lợi nhuận, nhưng làm thế nào để giải quyết các vấn đề do quyền lực? Rõ ràng, các mô hình lớn nhanh chóng đào tạo các mô hình tri thức sử dụng kiến thức được con người tích lũy trong nhiều thập kỷ và được chia sẻ tự do trên Internet, nhưng mô hình này được kiểm soát bởi một số lượng rất nhỏ người.

  1. Do đó, có một xung đột lớn về giá trị giữa các mô hình lớn và blockchain. Các chuyên gia blockchain cần tham gia vào khởi nghiệp với các mô hình lớn và sử dụng công nghệ blockchain để giải quyết các vấn đề của mô hình lớn. Nếu lượng dữ liệu lớn tự do trên Internet là kiến thức chung của nhân loại, thì các mô hình lớn được tạo ra dựa trên những dữ liệu này nên thuộc về toàn bộ nhân loại. Gần đây, OpenAI đã bắt đầu trả tiền cho cơ sở dữ liệu văn học, OpenAI cần phải trả tiền cho những blog cá nhân mà bạn và tôi cống hiến.

Miễn trừ trách nhiệm:

  1. Bài viết này được sao chép từ [ ThreeDAO, Đảo của Mọi Điều]. Tất cả bản quyền thuộc về tác giả gốc [36C]. Nếu có ý kiến ​​phản đối về việc tái in này, vui lòng liên hệ với Học Gateđội ngũ, và họ sẽ xử lý nhanh chóng.
  2. Miễn trách nhiệm về trách nhiệm: Các quan điểm và ý kiến được thể hiện trong bài viết này chỉ thuộc về tác giả và không đại diện cho bất kỳ lời khuyên đầu tư nào.
  3. Các bản dịch của bài viết sang các ngôn ngữ khác được thực hiện bởi nhóm Gate Learn. Trừ khi được đề cập, việc sao chép, phân phối hoặc đạo văn các bài viết dịch là cấm.

Làm thế nào mô hình trí tuệ nhân tạo lớn và Web3 cùng tồn tại? |All Creation Camp AI+Crypto Studio

Trung cấp1/31/2024, 3:56:38 PM
Bài viết này giải thích cách công nghệ blockchain có thể giải quyết các hạn chế hiện tại trong việc huấn luyện các mô hình AI lớn, bao gồm: cân bằng giữa khối lượng dữ liệu và quyền riêng tư, chi phí và sức mạnh tính toán, vv., và khám phá mối quan hệ tương tác giữa AI và Xã hội.

Là công nghệ công nghệ cao phát triển nhanh nhất trong lịch sử nhân loại, mô hình lớn đã thu hút sự chú ý của mọi người. Web3, một thứ chỉ mới xuất hiện hôm qua, ngày càng bị thách thức về mặt pháp lý. Nhưng với hai công nghệ hoàn toàn khác biệt, không có sự thay thế giữa hai công nghệ này. Người đứng đầu “AI+Crypto Studio” trên Đảo Mọi Thứ - Ông Tiến Hồng Phi, sẽ thảo luận với bạn về các vấn đề gặp phải trong quá trình phát triển mô hình lớn và cách các công ty trong lĩnh vực web3 cam kết giải quyết những vấn đề này.

Vấn đề trong ngành Mô hình lớn và Cách tích hợp Web3 để giải quyết chúng

Như chúng ta đã biết, ngành công nghiệp Internet đã bước vào giai đoạn độc quyền sau năm 2015, và các quốc gia trên thế giới đã tiến hành kiểm tra chống độc quyền đối với các công ty nền tảng. Sự xuất hiện của các mô hình lớn tiếp tục làm tăng cường vị thế độc quyền của các oligopolies. Các mô hình lớn bao gồm thuật toán, sức mạnh tính toán và dữ liệu:

  • Trong lĩnh vực của các thuật toán, mặc dù có một mức độ độc quyền, các thuật toán vẫn có thể duy trì mở rộng do sức mạnh mã nguồn mở và sự cạnh tranh của các trường đại học nghiên cứu, cũng như sự không tin tưởng của mọi người đối với các oligarch;
  • Về sức mạnh tính toán, do chi phí rất cao để huấn luyện các mô hình lớn, sức mạnh tính toán chỉ có thể được đáp ứng bởi các doanh nghiệp lớn, do đó điều này dẫn đến việc sản xuất thuật toán hoàn toàn được kiểm soát bởi các doanh nghiệp lớn;
  • Về mặt dữ liệu, trong khi việc huấn luyện các mô hình lớn phụ thuộc vào dữ liệu công cộng, dữ liệu công cộng sẽ sớm cạn kiệt dựa trên sự tăng trưởng của các tham số của các mô hình lớn, và do đó sự tiếp tục tăng trưởng của các mô hình lớn phụ thuộc vào dữ liệu riêng. Trong khi lượng dữ liệu tuyệt đối do một số lượng lớn các doanh nghiệp nhỏ sở hữu là lớn, nhưng khó khăn trong việc sử dụng một cách đơn lẻ, vì vậy các doanh nghiệp lớn vẫn chiếm độc quyền dữ liệu.

Kết quả là, thời đại Mô hình Lớn hiện đang được kiểm soát tập trung hơn bao giờ hết, và thế giới trong tương lai có thể sẽ được kiểm soát bởi một số ít hoặc thậm chí là một máy tính duy nhất. (Ngay cả trong thế giới Web3 phi tập trung, Cuộc chơi Cuối cùng do Vitalik đề xuất cho Ethereum sẽ được thực hiện bởi một cỗ máy khổng lồ ngoài khối.)

Ngoài ra, công ty OpenAI phát triển ChatGPT chỉ có hơn 20 nhân sự chính. Do nhiều lý do khác nhau, thuật toán của ChatGPT chưa được công bố mã nguồn mở cho đến nay. Bản chất doanh nghiệp phi lợi nhuận ban đầu đã được thay đổi thành lợi nhuận hạn chế. Khi các ứng dụng khác nhau phụ thuộc vào ChatGPT đã thay đổi cuộc sống con người, một số sửa đổi cho mô hình ChatGPT sẽ có tác động lớn đến con người. So với nguyên tắc không làm điều ác của Google, ChatGPT có tác động sâu sắc hơn đối với con người.

Do đó, tính minh bạch tính toán của mô hình sẽ trở thành một vấn đề quan trọng. Mặc dù OpenAI có thể hoạt động như một tổ chức phi lợi nhuận, việc kiểm soát quyền lực bởi một số người vẫn sẽ có nhiều hậu quả tiêu cực. (Ngược lại, mặc dù Ethereum End Game được đề xuất bởi Vitalik là do máy móc sản xuất, nó sẽ duy trì tính minh bạch thông qua việc xác minh rất dễ dàng bởi công chúng.)

Đồng thời, vẫn còn những vấn đề trong ngành công nghiệp mô hình lớn: thiếu sức mạnh tính toán, dữ liệu đào tạo có sẵn sắp bị tiêu thụ hết, và chia sẻ mô hình. Theo thống kê, trước năm 2021, vấn đề trong ngành trí tuệ nhân tạo là thiếu dữ liệu, và tất cả các công ty học sâu đang tìm kiếm dữ liệu trong các ngành công nghiệp theo chiều dọc; và sau các mô hình lớn, sự thiếu hụt sức mạnh tính toán trở thành một trở ngại.

Việc phát triển mô hình lớn được chia thành một số giai đoạn: thu thập dữ liệu, tiền xử lý dữ liệu, huấn luyện mô hình, điều chỉnh mô hình, và triển khai truy vấn suy luận. Từ những giai đoạn này, hãy mô tả ngắn gọn đóng góp của blockchain vào các mô hình lớn và cách chống lại hại của sự tập trung quá mức của các mô hình lớn.

  • Về dữ liệu, khi dữ liệu công cộng sẽ bị tiêu thụ sau năm 2030, cần sử dụng lượng dữ liệu riêng có giá trị và lớn hơn trong khi bảo vệ sự riêng tư thông qua công nghệ blockchain;
  • Trong thuật ngữ gán nhãn dữ liệu, các token có thể được sử dụng để khuyến khích việc gán nhãn quy mô lớn hơn và xác minh dữ liệu;
  • Trong giai đoạn huấn luyện mô hình, sức mạnh tính toán được chia sẻ thông qua việc chia sẻ mô hình và huấn luyện cộng tác;
  • Trong giai đoạn điều chỉnh mô hình, sự tham gia của cộng đồng có thể được khuyến khích thông qua token;
  • Trong giai đoạn truy vấn người dùng và tính toán lý do, blockchain có thể bảo vệ quyền riêng tư dữ liệu người dùng.

Cụ thể:

1) Sức mạnh tính toán khan hiếm

Sức mạnh tính toán là một yếu tố sản xuất cần thiết cho các mô hình lớn, và đó là yếu tố sản xuất đắt đỏ nhất hiện nay, đến nỗi các công ty khởi nghiệp vừa huy động vốn đã phải chuyển 80% vốn của họ cho NVIDIA để mua GPU. Các công ty sản xuất mô hình lớn của riêng họ phải tiêu ít nhất 50 triệu đô la để xây dựng trung tâm dữ liệu riêng của họ, trong khi các công ty khởi nghiệp nhỏ phải mua dịch vụ máy chủ đám mây đắt tiền.

Tuy nhiên, sự phổ biến ngắn hạn của các mô hình lớn và lượng tài nguyên máy tính mà chính các mô hình lớn tiêu thụ đã vượt quá khả năng cung cấp của NVIDIA một cách lớn. Theo thống kê, nhu cầu về sức mạnh tính toán của các mô hình lớn tăng gấp đôi mỗi vài tháng. Từ năm 2012 đến năm 2018, nhu cầu về sức mạnh tính toán đã tăng 300.000 lần, và chi phí tính toán mô hình lớn đã tăng 31 lần mỗi năm.

Đối với các công ty Internet Trung Quốc, họ cũng phải đối mặt với lệnh cấm của Mỹ đối với GPU cao cấp. Có thể nói rằng chi phí đào tạo lớn là lý do chính tại sao công nghệ mô hình lớn được kiểm soát bởi một số ít người.

Vậy làm thế nào để giải quyết vấn đề sức mạnh tính toán của các mô hình lớn thông qua blockchain?

Xem xét về việc sản xuất các mô hình lớn, nó chủ yếu được chia thành việc đào tạo mô hình lớn, điều chỉnh tinh chỉnh và tính toán truy vấn người dùng. Mặc dù việc đào tạo các mô hình lớn rất đắt đỏ, một phiên bản của một mô hình lớn chỉ cần được tạo ra một lần. Hầu hết thời gian, đối với người dùng dịch vụ mô hình lớn, chỉ cần tính toán suy luận. Theo thống kê của AWS, điều này cũng được xác nhận, 80% công suất tính toán thực sự được tiêu thụ trong các tính toán suy luận.

Mặc dù việc huấn luyện các mô hình lớn đòi hỏi khả năng truyền thông tốc độ cao giữa các GPU, nhưng không thể hoàn thành trên mạng (trừ khi bạn chọn trao đổi thời gian mở rộng cho chi phí thấp). Nhưng tính toán suy luận có thể được thực hiện trên một GPU duy nhất. Việc điều chỉnh tinh chỉnh dựa trên mô hình lớn đã được tạo ra và cung cấp dữ liệu chuyên nghiệp, vì vậy nó yêu cầu ít tài nguyên máy tính hơn so với việc huấn luyện mô hình lớn.

Khi nói đến việc xử lý đồ họa, rõ ràng là GPU dành cho người tiêu dùng hoạt động tốt hơn so với GPU doanh nghiệp và thường trống rảnh. Kể từ khi Đại học California, Berkeley ra mắt SETI để tìm kiếm người ngoài hành tinh vào năm 1999, và Grid Computing trở nên phổ biến vào năm 2000, đã có một số kiến ​​trúc kỹ thuật sử dụng tài nguyên máy tính không hoạt động để hợp tác hoàn thành một số nhiệm vụ tính toán lớn. Trước sự xuất hiện của blockchain, những hợp tác này thường tập trung vào các nhiệm vụ khoa học và phụ thuộc vào sự nhiệt tình và sự tham gia vì cộng đồng của các thành viên, hạn chế phạm vi tác động. Bây giờ, sử dụng công nghệ blockchain, các ứng dụng rộng lớn của nó có thể được khuyến khích thông qua token.

Tương tự như dự án điện toán đám mây phi tập trung Akash, một mạng lưới tính toán chung đã được thiết lập, và người dùng có thể triển khai các mô hình học máy để tính toán lý luận và kết xuất hình ảnh. Cũng có các dự án trí tuệ nhân tạo dựa trên blockchain như Bittensor, Modulus Lab, Giza và ChainML, tất cả đều nhằm mục đích tính toán suy diễn truy vấn.

Các giao thức tính toán trí tuệ AI trên blockchain Gensyn và nền tảng trí tuệ AI sinh học mã nguồn mở Together quyết tâm xây dựng một mạng lưới tính toán phi tập trung phục vụ việc huấn luyện mô hình lớn.

Thách thức: Đối với các mạng tính toán phi tập trung, khó khăn không chỉ nằm ở việc mạng truyền thông chậm và không đáng tin cậy, không thể đồng bộ trạng thái tính toán, xử lý nhiều loại môi trường tính toán GPU, mà còn phải đối mặt với kích thước kinh tế, gian lận của người tham gia, chứng minh khối lượng công việc, an ninh, bảo vệ quyền riêng tư và chống lại các cuộc tấn công rác.

2) Dữ liệu khan hiếm và sửa dữ liệu

Thuật toán cốt lõi của mô hình lớn, Reinforcement Learning from Human Feedback (RLHF), yêu cầu sự tham gia của con người trong việc điều chỉnh huấn luyện để sửa lỗi và loại bỏ sai lệch và thông tin có hại. OpenAI đã sử dụng RLHF để điều chỉnh GPT3 để tạo ra ChatGPT. Trong quá trình này, OpenAI đã tìm thấy các chuyên gia từ Nhóm Facebook và trả công nhân lao động Kenya 2 đô la mỗi giờ. Huấn luyện tối ưu hóa thường đòi hỏi sự tham gia của các chuyên gia con người trên dữ liệu từ các lĩnh vực chuyên ngành, và việc triển khai có thể hoàn toàn kết hợp với cách thức khuyến khích sự tham gia của cộng đồng thông qua mã thông báo.

Ngành Cơ sở hạ tầng Vật lý Phi tập trung (DePINs) sử dụng token để khuyến khích mọi người chia sẻ dữ liệu thời gian thực từ thế giới vật lý theo cảm biến cho việc huấn luyện mô hình khác nhau. Bao gồm: React thu thập dữ liệu sử dụng năng lượng, DIMO thu thập dữ liệu lái xe, WeatherXM thu thập dữ liệu thời tiết và Hivemapper thu thập dữ liệu bản đồ thông qua sự khích lệ bằng token để khuyến khích mọi người đánh dấu biển báo giao thông và giúp thuật toán học máy RLHF cải thiện độ chính xác.

Vào cùng một thời điểm, khi các thông số của các mô hình lớn tăng lên, dữ liệu công khai hiện có sẽ bị cạn kiệt vào năm 2030, và sự tiến triển liên tục của các mô hình lớn sẽ phải dựa vào dữ liệu riêng. Lượng dữ liệu riêng tư là 10 lần dữ liệu công khai, nhưng nó phân tán trong tay các doanh nghiệp và cá nhân, và có tính chất riêng tư và bí mật, làm cho việc khai thác trở nên khó khăn. Một tình thế kép phát sinh. Một mặt, mô hình lớn cần dữ liệu, nhưng mặc dù bên có dữ liệu cần mô hình lớn, nhưng họ không muốn giao dữ liệu cho mô hình lớn. Vấn đề kép này cũng có thể được giải quyết thông qua công nghệ trong lĩnh vực blockchain.

Đối với các mô hình suy luận mã nguồn mở, vì chúng yêu cầu ít tài nguyên máy tính hơn, mô hình có thể được tải xuống phân đoạn dữ liệu để thực thi; đối với các mô hình không công cộng hoặc mô hình lớn, dữ liệu cần được làm mờ và tải lên cuối mô hình. Các phương pháp làm mờ bao gồm dữ liệu tổng hợp và chứng minh kiến thức không.

Dù mô hình được tải xuống phía dữ liệu hay dữ liệu được tải lên phía mô hình, vấn đề quyền hạn cần được giải quyết để ngăn chặn gian lận mô hình hoặc dữ liệu.

Thách thức: Mặc dù ưu đãi token của Web3 có thể giúp giải quyết vấn đề này, vấn đề gian lận cũng cần phải được giải quyết.

3) Hợp tác mô hình

Trong cộng đồng Civitai, nền tảng chia sẻ mô hình vẽ AI lớn nhất thế giới, mọi người chia sẻ các mô hình và có thể dễ dàng sao chép một mô hình và chỉnh sửa để tạo ra một mô hình phù hợp với yêu cầu của riêng họ.

Bittensor, một dự án blockchain chứng thực song phương và nhà mới vào lĩnh vực trí tuệ nhân tạo mã nguồn mở, đã thiết kế một bộ mô hình phân quyền khuyến khích token. Dựa trên cơ chế hợp tác của một hỗn hợp chuyên gia, nó cùng nhau tạo ra một mô hình giải quyết vấn đề và hỗ trợ rút trích kiến thức, có thể được chia sẻ giữa các mô hình. Thông tin, đào tạo tăng tốc, cung cấp cơ hội cho nhiều startup tham gia vào các mô hình lớn.

Với vai trò là mạng lưới thống nhất cho các dịch vụ ngoại chuỗi như tự động hóa, oracles và trí tuệ nhân tạo chia sẻ, Autonolas đã thiết kế một khung cộng tác cho các đại lý đạt được sự đồng thuận thông qua Tendermint.

Thách thức: Việc huấn luyện nhiều mô hình vẫn đòi hỏi rất nhiều sự giao tiếp, và tính đáng tin cậy cũng như hiệu quả về thời gian của việc huấn luyện phân tán vẫn là những rào cản lớn;

Mô hình lớn và sáng tạo trong Web3

Kết hợp với những gì đã được thảo luận ở trên là làm thế nào Web3 có thể được sử dụng để giải quyết một số vấn đề trong ngành công nghiệp mô hình lớn. Sự kết hợp của hai lực lượng quan trọng sẽ dẫn đến một số ứng dụng sáng tạo.

1) Sử dụng ChatGPT để viết hợp đồng thông minh

Gần đây, một nghệ sĩ NFT đã sử dụng các gợi ý để vận hành ChatGPT mà không cần kiến thức lập trình để phát hành hợp đồng thông minh của mình và phát hành token Turboner. Nghệ sĩ đã sử dụng YouTube để ghi lại quá trình sáng tạo của mình trong một tuần, truyền cảm hứng cho mọi người sử dụng ChatGPT. Tham gia vào quá trình tạo hợp đồng thông minh.

2) Thanh toán Tiền điện tử giúp quản lý thông minh

Sự phát triển của các mô hình lớn đã cải thiện đáng kể trí thông minh của trợ lý thông minh và kết hợp với thanh toán được mã hóa, trợ lý thông minh sẽ có thể phối hợp nhiều tài nguyên hơn và cộng tác trên nhiều nhiệm vụ hơn trong thị trường trợ lý thông minh. AutoGPT thể hiện sự phụ thuộc vào thẻ tín dụng do người dùng cung cấp và anh ta có thể giúp người dùng tự động hóa việc mua tài nguyên điện toán đám mây và đặt chuyến bay, nhưng bị giới hạn bởi đăng nhập tự động hoặc xác thực bảo mật khác và khả năng của AutoGPT bị hạn chế nghiêm trọng bởi đăng nhập tự động hoặc xác thực bảo mật khác. Thiết kế Hệ thống đa tác nhân (MAS), bao gồm Giao thức mạng hợp đồng, bao gồm sự hợp tác của nhiều trợ lý thông minh trong một thị trường mở và nếu được hỗ trợ bởi các mã thông báo, sự hợp tác như vậy sẽ phá vỡ sự hợp tác hạn chế dựa trên sự tin tưởng và trở thành một sự hợp tác quy mô lớn hơn dựa trên nền kinh tế thị trường, giống như xã hội loài người chuyển từ xã hội nguyên thủy sang xã hội tiền tệ.

3) zkML(Zero Knowledge Machine Learning)

Việc áp dụng công nghệ zkp (Zero Knowledge Proof) trong blockchain được chia thành hai loại. Một loại là giải quyết vấn đề về hiệu suất của blockchain bằng cách chuyển yêu cầu tính toán ra khỏi chuỗi, sau đó chứng thực trên chuỗi thông qua zkp; loại thứ hai được sử dụng để bảo vệ quyền riêng tư giao dịch. Các ứng dụng của zkp trong các mô hình lớn bao gồm việc tính toán đáng tin cậy của mô hình (để chứng minh tính nhất quán và xác thực của các tính toán mô hình) và tính toán quyền riêng tư của dữ liệu đào tạo. Trong môi trường phi tập trung, nhà cung cấp dịch vụ của mô hình cần chứng minh cho khách hàng rằng mô hình bán là mô hình đã hứa cho khách hàng, không cắt giảm; đối với các đối tác dữ liệu đào tạo, họ cần tham gia vào quá trình đào tạo hoặc sử dụng mô hình trên cơ sở bảo vệ quyền riêng tư của mình. Mặc dù zkp mở ra một số khả năng, nhưng vẫn còn nhiều thách thức, và các giải pháp như tính toán homomorphic và tính toán quyền riêng tư liên minh vẫn còn non trẻ.

Giải pháp dựa trên kiến trúc BEC (Blockchain Edge Client)

Ngoài các trường hữu trên, có một trường học khác chưa nhận được sự chú ý rồi do thiết hết ý thức token và việc sử dụng các ứng dụng blockchain tích cực.

Kiến trúc dựa trên BEC có nhiều điểm tương đồng với các khái niệm về Web5 được đề cập bởi Jack Dorsey và Solid bởi Tim Berners-Lee ở nhiều khía cạnh.

Họ đều nghĩ:

  • Mỗi người có một nút cạnh kiểm soát tương ứng;
  • Các kịch bản ứng dụng trong hầu hết các trường hợp nên được xử lý tại các nút cạnh;
  • Sự hợp tác giữa các nút cá nhân được hoàn thành thông qua blockchain;
  • Giao tiếp giữa các nút được hoàn thành thông qua P2P;
  • Cá nhân có thể hoàn toàn kiểm soát các nút của mình một mình hoặc ủy quyền cho những người tin cậy để quản lý các nút (được gọi là máy chủ truyền tải trong một số kịch bản);
  • Đạt được sự phân quyền tối đa có thể;

Khi nút này tương ứng với từng người và được kiểm soát bởi cá nhân lưu trữ dữ liệu cá nhân và tải mô hình lớn, một tác nhân thông minh cá nhân (Tác nhân) được cá nhân hóa hoàn toàn, được bảo vệ 100% quyền riêng tư có thể được đào tạo. Đối tác sáng lập Trung Quốc của SIG, Tiến sĩ Gong Ting đã so sánh một cách lãng mạn nút cá nhân trong tương lai với đám mây cá nhân trên đầu Olaf trong "Frozen" luôn theo dõi anh ta.

Theo cách này, Avatar trong Thế giới ảo sẽ không còn là một hình ảnh được điều khiển bởi bàn phím, mà là một đại lý có tâm hồn. Anh ta có thể học tin tức trực tuyến, xử lý email, và thậm chí tự động trả lời các tin nhắn trò chuyện xã hội của bạn thay mặt chúng tôi 24 giờ mỗi ngày. (Chú ý, các bạn gái hay gây rối, bạn có thể cần một cách để phát hiện xem bạn trai của bạn có đang sử dụng một đại lý để xử lý vấn đề với bạn trong tương lai). Khi đại lý của bạn cần kỹ năng mới, giống như việc cài đặt ứng dụng trên điện thoại di động, bạn có thể cài đặt một ứng dụng mới trong nút của bạn.

Tóm tắt

Trong lịch sử, với sự nền tảng hóa liên tục của sự phát triển của Internet, mặc dù thời gian ra đời của các công ty kỳ lân ngày càng ngắn lại, nhưng nó ngày càng trở nên bất lợi cho sự phát triển của các ngôi sao.

Với nền tảng phân phối nội dung hiệu quả do Google và Facebook cung cấp, Youtube, ra đời vào năm 2005, đã bị Google mua lại chỉ sau một năm với giá 1,6 tỷ đô la Mỹ.

Cùng với nền tảng phân phối ứng dụng hiệu quả của Apple App Store, Instagram được thành lập vào năm 2012 bởi hơn 10 người và đã được Facebook mua lại với giá 1 tỷ đô la Mỹ vào năm 2012.

Với sự hỗ trợ của mô hình lớn ChatGPT, Midjourney, chỉ có 11 người, kiếm được 100 triệu đô la Mỹ mỗi năm. Và OpenAI, chỉ có không quá 100 người, được định giá hơn 20 tỷ đô la Mỹ.

Các công ty nền tảng Internet ngày càng mạnh mẽ hơn, và sự xuất hiện của các mô hình lớn không thay đổi mô hình hiện tại của Internet bị độc quyền bởi các doanh nghiệp lớn. Ba yếu tố của các mô hình lớn, thuật toán, dữ liệu và sức mạnh tính toán vẫn đang bị độc quyền bởi các doanh nghiệp lớn. Các công ty khởi nghiệp không có khả năng sáng tạo các mô hình lớn và không có sức mạnh tài chính để huấn luyện các mô hình lớn. Họ chỉ có thể tập trung vào ứng dụng của các mô hình lớn trong các lĩnh vực dọc. Mặc dù các mô hình lớn dường như thúc đẩy việc phổ biến kiến thức, quyền lực thực sự đang được kiểm soát bởi không quá 100 người trên thế giới có khả năng tạo ra các mô hình.

Nếu các mô hình lớn thâm nhập vào tất cả các khía cạnh của cuộc sống của mọi người trong tương lai và bạn hỏi ChatGPT về chế độ ăn uống hàng ngày, sức khỏe, email công việc và thư của luật sư, thì về lý thuyết, những người thành thạo các mô hình lớn chỉ cần bí mật thay đổi một số thông số. Nó có thể ảnh hưởng lớn đến cuộc sống của vô số người. Một số thất nghiệp gây ra bởi mô hình lớn có thể được giải quyết thông qua UBI hoặc Worldcoin, nhưng hậu quả của khả năng xấu xa gây ra bởi mô hình lớn bị kiểm soát bởi một vài người nghiêm trọng hơn. Đây là ý định ban đầu của OpenAI. Mặc dù OpenAI giải quyết các vấn đề hướng đến lợi nhuận thông qua các phương pháp phi lợi nhuận, nhưng làm thế nào để giải quyết các vấn đề do quyền lực? Rõ ràng, các mô hình lớn nhanh chóng đào tạo các mô hình tri thức sử dụng kiến thức được con người tích lũy trong nhiều thập kỷ và được chia sẻ tự do trên Internet, nhưng mô hình này được kiểm soát bởi một số lượng rất nhỏ người.

  1. Do đó, có một xung đột lớn về giá trị giữa các mô hình lớn và blockchain. Các chuyên gia blockchain cần tham gia vào khởi nghiệp với các mô hình lớn và sử dụng công nghệ blockchain để giải quyết các vấn đề của mô hình lớn. Nếu lượng dữ liệu lớn tự do trên Internet là kiến thức chung của nhân loại, thì các mô hình lớn được tạo ra dựa trên những dữ liệu này nên thuộc về toàn bộ nhân loại. Gần đây, OpenAI đã bắt đầu trả tiền cho cơ sở dữ liệu văn học, OpenAI cần phải trả tiền cho những blog cá nhân mà bạn và tôi cống hiến.

Miễn trừ trách nhiệm:

  1. Bài viết này được sao chép từ [ ThreeDAO, Đảo của Mọi Điều]. Tất cả bản quyền thuộc về tác giả gốc [36C]. Nếu có ý kiến ​​phản đối về việc tái in này, vui lòng liên hệ với Học Gateđội ngũ, và họ sẽ xử lý nhanh chóng.
  2. Miễn trách nhiệm về trách nhiệm: Các quan điểm và ý kiến được thể hiện trong bài viết này chỉ thuộc về tác giả và không đại diện cho bất kỳ lời khuyên đầu tư nào.
  3. Các bản dịch của bài viết sang các ngôn ngữ khác được thực hiện bởi nhóm Gate Learn. Trừ khi được đề cập, việc sao chép, phân phối hoặc đạo văn các bài viết dịch là cấm.
Начните торговать сейчас
Зарегистрируйтесь сейчас и получите ваучер на
$100
!