Bảy tín hiệu để hiểu AI trong tuần này: rò rỉ mô hình, động cơ mã, kiểm soát nhân sự

Tác giả: Tara Tan / StrangeVC

Dịch: Deep潮 TechFlow

Deep潮 giới thiệu: Báo cáo tuần này có độ tập trung cao, với bảy tín hiệu độc lập bao quát các xu hướng quan trọng nhất của ngành AI.

Trong đó đáng chú ý nhất: Anthropic do sơ suất trong cấu hình CMS đã vô tình tiết lộ chi tiết về mô hình mới mang mã số “Capybara”, nằm trên cấp độ của Opus.

Toàn văn như sau:

Trong vài tháng qua, chúng ta chắc chắn đã vượt qua một ngưỡng agentic nào đó. Những công trình mất bốn đến sáu tuần để hoàn thành năm năm trước nay chỉ cần chưa đầy năm phút. Sáu tháng trước, cùng một nhiệm vụ vẫn mất từ một đến hai giờ kèm theo nhiều điều chỉnh.

Đây là một sự biến đổi đáng kể, có thể chúng ta vẫn chưa hoàn toàn tiêu hóa. Sự sụp đổ của khoảng cách giữa ý tưởng và sản phẩm khả thi sẽ viết lại toàn bộ ngành công nghiệp này. Đây là bước nhảy vọt trong công cụ mà con người dùng để xây dựng, sáng tạo và giải quyết vấn đề.

Liên quan đến đó, OpenClaw kể từ khi được OpenAI mua lại rõ ràng đã ổn định hơn nhiều. Nó có một lộ trình rõ ràng để trở thành một trong những dự án mã nguồn mở quan trọng nhất trong lĩnh vực AI.

Chuyển sang nội dung của tuần này.

Rò rỉ Claude Mythos của Anthropic tiết lộ cấp độ mô hình mới

Vì sơ suất trong cấu hình CMS, Anthropic đã vô tình tiết lộ chi tiết về một mô hình chưa ra mắt có tên là Claude Mythos. Bản nháp rò rỉ mô tả một cấp độ “Capybara” mới, nằm trên Opus, có bước đột phá lớn về khả năng lập trình, suy luận và an ninh mạng. Anthropic xác nhận đang thử nghiệm mô hình này với khách hàng truy cập sớm, gọi đó là “bước nhảy vọt” và “mô hình mạnh nhất từ trước đến nay”. (Fortune, The Decoder)

Tại sao quan trọng: Ngoài chính mô hình, có hai điểm đáng chú ý hơn. Thứ nhất, bản nháp rò rỉ cảnh báo rằng khả năng an ninh mạng của mô hình này “vượt xa bất kỳ AI nào khác”, đã thúc đẩy giá cổ phiếu an ninh mạng trong ngày giao dịch. Thứ hai, việc giới thiệu cấp độ mô hình thứ tư (Capybara nằm trên Opus) cho thấy Anthropic đang xây dựng không gian định giá cho khách hàng doanh nghiệp, chứ không chỉ tập trung vào hiệu năng để benchmark.

Claude Code trở thành động lực tăng trưởng cốt lõi của Anthropic

Hiện tại, Claude Code chiếm khoảng 4% tổng số lần gửi commit công khai trên GitHub, dự kiến đến cuối năm sẽ vượt 20%. Doanh thu hàng năm của Anthropic ước tính đạt 14 tỷ USD, trong đó riêng Claude Code đóng góp khoảng 2,5 tỷ USD. Công cụ này đã mở rộng người dùng từ các nhà phát triển sang cả người dùng phi kỹ thuật, những người đang học lệnh terminal để xây dựng dự án với nó. (SemiAnalysis, Uncover Alpha, VentureBeat)

Tại sao quan trọng: Claude Code nhờ vào việc phát triển tự nhiên của các nhà phát triển, giúp giảm thiểu gần như hoàn toàn chi phí thu hút khách hàng. Việc mở rộng sang các vai trò không phải nhà phát triển qua Cowork đã mở rộng thị trường mục tiêu ra ngoài 28 triệu nhà phát triển chuyên nghiệp toàn cầu.

Cheng Lou và Pretext: Bố cục văn bản không phụ thuộc CSS

Cheng Lou là một trong những kỹ sư UI có ảnh hưởng nhất trong thập kỷ qua (React, ReasonML, Midjourney), ông đã phát hành Pretext, một thuật toán đo lường văn bản thuần TypeScript, hoàn toàn bỏ qua CSS, đo lường DOM và tái sắp xếp trình duyệt. Các ví dụ trình diễn bao gồm: render ảo hóa hàng chục nghìn khung văn bản ở 120 fps, bong bóng chat nén không lãng phí pixel, bố cục tạp chí đa cột phản hồi, và nghệ thuật ASCII với độ rộng biến đổi. (X post)

Tại sao quan trọng: Bố cục và đo lường văn bản luôn là những điểm nghẽn tiềm ẩn cản trở thế hệ UI mới. CSS dành cho tài liệu tĩnh, không phù hợp với các giao diện linh hoạt, AI sinh ra, và thời gian thực hiện hiện nay. Nếu Pretext chứng minh được hiệu quả trình diễn, nó sẽ loại bỏ một trong những hạn chế nền tảng cuối cùng về ngoại hình và trải nghiệm của giao diện AI nguyên bản.

Arm lần đầu ra chip tự phát triển sau 35 năm

Arm đã ra mắt CPU AGI, một bộ xử lý trung tâm dữ liệu 136 nhân dựa trên quy trình 3nm của TSMC, hợp tác cùng Meta. Đây là lần đầu tiên công ty bán ra chip hoàn chỉnh thay vì chỉ bán bản quyền IP. Các đối tác đầu tiên gồm OpenAI, Cerebras và Cloudflare, dự kiến bắt đầu giao hàng số lượng lớn vào cuối năm. (Arm Newsroom, EE Times)

Tại sao quan trọng: Hiện tại, trung tâm dữ liệu AI chủ yếu dùng GPU. GPU đảm nhiệm huấn luyện và vận hành mô hình, còn CPU chủ yếu xử lý luồng dữ liệu và điều phối. Nhưng tải công việc agentic khác biệt rõ rệt. Khi hàng nghìn AI agent chạy đồng thời, mỗi cái đều phối hợp nhiệm vụ, gọi API, quản lý bộ nhớ, định tuyến dữ liệu qua hệ thống, thì các công việc phối hợp này đều nằm trên CPU. Arm tuyên bố điều này sẽ thúc đẩy nhu cầu CPU cho mỗi gigawatt công suất trung tâm dữ liệu tăng gấp 4 lần. (HPCwire, Futurum Group)

Nvidia và Emerald AI biến trung tâm dữ liệu thành tài sản lưới điện

Nvidia và Emerald AI công bố liên minh với AES, Constellation, Invenergy, NextEra và Vistra để xây dựng “nhà máy AI linh hoạt”, điều chỉnh tải tính toán để tham gia dịch vụ cân bằng lưới điện. Cơ sở đầu tiên, Aurora, nằm ở Manassas, Virginia, dự kiến khai trương vào nửa đầu năm 2026. (NVIDIA Newsroom, Axios)

Tại sao quan trọng: Thách thức lớn nhất để mở rộng hạ tầng AI không phải chip, mà là thời gian tiếp cận lưới điện, thường mất từ 3 đến 5 năm ở nhiều khu vực. Các trung tâm dữ liệu có khả năng linh hoạt về lưới điện có thể kết nối nhanh hơn, ít gặp trở ngại về quy định hơn. Điều này định hình lại câu chuyện năng lượng cho các nhà đầu tư hạ tầng AI: chiến lược thành công không phải là “nhiều điện hơn”, mà là “điện thông minh hơn”.

Chính quyền Trung Quốc hạn chế xuất cảnh của lãnh đạo Manus AI

Sau khi Meta mua lại startup AI đăng ký tại Singapore với giá 2 tỷ USD, chính quyền Trung Quốc đã hạn chế CEO Manus, Tiêu Hồng, và nhà khoa học trưởng Ji Yichao ra nước ngoài. Trong tháng này, Ủy ban Phát triển và Cải cách Quốc gia đã triệu tập hai lãnh đạo này về Bắc Kinh, đồng thời áp dụng hạn chế đi lại trong quá trình kiểm tra quản lý. (Reuters, Washington Post)

Tại sao quan trọng: Đây không phải là hạn chế thương mại, mà là hạn chế về nhân sự. Trung Quốc có thể đang gửi tín hiệu: nhân tài AI có nền tảng đại lục là tài sản bị kiểm soát, bất kể đăng ký công ty ở đâu.

Mô hình lớn 400 tỷ tham số chạy trực tiếp trên iPhone 17 Pro

Một dự án mã nguồn mở tên là Flash-MoE đã trình diễn một mô hình hỗn hợp chuyên gia 400 tỷ tham số hoàn toàn chạy trên thiết bị, sử dụng chip A19 Pro của iPhone 17 Pro, truyền trọng số qua SSD đến GPU. Mô hình này (Qwen 3.5-397B, lượng tử 2 bit, 17 tỷ tham số hoạt động) chạy với tốc độ 0,6 token mỗi giây, còn dư 5,5GB RAM. (WCCFTech, TweakTown, Hacker News)

Tại sao quan trọng: Đây chỉ là thử nghiệm ý tưởng, không phải sản phẩm thương mại. Mô hình 400 tỷ tham số có thể chạy trên điện thoại có RAM 12GB nhờ chỉ một phần nhỏ của mô hình hoạt động cùng lúc (hỗ trợ hỗn hợp chuyên gia), phần còn lại truyền theo yêu cầu từ SSD tích hợp trong điện thoại. Áp dụng kỹ thuật tương tự cho các mô hình nhỏ hơn, như 7 tỷ hoặc 14 tỷ tham số, trên chip di động lưu trữ tốc độ cao thế hệ tiếp theo, sẽ tạo ra AI hoàn toàn chạy nội bộ, tốc độ phản hồi nhanh, không cần đám mây.

AI Agent tự chủ thực hiện toàn bộ chuỗi thí nghiệm vật lý hạt

Các nhà nghiên cứu MIT đã công bố khung làm việc tên là JFC (Just Furnish Context), thể hiện rằng một agent dựa trên Claude Code có thể tự thực thi toàn bộ quy trình phân tích vật lý năng lượng cao: lọc sự kiện, ước lượng nền, định lượng bất định, suy luận thống kê và viết bài báo. Hệ thống này chạy trên dữ liệu mở từ các detector ALEPH, DELPHI và CMS. (arXiv 2603.20179)

Tại sao quan trọng: Đây là một trong những minh chứng rõ ràng nhất cho khả năng tự chủ của AI agent trong tự động hóa toàn diện các quy trình khoa học trong lĩnh vực có độ chính xác phương pháp luận cực cao. Tác động đầu tư trực tiếp hướng tới việc phân tích lại các bộ dữ liệu còn lưu trữ trong vật lý, di truyền học và khoa học vật liệu — hàng chục năm dữ liệu lưu trữ vẫn chưa được khai thác triệt để.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.26KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.26KNgười nắm giữ:0
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$2.25KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.24KNgười nắm giữ:1
    0.00%
  • Ghim