🌕 Gate 廣場 · 中秋創作激勵 Day 8 賞金話題公布- #XRP ETF上线# !
創作點亮中秋,帶熱門話題發帖,瓜分 $5,000 中秋好禮!🎁
立即報名查看詳情 👉 https://www.gate.com/campaigns/1953
💝 新用戶首次發帖並完成互動任務,即可瓜分 $600 新人獎池!
🔥 Day 8 熱門話題:XRP ETF上線
REX-Osprey XRP ETF(XRPR)本週確認上線!XRPR 將成爲首檔追蹤第三大加密貨幣 XRP 表現的現貨 ETF,由 REX-Osprey 推出(同時也是 SSK 背後團隊)。據彭博高級 ETF 分析師消息,XRPR 將與狗狗幣 ETF(DOJE)一同於本週四登場,這檔 ETF 對 XRP 意味着什麼?是推動機構資金進場的轉折點,還是僅僅帶來短期炒作?
發帖建議:
1️⃣ 分享你對 #XRP# ETF 上線的第一反應與看法。
2️⃣ 分析 XRP #ETF# 對 XRP 價格及流動性的短期影響。
3️⃣ 結合比特幣、以太坊 ETF 過往案例,談談 XRP ETF 是否可能成爲資金流入新焦點。
快帶上 #XRP ETF上线# 和 #Gate广场创作点亮中秋# 發帖,內容越多越優質,越有機會贏取 $5,000 中秋好禮!
大模型開發棧已成!
作者| Richard MacManus
策劃| 言徵
來源丨51CTO技術棧
Web3未能顛覆掉Web2,但新興的大模型開發棧正在讓開發者從“雲原生”時代邁向新的AI技術棧。
提示工程師或許不能觸動開發者奔赴大模型的神經,但產品經理或者領導的一句:能不能開發一個“agent”,能不能實現一條“chain”,“使用哪款向量數據庫”,卻成為了目前各大主流大模型應用公司中驅動技術同學攻克生成AI開發的難點所在。
那麼,新興的技術棧究竟分哪幾層?哪裡最為棘手?本文帶大家一探究竟。
技術棧需要更新了,開發者迎來AI工程師時代
在過去一年,LangChain和LlamaIndex等工具的出現,使得AI應用程序的開發者生態系統開始成熟。甚至,現在還有一個術語來形容專注於人工智能的開發人員:“AI工程師”,根據其倡導者Shawn@swyx Wang的說法,這是“提示工程師”的下一步。他還創建了一張坐標圖,形象展示了AI工程師在更廣泛的人工智能生態系統中的位置:
大型語言模型(LLM)是AI工程師的核心技術。 LangChain和LlamaIndex都是擴展和補充LLM的工具,這絕非巧合。但是,對於這類新的開發人員來說,還有什麼其他工具可用呢?
到目前為止,我看到的LLM堆棧的最佳圖表來自風險投資公司Andreessen Horowitz(a16z)。以下是它對“LLM app stack”的看法:
沒錯,最頂層的還是數據
很明顯,LLM技術棧中最重要的是數據。在a16z的圖中,這是最頂層。 “嵌入模型”是LLM的用武之地——你可以從OpenAI、Cohere、Hugging Face或其他幾十種LLM選項中進行選擇,包括越來越流行的開源LLM。
但即使在使用LLM之前,還需要建立一個“數據管道”——它將Databricks和Airflow列為兩個示例,或者可以對數據進行“非結構化”處理。這也適合數據周期,可以幫助企業在將數據輸入自定義LLM之前“清理”或簡單地整理數據。像Alation這樣的“數據智能”公司,就提供這種類型的服務——聽起來,有點像IT技術棧中更為人知的“商業智能”等工具。
數據層的最後一部分則是近期名聲大噪的向量數據庫,來存儲和處理LLM數據。根據微軟的定義,這是“一種將數據存儲為高維向量的數據庫,高維向量是特徵或屬性的數學表示。”數據通過一種名為“embedding”的技術存儲為向量。
領先的向量數據庫供應商Pinecone在一次媒體交談時指出,Pinecone的工具經常與數據管道工具(如Databricks)一起使用。在這種情況下,數據通常位於其他地方(例如,數據湖),然後通過機器學習模型將其轉換為嵌入。在對數據進行處理和分塊後,生成的向量被發送到Pinecone。
提示和查詢
接下來的兩層可以概括為提示和查詢——這是人工智能應用程序與LLM和(可選)其他數據工具接口的地方。 A16z將LangChain和LlamaIndex定位為“編排框架”,這意味著開發人員一旦知道自己使用的是哪種LLM,就可以使用這些工具。
根據a16z的說法,像LangChain和LlamaIndex這樣的編排框架“抽象掉了提示鏈接的許多細節”,這意味著在應用程序和LLM之間查詢和管理數據。這個編排過程包括與外部API接口,從矢量數據庫檢索上下文數據,以及在多個LLM調用中維護內存。 a16z圖表中最有趣的方框是“遊樂場”,其中包括OpenAI、nat.dev和Humanloop。
A16z在博客文章中沒有確切定義,但我們可以推斷,“遊樂場”工具可以幫助開發人員施展A16z所說的“提示柔術”。在這些地方,開發人員可以嘗試各種提示技術。
Humanloop是一家英國公司,其平台的一個功能是“協作提示工作區”。它進一步將自己描述為“用於生產LLM功能的完整開發工具包”。因此,基本上,它允許您嘗試LLM的東西,然後將其部署到應用程序中(如果它有效的話)。
流水線作業:LLMOps
大模型生產的流水線目前正在逐漸清晰。編排框的右側是許多操作框,包括LLM緩存和驗證。還有一系列與LLM相關的雲和API服務,包括Hugging Face等開放的API存儲庫,以及OpenAI等專有的API提供商。
這可能是我們在“雲原生”時代習慣的開發人員技術棧中最相似的地方,許多DevOps公司將人工智能添加到了他們的產品列表中,這絕非巧合。 5月,我與Harness首席執行官Jyoti Bansal進行了交談。 Harness運行一個“軟件交付平台”,專注於CI/CD流程的“CD”部分。
Bansai告訴我,人工智能可以減輕軟件交付生命週期中涉及的繁瑣和重複的任務,從基於現有功能生成規範到編寫代碼。此外,他還表示,人工智能可以自動化代碼審查、漏洞測試、錯誤修復,甚至為構建和部署創建CI/CD管道。根據我在五月份的另一次對話,人工智能也在改變開發人員的生產力。來自構建自動化工具Gradle的Trisha Gee告訴我,人工智能可以通過減少重複任務(如編寫樣板代碼)的時間來加速開發,並使開發人員能夠專注於大局,如確保代碼滿足業務需求。
Web3涼了,大模型開發棧來了
在新興的LLM開發技術棧中,我們看到了一系列新的產品類型,例如編排框架(LangChain和LlamaIndex)、向量數據庫和Humanloop等“遊樂場”平台。所有這些都擴展和/或補充了這個時代的底層核心技術:大型語言模型。
一如前幾年Spring Cloud、Kubernetes等雲原生時代工具的興起。只不過當下,幾乎所有云原生時代的大、小、頂流企業都在極力將其工具適應AI工程化,這就會對LLM技術棧的未來發展非常有利。
沒錯,這一次的大模型儼然“站在巨人的肩膀上”,計算機技術中最好的創新總是建立在以前的基礎上。也許這就是“Web3”革命失敗的原因——與其說它是建立在上一代的基礎上,不如說它試圖篡奪它。
很明顯,LLM技術棧似乎做到了,它是從雲開發時代到更新的、基於AI的開發者生態系統的橋樑。
參考鏈接: