廣場
最新
熱門
新聞
我的主頁
發布
TheSmartApe🔥
2026-03-09 17:37:47
關注
每個人都在談論 @karpathy autoresearch,但你們大多數人根本不知道它實際做了什麼。
有一個訓練腳本 (train(dot)py),用來訓練一個小型語言模型,基本上就是一個嬰兒GPT。而有一個指令文件 (program(dot)md),用來告訴AI代理該做什麼。
你按下開始。代理會調整訓練腳本,訓練5分鐘,檢查分數。更好?保持。更差?還原。重複100次,整夜讓你睡覺。
就這麼簡單。
它實際在優化的是:模型架構。不是預測。不是交易。也不是你的投資組合。
像這樣的問題:
→ 4層還是8層?
→ 最佳學習率?
→ AdamW還是Muon優化器?
→ 哪個批次大小在這台特定GPU上效果最好?
最佳架構取決於你的硬體。H100需要完全不同的模型,跟你的MacBook不一樣。autoresearch會自動找到最適合你機器的配置。
你可以用它做的事情:
> 建立一個寫程式的小型LLM,autoresearch找到最佳架構,你用你的資料集訓練
> 創建一個離線在手機上運行的輕量級聊天機器人
> 用你自己的寫作訓練一個模型,讓它聽起來像你
> 在一夜之內測試「RoPE是否比ALiBi更適合小模型?」100個變體,而不是花3週做博士研究
> 為樹莓派或邊緣設備優化模型
你不能做的事情:
> 預測股價
> 找交易優勢
> 分析試算表
> 預測體育比賽結果
autoresearch是一個為想要建立語言模型的人設計的工具,而不是用來使用它的。Karpathy建立了一個自主循環,讓AI改善AI。真正的天才。但它解決的是一個非常特定的問題。
而那個問題可能不是你的。沒關係,就不要假裝它是別的東西。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見
聲明
。
打賞
按讚
留言
轉發
分享
留言
請輸入留言內容
請輸入留言內容
留言
暫無留言
熱門話題
查看更多
#
四月行情預測
30.01萬 熱度
#
加密市場普遍上漲
4.3萬 熱度
#
金銀同步走強
32.75萬 熱度
#
ClaudeCode50万行源代码泄漏
80.07萬 熱度
#
川普釋放停戰訊號
1.98萬 熱度
熱門 Gate Fun
查看更多
Gate Fun
KOL
最新發幣
即將上市
成功上市
1
8T
8 Trend
市值:
$2272.41
持有人數:
1
0.00%
2
mb
macbook
市值:
$2279.83
持有人數:
2
0.00%
3
TBKB
特不靠谱
市值:
$2333.18
持有人數:
2
0.00%
4
ch
chill
市值:
$2244.82
持有人數:
1
0.00%
5
MIP
MIP
市值:
$2244.82
持有人數:
1
0.00%
置頂
🤔 此時此刻,全世界只有你還沒抽獎了?
別盯著盤面看啦,來 #Gate广场 抽個金條壓壓驚!
第 17 期成長值抽獎進行中,尤其是新朋友,中獎率 100%,真的不打算來“白嫖”一下嗎?
🎁 錦鯉清單: 10g 純金金條、紅牛賽車周邊、大額體驗券...
🚀 极速上車: 廣場發帖/點贊攢夠 300 積分即可開抽!
👇 戳這裡,測測今天的歐氣:https://www.gate.com/activities/pointprize?now_period=17
#BTC #ETH #GT
網站地圖
每個人都在談論 @karpathy autoresearch,但你們大多數人根本不知道它實際做了什麼。
有一個訓練腳本 (train(dot)py),用來訓練一個小型語言模型,基本上就是一個嬰兒GPT。而有一個指令文件 (program(dot)md),用來告訴AI代理該做什麼。
你按下開始。代理會調整訓練腳本,訓練5分鐘,檢查分數。更好?保持。更差?還原。重複100次,整夜讓你睡覺。
就這麼簡單。
它實際在優化的是:模型架構。不是預測。不是交易。也不是你的投資組合。
像這樣的問題:
→ 4層還是8層?
→ 最佳學習率?
→ AdamW還是Muon優化器?
→ 哪個批次大小在這台特定GPU上效果最好?
最佳架構取決於你的硬體。H100需要完全不同的模型,跟你的MacBook不一樣。autoresearch會自動找到最適合你機器的配置。
你可以用它做的事情:
> 建立一個寫程式的小型LLM,autoresearch找到最佳架構,你用你的資料集訓練
> 創建一個離線在手機上運行的輕量級聊天機器人
> 用你自己的寫作訓練一個模型,讓它聽起來像你
> 在一夜之內測試「RoPE是否比ALiBi更適合小模型?」100個變體,而不是花3週做博士研究
> 為樹莓派或邊緣設備優化模型
你不能做的事情:
> 預測股價
> 找交易優勢
> 分析試算表
> 預測體育比賽結果
autoresearch是一個為想要建立語言模型的人設計的工具,而不是用來使用它的。Karpathy建立了一個自主循環,讓AI改善AI。真正的天才。但它解決的是一個非常特定的問題。
而那個問題可能不是你的。沒關係,就不要假裝它是別的東西。