🌕 Gate 廣場 · 中秋創作激勵 Day 9 賞金話題公布- #BTC战略储备市场影响# !
創作點亮中秋,帶熱門話題發帖,瓜分 $5,000 中秋好禮!🎁
立即報名查看詳情 👉 https://www.gate.com/campaigns/1953
💝 新用戶首次發帖並完成互動任務,即可瓜分 $600 新人獎池!
🔥 Day 9 熱門話題:BTC戰略儲備市場影響
近日,美國財政部攜手跨黨派議員重啓“比特幣戰略儲備”議題,討論是否將BTC納入國家資產配置框架。支持者認爲BTC稀缺性與抗通脹特性,可與黃金形成雙保險;反對者則擔憂高波動性與監管缺口,可能衝擊現有儲備體系。你怎麼看?
發帖建議:
1️⃣ 如果美國真把 #BTC# 列入戰略儲備,會不會成爲下一輪牛市的超級導火索?
2️⃣ 機構入場往往推高價格,你預測BTC短期/長期可能會衝到多少?會不會挑戰20萬美金?
3️⃣ 你覺得這一提案最快什麼時候可能落地?若通過,其他國家會不會跟進儲備?
快帶上 #BTC战略储备市场影响# 和 #Gate广场创作点亮中秋# 發帖,內容越多越優質,越有機會贏取 $5,000 中秋好禮!
揭秘iPhone裡的Transformer:基於GPT-2架構,分詞器含emoji,MIT校友出品
原文來源:量子位
蘋果Transformer的“秘密”,讓發燒友給扒出來了。
大模型浪潮下,即使保守如蘋果,也每逢發布會必提“Transformer”。
比如,在今年的WWDC上,蘋果就已宣布,船新版本的iOS和macOS將內置Transformer語言模型,以提供帶文本預測功能的輸入法。
一位名叫Jack Cook的小哥,就把macOS Sonoma beta翻了個底朝天,結果,還真挖出不少新鮮信息:
更多細節,一起來看。
基於GPT-2架構
先來回顧一下蘋果基於Transformer的語言模型能在iPhone、MacBook等設備上實現怎樣的功能。
主要體現在輸入法方面。語言模型加持下的蘋果自帶輸入法,可以實現單詞預測和糾錯的功能。
**
**### △圖源:Jack Cook博客文章
模型有時也會預測即將出現的多個單詞,但這僅限於句子語義十分明顯的情況,比較類似於Gmail裡的自動完成功能。
**
**### △圖源:Jack Cook博客文章
那麼這個模型具體被裝在了哪裡?一通深入挖掘之後,Cook小哥確定:
原因是:
進而,小哥根據unilm_joint_cpu中描述的網絡結構,推測蘋果模型是基於GPT-2架構打造的:
主要包含token embeddings、位置編碼、解碼器塊和輸出層,每個解碼器塊中都有類似gpt2_transformer_layer_3d這樣的字眼。
**
**### △圖源:Jack Cook博客文章
根據每層大小,小哥還推測,蘋果模型約有3400萬參數,隱藏層大小是512。也就是說,它比GPT-2最小的版本還要小。
小哥認為,這主要是因為蘋果想要一種不太耗電,但同時能夠快速、頻繁運行的模型。
而蘋果官方在WWDC上的說法是,“每點擊一個鍵,iPhone就會運行模型一次”。
不過,這也就意味著,這個文本預測模型並不能很好地完整續寫句子或段落。
**
**### △圖源:Jack Cook博客文章
模型架構之外,Cook小哥還挖出了分詞器(tokenizer)的相關信息。
他在unilm.bundle/sp.dat裡發現了一組數量為15000的token,值得關注的是,其中包含100個emoji。
Cook揭秘庫克
儘管此Cook非彼庫克,小哥的博客文章一發出,還是吸引了不少關注。
此前,他曾在英偉達實習,專注於BERT等語言模型的研究。他還是《紐約時報》的自然語言處理高級研發工程師。
那麼,他的這一番揭秘是否也引發了你的一些思考?歡迎在評論區分享觀點~
原文鏈接: