マイクロソフトは、自社のVibeVoiceモデルを基にした無料の音声入力ツールVibingをリリースしました。これは、有料製品のWisprFlowと対比・対抗するものです。

BlockBeatNews

据 1M AI News 监测,微软发布桌面语音输入工具 Vibing,基于自家开源语音 AI 模型 VibeVoice,支持 macOS 和 Windows,免费使用。
按下快捷键(Mac 右 Option / Windows Ctrl+Win)即可在任意应用中唤起录音,结束后自动输出文本。
AI/ML 社区测评者 @realmrfakename 亲测后称转录准确、速度快,评价为「WisprFlow 的免费替代品」。

Vibing 不只是语音转文字。
它通过 LLM 将口语重写为适合当前场景的书面文本,支持在输入过程中用自然语言直接修改、删除、整理已有内容。
其他功能包括单次 5 分钟以上连续录音、50+ 语言自动识别、同一句话内中英文混合输入、自定义热词以及实时翻译。

底层的微软 VibeVoice 是 MIT 协议开源的语音 AI 模型家族,GitHub 星标超 2.8 万,
包含 7B 参数的 ASR 模型(单次处理 60 分钟音频)、1.5B 的 TTS 模型(生成 90 分钟多人语音)和 0.5B 的实时模型(300ms 延迟)。
WisprFlow 是目前 Mac 上最受欢迎的 AI 语音输入工具之一,按月订阅收费,
Vibing 直接以免费 + 开源的方式进入同一赛道。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし