hacker_news_audio_tech_2026-03-12

Hacker News 音频技术 - 2026-03-12

1. 自托管TTS代理与语音管理器

作者: mooreds | 发布于: 2026-03-10 13:32


2. Show HN:TTS.ai

作者: nadermx | 发布于: 2026-03-08 07:01


3. Qwen3-ASR-Swift

作者: handfuloflight | 发布于: 2026-03-05 10:00


4. Show HN:KokoClone——使用Kokoro TTS实现零样本语音克隆

KokoClone项目在Kokoro TTS基础上实现零样本语音克隆,支持多语言,可在CPU/GPU上运行,保持原项目的速度和实时性。

作者: Ashish106 | 发布于: 2026-03-04 19:07


5. 多语言语音识别中的音调保真度:一项诊断性评估

作者: ibobev | 发布于: 2026-03-04 18:10


6. Ask HN:Mac上有类似willowvoice的TTS工具吗?

用户寻求在Mac上通过快捷键使用高质量TTS朗读文本的替代方案。

作者: fiiico | 发布于: 2026-03-04 11:24


7. 原生 Swift/MLX 全语音处理流程:端侧 ASR、TTS 与语音转换

作者: ipotapov | 发布于: 2026-03-03 06:41


8. Qwen3-ASR 0.6B与1.7B转录模型的C语言推理实现

作者: Curiositry | 发布于: 2026-02-28 00:05


9. Parakeet.cpp – 纯C++实现、支持Metal GPU加速的Parakeet语音识别推理引擎

作者: noahkay13 | 发布于: 2026-02-27 03:48


10. Show HN:基于 Kitten TTS 的 CPU 低延迟流式语音助手

Neo AI开发了一个在CPU上低延迟运行的语音助手管道,适用于普通笔记本或边缘设备,包含语音检测和流式处理模块。

作者: gauravvij137 | 发布于: 2026-02-26 12:42


11. TinyTTS:超轻量级英语TTS(900万参数,20MB),CPU提速8倍,GPU提速67倍

TinyTTS是一个专为边缘设备设计的超轻量级文本转语音模型,仅9M参数、20MB大小,可在CPU上快速生成音频,旨在节省VRAM与计算资源。

作者: letrghieu | 发布于: 2026-02-25 14:46


12. Show HN:Moonshine 开源权重 STT 模型——准确率超越 WhisperLargev3

小型初创公司推出开源语音转文本模型,在流式处理和词错率方面优于OpenAI Whisper,性能接近行业领先水平。

作者: petewarden | 发布于: 2026-02-24 21:54


13. Show HN:Localvoxtral – 在 macOS 上实现带流式语音识别的本地实时听写

一款macOS菜单栏实时听写应用,完全在设备上运行,使用Mistral Voxtral实现边说边转录,支持Apple Silicon和NVIDIA GPU后端。

作者: T0mSIlver | 发布于: 2026-02-24 15:00


14. Show HN:TTSLab——一款基于WebGPU在浏览器中运行的语音AI助手与TTS实验室

TTSLab是一款开源工具,利用WebGPU和WASM在浏览器中本地运行文本转语音和语音转文本模型,无需API或网络请求,支持多种模型和语音代理功能。

作者: MbBrainz | 发布于: 2026-02-23 15:52


15. Kyutai Labs 的 Pocket TTS 推出 iOS 版本

作者: unamentis | 发布于: 2026-02-20 17:14


16. Show HN:Apple Silicon 本地 TTS 支持 OpenClaw(基于 MLX,零配置)

为Mac开发的OpenClaw插件,可在本地运行文本转语音,无需API密钥或云端服务。它封装mlx-audio,自动管理Python环境和服务器进程,并提供多种语音模型选择。

作者: ZacharyZZ | 发布于: 2026-02-20 03:00


17. Show HN:KittenML 发布三款新模型,开源 TTS 小于 25 MB,表现力出众

作者: rohan_joshi | 发布于: 2026-02-20 02:11


18. 开源语音克隆应用采用Qwen3-TTS技术

作者: angelmm | 发布于: 2026-02-19 12:25


19. 语音代理STT性能基准测试:10项服务、千条样本、语义WER评估

作者: edgarsDev | 发布于: 2026-02-18 17:26


20. [Android] Nabu 0.5.4 发布:支持 Soprano TTS 及本地 LLM HTTP 服务器

作者: mewmix | 发布于: 2026-02-16 17:50