AI 驱动的语音转文字

语音到润色文本,
轻松高效

Yark 将高质量语音识别与 AI 润色相结合,为您提供准确、可直接使用的文本。自由选择你信任的模型,我们让它完美运行。

150+ 种语言
AI 智能润色
你的密钥,你做主
下载 macOS 版本
免费试用 • 无需信用卡 • 使用免费 API 可实现 $0/月

速度

说得更快,做得更多

普通人打字速度是 40 WPM,但说话速度是 150 WPM。这是 3.7 倍的速度优势,等待你来解锁。

40
WPM 打字
3.7x
更快的输入
150
WPM 说话
真实世界的影响

来自一位同时管理多个 AI 会话的深度用户:

「打字时,我最多只能同时管理 2 个 Claude Code 会话,每次的 prompt 也不长。但用语音输入后,我可以同时维护 4-5 个会话,还能同时回复工作消息和朋友消息,向 ChatGPT 查询信息——同时给每个 AI 更长、更详细的 prompt,获得更高质量的回答。」

语音输入大放异彩的场景

AI 对话

提供更丰富的上下文,获得更好的答案。轻松管理多个 AI 会话。

简短 prompt,上下文有限
详细 prompt,完整上下文

邮件和消息

几秒内完成回复草稿,而不是几分钟。自然的语气,更快的处理速度。

每封邮件 5-10 分钟
每封邮件 1-2 分钟

笔记和文档

以思考的速度捕捉想法。完美适用于会议、头脑风暴、日记。

因为麻烦经常被跳过
轻松、完整地记录

工作原理

没有黑盒,一切透明

我们不会用神秘的「AI 魔法」来忽悠你。Yark 对工作原理完全透明。

1

你说话

按下快捷键,对着麦克风自然说话

2

语音转录

本地或云端模型将你的声音转换为文字

3

AI 润色

大语言模型优化语法、标点和格式

4

文本就绪

润色后的文本插入到光标位置

你选择每个模型。你拥有每个密钥。我们只是让它们完美协作。

使用 SenseVoice 等非自回归架构模型,40秒语音本地转录仅需 0.5 秒;配合 Groq 快速 LLM,整体延迟可控制在 1 秒左右。与 Wispr Flow、Typeless 等云端方案相比,质量相当,部分模型组合下延迟更低。

功能

语音转文字所需的一切

高质量转录配合 AI 润色,为最大的灵活性和隐私保护而设计。

高质量转录

结合快速本地语音识别与 AI 润色。几秒内获得准确、格式化的文本,让你专注于表达。

  • 快速本地处理
  • AI 增强输出
  • 离线可用
  • 多种模型可选

AI 智能润色

每次转录都由你选择的大语言模型优化。自动修正语法、添加标点、提升可读性。

  • 语法修正
  • 智能标点
  • 支持自定义提示词
  • BYOK(自带密钥)

你的模型,你做主

完全本地运行以获得最大隐私,或使用云端 API 获得最佳准确度。你的密钥,你的选择,你的数据。

  • 支持完全本地
  • 自选服务商
  • 无数据收集
  • 完全透明

150+ 种语言

从英语到粤语,印地语到阿拉伯语。支持全球主流语言及方言,覆盖你的所有场景。

  • 自动语言检测
  • 多种方言
  • 混合语言支持
  • 持续扩展中

使用 Omnilingual 模型可支持 1600+ 种语言

更多功能

全局快捷键

使用完全可自定义的快捷键,随时随地开始和停止转录。适用于任何应用。

灵敏语音拾取

在安静的办公室、图书馆或深夜?Yark 的调优音频管道即使在轻声细语时也能清晰捕捉。

全方位自定义

使用本地模型免费转录,或用 Groq 等云端服务。自定义润色提示词来匹配你的写作风格。

灵活的模型支持

选择你的语音识别模型(SenseVoice、FunASR 等)和大语言模型服务商(OpenAI、Anthropic、Groq、本地)。按需组合搭配。

音频闪避

录音时自动降低其他音频音量,提升转录质量。

AI 改写模式

选中任意文本,一键让 AI 改写、润色或转换风格。

自定义词典

添加技术术语、人名和行业用语,提升特定领域的转录准确度。

词典自动识别(即将推出)

文本片段

预设常用短语或模板(如邮件签名、地址),说出触发词即可快速插入。

成本

转录的真实成本

别再为那些隐藏工作原理的服务每月支付 $15-30 了。

Yark

$29 一次性

免费 API

使用 Groq 或 OpenRouter 免费额度

$0

/月

付费 API

XAI Grok 高强度使用

~$0.80

/月

年度总成本(含授权)$29 - $39/年

订阅制工具

持续订阅

Wispr Flow

月付

$15/月

年付

$12/月

Typeless

月付

$30/月

年付

$12/月

年度成本范围$144 - $360/年

每年可节省高达 $348

使用免费 API 时,每年只需 $29(仅首年)

隐私

隐私由你做主

不同于那些把你的声音发送到未知服务器的订阅服务,使用 Yark 你能清楚知道数据流向何处。

完全本地模式

可选完全本地运行,没有数据离开设备。适合敏感内容。

BYOK 云端

使用自己的 API 密钥。选择有数据不保留政策的服务商,安心使用。

混合模式

本地语音识别 + 云端大语言模型。两全其美——快速私密的语音捕获配合强大的 AI 润色。

你始终掌控一切。没有隐藏的数据收集。没有神秘的云端处理。

定价

简单透明的定价

一次付款,永久拥有。API 成本另计(可以是 $0)。

终身授权
$29美元

一次付款 • 永久拥有

  • 无限转录
  • 使用您自己的 API 密钥
  • AI 智能润色
  • 150+ 种语言支持
  • 完全隐私控制
  • 包含 1 年更新($19/年续期)
查看定价详情

14 天免费试用 • 无需信用卡

API 成本独立计算,取决于你的使用量。使用免费额度,每月成本可以是 $0。

准备好改变你的打字方式了吗?

下载 Yark,体验真正好用的语音转文字。14 天免费试用,无需信用卡。

14-day free trial
No credit card required
$0/month possible