Typeless 两周使用体验

lucyqin
IT
2026-02-01
322热度
0评论

当年在看《奇点临近》这本书的时候，我记得有一个比喻。我忘了是书里的原话，还是我看完书后自己想到的：AI 或者说那个“奇点”，就像一辆 48 路公交车。你等它等得很焦急，等了 40 分钟，它终于从远处出现了。你非常激动，终于等到它了！结果它到你身边的时候并没有停，而是只用了5秒钟就呼啸而过，留下你在原地不知所措。

我们正身处AI 时代，一切事物都在显而易见地加速。2026 年才过了 1 个月，就有网友在 Twitter 上感慨，这 1 个月的信息量，简直能赶上过去一整年。在这波浪潮中，基本上可以确定，语音输入将扮演重要的角色，2026 年将是语音输入的井喷之年。钉钉在 2025 年 9 月推出了录音卡，现在已经经过了 4 个月的迭代；安克、飞书不甘落后，推出了 AI 录音豆。而这篇的主要内容是关于 Typeless。

Typeless 从安装使用到现在已经两周时间了。查看了一下记录，使用 Typeless 的时间一共是 2 小时 40 分，输入 words 17300 个，节约时间是 8 个小时。看来免费的每月 4000 字额度是远远不够用的啊。

下面我从几个方面来点评一下 Typeless 使用中的感受，也包括我认为的几个不足之处。

一、语音识别

在一般情况下，如果你拿着笔记本进行面对面的语音输入，或者给台式机装上麦克风，你可能不会过多在意录音设备瓶颈及与之密切相关的语音识别率问题，因为在录音效果非常好的情况下，目前任意一款语音识别软件都可以达到很高的识别率。

我经常开会，有很强的会议记录需求，之前的折腾经历告诉我，任何单一设备在较大的会议室中，录音效果都是差强人意的。所以我自然而然想到，可以测试一下 Typeless 在会议室场景下的识别率表现。

我在笔记本电脑上同时安装了讯飞语音输入和 Typeless，然后在一个大约有 20 个人参加的中型会议中进行了实测。结果发现，讯飞在这种场景下识别出来的结果惨不忍睹，几乎没有办法使用（这一点有预期）。而 Typeless 可以达到 90% 以上的准确率，同时还能帮你自动排版，甚至自动给专有名词加上引号。

当然，我测试时用的是笔记本自带的录音装置，并不是讯飞的专用录音笔硬件。但我的测试是在同样的录音条件基准下进行的，双方的表现差异实在是太大了，Typeless 完全秒杀了讯飞。在这样的会议规模下，Typeless 甚至可以取代很多专用于会议的设备和“硬件+软件”的转写方案——而我曾经一度认为用笔记本自带的录音在会场上进行语音识别是不可能实现的。 Typeless 将“不可能”变成了“可能”。

可以看出，以大模型为技术底座的语音转写方式，对传统的语音识别方式完全是降维打击。

二、自动整理

因为 Typeless 是基于大模型的，所以它最大的卖点就是可以消除说话中的“嗯、啊”等语气助词，以及一些颠三倒四的表达瑕疵，自动帮你修复成流畅、准确的表达。它在很大程度上（虽然不能说100%）能够遵循你的原意，这是它最出色的地方。

让人印象深刻的几点：

1、自动分段和添加小标题：它能够自动帮你分段，并根据实际语义，将部分文字以小标题的形式呈现。

2、中英文混输：当你中英文混杂输入时，它的识别非常准确，甚至可以自动帮你加括号，这一点在传统的语音输入上是明显的短板。

3、流行词汇识别：它能识别一些最新的流行词汇，这也是传统语音输入常常表现不佳的地方。

三、局部修改

在 Typeless 的相关讨论中，我发现较少有人讨论局部修改的问题，但我认为这一点是很关键的。显而易见，再好的模型也不可能做到 100% 正确。如果它的定位是让你彻底抛弃键盘，就必须妥善解决局部修改的问题。在一次识别完成后，你需要修改的可能仅仅是一两个字、一个数字或者一个标点符号，如何方便地做到这一点，是语音输入法的“最后一公里”。

在这一点上，Typeless 实现得非常不错。在PC 端，Typeless 并不是作为输入法被安装的，它是一个独立的第三方软件。这种设计非常巧妙，当你语音输入发现局部要修改的时候，你可以直接用已有的输入法进行修改。当然，用语音修改也是可以的，你可以选中任意可编辑的文字，再用 Alt 键或 Alt + 空格键启动 Typeless，它就进入了修改模式，你说的话会被理解为语音指令而不是输入内容，AI 将对选中的文字进行你要求的修改。比如，你可以告诉它“修改哪一个逗号”、“把某一个逗号改成句号”，或者修改具体的数字和个别文字。

在手机端稍有不同。当你语音输入完一段话，显示出识别内容后，你可以点击输入面板右下角的编辑按钮，再给出编辑的语音命令。

这里的体验稍有不足的是，通过语音修改一个标点符号或者个别字，因为要经过 AI 的理解和执行，效率上显得不那么高。但如果结合语音输入的场景（比如正在开车），有这样一种完全无需动手的方式还是有必要的。

四、超越“输入法”

Typeless 既是输入法又超越了输入法。最近更新的新版本还支持直接翻译，这给人很大的惊喜。这显然超出了正常输入法的范畴，但你会觉得非常实用，有一种“输入法还能这么用”的“AHA”感。

我们当下可用的翻译工具很多了，Google、Baidu，都提供了翻译专用的页面，但这种“切换来切换去”并且“复制来复制去”的方式，与 Typeless 的这种一步到位的方式相比，后者“优雅”多了。

结合它强悍的语音识别率，在国际会议上，它已经可以充当一个实时翻译记录的工具。我实际测试过，在电脑上播放一段英文视频，让它一边听写一边记录为中文，效果是令人满意的。

另外，Typeless 不仅仅超越了“输入法”，也超越了“翻译”。当你想要写一封英文邮件的时候，你可以口述一段中文，然后它直接输出英文；然后你选中这段英文，让它帮你转成“邮件格式”，Typeless 也会帮你妥帖改好。这一切工作都不会离开当前的编辑页面，实在是体验感满分。

五、个人词典

所有的语音输入法都有一个共同的痛点，就是专有词汇（个人词典）的问题。如果你不给模型提供专有词汇，在专业会议这种涉及大量专业术语的场合，或者像同音人名的情况（例如“王小明”的“小”可能是大小的小，也可能是晓得的“晓”），仅凭语音是不可能准确识别的。这就需要用户自定义词汇，也是所有语音识别软件的一个必备的功能。

在这方面，我觉得 Typeless 有做得好的地方，也有不足的地方。好的地方是，它打破了传统的用户手动自定义模式，可以根据你以往的编辑过程，自动识别出专有名词，并添加到个人词典里面。这一点是突破性的进步。

不足之处在于，目前 Typeless 并不支持导入用户个人文件，或读取用户手机上的通讯录。如果它可以把通讯录上的姓名全部添加到个人词典，显然可以显著提升使用体验，那 Typeless 为什么不做呢？我理解可能是担心侵犯用户隐私。但我觉得，想做好一个完美的输入法，还是需要往前迈进一步，至少可以让用户自己选择是否开放通讯录读取权限。

六、一次性录制时长

估计很少有用户发现，Typeless 一次性录制时长是有上限的，是 6 分钟。一般情况肯定够了，但如果用在会议室这种情况下，还是远远不够的，对于某些喜欢在屋子里一边转圈、一边口述文章的人来说，也是不够的。当时间已经接近上限的时候，它会屏幕上出现提示，这时候你就需要手动地先识别一轮，然后再启动下一轮。

这里是有改进空间的：从软件设计逻辑上讲，它完全可以在上传、识别前一个 6 分钟录音的同时，自动开启下一轮录音。这个能实现的话，我觉得它的适用场景会进一步拓展。

七、Apple 系列的录音权限管理

iPad、iPhone等对录音权限的管理相对比较严格，对于自定义输入法，它必须常驻后台，才能始终开启录音权限。也就是说，当你在使用其他 App 时，就算你当前没有使用输入法，但 Typeless 常驻后台，所以录音权限始终是开着的。这导致屏幕的右上角始终有一个橙色的点，表示录音功能正在使用。这个机制可能会给一些安全敏感型用户带来顾虑。

如果用户担心窃听，手动将这个录音权限关闭，那就等同于关闭了输入法，在下一次激活 Typeless 输入法时，它就会重新申请一次录音权限。这让 Typeless 在整个 Apple 系列产品中的使用体验上，稍微有一点瑕疵。