Telegram Web
Gemini 2.5 pro 版本更新

现已更新 0605 版本,可在AI Studio试用或通过API调用
把之前常用的AI提示词做了个页面分享,其中比较有趣的或许是头图生成的HTML、之前总结内容的提示词等

只是比较粗浅的使用大模型,在使用大模型的道路上还有很长的路要走

https://craft.linlife.link/7veTS5HWTH8eks
嗯..不是很认可,但可能我还要多想想 source
失去了颜色这一重要的辨识维度的icon,Apple 是想彻底放弃中老年市场吗

希望只是我理解不准确

edit:可选开关
伊朗官宣,伊斯兰卫队最高总司令在以色列首轮打击中阵亡。
Forwarded from 财经慢报
华立科技创立音乐厂牌并举办音乐节
华立科技于 6 月 13 日宣布,公司旗下全新音乐厂牌 “WA MUSIC” 将于 7 月 20 日在广州举办首场大型音乐节。
Forwarded from 404 KIDS SEE GHOSTS (生产力之王版 (志筑仁美)
# AI 语音输入法丨如何 X10 倍提升我的思维传输效率
https://tryvoiceink.com/

最近我使用大疆 Mic mini + VoiceLnk 进行高强度语音输入,与朋友聊天、内容创作和日常交互,每天几万字的输入,极大提升了沟通和创作欲望,真正 X10 倍提升思维传输效率。

我主要使用 VoiceLnk 进行语音输入,作为非常强的 AI 语音输入软件,VoiceLnk 采用本地 AI 模型、可选择各种转录模型和接入 AI API 来进行语音的转录、处理和输入,它完全本地化处理,珂自定义个人词典、设置全局快捷键,以及拥有上下文感知功能,其智能模式还能根据不同 APP 来识别并适配不同 AI 预设提示词以进行转录和处理,非常强大。

VoiceLnk 是 WisprFlow/ SuperWhisper/ MacWhisper 的超强替代品,这些自定义功能完全吊打他们。这里注意和 VoiceNotes 区分,前者是全局听写的 AI 语音输入工具,VoiceNotes 是主打语音笔记录入和会议录入的语音记录工具,虽然目前已经出了与 VoiceLnk 类似的全局听写功能(dictate),但是配置简单,没有自定义提示词和其它高级玩法,需要区分场景。

最新季的黑镜中有一集是关于「量子吊坠」,主角可以通过她的吊坠以调动不同平行时空来实现当前说话提示的场景(Prompt)。我通过 Mic mini 挂坠与VoiceLink 结合,完全实现了量子吊坠的 Demo 功能,使用智能模式在不同的软件如 Discord 中,直接调动该 APP AI 预设提示词,将中文翻译成英文;或者邮件界面,调用邮件格式的提示词以处理当前场景,我只需要说主要内容。另外,我在房间里面踱步,边走边说,随时停顿,然后继续或者完成。

01 语音输入作为无损思维传输方式。

语音输入法的每分钟词数(WPM)远超键盘输入,有研究表示,语音输入相较于键盘输入的速度优势达到 4-5 倍,这是最直接的优势。使用语音输入最大的感触是重塑了我的思考和表达能力,它让我适应说话和思考的节奏、有停顿感,让我更贴近真实的说话、分享、思考模式,语音输入和思维连贯一体,说话与思考倾泻而出。我闭上眼睛表达,纯粹地传输我的思考,脑子里的图像以及我想构筑的场域。

书写和键盘打字只是延迟和复刻这种传输,几乎降格为前现代的思维有损传输方式,甚至变得疏离,键入书写时的反复修改,停顿和构思措辞、笔触,以及那些无法增量语义的内容,极度降低效率。它不能完全地传达思想,无法更迅速,我在想,可能迅速是一种全保真的方式,如果你的速度不快,它就可能失真,它会在传输过程中丢掉很多东西。

当然,这种语音输入的表达和思考方式需要训练。这里面涉及新的摩擦和认知负荷,但绝对有益。写作即思考,如果你不能将你思考的内容写出来,那说明你没有思考过,或者思考得不够透彻,现在这句话完全可以转移,如果你不能直接和流利地说出来,那么你也几乎没有彻底思考,而这更能考验你思考的深度和准确度,即无损传输。

02 语音受到环境、口音、习惯和识别率的影响,这决定了语音输入需要考虑更多摩擦和认知负荷问题。

语音输入具有阶段性功能。如果语音转录识别率达到百分之百,也是无法直接使用,这对个人表达和认知负荷能力要求高,另外,将提示词大幅地增加和应用润色,于那些对自己思维方式和思考内容原生性要求极高的人也行不通,他们遵从自己的文本习惯和思维,笔触或者说措辞。

这里需要考虑语义失真的问题,所以这里语音输入有一个核心功能,即作为前期语义识别的转录优势来传输。这种语义和思维识别率上达到最佳即可,因为后续都需要深层建构和打磨修改,只需要完整的保留和转录思维本身。

语音输入具有任务性功能。AI 语音输入非常适合在聊天互动中进行长文本输出,当表达观点、回答问题以及在日常聊天互动中,都可以需要成块成簇式表达我们的观点,而不是碎片式沟通,这对于常态语境下的沟通没有多少意义。第二个,非对话式交互(与人),与 AI 聊天窗口沟通、搜索内容,都可以用 AI 语音输入。第三,在作为灵感的写作输入输出的时候,前期这种阶段性语义调思维提取和铺垫都可以使用。而对于如编程、代码和设计这些高精度内容处理则不再适用。

Voicelnk 现在速度非常不错,长段内容都是几秒处理,除了说得太快它无法正确识别,无可厚非,主要它前期的语义输出优势太大。

键盘仍然有其不可忽视的功能使命,人是视觉动物,键盘输入伴随即时持续的文本视觉反馈可以非常从容地处理内容,虽然我们在前面提到语音输入阶段的修改可能会造成语义和思维受损,但在后期的打磨和作品生成阶段,键盘塑形是必要的,需要去推敲、构筑和增删文本,以触及那种灵光乍现和去往其他的深层内容,这是思维的奥妙之处,这很有趣。所以键盘在这里作为一种 Craft 艺术、视觉化反馈必要的创作方式,就像人们画画、雕塑,去实打实地调用触觉、视觉和嗅觉等感官感受作品。至少脑机接口实现之前,无可替代。

人们的日常表达和传输速度已经完全溢出,我们已经很难同步跟上这种传输节奏,无论是以前仿生阅读,还是 AI 总结,吸收速率大打折扣。我认为现在真正需要去打磨的还是阅读吸收方式。我们局限太多。

#ai #tools
Forwarded from Karen医生の日常
正常剂量不会伤害到肝脏的
2025/06/14 14:13:59
Back to Top
HTML Embed Code: