AI照亮人生:发音不清的他,用自己做的AI,让全场听懂了他

AI照亮人生:发音不清的他,用自己做的AI,让全场听懂了他div class img wrapper div

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



 
  
    
    

  4月10日,杭州,演讲台上。

  一个年轻人刚开口,台下有人下意识皱了下眉。他的声音含混、吃力,像含着一朵厚棉花。

  但下一秒,所有人的目光都被屏幕吸引。左右两块大屏上,文字一行行跳出来,准确、流畅,和他嘴里发出的音节一一对应。没有人需要费力去猜他在说什么。

  那个帮他“翻译”声音的工具,叫“燃言”,这是他自己开发的。

  这是28岁的邱生峰人生第一场公开演讲。他出生时因缺氧导致脑瘫,发音不清。这一天,他用自己的AI产品,让自己被完整地听见了。

  “最大的困难不是说不清

  而是不愿等”

  邱生峰是四川隆昌人,重庆大学数学系毕业,后来成了一名算法工程师。在MBTI测试里,他是典型E人。他总对外界充满好奇,喜欢和人交流。但现实生活中,发音不清让他一次次把想说的话“咽”了回去。

  高三那年,大家学习紧张,很少有人愿意花时间听他讲完一句完整的话。他一度陷入低落,不知道怎么开口,也很少有人主动和他沟通。后来他考上大学、进入职场,以为技术能改变一切,但现实的摩擦从未消失。

  职场里,效率是第一语言。在开会、谈合作的很多瞬间,让邱生峰逐渐意识到一个更根本的问题:他最大的困难,从来不是生理上的“说不清”,而是环境里的“不愿等”。

  中国有超过一千万人面临构音障碍的困扰。脑瘫、渐冻症、中风、听力损伤……他们中的很多人因此不敢出门、不敢社交。市面上几乎没有一款成熟的辅助产品,因为绝大多数AI语音工具只能听懂标准发音,而构音障碍者的声音千差万别,数据极其稀缺。

  邱生峰突然想到:我懂AI,我为什么不自己做?

  从“不清”到“燃言”

  去年,邱生峰参加了通义实验室与魔搭社区举办的“小有可为”AI向善比赛。看到助盲眼镜、智能轮椅,他深受触动。赛后,他创办了“燃言”,一个能实时将不清的发音翻译成文字的工具。

  技术上最难的不是算法,而是数据。中文构音数据几乎为零,不同病因、不同程度的发音差异巨大。他和两位伙伴翻遍全球60多篇论文,整理成开源仓库。然后他拉来30多位种子用户,每天录音、标注、迭代。他还一个人跑去北京路演,过程很辛苦、很笨拙,好在换来了训练资源。

  一个用户告诉他:“我讨厌在外面被家人替代表达。”另一个说:“我希望能用自己的声音主动参与社交。”

  “这些需求定义了我们的产品。”邱生峰说。燃言的核心功能有三个:实时辅助沟通、语句训练反馈和个人记忆管理。让AI记住每个人的说话习惯,越用越准。

  今天,邱生峰第一次带着他自己研发的产品站上舞台。台下坐着几百个陌生人。他讲了二十多分钟,没有一次需要重复,没有一个人露出不耐烦的表情。

  演讲最后,他说了一段话,被“燃言”一字不差地打在屏幕上:

  “过去我常想,如果有一天我能流畅地表达,我想说什么?现在我觉得,说什么没那么重要。重要的是,我终于可以说了。”

  台下掌声雷动。

  那些被“微小需求”卡住的人

  每次坐进医生诊室,戴嘉玮都会先深深吸一口气。

  在外,他是杭州一家公司的产品经理,回到家里,他是慢性病患者的家属。过去十几年,他积累了厚厚一摞的纸质报告、化验单和手术记录,带着它们跑遍了北京、上海的十几家医院。

  每次换一家新医院,医生都要问同样的问题:什么时候发病的?用过什么药?做过什么手术?尽管十几年时间他已经烂熟于心,但每次面对医生还是免不了紧张。因为医生面诊时间非常有限,一旦漏掉了某个关键信息,或者一时找不到对应的报告单,又或者说错了某个专业术语,就会影响了医生的诊断。

  他去应用商店搜过,没有一款工具能帮他。不是技术做不到,而是需求太小众,没有商业动力去做。

  “那我就自己做一个。”一个念头闪过。

  但对一个非程序员来说,独立开发一款支持图像识别和自然语言处理的软件,以前几乎是天方夜谭。不过现在,有了AI编程工具的辅助,有了千问开源模型以及背后强大社区的支持,这个“不可能”变成了现实。

  基于Qwen3-VL的多模态能力,他开发了“Aura”智能健康助手,拍照上传化验单即可生成病程时间线和就诊简报,数据完全留在本地。从此,他再也不用对着新医生反复背诵那十几年的病史。

  作为一名身在AI热浪之下的从业者,戴嘉玮最大的感受可以用两个字来概括——释放。

  “AI正在以前所未有的方式,满足着那些长尾的、个性化的、在过去长期被压抑的人类需求。”戴嘉玮说。

  有件小事对戴嘉玮的启发很大。

  对普通人来说,洗澡的时候用沐浴液和洗发液是一件再普通不过的事。但对视障人士来说,沐浴液和洗发液必须放在固定位置,要不然就会弄错。市面上也没有任何工具去可以解决生活场景里这样的小问题。

  去年,在“小有可为”AI向善比赛中,他见到了一位名叫“帆哥”的 95 后开发者,仅仅花了100 多元成本,通过调用开源的千问大模型,就“手搓”出了一副专门给视障人群使用的 AI 眼镜。

  这副眼镜非常神奇,它能实时识别盲道、红绿灯,甚至能给盲人讲解超市货架上的商品。他戴着这副眼镜在街头进行实地测试,在 27 分钟的时间里,安全地穿越了 4 个没有信号灯的复杂路口。

  其实,在 2024 年,戴嘉玮也尝试开发过类似的眼镜。但受限于当时模型的性能,大约有1 秒以上的延迟,这种体验始终无法满足日常生活的安全需求。但仅仅不到一年的时间,模型的发展速度超乎了所有人的想象,“帆哥”开发的这副眼镜,使用延迟已经降到了不超过200 毫秒。

  戴嘉玮在演讲中分享了一句话,后来被很多人记下来:“技术的温度,不在于它能实现多伟大的叙事,而在于它愿意为多小的需求弯腰。”

  AI热浪之下的普通人:

  用AI照亮人生

  你还记得九年前最火的是什么?共享单车。9年后的今天,让全世界疯狂的是一个叫“小龙虾”的AI智能体。

  过去两年,大模型技术狂飙突进,但聚光灯大多打在科学家、工程师和资本身上。AI浪潮之下的普通人,或焦虑,或逃避,或在焦虑与兴奋之间横跳。

  今天,在阿里巴巴西溪园区,国内知名的演讲平台“一席”联合阿里通义实验室,把镜头对准了AI热浪中的普通人。

  演讲的舞台上,包括邱生峰、戴嘉玮在内的五位普通人,用自己的生活经历告诉每个热浪之下的普通人:AI正在从专业工具变成通用能力,即使不懂代码,也能定义产品、填补世界的缺口。

  邱生峰不是天才程序员,他只是一个被生活卡住了很久、然后决定自己动手的人。

  63岁的赵伟程退休后才开始学AI,现在教上千个退休老人用AI解读体检报告、整理人生故事。

  大四学生范文涵用AI帮农学院解决了“判麦子”的苦活:人工记录时间缩短三分之二,准确率超过92%。

  在新加坡,Jian Gang Ngui和他的团队为7亿东南亚人打造了母语大模型SEA-LION,让外籍劳工能用母语了解自己的权益。

  他们都不是技术大牛,没有写论文、发顶会。他们只是普通人,被生活里某个具体的难题卡住了很久,然后发现:AI能帮上忙。

  当然,不是每个人都有能力从零开始写代码、调模型。很多人连第一步都不敢迈,怕踩坑,怕搞不懂。这两年的变化在于,像通义这样的实验室每季度都会举办多场开发者黑客松比赛,动手门槛也是越降越低,同时模型使用教程、线下沙龙一应俱全。

  据说今年参赛的“小白”开发者比例大幅上升,有人结合小时候家里养羊的经验做了“羊脸识别”,希望能帮助小型家庭养殖户;有人为自己定制了篮球姿势识别矫正器,让训练更专业。普通人正在从“用技术的人”变成“造技术的人”。

  这可能也是AI浪潮里最动人的部分:它不再是实验室里冷冰冰的参数,而是弯下腰,去捡起那些被忽略的、微小却真实的需求。

  文|沈积慧

小讯
上一篇 2026-04-14 17:58
下一篇 2026-04-14 17:56

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/260566.html