问题还没说完,就被AI抢答是一种什么体验?被AI的“活人感”震撼到一度怀疑究竟和自己对话的是真人还是机器人又是什么感受?近日,在上海举办的WAIC 2025上,笔者就看到了Soul App情绪价值赋能方向等诸多智能体应用落地的场景,也看到了现场观众讨论AI的热情。“下一轮的AI,卖的不是工具,而是收益。”这句话已经成为行业共识,生成式AI的赛道也正在从“如何制造更多工具”向着“如何产生更多价值”的方向发展。当技术转化为更多普通个体愿意为之买单的实际体验,才能催生AI时代的Killer App,而这届WAIC大会提供了一种方向。AI步入新时代,从工具到创造价值AI不再是卖工具,而是创造价值已经是当下AI发展的重要趋势,这点从近日举办的WAIC上就能“可见一斑”。与去年绝大多数应用场景仍处于炒概念不同的是,今年WAIC期间,各个参展商都带来已经成熟落地的应用,这些应用有一些是在原先软件服务基础上,AI化之后提供的“解决方案的智能化”,有一些则是基于AI开发的,AI原生的“智能化的解决方案”,但它们相较于去年,都有了不少实际落地的经验与成果展示。比如,在大会期间,在中信集团展台上,华智生物展示了融合AI图像识别与深度学习技术的智能考种分析仪,解决了传统依赖皮带传动与风选模式识别空头稻穗存在的误判率高、数据离散等痛点。AI智能体创造价值的场景不仅局限于农业领域,围绕医疗、工业、金融、交通等领域,也有不少厂商在本届WAIC上带来了全新的,结合了智能体的应用场景。除了传统面向B端的企业级AI应用之外,在C端,AI在面向终端用户方面也有了不少成熟的应用落地。比如在Soul连续多年参加WAIC的主题中,可以看到其“AI+社交”的发展路线,今年,Soul更是在原有AI功能的基础上,在底层技术和应用方面升级,带来了全双工实时语音通话大模型,以及全新的AI社区应用成果。AI+社交,为什么“活人感”很重要根据关注年轻人趋势的Just So Soul研究院2025年上半年调研数据,超过80%的年轻用户正借助AI建立起真实的人际关系。其中,39.9%从AI获得了话题建议和情感咨询/支持,43.6%凭借AI生成答复成功社交破冰,37.7%在AI帮助下匹配到了志趣相投的好友。观察Soul的技术发展路线,其人机互动的迭代方向便是让AI实现类真人能力,在交互中为用户带来情绪价值和信息价值,提升个体体验,并促进现实关系发展。一方面,快速的生活节奏催生了个体的“原子化”趋势和现实社交困境;另一方面,AI技术的升级进一步赋能链接并重塑大众对人机互动的认知。据了解,过去一年,Soul的AI能力有了较大的迭代,特别是在2024年,Soul AI大模型能力整体升级为了多模态端到端大模型,支持文字对话、语音通话、多语种、多模态理解、真实拟人等特性。“目前,Soul的关系模型灵犀能够推荐‘精神层面距离最近的灵魂’,情绪模型Soul X能够精准捕捉如孤独感、安全感等用户情感需求,通过AI向用户提供长期的情绪价值。”在WAIC现场,Soul App副总裁及市场负责人范莉这样介绍道。值得注意的是,在AI技术不断演进的过程中,Soul在过去一段时间重点布局了“全双工”方向,打破目前行业中语音交互普遍的“一来一往”形式,让AI自主决定说话时机。笔者在WAIC现场感受了一下全双工语音大模型的效果。传统的半双工的一问一答,且中间还需要AI反应回馈的等待时间。但在全双工的模式下,用户与AI的交互是同步的,AI甚至会打断对话者的通话并基于这段对话反馈。比如在笔者体验过程中,面对笔者提出的“你是哪里人?”的问题,当笔者“话音未落”,AI就开始回答,并主动向笔者介绍了当地的特色。(WAIC 2025 Soul App展台体验现场)值得注意的是,全双工语音大模型发音方面与真人“难辨真假”,在现场体验环节,笔者仅通过听声音并不能准确地辨别对话中两个声音哪个是真人,在工作人员的告知下才得知真相。除此之外,该模型还能模仿各个地区的方言。与传统的语音模型声音过于机器化相比,全双工大模型能带给用户更加真实的体验,带来“活人感”的互动。当然,在技术探索的过程中,Soul也遇见了不小的挑战,其中,打破行业中普遍存在的“轮次对话”模式,赋予AI自主决策对话节奏的能力就是一个不小的挑战。例如,Soul通过让模型基于建模预测沉默(Silence)和响应(Response)Token预测任务,实现机器人的完全自主决策能力,精准控制对话节奏中的沉默与发声时机,“Soul的方法让AI自己‘琢磨’什么时候该沉默(等着听你说),什么时候该开口回应你,就像真人对话一样,它自己掌控节奏,时机更准。”Soul App AI技术负责人尹顺顺表示。以持续的技术能力建设为基础,Soul希望围绕用户实际的社交需求,深入推进AIGC技术与社交场景的深度融合,在‘模应一体’方向下,为用户带来更沉浸、更智能、更深度的社交体验。而看好全双工语音大模型的不仅是Soul一家,还有很多国内外的厂商都围绕全双工大模型展开了布局。以谷歌为例,在 Google I/O 2025大会上,谷歌就对Gemini Live API 进行了全新升级,除了更加细致的情感理解和双人语音合成,更吸引人注意的便是“主动音频”和“主动视频”功能。以主动音频为例,谷歌Gemini模型展现的能力,就与Soul推出的全双工语音大模型能力类似。具体来看,主动音频功能中,模型将忽略背景对话并知道何时回应。demo演示中,Gemini会主动忽略人类对话里一些类似“ok”这样的背景声音,持续说话。在接受媒体访谈时,Google DeepMind研究主管Greg Wayne也曾表示,谷歌在全双工音频输出方面加大了研发力度,“它可以同时处理听和说,这可能会有点烦人。它可能会打断你。但它也更像自然的对话。当你说话时,我可能会说,‘嗯嗯’、‘嗯嗯’,它在同时听和说。这是用来确认的语言的一部分。”Greg Wayne指出。由Soul和谷歌的业务布局不难看出,基于人类对更为真实的交互感受的向往,AI若想真正要在社交中体现价值,具备更强的“活人感”和“主动性”,是必不可少的能力。从“AI”到“爱”,在应用中展现价值全双工语音大模型的探索外,本届WAIC上,Soul还展示一些“不一样”的尝试——让AI真正融入到个体的社交网络之中,让社交变得更简单。具体来看,Soul在此次WAIC展会上展示的新能力落地在Soul平台应用场景——群聊派对AI主持的真实交互体验。依托新能力,在多人语音互动场景中,AI主持人不仅具备全面管理群聊派对秩序的类真人主持的操作能力,还能够自然进行语音互动,有效活跃气氛、鼓励用户参与对话讨论,显著提升群聊派对的参与度和体验感。可以想象一下,在年轻人具体使用场景中,如当求职季到来,大家可以在AI面试官的组织下,举办“模拟群面”,感受真实招聘场景下可能遇到的提问、集体问答、抢答等现实环节;而在相亲场景中,大家可以在AI红娘的主持中,自然破冰、相识,一起进行趣味互动。(现场体验与虚拟人视频通话)不仅于此,现场笔者还体验到了Soul还在探索全双工视频通话能力的探索,和虚拟人“实时视频”过程中,基于实时的视频生成能力和全双工语音交互能力,在实际交互体验中,可以看到“AI的形象和世界”,人机交互真正成为了“情感与信息的双向交流”。随着AI技术从大模型向智能体演进进程的深入,社交智能体也是Soul布局的重点。社交智能体需要非常多维和复杂的能力组合,其中包括了交互能力(例如自然语言理解与生成、全双工语音/视频通话、多模态感知/表达)、认知与情感能力(例如情感识别、长记忆、心智理论能力)、社会性构建(人设一致性、时间/事件感知能力)、风控安全体系等等。而Soul在社交领域的深入布局,也让其在技术与行业Know How上具备了先发优势。上线于2016年,多年的积累和长期与用户对接的过程,已经让Soul在社交软件领域具备了充足的行业Know How。在技术方面,Soul于2020年就开启了AIGC的研发工作,并在智能对话、语音、3D虚拟人等方面拥有前沿积累。自2023年推出自研语言大模型Soul X后,Soul还陆续上线了语音生成大模型、语音通话大模型、音乐生成大模型等语音大模型能力。目前,Soul AI大模型能力已整体升级为了多模态端到端大模型,支持文字对话、语音通话、多语种、多模态理解、真实拟人等特性,能够实现更接近生活日常的交互对话和“类真人”的情感陪伴体验。这些都是Soul在社交智能体的构建中积累的前沿能力,例如此次的全双工语音通话大模型的发布,便能够极大提升了社交智能体的交互能力,此外在多模态交互、认知与情感能力、社会性构建、AI安全等Soul都有探索和布局。除了技术上的探索之外,在社区生态运营上,Soul也有着自己独特的见解。据Soul统计,平台“广场”上有高达18%的新发帖直接反映了用户的真实社交困境(如人际关系处理、社交开启话题、职场交友),而用户分享的生活、情感内容及其引发的深度共鸣,构成了宝贵的“社交样本库”。Soul App副总裁及市场负责人范莉介绍道,Soul正在深化AI与社区的融合,具体包括了多维度的举措。例如,利用AI的能力,可以重塑社交内容和互动方式,通过大模型,根据用户兴趣和历史数据,智能推荐主题,并辅助生成内容,降低了用户表达门槛的同时,还能实现个性化内容的产出。同时,打造由虚拟达人组成的Agent生态,构建社交情感的“附近”。不同人设的虚拟达人,能从海量信息中识别真实的孤独信号,并以细腻、温暖的互动提供即时情感支持和共鸣。最终,通过“可共创、可互动”的虚拟人与真人社交的深度融合,Soul希望推动社交向“情感共生”进化,助力构建新世代的数字身份认同体系。正如前文提到的:Just So Soul研究院2025年上半年调研数据显示,超过80%的年轻用户正借助AI建立起真实的人际关系,此外,超过70%的年轻人愿意和AI交朋友,这显示出了Z世代的年轻人对于人机关系新的理解。而在情绪价值的交互中,也将催生新市场,《情绪消费崛起:2025年市场格局与未来走向》显示,中国情绪消费市场规模预计到2025年将突破2万亿元。AI作为关键变量,也将在与社交方向融合过程中,延展出新的产品范式和商业机会。对于社交类APP而言,在AI时代谁能提供更为真实的交互感受,以及更多的情绪价值,谁就能占有更多的年轻人市场,而在这点上显然Soul已经走在了前列。更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App