尊龙凯龙时(中国)官方网站 登录入口-凯时体育游戏app平台你搜索到的每一个谜底-尊龙凯龙时(中国)官方网站 登录入口

凯时体育游戏app平台你搜索到的每一个谜底-尊龙凯龙时(中国)官方网站 登录入口

发布日期:2026-03-26 07:48  点击次数:139

凯时体育游戏app平台你搜索到的每一个谜底-尊龙凯龙时(中国)官方网站 登录入口

编订|杜伟

2026 马年注定迎来一个「AI 味」最浓的春节。

一个如胶似漆的玩家参加咱们的视野,它恰是国内最有活东说念主感的生计和铺张社区 —— 小红书,卷起了「感知力」。

小红书围绕着发布、辩驳、搜索、支吾等高频互动场景,洞开了多种 AI 语音新玩法,包括语音发布、语音辩驳、语音信一问、语音私信贺年等。

这些新奇意思的语音玩法,带来的直不雅效果是:用户之间的相似绪论不再仅仅图文,而运转了「动嘴」模式。

语音回帖让以往冷飕飕的辩驳区有了「满满的活东说念主感」,涌进世界各地的语言、中国各地的方言,还有东说念主秀起歌喉以及各样各样的播音腔、磁性嗓、低音炮。

伸开剩余92%

图源:@牛角包大王 @别咬我兔耳朵

要是说语音辩驳增强了支吾意旨性,这两天风雅上线的「语音信一问」则是社区搜索花样与功能的一次大变身。

它与传统 AI 搜索最大的区别是将真东说念主训戒与 AI 追忆鸠合了起来,你搜索到的每一个谜底,皆是真确用户的学问与训戒千里淀。

在小红书里平直搜「语音信就有活东说念主谜底」参加行为页面,便能开启该功能。这个春节,年货买什么、那儿好逛,启齿问就行。

用户还可以参与「语音信一问抽新春小红盒、语音贺年、语音联欢会」等特色迎春行为,互动起来更能感受到年味。

图源:@甜甜圈

声息,让小红书社区「活」起来

当作东说念主类最当然的交流绪论,声息的加入正在将小红书改酿成更有「声」命力的社区。

先从语音评申诉起,自开启该功能内测以来,各路网友脑洞打开,有东说念主秀我方的正统法式发音:

图源:@labalibi

声源:@nagono

上海话让东说念主念念到江南烟雨中的温婉女子:

图源:@基尼斯贝贝.

声源:@琉璃

一些歌手已运转在辩驳区一展歌喉,如杨丞琳:

图源&声源:@杨丞琳

不同曲风的 K 歌接龙以及稀有乖癖的声息师法让辩驳区充满了沸腾:

图源:@Han(天线短路宝宝)

声源:@yearn

图源:@兜兜有米

声源:@灏-Mioarti

好玩以外,语音辩驳还可以很暖心。听障东说念主士向外界展示他们真确的声息,这种东说念主文体恤令东说念主动容。

图源:@听障探究生~彤

声源:@! ! !

上线即火爆的「语音信一问」功能,其 AI 增强搜索与问答智力让体验从手动翻阅一篇篇条记进化到一问即得。

好多明星皆参与了进来,比如曾参加过《歌手 2024》的好意思国男歌手 Adam Lambert 操着蹩脚的粗造话提问「动口不脱手」的含义,还请问了春节慷慨的粤语抒发。

咱们也启齿问了两个问题,第一个是「北京春节有哪些年味浓的地方」,中间还进行了追问。在识别语音之后,AI 很快笔据小红书站内条记生成结构化追忆,还进行比物丑类,比如经典年味地标、文艺小众行止和老北京大集,终末还附上了出行小贴士。

接着问「腊月 23 小年的罕见含义以及南朔方的互异」。从收尾来看,AI 同样调取站内条记,将其中零星的信息重组转念为一份结构严实的谜底,明晰列出了南朔方小年在日历、习俗、饮食、行为等方面的互异。

当你念念挑一些「看起来比较可贵,但又不是确凿很贵的礼物」时,出来的这份谜底能否骄矜你的条款呢?

全新的玩法「语音发布」也一经上线,不少明星用它来共享平素生计、发送祝贺。

图源&声源:@王铮亮

从互动到搜索、再到条记,AI 语音的全链路浸透,让 2026 年春节的小红书社区变成了「辩驳可发声、搜索语音信」。

AI 语音落地,面对多重关

在小红书这么用户体量纷乱的社区,AI 语音的班师落地需要不竭好以下些许问题。

率先需要不竭复杂场景下的音频融会。

小红书的用户分散极广,存在普随地域方言、口音、不同庚级段或用户群体的使用习尚(如谜语、中英搀杂等情况)。诱惑互异、配景声息、嘈杂环境、语速同样会影响识别的准确性。

除了语义内容,模子也需要感知用户语音中的心思、音色本性;音乐歌声中的心思、学派、作风;当然界的风声、雨声、浪潮声等环境音。

要是说听懂是基础,那么有温度地回应是灵魂所在,亦然达成当然交互的要道。这就要面对第二大问题:如何让音频生成具备活东说念主感。

小红书内容场景作风「千东说念主千面」,条款模子笔据场景生动切换,拒却一种腔调走宇宙。心思抒发要「连贯畅达」,不再是孑然时诵读句子,而是能读懂凹凸文的承前启后;细节语气也要精确拿握,规复语言的「弦外之音」。

这就条款模子在充分消化融会用户凹凸文的同期,还要具备相应的心思感知智力。

终末,反应速率平直影响用户本色体验。

要是语音交互处理历程很长,用户说完后总要经历几秒钟的「死寂」,系统才有反应。这种非及时性会将本来连贯的对话切得鸡零狗碎,体验相配生硬。

自然上风以外,更有高出语音本事

关于小红书而言,其打造万般化 AI 语音智力具有自然上风:

一是丰富内容花样,涵盖图文、条记、视频等多种神志,多元内容结构可以无缺承载语音当作交互的中间绪论。二是相较于单纯的短视频平台,在小红书辩驳区插入语音不会导致体验上的「打断感」。三是小红书的 AI 语音智力集成于主站中枢场景,为本事提供了接续改进与优化的空间。

这些上风使得小红书成为 AI 语音落地的理念念试真金不怕火场,但要达到如今的水平,更有坚实的本事支撑。

据了解,这些本事出自小红书 Super Intelligence-AudioLab团队,负责东说念主为风龙。团队中枢布局了语音识别、语音合成、全双工语音交互及 ALLinOne 基座模子、音乐融会生成四大所在,支撑起小红书在各业务场域的诳骗探索。

在语音识别领域,自研 FireRedASR 大模子取得华文语音识别开源 SOTA 效果。近期,团队也准备开源全链路 ASR 系统级不竭决策 FireRedASR2S,包含静音检测、语种检测、语音识别、标点集成等模块。

FireRedASR 技俩地址:https://github.com/FireRedTeam/FireRedASR FireRedASR2S 技俩地址:https://github.com/FireRedTeam/FireRedASR2S

在功能上,FireRedASR2 新提拔 20 + 方言和口音,在华文粗造话和方言公开的 24 个测试集上字错率为 9.67%,比较之下,Doubao ASR 和 Qwen3-ASR-1.7B 的字错率分手为 12.98%、10.12%。

另外,FireRedLID 语种检测模子提拔 100 + 语种和 20 + 华文方言,语种准确率达 97.18%,而 OpenAI Whisper 仅为 79.41%。FireRedVAD 提拔 100 + 语种,在多语言语音 Fleurs 测试集上,它的 F1 分数为 97.57%,开源 Silero-VAD 为 95.95%。

FireRedASR2 不同版块与竞品模子的平均字错率对比。

在语音合成领域,同样作念到华文对话长语音合成 SOTA。自研 FireRedTTS2 大模子提拔 3 分钟以上长对话生成,在多轮对话场景中,其音色踏实性和当然度显耀优于多家竞品,代表了当今开源模子的最高水平。

该模子引入的心思感知智力是语音「活东说念主感」得以达成的要道,当感知到用户心思低垂时,语音中会当然地带有安危的语调,开脱机械感。

更早之前的 FireRedTTS1/1S 主勒索句生成与克隆,能够精确规复参考音频的特色,当今稳居该领域的开源第一梯队。

FireRedTTS1/1S 技俩地址:https://github.com/FireRedTeam/FireRedTTS FireRedTTS2 技俩地址:https://github.com/FireRedTeam/FireRedTTS2

FireRedTTS 系列模子与 OpenStoryline AI 视频编订的鸠合,可以提供当然东说念主感的语音生成智力。改日,团队将接续膨胀智力至播客、语音翻译等多个场景。

表 3 为 FireRedTTS-2 在交互式对话场景微调后的情愫截至准确率,表 4 为 zero-shot 播客生成的客不雅与主不雅评估。

关于全双工语音交互及 ALLinOne 基座模子,团队推出了业内首个开源、提拔专有化部署的全双工语音交互系统 FireRedChat。

针对传统 AI 反应慢、乱打断的痛点,系统通过自研的 pVAD(鉴识声息)和语义判停 EoT(听懂意思意思) 本事,精确判断语言时机,端到端蔓延低至 2 秒,反应又快又稳。其最大亮点是不依赖外部 API,即可达成一键腹地部署。它让 AI 不再是冷飕飕的机器,而是能共情、有温度的伙伴。

FireRedChat 技俩地址:https://github.com/FireRedTeam/FireRedChat

ALLinOne 基座模子达谚语音、音效、音乐的调处编码,无缺买通泛音频的融会与生成,带来了音频智力的知道。同期通过提拔多类型、深头绪的标签分析,为语音辩驳的音频内容融会提供了坚实的基础智力。据悉团队将于本年上半年和业内共享开源模子。

在音乐融会与生成领域,自研的音乐融会与生成模子达成了对音乐的多法式深层融会、创作意图交融与生动可控创作,将专科音乐创作的学问融入模子的融会 - 转念 - 生成各阶段,为从音乐醉心者到专科音乐东说念主的不同用户提供一体化音乐创作不竭决策。

模子在音乐曲风、情愫、场景、节律律动等多个维度的融会智力和高品性生成智力已赋能小红书音乐东说念主创作,据悉同样会在上半年和业内共享开源模子。

在拿到模子测试经验后,咱们也小试了一下,生成的一分多钟的音乐效果可以:

恰是有了以上千里淀,小红书构筑起了一套掩饰底层架构优化、高质料语音合成、情愫化语音互动、智能语音信答的完整本事栈,通过语音主导的东说念主性化抒发和问搜协同,营造一个兼顾交互意旨性与情愫温度的社区生态。

除了语音,所有 Super Intelligence 团队是小红书面向改日内容花样与通用智能的进军本事引擎,其负责东说念主为汤神,见识是构建业界高出的多模态基础大模子体系,并形成可接续演进的通用智能智力。

团队包括 Audio Lab、Vision Lab、Foundation Lab 等实验室,在内容融会、视觉与多模态、图像生成与编订、语音融会与生成、Omni Model、殊效渲染与影音体验等所在长期对标行业 SOTA,同期强调模子智力在保举、搜索、视频 & 直播、电商、交易化告白、海外化等复杂真确业务中的可用性与范畴化落地。

往日两年,汤神过头团队先后主导了图搜、内容融会、创作器具升级等关键技俩,并负责语音 & 多模态 & 图像生成与编订等大模子。团队在学术与产业两头同步鼓励,累计发表了 40 余篇顶会与期刊论文,千里淀出 InstantID、StoryMaker、FireRedTTS、FireRedASR 等具有行业影响力的开源本事效果,告捷孵化语音辩驳、笔墨大字报、长文、满屏高清等多项站内爆款功能。

结语

小红书的 AI 语音探索,一方面让用户欢乐尝试好玩的语音辩驳,可以晋升社区活跃度;另一方面,语音搜索让用户赢得信息像聊天一样约略,尤其适用于不习尚或不浅近打字的群体或场景。

这么的践诺也考证了:在追求本事高度以外,体验深度同样进军。就拿最近火热的 Agent 来说,用户敬重的不只单是智力的强弱,也介意交互当然度、意图融会进程和就业无感化。

约略,终末拼的是能否以直不雅、亲和、高效的旅途触达用户,让 AI 接地气,在更当然的交互中达成价值。

文中视频、音频一语气:https://mp.weixin.qq.com/s/DV-JSNHiciR76m_OyoM5tg凯时体育游戏app平台

发布于:北京市

相关资讯
热点资讯
  • 友情链接:

Powered by 尊龙凯龙时(中国)官方网站 登录入口 @2013-2022 RSS地图 HTML地图