抓取结果
语音识别-人工智能实验室AiLab旗下语音识别频道,汇集最新最全的语音识别新闻及资讯,让您掌握语音识别第一手的资讯-中国人工智能网-Powered by AiLab.cn 首页科技新闻 机器学习 物联网 云计算 机器人 无人机 VR虚拟现实 语音识别 投稿 更多内容 模式识别 智能算法 字符识别 专家系统 遗传算法 蚁群算法 加密与安全 创业 企业新闻 产品动态 人物报道 展会会议 量子技术 扫地机器人 太空探索 基因工程 AR增强现实 6G通信 人工智能应用 人工智能教育 产业政策 动力能源 分类1 | 分类2 --> 语音识别热点 HotNews 日立出展第12届上海国际数据中心产业展览会 集微大会AI赋能峰会圆满收官,详解大模型与算力如何赋能全产业升级 戴纳科技:无人值守、全自动运行 AI黑灯实验室开启智能检测新时代 2026实验室设备选型指南:实验台操作与维护全解析 半月内两次问鼎全球:中国创业公司,在AI图像生成赛道掀了桌子 1 2 3 4 5 帝国理工学院首次为语音识别AI做“体检”:揭开机器如何在噪声中“听懂”我们说话的秘密 “AI终于会接话了”!NVIDIA开源全双工语音大模型,告别对讲机交谈,实现真人版流畅对话! 谷歌:语音翻译功能现已向Meet移动设备推出 “AI终于会接话了”!NVIDIA开源全双工语音大模型,告别对讲机交谈,实现真人版流畅对话! 谷歌:语音翻译功能现已向Meet移动设备推出 帝国理工学院首次为语音识别AI做“体检”:揭开机器如何在噪声中“听懂”我们说话的秘密 科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电 GPT-4o模仿人声说“不”,无意的语音生成仍是模型弱点 科大讯飞申请语音识别专利,提升实体词的识别效果 高通公司申请使用语音认证的设备查找器专利,使得扬声器可听见地输出警报声音以协助用户定位计算设备 小赛道领跑?埃及AI公司阿拉伯语语音识别准确率超越谷歌 ChatGPT可以语音交流了 苹果、微软、谷歌、亚马逊、Meta 合作,将改善残疾人的语音识别 Amazon研发人声复制技术 离世者可借语音助理重新发声 中国联通AI语音识别实时传译与转换 造就无界沟通新体验 广告 当前位置:人工智能实验室> 语音识别 苹果预告 iOS 27 辅助功能,语音控制支持自然语言操作 语音识别2026-05-20 08:02 537 IT之家 5 月 20 日消息,苹果公司昨日(5 月 19 日)发布博文,预告将会在 iOS 27、iPadOS 27、macOS 27 等系统中,把 Apple Intelligence 深度接入无障碍功能。在 iOS 27、iPadOS 27 等系统中,Voice Control(语音控制)通过整合 Apple Intelligence,支持自然语言输 ...... “AI终于会接话了”!NVIDIA开源全双工语音大模型,告别对讲机交谈,实现真人版流畅对话! 语音识别2026-04-10 09:32 928 会 "接话" 的 AI 来了!它就是英伟达推出的开源全双工语音模型:PersonaPlexNVIDIA称它是首个支持文本角色提示和音频声音调节的实时全双工语音对话模型!(字节推出了国内版本的Seeduplex全量上线豆包应用,中美竞争真是你追我赶!但字节的是闭源,不开源)真·全双 ...... AI 语音赛道的角逐,可能已经结束了 语音识别2026-04-09 08:31 1016 我最喜欢的小模型创业公司面壁智能开源了一款全新的语音模型:VoxCPM 2。这款模型非常能打,我觉得之前那些 AI 音频一听假的日子彻底过去了。不是夸张。之前我对 AI 语音一直有偏见,总觉得人的声音更有灵气,AI 生成的东西差那么一口气,一听就知道是机器。但这次,同 ...... 谷歌:语音翻译功能现已向Meet移动设备推出 语音识别2026-04-09 08:30 860 谷歌当地时间4月8日宣布,继近期网页版正式上线后,语音翻译功能现已登陆Meet安卓和iOS应用,该功能可将音频近乎实时地翻译成其他语言。谷歌表示,该功能目前支持英语与西班牙语、法语、德语、葡萄牙语和意大利语之间的双向翻译,一次会议中只能有一种语言对(例如,英 ...... 帝国理工学院首次为语音识别AI做“体检”:揭开机器如何在噪声中“听懂”我们说话的秘密 语音识别2026-03-24 09:07 1217 这项由帝国理工学院和NatWest AI Research联合开展的突破性研究发表于2025年,论文编号为arXiv:2603.12046v1,为我们揭开了一个令人着迷的谜团:当周围环境嘈杂时,语音识别AI究竟是如何决定更多地"相信"我们的嘴唇动作,还是依然坚持"倾听"声音信号的?想象一 ...... 阿里开源Qwen3-ASR !这可能是目前最实用开源语音识别方案 语音识别2026-01-30 07:22 1147 最近我在关注语音技术领域的进展,发现阿里云 Qwen 团队在 1 月 29 日开源了Qwen3-ASR系列模型。作为一个长期关注 AI 基础设施的从业者,我认为这个发布值得认真说一说。不是因为它又刷了什么榜单,而是因为它解决了一些实际问题够稳定、能流式、多语言、还能唱歌识别。 ...... 重塑语音安全!上海交大联合宇生月伴,研发高性能高泛化语音鉴伪大模型 语音识别2026-01-01 08:42 660 在生成式 AI 技术日新月异的背景下,合成语音的逼真度已达到真假难辨的水平,随之而来的语音欺诈与信息伪造风险也愈演愈烈。作为应对手段,语音鉴伪技术已成为信息安全领域的研究重心。然而,当前的语音鉴伪模型正面临严峻的「泛化性挑战」:许多在特定实验室数据集上表 ...... 谷歌推出AI语音同声传译功能 不知道对方是哪国人也能用 语音识别2025-12-13 17:53 586 财联社12月13日讯(编辑 史正丞)科技巨头谷歌公司周五发布公告称,正式将最先进的Gemini翻译能力引入翻译应用,包括通过佩戴耳机实现的“AI同传/交传”,同时大幅提升文字翻译工具的能力,以提供更自然、地道的翻译,而不是逐字逐句直译。谷歌还顺便敲打了一番语言学习 ...... ChatGPT 升级多模态交互 语音文本无缝合并打破体验边界 语音识别2025-11-26 09:55 434 【TechWeb】11月26日消息,OpenAI 正式宣布 ChatGPT 完成重大功能迭代,将原独立的 “语音模式”(Voice Mode)全面整合至主聊天界面,实现语音与文本交互的深度融合,用户无需切换模式即可同步获取语音应答、视觉呈现与文字转录服务。据 OpenAI 官方博文披露,此前需单 ...... 微信支持潮汕话语音转文字了 语音识别2025-11-17 11:08 525 记者 陈月芹11月中旬,微信的语音转文字功能悄然启动了对潮汕话的支持,这是继粤语之后开放的第二种汉语方言。经济观察报记者实测发现,用户将微信版本更新至最新版本后,在聊天窗口中,可以选择“按住说话”并上滑直接转成文字发送,或长按语音消息“转文字”,即可实 ...... 识别1600+种人类语言,支持少样本扩展到5400+种语言,Meta自动语音识别模型开源 语音识别2025-11-14 07:51 520 专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!Meta AI发布了名为Omnilingual ASR(自动语音识别),它能转录超过1600种人类语言。这其中,有500多种语言是历 ...... 打破全球语言壁垒:Meta推出支持1600种语言的语音识别系统并开源 语音识别2025-11-12 10:23 575 IT之家 11 月 11 日消息,Meta 基础人工智能研究(FAIR)团队推出了“全语种自动语音识别系统”(Omnilingual ASR),该系统可支持 1600 多种语言的语音转写,大幅拓展了当前语音识别技术的语言覆盖范围。此前,大多数语音识别工具都专注于几百种资源丰富的语言,这些语 ...... AI 实时语音深度伪造技术实现突破性进展,诈骗成功率近 100% 语音识别2025-10-26 12:31 334 IT之家 10 月 25 日消息,接触过变声器的朋友应该或多或少听说过,目前主流的语音处理方案都是会有一定延迟时间的,甚至可以说效果越逼真,延迟就越高。据网络安全公司 NCC Group 最新披露,AI 正推动语音深度伪造技术走向“实时”阶段,攻击者可在通话中即时模仿他人声 ...... 豆包发布语音合成/声音复刻等大模型:能理解情感、调节音调风格 语音识别2025-10-16 18:55 307 IT之家 10 月 16 日消息,据“火山引擎”公众号,在今天的 FORCE LINK AI 创新巡展·武汉站活动中,火山引擎全新发布和升级了四款豆包大模型:豆包大模型 1.6 升级,原生支持 4 种思考长度;豆包大模型 1.6 lite、豆包语音合成模型 2.0、豆包声音复刻模型 2.0 全新发布 ...... 字节正在内测一款全新的语音输入法 语音识别2025-10-13 15:35 389 说一个可能有争议的观点:键盘已经是上个时代的产物。用不了几年时间,语音将彻底取代键盘,成为我们主要的输入方式。我同事并不认同这个判断。他说,在办公室、会议室这些场景里,谁会用语音输入?那不尴尬死吗?谁能受得了这样的同事?我理解他的想法。可问题是,当你 ...... 哔哩哔哩自研语音生成大模型IndexTTS-2.0 正式开源 语音识别2025-09-09 20:39 985 IT之家 9 月 9 日消息,B站(Bilibili)昨日(9 月 8 日)发布公告,宣布正式开源其自研语音生成大模型 IndexTTS-2.0,是首个支持精确时长控制(Duration Control)的自回归(Autoregressive)零样本文本转语音(TTS)系统。IT之家援引 GitHub 页面介绍,相比较传统逐 t ...... 阿里端出最强语音模型!英文rap精准转文字,准确率干翻全球 语音识别2025-09-09 11:25 702 智东西9月9日报道,昨天,阿里发布最新语音识别模型Qwen3-ASR-Flash,该模型基于Qwen3基座模型训练,支持11种语言和多种口音。用户可以通过ModelScope、HuggingFace和阿里云百炼API Qwen3-ASR-Flash免费体验。在ASR(自动语音识别)的多项基准测试中,Qwen3-ASR-Flash在 ...... OpenAI ChatGPT 高级语音模式已登陆 Windows 和 Mac 平台 语音识别2024-10-31 08:10 416 IT之家 10 月 31 日消息,OpenAI 今日宣布,ChatGPT 的高级语音模式(Advanced Voice Mode,简称 AVM)现已登陆 Windows 和 Mac 平台。AVM 基于 OpenAI 最先进的 GPT-4o 模型运行,允许用户像与真人对话一样与 ChatGPT 进行交流,包括打断、停顿等自然语言行为。OpenAI ...... 科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电 语音识别2024-09-10 14:24 2750 新智元报道 编辑:乔杨 Frey 【新智元导读】 虽然OpenAI的「Her」还是期货,但硅谷的科技巨头们已经开始相继发力语音模型。前有谷歌的Gemini Live和苹果的升级版Siri,如今巨头亚马逊和新秀Cerebras也加入了这场竞争。继OpenAI在5月发布会上展示「期货」GPT-... GPT-4o模仿人声说“不”,无意的语音生成仍是模型弱点 语音识别2024-08-13 14:16 7571 在提供的案例中,AI模型发出No的声音,后用一种与红队(OpenAI雇佣进行对抗性测试的人)相似的声音继续说话。数据科学家评价称OpenAI刚刚泄露了《黑镜》下一季的剧情。 OpenAI 和机器人对话,机器人突然开始用你的声音和你说话,这并非科幻剧情,而是OpenAI... 语音克隆技术引发担忧,OpenAI 再次解释其文本转语音工具 语音识别2024-06-11 10:04 5031 IT之家 6 月 10 日消息,OpenAI 在几个月内第二次就其文本转语音工具进行解释,并再次强调该工具目前并未大范围开放,且未来也可能不会。 图源 Pexels 无论我们最终是否会大规模部署这项技术,让世界各地的人们理解这项技术的发展方向都非常重要,OpenAI公司... 智能座舱算法基础之语音识别篇 语音识别2024-02-17 08:39 6482 近年来人工智能技术快速发展,比较引人注目的包括智能语音技术、计算机视觉技术和自动语音识别技术等。其中,自动语音识别(ASR),简称语音识别,是重要的组成部分。其主要目标是把语音信号转变为相应的文字,从而让机器具有听觉功能,能够直接接收人的口语... 12345678910下一页末页 热门排行 阿里开源Qwen3-ASR !这可能是目前最实用开源语音识别方案 阅读量:1137 AI 语音赛道的角逐,可能已经结束了 阅读量:982 苹果预告 iOS 27 辅助功能,语音控制支持自然语言操作 阅读量:515 最新发布 苹果预告 iOS 27 辅助功能,语音控制支持自然语言操作 “AI终于会接话了”!NVIDIA开源全双工语音大模型,告别对讲机交谈,实现真人版流畅对话! AI 语音赛道的角逐,可能已经结束了 谷歌:语音翻译功能现已向Meet移动设备推出 帝国理工学院首次为语音识别AI做“体检”:揭开机器如何在噪声中“听懂”我们说话的秘密 阿里开源Qwen3-ASR !这可能是目前最实用开源语音识别方案 重塑语音安全!上海交大联合宇生月伴,研发高性能高泛化语音鉴伪大模型 谷歌推出AI语音同声传译功能 不知道对方是哪国人也能用 ChatGPT 升级多模态交互 语音文本无缝合并打破体验边界 微信支持潮汕话语音转文字了 本月热点 AI 语音赛道的角逐,可能已经结束了 “AI终于会接话了”!NVIDIA开源全双工语音大模型,告别对讲机交谈,实现真人版流畅对话! 谷歌:语音翻译功能现已向Meet移动设备推出 苹果预告 iOS 27 辅助功能,语音控制支持自然语言操作 推荐内容 2026年法国劳保展 2026第30届中国国际口腔设备材料展览会暨技术交流会(北京国际口腔展 Sino-Dental) EUROSATORY2026第29届欧洲巴黎国际防务展 2026越南平阳国际煤矿设备展览会 2026第三十二届北京国际图书博览会(BIBF) 2026越南平阳国际表面处理及电镀涂装展览会 2026越南平阳国际电子元器件展览会 2026越南平阳国际粉末冶金及硬质合金展览会 2026越南平阳国际复合材料展览会 2026越南平阳国际锅炉及压力容器展览会 2026越南平阳国际智能仓储及物料搬运展览会 2026越南平阳国际3D打印技术及增材制造展览会 2026越南平阳国际金属加工及焊接切割展览会 2026越南平阳国际机床工业展览会 2026越南平阳国际工业自动化及机器人展览会 2026越南平阳国际铝工业展览会 2026越南平阳国际润滑油及应用技术展览会 2026越南平阳国际轴承展览会 2026越南平阳国际金属及冶金展览会 2026越南平阳国际电机及线圈展览会 2026俄罗斯西伯利亚国际石油化工及天然气技术装备展览会 2026杭州国际珠宝展览会(中宝协珠宝展) 2026第十五届中原国际汽车展览会暨新能源智能出行展(尚格车展) 云推荐 看好i16换机潮 知名分析师对苹果翻多:买点浮现 2026中国国际金属成形展览会 2026中国·上海跨境电商博览会 官方网站 手办去哪里进货?潮玩代理怎么做? 荣耀平板9 Pro开售 支持超级笔记、智慧互联等AI功能 6G来了!工信部批复6G技术试验频率 讯飞星火首发“多情感超拟人合成”,还能一句话声音复刻 空间智能 新质引擎|2024空间智能软件技术大会在京召开 昂达推出B650M-W M-ATX主板 定位入门市场 数字化产品经理证书怎么考?有什么用? DeepSeek不会向资本低头 一肥六效 鲁花花生肽肥化肥替代之路在田间地头实地探访鲁花花生肽肥六大超能力 浪尖调研 | 刘海涛:物联网下一步是和AI结合为场景智能 智汇余杭,共启AI新程——2026全球人工智能技术大会圆满举行 2026俄罗斯西伯利亚铸造锻造压铸及热处理工业炉展览会 2026宁波国际汽配展览会 家庭娱乐市场再迎王炸,小度推出添添闺蜜机(悦享版)引领智能体验新潮流 订单狂涨 61%!不靠低价内卷,品质餐厅都在用这招破局 阿里巨轮急转,菜鸟IPO仍正常进行 “AI淘金热”明年还能持续吗? 智能汽车赛道为何持续火爆 陶瓷基板:奇点已至!AI算力时代的“隐形刚需”爆发前夜! 解码AI手机:三星Galaxy S24系列以高完成度AI应用打动消费者 算力×联接,让未来更智能 | 新华三出席2024MWC上海人工智能基础设施峰会 谷歌Gemini Spark个人智能体发布:一句话让AI干几份活 扫地机器人,不想只把地扫干净 大学生自己创业做什么?五个热门领域值得关注! 2026义乌厨房、卫浴设施展览会 中邮通信Hi nova 12 SE手机现已开售 支持5G双模全网通 诚意满满!易控智驾首次参展世界人工智能大会并发布全新方案“著山2.0” 2026慕尼黑上海电子展 重新定义2B应用的交付深度:百型背调智能体席卷广交会 华为岳伟:F5G-A品质全光网,开启体验经营新时代 销量领跑京东“618”!元萝卜凭实体交互实力深耕AI陪伴新赛道 2026上海有机食品展|天然食品展|绿色食品展|燕窝滋补品展 乒乓球机器人球技如何?最新研究称可超越人类精英乒乓球手 揭秘!想知道现在做什么生意赚钱?看这里就对了! 快手达人组团泰国招商 为老铁淘全球好物 做鸭货生意,轻松赚钱不是梦 Commvault联合GigaOm发布《2024网络恢复就绪报告》 前4个月出口超500亿元,占全国两成 浙江“宝贝经济”火遍全球 欢迎访问2026中国地坪涂料展览会 一颗秋糖两头甜,秋糖再甜南京城 2026第十五届中原国际汽车展览会暨新能源智能出行展(尚格车展) 2026俄罗斯西伯利亚国际石油化工及天然气技术装备展览会 2026越南平阳国际智能仓储及物料搬运展览会 松山棉店第二届「松松成林」敦煌植树:以柔软之力,筑沙漠新绿 2026郑州国际酒店用品及餐饮博览会【参展定展位入口】 携手豆包大模型,领克汽车在智能销售领域迈出坚实一步 2026年第42届亳州中医药及中药材交易博览会 科技与内容的双重升级:三星电视成暑假亲子时光的完美拍档 友情链接 Links 展会 Discuz大师网 人工智能世界 人工智能世界 人工智能世界 中国VR产业网 实验室管理软件 实验室管理软件 人工智能公司 智能家 图标素材 pixabay免费图片 人工智能 人工智能平台 Ai中国网 财经 极智能 张家港论坛 591ARVR 591ARVR 留学移民 张家港论坛 SMT贴片加工 找标注网 点我数据标注 华锐视点VRAR 查IC网 云帮手运维工具 AGV百科网 热门栏目 HotCates 人工智能 人工智能论坛 科技新闻 人工智能动态 机器学习 语音识别 自然语言处理 指纹识别 人脸识别 神经网络 大数据 物联网 云计算 IPv6 4G通信 机器视觉 机器人 人机交互 人物动态 智能家居 5G通信 车联网/无人驾驶 可穿戴/智能硬件 移动支付/NFC 无人机 VR虚拟现实 区块链/数字货币 石墨烯 3D打印 模式识别 智能算法 字符识别 专家系统 遗传算法 蚁群算法 加密与安全 创业 企业新闻 产品动态 人物报道 展会会议 量子技术 扫地机器人 太空探索 基因工程 AR增强现实 6G通信 人工智能应用 人工智能教育 产业政策 动力能源 头条资讯 互联网 行业百态 市场动态 财经快讯 媒体之声 云时代 笑话-开心一刻 股票资讯 全网热点 展会新闻 展会信息 展会资讯 IT新闻 IT观察 商业快讯 展开 收缩 在线客服 值班编辑 友情链接 商务合作 广告合作 展会合作 申请专栏 关于我们 人工智能实验室(AiLab:Artificial Intelligence Laboratory)中国人工智能领域的专业媒体平台,始于2010年的中国AI创业先行者,专注人工智能、机器人、无人驾驶、可穿戴、模式识别、物联网、云计算等新兴技术信息资讯,是人工智能爱好者学习和交流平台,是一群梦想者与实践者的网络家园! 版权声明 本站部分文章来源于互联网以及网友投稿,本站只负责对文章进行整理、排版、编辑,是出于知识传递之目的,并不意味着赞同其观点或证实其内容的真实性。如果您有什么意见或建议,请联系E-mail:kefu#ailab.cn(将#换成@)! Copyright © 2010-2026 AiLab Team. 人工智能实验室 版权所有 关于我们 | 赞助我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 展会港 | 工作机会
网站标题
语音识别-人工智能实验室AiLab旗下语音识别频道,汇集最新最全的语音识别新闻及资讯,让您掌握语音识别第一手的资讯-中国人工智能网-Powered by AiLab.cn
关键词
语音识别芯片,中文语音识别系统,语音识别api,智能语音识别芯片,电脑语音识别系统,语音识别软件,语音识别技术,语音识别软件电脑版,语音识别文字软件,语音识别系统,语音识别模块,百度语音识别,语音大师,语音记事本,语音输入
站点描述
语音识别技术,也被称为自动语音识别(英语:Automatic Speech Recognition, ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。