0

MiniMax卷向AI语音生成!一句话定制任意音色、情感,免费可用

智东西 作者 ZeR0 编辑漠影 智东西 6 月 21 日报道,今日凌晨,国内大模型“六小虎”之一、上海 AI 大模型独角兽 MiniMax 发布其 MiniMax Week 的“最终弹”——语音设计工具。该工具由 MiniMax 最新语音设计模型提供支持。 在 MiniMax Audio 界面,用
0

音频大模型安全可信度的全面“体检”!清华南洋理工联手打造

AudioTrust 团队投稿 量子位 | 公众号 QbitAI 首个专为 ALLMs(音频大语言模型)设计的多维度可信度评估基准来了。 南洋理工、清华大学领衔的研究团队注意到,现有评估框架大多只关注文本模态或仅涵盖有限的安全维度,未能充分考虑音频模态的独特特性与应用场景。 于是他们创新性地提出了新
0

AI芯片之王的加冕与威胁:英伟达能否抵御未来挑战?

投资者向英伟达投入巨资,使其成为全球市值最高的芯片公司,他们坚信英伟达在人工智能(AI)计算领域的领先地位将带来巨额财富。如今,人们的注意力转向了 AI 本身,看看那些投资数百亿美元建设庞大数据中心的公司是否能从中获益。 目前,英伟达仍然是 AI 淘金热中领先的芯片公司,其营收仍在飙升,加速器芯片的
0

阿里橙狮体育在上海成立新公司,注册资本200万

天眼查 App 显示,近日,上海松江乐动力体育有限公司成立,法定代表人为彭铿,注册资本 200 万人民币,经营范围包括食品销售、演出经纪、体育场地设施经营、人工智能硬件销售、智能机器人销售等。股东信息显示,该公司由橙狮体育有限公司全资持股。
0

英伟达合作推出 Fast-dLLM 框架,AI 推理速度最高飙升 27.6 倍

IT 之家 6 月 3 日消息,科技媒体 marktechpost 昨日(6 月 2 日)发布博文,报道称英伟达联合麻省理工学院(MIT)、香港大学,合作推出 Fast-dLLM 框架,大幅提升扩散模型(Diffusion-based LLMs)的推理速度。 扩散模型被认为是传统自回归模型(Auto
0

马斯克AI公司xAI再出招:拟融资50亿美元,员工也有望套现

6 月 3 日消息,据多家媒体周一报道,投资银行摩根士丹利(Morgan Stanley)正为埃隆·马斯克(Elon Musk)的人工智能企业 xAI 运作一笔 50 亿美元的债务融资。此外,xAI 公司还计划通过出售 3 亿美元股份,力争实现 1130 亿美元的估值。 彭博社援引知情人士消息称,此
0

菜鸟持续布局物流+AI 联手东方航空打造全球首个智慧机库

近日,有技术杂志披露,东方航空技术有限公司联合菜鸟集团,共同打造智慧机务整体解决方案。项目中应用 AI 技术识别飞机损伤,并通过数据挖掘,提前预测潜在故障;此外还通过增强现实(AR)和虚拟现实(VR)技术,培训和指导维修人员,提高维修效率和准确性。 据介绍,这一项目中,东航以“智慧机务”为核心,首次
0

泡泡玛特带火跨境电商,速卖通直播间成“购娃主阵地”

作为泡泡玛特在海外的重要官方销售渠道之一,速卖通 AliExpress 近期成为全球网友抢购泡泡玛特的主要阵地。 海外 618,速卖通 AliExpress 首场泡泡玛特直播开播后,涌入全球数十万网友,用多种语言在直播间里刷弹幕求库存。除了 labubu,Crybaby 的热度也开始上升,有网友在弹
0

田渊栋:连续思维链效率更高,编码多个路径,“叠加态”并行搜索

闻乐发自凹非寺 量子位 | 公众号 QbitAI AI 也有量子叠加态了? 连续思维链的并行搜索类似于量子叠加,比离散型思维链更具优势。 这是 AI 大牛田渊栋团队的最新研究成果。 传统 LLM 通过生成 “思维 token”(如文本形式的中间步骤)进行推理(即离散思维链),但在处理复杂任务(如判断
0

仅32B,昆仑万维开源「Skywork-SWE-32B」,拿下代码开源SOTA

6 月 20 日,昆仑万维发布软件工程(Software Engineering, SWE)自主代码智能体基座模型 Skywork-SWE,在开源 32B 模型规模下实现了业界最强的仓库级代码修复能力。昆仑万维团队通过构建超过 1 万个可验证的 GitHub 仓库任务实例,打造出目前最大规模的可验证
0

Anthropic推出新功能:用户可直接在Claude应用中构建AI驱动应用

IT 之家 6 月 26 日消息,人工智能公司 Anthropic 宣布其 Claude 聊天机器人新增一项功能,允许用户直接在应用内构建由 AI 驱动的应用程序。该功能目前已进入测试阶段,是基于去年推出的 Artifacts 功能开发的,Artifacts 功能允许用户查看并与 Claude 所创
0

Jina AI 开源多模态多语言向量模型 Jina Embeddings V4

Jina AI 宣布正式推出 jina-embeddings-v4,一款全新的多模态向量模型,参数规模达到 38 亿,并首次实现了对文本与图像的同步处理。 项目团队在模型内置了一套面向特定任务的 LoRA 适配器,专门强化了模型在处理查询 - 文档检索、语义匹配以及代码搜索等任务时的表现。 公告称,
0

聚焦青少年体重控制,上海六院携手高校研发VR智能运动干预系统

青少年肥胖已成为全球性的公共健康危机,其患病率正迅速上升。 6 月 24 日,澎湃新闻(www.thepaper.cn)记者从上海交通大学医学院附属第六人民医院获悉,该院李华婷教授团队、上海交通大学计算机学院/人工智能教育部重点实验室盛斌教授团队携手上海体育大学王继红研究员团队、上海科技大学/上海临
0

抖音辟谣商业化副总裁离职传闻:信息源由AI生成 已删除

6 月 23 日消息,据媒体报道,近日有消息称“字节跳动商业化副总裁浦燕子即将离职,原因系与 AI 部门资源分配问题。” 对此,抖音官方回应媒体称:此为不实消息,相关信息最早来源是一则明显由 AI 生成的谣言,目前已经删除。 下图为此前 AI 生成的谣言内容: 据公开资料显示,浦燕子自 2013 年
0

推理越多,幻觉越重?多模态推理模型的「幻觉悖论」

新智元报道 编辑:LRST 多模态推理模型真的「越想越明白」吗?研究表明,R1 系列模型在推理链条加长的过程中,其视觉感知能力出现下降趋势,生成内容有时会偏离图像本身,出现「看见」不存在事物的幻觉现象。推理能力的提升,在一定程度伴随着视觉对齐的弱化,呈现出「越推理越幻觉」的倾向。这一现象引发了研究者
0

OpenAI Codex 团队:未来的 Agent 会趋向独立

日前,OpenAI 编程产品 Codex 的研究员 Hanson Wang 和产品负责人 Alexander Embiricos 在接受了红衫资本的采访,并分享了 Codex 的理念、对未来 AI 编程产品的设想。 采访中,Embiricos 提到,Codex 就像一个思想实验——它拥有自己的电脑,
0

10% KV无损数学推理!开源方法解决推理大模型「记忆过载」难题

R-KV 团队投稿 量子位 | 公众号 QbitAI 推理大模型虽好,但一个简单的算数问题能推理整整三页,还都是重复的“废话”,找不到重点…… 一种可以把大模型的“碎碎念”转化为可控记忆条目的高效压缩方法,出现了! R-KV 开源登场:显存↓90%、吞吐×6.6、准确率=100%。 它可以通过实时对
0

像真人一样对话,AI电话数字员工公司「Whobot」完成数千万元A轮融资

作者 | 钟艺璇 36 氪获悉,AI 电话数字员工公司「Whobot」(呼波特人工智能)近期完成数千万元A轮融资,此轮融资由金沙江创投领投,向阳资本担任独家财务顾问,所获资金将投入技术研发、市场拓展等关键环节。 Whobot 成立于 2023 年,是专门针对通信场景,为企业提供智能化一站式解决方案的
> 返回新闻首页