最新AI产品

阿里达摩院 AI 模型 DAMO PANDA 获 FDA 突破性医疗器械认定,用于胰腺癌筛查
阿里达摩院AI 模型 DAMO PANDA 通过“平扫 CT+AI”技术,以92.9%敏感性和 99.9%特异性获 FDA 突破性医疗器械认定,首次实现普通人群胰腺癌高效早筛,显著提升早期诊断率。

字节跳动开源多模态智能体 UI-TARS-1.5,融合视觉理解辅助多场景应用
字节跳动开源多模态智能体 UI-TARS-1.5 通过视觉-语言融合框架与系统化深度推理机制,实现跨平台 (Windows/MacOs) 自动化操作,突破传统工具依赖API的局限,推动AI交互进入实用化新阶段。

复旦大学研发“破晓”闪存器件,擦写速度达400 皮秒超 SR AM技术
复旦大学研发的全球最快非易失性存储技术“破晓”闪存器件,以400皮秒擦写速度突破SRAM性能极限,或将重构AI计算与存储芯片产业格局。

儿童青少年肥胖 AI 大模型“福星”启动多中心应用,提供防控方案
儿童青少年肥胖AI大模型《福星”通过整合医疗资源与行为干预策略,构建多场景动态监测与闭环管理体系,为肥胖防控提供精准化、智慧化解决方案。

国内AI动态

阿里通义万相开源“首尾帧生视频模型”,720p高清,可控特效与镜头
阿里通义万相开源“首尾帧生视频模型”,通过输入首尾帧智能生成5秒720p高清动态视频,实现精准特效、镜头控制及物理模拟,填补中文视频生成技术空白并推动影视、广告等场景高效创作。

火山引擎发布豆包1.5深度思考模型,数学等能力提升,兼具视觉理解
火山引擎推出豆包1.5深度思考模型,以多模态推理能力和高效MoE 架构实现数学、视觉双突破,推动企业智能化与消费场景应用,加速AI产业融合。

上海人工智能实验室发布书生·万象 3.0,性能接近 Gemini-2.5-Pro
上海人工智能实验室发布多模态大模型“书生·万象3.0”,以全量级开源策略和“通专融合”技术体系实现多模态能力对标国际顶尖闭源模型Gemini-2.5-Pro,推动AGI技术普惠化及工业、科研、内容创作等领域的深度应用。

北京市人工智能产业投资基金向智谱追加 2亿元投资,助力开源模型与算法创新
北京市人工智能产业投资基金向智谱追加2亿元投资,旨在通过支持开源模型与算法创新推动技术自主可控,加速其商业化应用进程。

国际AI动态

OpenAI 推出 Flex 处理API选项,模型价格更低,但响应较慢
OpenAI推出Flex处理API选项,通过将03和04-mini模型的API费用降低50%以上,为可容忍延迟的异步任务提供经济型解决方案,同时完成AI服务从"高性能优先"到'需求分层覆盖"的战略转型。

谷歌 Gemini Live 向安卓用户免费开放,实现摄像头、屏幕实时识别与信息反馈
谷歌免费向安卓用户开放其多模态AI实时交互工具Gemini Live, 支持摄像头/屏幕实时识别与自然对话,与微软Copilot Vision展开移动端入口争夺战,加速多模态AI普及。

微软 Copilot Vision在 Edge 浏览器免费上线,语音指令可解读屏幕内容
微软Copilot Vision正式在Edge浏览器免费开放,用户可通过语音指令实时解析屏幕内容,实现跨场景智能辅助,未来将向全系统生态扩展。

Meta禁用 iOS 18的Apple Intelligence功能,双方因隐私政策分歧合作受阻
苹果与Meta因设备端隐私处理与云端数据策略的根本分歧,导致后者AI功能在iOS 18的Apple Intelligence中被禁用。

标签: none

添加新评论