印尼宣布迁都决定 但还没
新浪科技讯7月28日下午消息,在2025金山办公AI生产力论坛上,金山办公发布了WPSAI3.0版本——WPS灵犀,用户只需通过自然语言、多轮对话即可完成文档创作、演示文稿生成及语音助手等功能,全程无需复杂操作和外部跳转。用户仅需要输入简单的提示词,比如在厨房区域的架子上找东西,进入娱乐室、向右转,然后打开通往院子的门等等,具身世界模型就能自主进行位姿、动作骨架和指令的生成。现场,商汤科技董事长兼首席执行官徐立展示了搭载具身世界引擎的人形机器人,生动讲解长安的荔枝PPT的效果,语言自然,风趣幽默,不仅可以自动翻页,还能回答各类问题,并进行阶段性小结。据介绍,悟能具身智能平台以商汤具身世界模型为核心引擎,依托商汤大装置提供端侧和云侧算力支持,能够为机器人、智能设备提供强大的感知、视觉导航及多模态交互能力,
我始终认为,智能眼镜是人工智能技术的理想物理形态,因为通过智能眼镜,用户可以直接让AI见你所见、听你所听,只要有显示器,它就可以和你对话。例如,用户输入黄昏、柔光、边缘光、暖色调、中心构图等关键词,模型可自动生成金色的落日余晖的浪漫画面。目前,该模型单次可生成5s的高清视频,用户可通过多轮提示词进一步完成短剧制作,未来通义万相还将继续提升单次视频生成的时长,让视频创作更高效。使用冷色调、硬光、平衡图、低角度的组合,则可以生成接近科幻片的画面效果。据悉,Wan2.2此次开源了文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-TI2V-5B)三款模型,其中文生视频模型和图生视频模型均为业界首个使用MoE架构的视频生成模型
借助物理信息实时认知理解能力,MogoMind能够识别路面状况、交通标识、障碍物的物理状态,还能将复杂的交通环境信息转化为可理解、可执行的智能决策建议。据悉,截至目前,通义千问在全球主要模型社区的下载量已经突破4亿,衍生模型突破14万个,超越Meta的Llama系列成为全球第一的开源模型家族,千问也是中国开发者和企业使用最广泛的大模型。大会期间,阿里云副总裁、大数据和智能实验室负责人叶杰平表示:三年前,我们发布了通义大模型,并承诺将核心模型开源开放在实际运用中,配合主