kaiyun官方网钉钉AI升级多模态:能根据图片识人、翻译、创作、多轮问答

  新闻资讯     |      2024-04-11 15:23

  kaiyun官方网钉钉AI升级多模态:能根据图片识人、翻译、创作、多轮问答新浪科技讯 3月28日午间消息,钉钉AI助理迎来升级,上线图片理解、文档速读kaiyun全站入口kaiyun全站入口kaiyun全站入口、工作流等产品能力kaiyun全站入口,探索多模态、长文本与RPA技术在AI应用的落地。

  基于阿里通义千问大模型,升级后的钉钉AI助理拥有更强的视觉推理能力和长文本速读能力。目前,用户在钉钉IM消息框或点击魔法棒按钮进入AI助理对话框kaiyun全站入口,发送长文件kaiyun官方网、在线文档、网页链接kaiyun全站入口kaiyun官方网、视频内容kaiyun全站入口kaiyun官网入口地址,即可根据内容识人kaiyun官网入口地址、识地点、分析kaiyun全站入口kaiyun官网入口地址、答题kaiyun登录入口登录kaiyun登录入口登录、翻译、摘要kaiyun官网入口地址、提取文字kaiyun全站入口kaiyun官方网,甚至可以通过多轮交互进一步做智能问答kaiyun登录入口登录

  基于通义千问Qwen-VL-Max视觉理解模型,钉钉AI助理能够准确描述和识别图片信息,并根据图片进行信息推理、扩展创作kaiyun全站入口kaiyun全站入口kaiyun官方网、文字提取、翻译等。

  此外kaiyun登录入口登录kaiyun官方网,AI助理也支持视频内容的速读。发送给AI助理的短视频、直播切片或培训视频可以被快速“观看”,AI助理会根据视频内容生成字幕,提取关键词,并生成一份智能摘要,对于最高2GB的视频内容kaiyun全站入口,仅需3分钟即可完成智能解读。

  基于通义千问大模型,钉钉AI助理可以快速阅读本地文件如Word、PDF、PPT、Excel 等kaiyun官网入口地址kaiyun官方网、钉钉文档、网页链接等多种格式文件。值得一提的是,钉钉AI助理对长文本的处理能力已支持单次阅读500页的文件kaiyun登录入口登录kaiyun登录入口登录,可以为法律、医学、金融等专业领域提供信息服务。

  为让AI助理可以完成一系列更复杂的任务,钉钉AI助理上线了工作流能力,比如搭建能自动写脚本并生成视频的创作AI助理kaiyun官网入口地址。为降低用户的使用门槛,钉钉官方还提供了多种工作流模板。