阿里通义上新PPT创造!PC端“功率”功用三合一,听读写一站搞定
鱼羊 房屋 发自 凹非寺
量子位 | 群众号 QbitAI
这年头,哪有人上班不发疯的(doge)。
就拿PPT来说,赵晓卉“PPTSD”这词儿一出,那真是戳到了打工人心田上。
对啊,PPT是什么尊贵的东西啊!都大模型年代了,就没有哪个AI能又好又快地帮我搞定这事儿吗!
还真甭说,打工人是会疼爱打工人的。就在俺们量子位批改们孜孜不倦寻觅解放双手的大模型东西的日常中,诶嘿,最近还真又挖到了新神器——
通义直接在网页版里上新了“功率”版块,功用很直给:实时记载、阅览帮手,还有PPT创造。
其间,PPT创造属所以新鲜出炉。
简略来说,主打一个功用是大模型给的,但并没多大“AI味”。
最要害的是,免费。
这咱不得抓住测验一波——
回绝PPTSD
具体来说,通义PPT创造首要供给了两种PPT制造办法。
一句话主题生成PPT:假如你啥思路没有,只要一句话主题,那么可以把主题当成Prompt直接扔给大模型。当然,假如你已经有完好的思路纲要,它也支撑最多10万字的超长文本输入上传文件生成PPT:文档、音视频文件都支撑。
一句话生成PPT
那么就,先给又菜又爱玩的手残党搭档们,搞一份《黑神话:悟空》攻略(PPT版)吧。
提示词很简略,便是:《黑神话:悟空》游戏攻略。
一份像模像样的PPT纲要秒速生成:
哪里看不顺眼可以上手批改,懒人党也可以直接下一步——选模板。
在不供给任何布景资料的情况下,通义生成的PPT能到达什么样的作用?
点击“生成PPT”,等候不到1分钟,答案立刻揭晓。
应该是依据通义大模型的联网查找才能,生成的游戏介绍里,《黑神话》的制造方、游戏引擎等要害信息都没犯错。
不过大模型自身看上去并没有被“剧透”,在具体游戏内容上,有点脑洞大开。但话术安排,规划排版,还真可圈可点。
单看这案牍,的确没什么AI味儿,说得上是言之有物。
人机协作批改起来也很便利:
点击文本框既能直接批改文字,也可以一键呼唤大模型协助一同优化案牍。
配图相同可以交给AI生成。
不会写提示词也不要紧,通义PPT内置“咒语书”,点击即用,也可以作为参阅。
看样子,日常用来欺骗老板妥妥够用了(不是)。
上传文件生成PPT
咳咳,仍是回到正派用途上,假如喂给通义PPT更具体的文档资料,它又会表现怎么?
比方,投喂一份量子位的内部训练资料,让通义PPT来协助搞定训练PPT。
作用上be like:妈妈再也不必忧虑我开会前做不完PPT。
PPT生成的内容和上传文件关联性很高,基本上把文档要害都划出来了,直接拿来用问题也不大。
简略总结一下,通义这波上新的PPT创造,具有以下几个长处:
言之有物:做到了生成文本更像人话(去AI味),并且不是片汤话,能结合用户需求和上传文件输出有信息量的PPT内容。模板丰厚:供给了各个不同场景、职业适用的PPT模板,规划漂亮,大学生到上班族都能用。智能编列:供给了全流程智能编列的才能,可在线实时调整PPT模板编列、PPT配图智能生成、PPT文本智能改写等。
量子位进一步扒拉了一下,通义PPT背面的根底模型是通义千问大模型2.5,相比上一版别,Qwen 2.5的了解才能、逻辑推理、指令遵从、代码才能别离提高9%、16%、19%、10%,功用逾越GPT-4 Turbo。
在对长文档的支撑方面,通义PPT支撑1000万字长文档,包含PPT、PDF和网页。
多模态方面,支撑上传最长6小时的音频、视频,也可以输入链接导入线上音视频。
文生图功用,则是引入了通义万相的才能。
三合一“通义功率”
值得一提的是,与PPT创造一起存在于通义功率版块的,还有别的两个功用:
实时记载,以及阅览帮手。
不说不知道,这两者其实都是通义用户的老朋友。
实时记载,原通义听悟,是音视频内容方面的AI帮手。
运用场景聚集讲堂记载、会议记载,能完结的作业,包含语音转文字、发言人区别、智能总结等。
界面十分简练,挑选言语(能辨认中、英、日三种言语),确认需不需要实时翻译成中文,即可开端在线录音。
外教课or国际会议,不必愁了。
在通义实时记载,录音是实时的,语音转文字是实时的,英文/日语录音转译成中文是实时的。
连边转文字边批改错别字,也是实时的。
是真的很实时(手动狗头)。
不只可以很好地区别发言人,依据不同发言人收拾中心观念,并且,用户可以边听边选中文段,自己划要害。
边开会边做会议纪要,不是梦。
整个界面的右侧板块,是用来写写画画自个儿做笔记的部分。
当录音完毕后,这一板块会划分红三个区域:
•导读:对录音内容进行AI总结,包含摘要、章节速览、待办事项等;
•脑图:依据录音内容收拾出思想导图,协助快速把握会议要害和头绪;
•笔记:望文生义,是录音过程中用户自己记载下的内容。
关于实时记载,最后来划个要害:支撑每天20小时的录制编撰时长,运用免费!仍是免!费!
阅览帮手,功用等同于本来的通义智文。
上来就先告知你,与实践记载相同,它相同是免费的。
在阅览帮手,各种格局的文档/论文/图书,包含PDF(含扫描件)、word、图片、HTML、Markdown、EPUB、Mobi,无论是网页链接仍是播客链接,都能被精准速读。
并且,超多格局伴跟着超大容量——
文档,可以是长达1000万字的;音频视频,可以是6小时起步的。
十分Nice。
上手测验过程中,咱们喂给了它两本书,别离是193页、英文版的《咱们赖以生存的隐喻》,和500页、中文版的《埃隆·马斯克传》。
首要,很要害的一个功用是阅览帮手支撑全文翻译,翻译速度还很快,简直不必等。
对常常读外文文献的朋友们来说,真的十分友爱。
其次,AI提炼出的导读部分,也会翻译成中文出现。
这一部分由全文概述、要害要害、速度导览等组成;假如丢给它的是论文,还会有论文速读(中心要害总结)、论文总结(文章长处、办法立异点、未来展望),协助用户快速了解内容。
假如厌弃导读仍是太长?
不要紧,指路周围的脑图,分分钟厘清首要头绪。
更有意思的是,在阅览帮手里,用户能针对原文划词解读,辅佐了解要害点。
可以挑选在板块底部的对话框,问出一切你不明白不了解的文档相关问题。
这个功用约等于“让死的论文活过来沟通讨论”。
如此这般,实时记载、阅览帮手、PPT创造,形成了三合一的通义功率。
实时记载功用可以敏捷捕捉并保存每一个重要信息;
阅览帮手则是辅佐位,协助在常识中挑选、提炼,让用户短时间内把握中心要义;
而PPT创造则能借用大模型的AI才能将散落的信息收拾成赋有逻辑性和视觉冲击力的展现资料。
这三者相得益彰,一起构成了一个从信息收拾、阅览了解到内容创造的完好作业学习流程;每一步环环相扣,不管是面临作业仍是学习,都能事半功倍。
大模型运用想卷,得靠技能和体会
上面说到的三个功用,都可以在PC端丝滑运用。
多说一嘴,除了PPT创造,别的两个功用还能在手机端体会。
“咱们期望经过这些东西协助用户节省时间,提高作业学习功率,激起无限构思。”通义功率产品司理王晓明表明,未来环绕作业学习场景,通义会继续帮用户用AI技能提效。
通义功率背面,正是依据强壮的通义大模型。
阿里旗下通义千问大模型聚集开源道路,宗族阵容庞大,是国内的头部队伍玩家,在多个全球评测榜单上也常常独占鳌头。
通义近期发布了全球功用最强的开源模型Qwen2-72B,该模型提高了代码、数学、推理、指令遵从、多言语了解等才能。多个国内外榜单显现,Qwen2-72B成为排名榜首的中国大模型,也是全球最强的开源模型。
长时间耕耘得来的技能优势,为通义功率供给了连绵不断的立异动力。
而三合一整合后推出的通义功率,精准地环绕作业学习流程,将信息收拾、阅览了解到内容创造这三大功用进行了无缝打通,形成了一个高效的作业学习闭环。
这一闭环不只可以激起用户的构思思想,还可以明显提高作业功率。
更为重要的是,通义功率率先将这些功用悉数实现在PC端,真实做到了“需求在哪里,功率就在哪里发挥作用”。
这种以用户需求为导向的规划理念,使得通义功率在提高用户作业功率的一起,也极大地增强了用户体会。
当然了,换个视角来看,通义上线“功率”的背面,其实反映了商场的挑选和趋势——
大模型的运用正在朝着智能化、个性化、一站式、高功率、少人工的方向开展。
这正是大模型在运用层面的实质表现。
跟着大模型日益融入群众的日常日子,用户在入门上手之后,寻求的便是愈加杰出的体会。
假如技能不行先进,体会不行优异,那么就简单被用户和商场所扔掉。
因而,大模型的运用落地和推行,有必要走向更有用、更好用的方向。
实践上,咱们正在见证这一趋势的产生,通义功率的挑选,便是最好的证明之一。
它告知咱们,运用落地和推行,只要真实满意用户需求,供给优质体会的产品,才能在AI 2.0的模型与运用大潮中站稳脚跟。
发表评论