【AI工具推荐】想要弯道超车?快来看看这些 AI 工具
2024-11-24 18:00:00

本周我们继续给大家推荐一些实用的AI工具,希望能够帮助到大家。

1.Vidu

如果说我想看马斯克穿着大花袄骑电动车,可以实现吗?当然可以,这是马斯克+大花袄+电动车

图片

这是Vidu帮我实现的画面:

图片

在 AIGC —— 尤其是 AI 视频生成领域,这样的吐槽已经成为一种日常。自从今年二月 OpenAI 的 Sora 横空出世,引发了一场 AI 视频生成的热潮。但无论是紧随其后的 Runway,还是 Pika Labs 和 Google 的 Lumiere,每一个视频生成模型都在苦苦挣扎于一个让创作者头疼的“换脸魔咒”。

这个被学术界称为「一致性」的难题,堪称 AI 视频生成的最大痛点。简单来说,就是如何让生成的主体在整个视频中保持外观、特征的一致性。听起来很基础,做起来却异常困难。即便是 Sora,在处理人物连续动作时依然会出现细微的特征漂移。

直到 11 月,国产清华系初创公司生数科技自主研发的 Vidu 大模型发布了 1.5 版本,展示了一个令全球 AI 从业者震惊的能力:只需要提供 1-3 张参考图片,就能实现对任意主体的精确控制。这意味着什么?意味着原本需要几十段视频、数小时训练才能达到的效果,现在只需要三张照片、30 秒就能实现。

当我们说“生成一个人”时,其实在要求模型完成一个极其复杂的任务:它需要理解这个人在不同角度下的样貌、在不同表情下的细节变化、在不同动作中的姿态转换。传统模型往往只能记住某个特定视角下的特征,一旦需要转换视角或改变表情,就容易出现“换脸”现象。

现在来试试,上传科比的正面照片和背面照片:

图片

图片

一张特写,让科比重新回到「战场」,眨眼、微笑、自然摆臂动作,Vidu全部精准拿捏。

图片

由此不难看出,在人物特写画面中,Vidu能够确保面部细节特征、表情自然流畅变化,呈现了人物真实本色。

接下来,才是Vidu真正放大招的时候了。现在,任何人可以在「多图参考」功能中选择上传多个主体。它既可以是人物角色,也可以是人物+道具物体、环境背景等等,即便是「多主体」Vidu 1.5也能做到一致性控制。

大家喜欢的IP也可以参与联动。

图片

图片

比如,百变小樱和雷姆一起对着镜头微笑。

图片

Vidu 1.5 的出现,无疑为 AI 视频生成领域带来了新的曙光。它突破了长久以来困扰行业的 一致性 难题,以卓越的性能和创新的功能,让我们看到了 AI 视频生成无限的可能性。无论是实现天马行空的创意想象,还是精准还原经典人物形象,Vidu 都展现出了强大的实力。相信在未来,Vidu 将继续引领 AI 视频生成技术的发展,为创作者们带来更多的惊喜和可能,让我们共同期待它在这个充满无限潜力的领域中创造更多辉煌的篇章。

入口:www.vidu.studio

 

2.讯飞智文

开题报告、转正述职、广告提案、商务谈判……现代社会的人,想实现高效沟通或是推动项目运转,离不开PPT这个关键工具。据悉,全球用户每天使用PowerPoint创建超过3000万份演示文稿。一面是惊人的普及率,一面是繁琐的制作流程,过去,做PPT堪称一件让人闻之色变又无法逃避的苦差

大模型时代的到来,彻底颠覆了PPT创作范式!基于讯飞星火的AI原生应用—讯飞智文,支持PPT一键生成。对于内容的精细打磨,提供AI速读与段落精写。还有随意切换的精美模板和多语种,满足个性化需求。排版一站式解决、内容秒速级生成。

图片

依托于讯飞星火V4.0的底座能力,讯飞智文2.0在PPT文本生成方面进行了独立训练。在优质语料的调教下,进化出PPT应用场景中更专业的表现力!

首先,对用户输入主题具备更强大的理解能力。无论大纲还是正文,生成质量都有肉眼可见的提升。

假如你要一份今年付航夺冠时刻的报告。

只需在“主题创建”中输入一句话主题,比如“付航夺冠时刻”;再勾选“联网搜索”,令大模型自动抓取实时资讯,确保事实的时效性和准确性。

图片

升级后的讯飞智文,PPT大纲环节,支持对主标题,副标题,以及章节的修改和调序。

图片

这让PPT大纲的编辑,变得更加灵活和方便。

加上排版图示的新增选项,让创作者也拥有了更自由的表达空间。

从1到10,可自行选择二级大纲的结构繁简,添加或者删减内容更加方便。

 

此外,AI配图上,智文2.0也有了更优异的表现

基于星火V4.0更强大的多模态能力,选中文本内容即可为你自动生成多张高清且适配的图片,一键规避版权风险,免去手动搜图的繁琐。

图片效果想要精益求精的话,也可以自行优化提示词,在多次生成结果中挑选最满意的那张。从画面内容到画面风格,可精准化定制自己的PPT配图。

图片

如果有特定配图需求,比如述职报告PPT中需要上传个人证件照,还可以一键替换成本地图片

从2023年11月诞生到每一次产品升级,讯飞智文从用户需求中来,又回到用户反馈中去,不断打磨PPT创作质量,立志解决用户的真实痛点。

入口:https://zhiwen.xfyun.cn/home