注:Elo是一种被广泛用于机器学习领域,用来衡量不同模型处理性能差异的评分方法
笔者试验SD3.5 Large 的效果图,可以看到手部的处理明显较好,但仍显略微畸形
官方解释称,经过优化之后的SD3.5系列可以做到在标准消费硬件上运行,对比了SD3.5 Turbo和目前业界流行的Flux.1[dev] 、Flux.1.1[pro]、SD3.0系列的跑分,SD3.5发布的2个模型达到了提示词推理和图像质量的高优平衡。
当前AIGC领域最受欢迎的Flux.1模型生成质量和速度已经足以令人惊叹,没想到的是,Flux.1模型团队在日前又给AIGC领域带来另一次震撼!最新发布的一款代号为“blueberry”(蓝莓)的Flux.1.1[pro]模型比它的上一代Flux.1 [pro]生成的速度要快上6倍!Blackforestlabs称,Flux1.1[pro]已经能够实现图像质量和推理速度的理想平衡。
升级版Claude 3.5 Sonnet和其他模型的行业基准性能跑分对比
升级后的3.5 Claude Sonnet参与的行业基准的测试来看,在编码和工具使用任务上性能有很大的提升。最重要的是,它实现了通过API接口输入指令,让Claude操作本地电脑:比如输入“使用我的计算机和在线数据来填写在线表格”指令,Claude 3.5 Sonnet会自动操作鼠标、打开网页、浏览数据然后根据表格类型进行填充。
在操作不复杂的软件评估上,Anthropic给出了对比:纯屏幕截屏操作3.5 Claude Sonnet获得14.9%的评分,第二名的AI操作系统仅得分7.8%;如果操作步骤指令稍微复杂一些,3.5 Claude Sonnet竟能获得22%的得分。
虽然这是一次小小的尝试,3.5 Claude Sonnet可能离我们想象中的“AI助手”更近了一些。
复旦大学和百度联手推出模型Hallo2,实现4K高清度的长视频生成/NEWS
近日,复旦大学和百度的研究人员联合推出了模型Hallo2,该模型可以生成长时间的人物动画。Hallo2 模型是首个实现4K分辨率且可以生成长时间视频的模型,研究人员表示,Hallo2 引入patch-drop技术、高斯噪声增强技术和文本控制机制解决AI生成视频中可能出现的脸部特征不稳定、动画连贯性欠缺以及动画的表现力和人物表情丰富度不够的问题。
Ideogram近日上线了新功能Canvas,不仅支持常规的生图功能,更强大的是它的扩图功能!用户可以通过提示词、拖动图像大小、融合参考图等方法保持上传的图像原图结构不变而无缝扩图。
不过,目前Canvas的Extend(画布拓展)、Magic Fill(魔术填充,替换对象、局部修复、添加文本)、Remix(根据用户上传图片或平台生成图片中选择不同图片进行再创作)是付费功能,免费用户每人每天只有2次免费体验Canvas的额度。
设计人绝不想错过的Adobe Max在日前开幕,今年的Max大会Adobe带来了重磅项目:Project Turntable。该项目目前仍在保密的开发当中,不过,会上的视频操作演示,我们可以看到Project Turntable颠覆美术行业的举动:只需要通过按键和滑动条的简单拖动,2D的图像就能实时生成3D效果,同时会补全旋转中各个角度!
大会演示的经过Project Turntabl项目独特的算法调节旋转角度生成的3D效果(1)
大会演示的经过Project Turntabl项目独特的算法调节旋转角度生成的3D效果(2)
大会演示的经过Project Turntabl项目独特的算法调节旋转角度生成的3D效果(3)
过去美术从业者、3D游戏业为了3D效果需要耗费大量的精力绘制,Project Turntable的出现有望让3D的绘制过程大大缩短。那么问题来了,Project Turntable会是3D从业者的福音还是寒冬?
OpenAI近日宣布,将为ChatGPT plus、团队、企业及校园用户这些付费用户提供Windows早期桌面版本,用户可以直接在微软应用商店下载,通过Alt+Space就能快捷使用。目前在微软应用商店已经可以下载ChatGPT for Excel和ChatGPT for Powerpoint。
关于我们:派生万物是澎湃新闻旗下独立技术品牌,专注于AI科技创新与应用。助力媒体、政务及各行业客户实现数智化转型。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。