东风 明敏 发自 凹非寺
量子位 | 公共号 QbitAI
AI工具秒做电商图,元购一张惟独一块钱 ,人图老本直降99% !布景本
随意上传一张照片,随意服饰巩固,换国改头换脸:
走南闯北即可配入种种布景,具降光影也能做作泛起 :
小哥哥也有哦,电商还能自动补全扩展,模特恣意修正图片巨细 :
哪怕不真人图 ,元购惟独人台照 ,人图也可揭示上身下场 :
致使可能跨次元 ,布景本把2次元纸片人的随意服饰酿成3D着实气焰。
这下场 ,换国乍一看很难分说出是AI天生的啊。
如斯一来 ,商家岂不是无需妨碍大批线下拍摄,省去换景离奇使外出拍图的步骤 ,在电脑前即可做出丰硕商品图?
啥情景,电商模特这碗饭也要端不住了 ?
1分钟做一张AI模特图
如上提到的AI工具 ,名叫小K电商图 。
如今能提供4种电商图生乐成用:
种种下场惟独3步即可搞定 ,界面颇为深入易懂,操作流程约莫在1分钟摆布 。
好比选一张迪丽热巴的照片,想替换人脸以及神色,而且把布景交流成T台 ,同时调解图片尺寸。
需要先上传图像 ,零星会自动对于图像妨碍分割,选中想要保存的地域 。
(假如服饰被头发遮住可能同时保存头发))
而后再设定想修正的元素,搜罗模特人脸气焰、面部神色 、布景等。
同时可能勾选一些特殊处置,填补服饰 。
在这里 ,咱们设定将原图人像换成一位欧美模特 、露齿笑、布景为T台,并扩展了原图尺寸。
可能看到生乐成果中,很好保存了服饰以及发型 ,可是其余元素都妨碍了响应调解。
而且对于发丝、光影都重新做了处置。布景也是AI重新残缺天生的,差距于传统PS抠图 。
一次天生会给出4张图,利便筛选。
天生图片布景的细节也可能处置患上很好 ,好比雪景布景下 ,人物鞋子上都市被加之雪花 。
在小K电商图里 ,提供的AI模特规范比力多 ,差距地域 、差距年纪都有拆穿困绕。
假如对于现有模特不知足,还可逍遥定制专属模特 ,定制化方式有两种:
除了AI模特 、真人,二次元人物也可定制。
可交流的AI布景也很丰硕。
据介绍 ,自界说布景功能 、物品图天生也即将推出。
以是 ,小K电商图是若何实现这些下场的呢?
散漫自研姿态算法
小K电商图的底层技术可能重大散漫为两部份 :天生+操作。
天在行腕来自开源的Stable Diffusion 。
操作方面则引入了小K自研的一系列算法,其中以姿态算法最为突出 。
要知道,AI画画很长一段光阴都无奈画大盗手,在可控性上展现也比力差 ,这是由于散漫模子自己的特色使然。
后续随着ControlNet泛起,经由给预磨炼散漫模子削减一个格外的输入,可能操作Stable Diffusion天生的细节 。
这里可能是种种规范的输入,搜罗草图、边缘图像、语义分割图像 、人体关键点特色、霍夫变更检测直线 、深度图 、人体骨骼等。
由此,Stable Diffusion加之人体姿态估量算法(Openpose)可能很好操作人物措施天生 。
小K电商图的技术逻辑也是如斯 ,不外他们接管了功能愈加晃动的自研算法 。
基于这套算法 ,小K的另一款视频动捕产物——小K直播姬已经实现为了经由艰深RGB摄像头 、无需任何传感器 ,即可实现3D动捕。
而且在手指细节的处置上展现很好。
因此 ,对于不四肢的人台图,小K电商图可能做到直接识别 。自动填补头部 、画手能耐提升也患上益于该算法。
在处置了姿态可控后,还需要处置面部可控 。在这方面小K电商图引入了LoRA。
LoRA原本是微软钻研团队早在2021年提出的一项狂语言模子微调的技术,可能大猛后退微调磨炼速率。
去年底,韩国迷信技术院KAIST一位钻研员@cloneofsimo与HuggingFace相助 ,将此措施扩展到Stable Diffusion上。
不光实现为了单块11GB显存的RTX2080Ti实现模子残缺微调 ,同时原始模子权重解冻,新磨炼进去的权重可能保存为3MB巨细的单个文件宣告。
这项技术被AI绘画喜爱者用来让模子牢靠天生一个物体,最盛行的便是牢靠一总体物抽象 。
在CivitAI社区里,每一个微调好的权重就叫做一个Lora ,就至关于一总体物模版 ,所有人都可能利便下载运用。
最后在布景方面 ,为了知足电商场景下的需要 ,小K也做了更强的操作。
好比一些情景下,用户着实只想交流模特人脸,其余都不做修正 。
那末在这种情景下,AI仍是会重新绘制一张新图 ,不外会保存95%的相似度。
假如用户想交流布景,算纪律会在光影等细节上做更多填补,力争图像做作、传神。
以是,是谁带来了小K电商图