大数据文摘
资料来源:github
出版人:元晓
上周,另一款人工智能侧门应用软件“一键脱衣软件”deep裸体(deep裸体)推出了一键脱衣软件,该软件可以用一键直接“脱掉”女装,风靡全球。
该应用程序也很容易启动。只要给它一张照片,你就可以借助神经网络技术自动“脱掉”你的衣服。虽然对该原理的理解门槛很高,但应用起来却很轻松,因为对于用户来说,他们只需点击一下就可以获得该原理,而无需任何技术知识。
根据出版商的说法,研发团队是一个小团队,相关技术显然还不成熟。大多数照片(尤其是低分辨率照片)经过deep裸体处理后会有人工痕迹;输入卡通人物照片获得的图像完全失真,大多数图像和低分辨率图像会产生一些视觉伪影。
当然,目标“图片”仍然是各种各样的女性。早些时候公开该应用程序的技术媒体主板表示,通过对数十张照片的测试,他们发现如果输入《体育画报》泳装的照片,他们会得到最逼真的裸照。
海外媒体Motherboard测试图片
海外媒体主板测试图片
该应用程序立即引发了社区的各种批评,表明它是人工智能使用的反例。
就连吴恩达也站出来谴责这个项目。
在一场运动中,该应用程序很快就下线了,但余震依然存在。
特别是,关于该应用背后的技术的讨论仍在继续。
本周,一个名为“deep裸体使用的图像生成和图像恢复相关技术和论文研究”的github登上了本周的热门榜单,并赢得了许多明星。
该项目的创始人显然研究了该项目背后的技术,并提出了生成该项目所需的一系列技术框架,以及哪些技术可能具有更好的实施效果。摘要转载于此。我希望极客们不仅能满足他们的技术好奇心,还能正确使用他们的技术力量。
以下是原始内容和源链接:
https://github.com/yuanxiaosc/deepnude-an-image-to-image-technology
接下来,我将开放一些图像/文本/随机到图像的神经网络模型,仅用于学习和交流。欢迎分享您的技术解决方案。
图像对图像演示
deep裸体软件主要使用图像到图像技术,该技术是在使用部分旋转的不规则孔的图像绘制中提出的。这项技术还有许多其他应用,比如将黑白简单笔划转换成彩色图片。您可以单击下面的链接,在浏览器中尝试“图像到图像”技术。
https://affinelayer.com/pixsrv/
根据你的想象,在左框中用简单的笔划画一只猫,然后点击pix2pix按钮,输出模型生成的猫。
深度裸体中的深度计算机视觉
图像修复图像修复
nvidia 2018纸张图像绘制,用于不规则孔,使用部分旋转和基于部分旋转的填充代码paper code partialconv。
效果
图像修复(nvidia_2018)。mp4视频左侧的操作界面只是需要工具来抹去图像中不必要的内容。即使形状非常不规则,nvidia的模型也可以“恢复”图像,并用非常逼真的图片填充涂抹的空白。这可以说是一个一键p图,“没有ps痕迹”。这项研究来自刘桂林和nvidia其他团队,他们发布了一种深度学习方法,可以编辑图像或重建受损图像,即使图像有洞或丢失像素。这是目前最先进的方法。
pix2pix(需要成对列车数据)
deep裸体主要使用这种pix2pix技术。
论文 Berkeley 2017 paper Image-to-Image Translation with Conditional Adversarial Networks.主页 homepage Image-to-Image Translation with Conditional Adversarial Nets代码code pix2pixRun in Google Colab pix2pix.ipynb
带条件逆网络的图像到图像的翻译是伯克利大学提出的图像到图像转换问题的一般解决方案。
cyclegan(不需要成对的列车数据)
论文:伯克利2017年论文使用循环一致优势网络进行未配对图像到图像的翻译代码:谷歌colab cyclegan ipynb中的代码cycleganrun
效果
周期性函数用于实现训练的一致性,而不使用周期性。换句话说,它可以从一个域转换到另一个域,而不需要源域和目标域之间的一对一映射。这为执行许多有趣的任务提供了可能性,例如照片增强、图像着色、样式转换等。您只需要源数据集和目标数据集。
将来
图像到图像可能不是必需的。我们可以使用gan直接从随机值或文本生成图像。
obj-gan
obj-gan是微软人工智能研究所开发的一种新的人工智能技术,它可以理解自然语言描述、绘制草图、合成图像,然后根据草图框架和文本提供的单个单词细化细节。换句话说,网络可以根据描述日常场景的文本描述生成相同场景的图像。
效果
模型
故事人
魔笔高级版:一句话和一个故事就可以生成一张图片
微软的新研究提出了一种新的gan-objgan,它可以根据文本描述生成复杂的场景。他们还提出了另一种可以画故事的gan——storygan。通过输入故事文本,他们可以输出“连环漫画”。
目前优化的文本图像生成模型可以基于单句描述生成逼真的鸟类图像。然而,文本到图像生成器远不止为一个句子生成一个图像。给定一个多句子段落,生成一系列图像,每个图像对应一个句子,整个故事完全可视化。
效果
现在最常用的图像对图像技术应该是美容应用,那么我们为什么不开发一款更智能的美容摄像头呢?