Google Guetzli 和基于 AI 的 Deep Photo Style Transfer。

  • 发布于 :2017/04/02
  • 分类 : 随笔
  • 字数 :1267 字
  • 阅读大约需要 :6 分钟
  • 最后更新于 :2024/04/24
点击查看目录

如果你看过美剧「硅谷」会记得剧中主角们所在的创业公司PiedPipper ,他们就是靠自己发明的视频压缩算法来跟大公司 Hooli 竞争的,这部剧现在已经发展到第 4 季,在腾讯视频 上可以免费观看。

最近关注了两个图像处理的 Open Source Projects。

另外对于图像处理还处于 Photoshop、Lightroom 这种摄影后期和图像处理命令行工具ImageMagick 的我来说,图像压缩,智能图像风格转换实乃上乘武功,不是我等凡夫俗子驾驭的了,但是乘兴而来,总不能败兴而归吧,下面我们来一探究竟。

Google Guetzli

聊聊架构微信公众号上有一篇介绍Google 开源新算法,可将 JPEG 文件缩小 35% 文章。

我在 Mac 上试用了一下,安装很简单,只要一条命令:

brew install guetzli

但是当我拿一张22M大小的照片使用 guetzli 压缩的时候,我是绝望的,先后三次 kill 掉了进程。

因为实在是太慢了,也能是我软件对内存和 CPU 的利用率不高,效果你们自己看看。

原图是这个样子的,拍摄地点在景山上的,俯瞰紫禁城的绝佳位置。

image
原图

guetzli --quality 84 --verbose 20160403052.jpg output.jpg

为什么 quality 要设置成 84 呢?因为只能设置为 84+ 的 quality,如果要设置的更低的话需要自己修改代码。

image
process

耗时了一个小时,后台进程信息。

image
后台进程

这个是使用Squash压缩后的大小效果,压缩每张照片差不多只要 3 秒钟。

Squash 的 logo 就是个正在被剥皮的🍊,这是下载地址

压缩比分别为70%30%

image
Img

压缩比 70% 后的细节放大图

image
70

压缩比 30% 的细节放大图

image
30

你看出什么区别了吗?反正我是没有。

下面再来看看耗时一个小时,千呼万唤始出来的 guetzli 压缩后的效果和使用 squash 压缩比为 30% 的效果对比。

image
对比

左面是使用 guetzli 压缩后(4.1M),右面使用的 squash 压缩后(3.1M)的照片。

似乎还是没有什么区别啊?你看出来了吗?

Guetzli 总结

可能是我使用 Guetzli 的方式不对,但是命令行里确实没有设置 CPU 和内存资源的选项啊,为啥压缩照片会这么慢呢?效果也并不出彩,不改代码的话照片质量只能设置成 84 以上,但是这个是Open Source的,使用的 C++ 开发,可以研究下它的图像压缩算法。

Deep Photo Style Transfer

来自康奈尔大学的 Luan Fujun 开源的图像 sytle 转换工具,看了README 的介绍,上面有很多图像风格转换的例子,真的很惊艳,市面上好像还没有这种能够在给定任意一张照片的情况下,自动将另一张照片转换成该照片的 style。

这个工具使用 Matlab 和 Lua 开发,基于Torch 运行的时候需要CUDAcudnnMatlab ,环境实在太复杂,就没折腾,启动有人发布Docker 镜像 ,已经有人提了 issue。

如果它能够被商用,绝对是继Prisma后又一人工智能照片处理应用利器。

后记

是不是有了照片风格转换这个东西就不需要做照片后期了?只要选几张自己喜欢的风格照片,再鼠标点几下就可以完成照片处理了?摄影师要失业了?非也!照片风格东西本来就是很主观性的,每个人都有自己喜欢的风格,照相机发明后就有人说画家要失业了,其实不然,画画依然是创造性地劳动,只能说很多写实风格的画家要失业了。Deep Photo Style Transfer 也许会成为 Lightroom 或者手机上一款 app 的功能,是一个不错的工具。也许还会成为像 Prisma 一样的现象级产品,who knows?🤷‍♂️