·AI去码(图像修复) 看到这个小标题,可能很多老司机就顿时不困了。如果说AI实时P视频只是将已有的元素重新组合,例如场景换成另一个场景、人脸换成另一张人脸等;而AI去码,则可谓是凭空画饼,将原本不存在的事物添加上去,这在很多场景下都有极大用途。 一般而言,去马赛克是需要人类“脑补”的工作。从原理来看,马赛克属于不可逆运算,把大量的小像素点合并到一个大的像素点,并取平均色,就制造成了马赛克——很显然,你是难以知道被搅匀之前的各个小像素的颜色是如何排布的。一般来说,要消除马赛克,需要人进行想象脑补,然后把缺失的内容重新画出来。而有了AI,人不再是必须了,Google Brain的算法能够自动去除马赛克,骑兵自动变步兵。
Google Brain使用的是一种全新的像素递归超分辨率技术,通过大量高、低分辨率的采样学习,然后得出规律来匹配修复结果。例如,Google Brain学习到了某种黑点是属于眼镜,那么在还原马赛克的时候,就可以把这种黑点还原成眼睛。从测试来看,效果的确不同凡响。 这样的AI技术有什么用?去除马赛克只是特定场合的具体应用,类似的算法在很多时候都可以发挥作用——只要当图像需要修复的时候,就用用武之地。例如拍照片手抖了失焦了,糊成一片该咋办?传统的方法可能就是简单粗暴的锐化了,而如果拍照APP使用AI技术,就可以“脑补”回丢失的细节和锐度,给你一张尽量可用的照片。 ·AI上色 既然AI能够识别图像内容、脑补细节,那么AI自动上色也就成为了可能。上色其实涉及到了创作层面,而创作被很多人视为人类和机器的鸿沟,但这在AI时代不那么灵了。借助AI技术,手机APP可以自动为黑白照片甚至线稿画作来涂上适合的颜色。 类似的技术现在已经出现。照片处理自不必说,AI识别场景调节颜色和黑白照片上色并没有本质上的区别;而给线稿上色,在之前曾被认为是不可思议的事情——电脑能够读懂线条勾勒的是何种轮廓、该轮廓还得填上适合的颜色,听上去就如同魔法。不过Paintschainer推出的AI上色技术却令人大吃一惊——它可以识别某部分属于皮肤,某部分是头发,某部分是衣服,某部分是背景,然后分别涂上适当的颜色。
不仅如此,Paintschainer的上色范围还相当精准,尽管线稿没有封闭,但颜色依然会保留在适当的范围,而不会涂得满地都是——用过PS中油漆桶工具上色的朋友,应该知道这是什么意思。 这意味着,以后在手机中绘画成为了可能。尽管手机的屏幕小且触控并不算精确(相比数位板),但得益于AI已经能辨识线稿,因此手指绘画粗糙的笔迹,就可以被AI完补为精细的描线,并填上适合的颜色。对于创作者而言,这大大节省了打磨具体画技所需要的功夫,将更多精力留给设计、构思,提高了效率。 这种AI辅佐创作的技术,并不仅能用于摄影、绘画,在作曲等领域也同样适用。或许在不久后,对着手机哼一段旋律,AI自动帮你编好曲、选择好演奏乐器、最后完成一段高质量曲子的日子,也已经并不遥远。 ·AI自动翻译 语义识别可谓是AI另一大广泛实装的应用了。无论是语音识别,还是自动翻译,都离不开精准的语义判断。得益于AI,近年的机翻竟然也能说人话了——例如Google翻译,已经基本做到了语句通顺流畅,用来阅读一些专业性不强的外文,Google翻译绰绰有余。这是如何做到的呢? 这主要得益于Google翻译引入了神经网络和深度学习等人工智能算法,迈入了“神经机器翻译(GNMT)”的时代。得益于人工智能和谷歌的大数据,谷歌翻译对语言的解析有了远比之前深入的理解,因此在长句、整篇翻译方面有了长足的进步。
在未来,AI翻译还会愈加强悍,也不仅仅局限于静态的文字。例如在Android 10当中,引入了Live Caption(实时字幕)功能,借助机器学习,它能够让手机在播放任何视频的时候,精准识别出音频,并生成字幕。该技术显然可以和AI翻译结合,帮助人们啃下各地语言的生肉,大大减少交流的鸿沟。
另外,AI自动翻译还可以用于语音交流。随着处理速度和精准度的上升,手机安装响应的APP后,化身同声传译器也并非不可能,虽然对于一些专业词句、地域文化梗的翻译,可能还比不上人工,但对比现在已有的机翻,这无疑要好上太多。
|
正在阅读:AI芯片是鸡肋or真有用:未来还能一键去码?AI芯片是鸡肋or真有用:未来还能一键去码?
2019-10-19 00:15
出处:PConline原创
责任编辑:censi
键盘也能翻页,试试“← →”键
本文导航 | ||
|