AI走入万物互融时代,科技巨头与高校学子之间擦出别样火花

12-30 科技

最近各种形式的“AI作画”一时间刷爆了朋友圈,只需要上传照片,AI就可以生成各种风格的照片,比如生成一只赛博朋克风格的小猫,或者一个油画风格的自拍照

这些应用的背后,就是近年来在AI领域大火的AIGC技术,比如前不久一度登上各类科技热榜的,能够打代码、写文章、回答各类问题的ChatGPT,就是AIGC技术的一类应用。

放眼国内,其实很多科技巨头已经在AIGC相关领域有所布局了,比如在智能终端巨头OPPO最近举办的未来科技大会上,OPPO小布助手就进行了一系列升级,推出了小布作画这样的功能。

借助AIGC小布作画技术,小布化身为一个会画画的智能助手,我们可以通过自己的描述、上传图片得到我们想要的作品,这种人与科技的有温度的交互,令人颇感惊喜,而这种体验,很快可以被数亿OPPO用户享受到。

在深厚AI技术积累之上,小布助手也在产学研方面积极布局,让技术可以更好地在产业、高校之间流动,通过融合共创的方式刺激AI技术的发展。

今年浙江大学与OPPO联合承办了中国高校计算机大赛-智能交互创新赛,竞赛将智能交互这一领域命题带给了更具想象力和创造力的新生人才,与全球高校大学生一起,探究了智能交互更多的可能性。

在此次的大赛中,一个年轻的科技团队引起了不少人的关注,斩获一等奖的三阙定则,其初创成员为几名杭州电子科技大学的学生,他们的智能绘画机器人项目,在实现前沿AI技术突破的同时,让我们看到了智能交互技术应用的巨大想象空间,同时也很好地诠释了“科技为人”的理念。

智能绘画机器人“杭小电”为新生画肖像素描、写祝贺信

此次智东西有幸与三阙定则科技团队的周景林、喻家瑶两位初创成员进行了近两个小时的深度交流,进一步挖掘了这群年轻人创业背后的精彩故事、产品背后的硬核技术创新,以及他们对于智能交互技术的思考,同时也对智能交互技术给未来科技产业带来的可能进行了大胆前瞻畅想。

我们深刻感受到,智能交互技术,已成为打开万物互融时代大门的关键钥匙。

一、一台小小的绘画机器人,如何诠释“科技为人”的理念?

为什么会选择做一台智能绘画机器人?这台小小的机器人能给用户带来什么样的体验,而它又与“智能交互”的竞赛主题有着怎样的联系?带着这些首先跃入脑海中的问题,我开始了与三阙定则科技团队的第一次接触。

在周景林看来,做一台智能绘画机器人的想法,与他们对于AI技术的兴趣和思考是密不可分的。

团队中的不少成员很早就开始关注AI领域,包括AIGC方面的研究,但他们渐渐发现,很多非常有趣的AI领域的前沿工作其实并没有运用到实际生活中,普通用户跟前沿科技之间的“距离感”很强。

我们平时想要接触到AI技术,比如像ChatGPT这样的AIGC应用,通常都是有门槛的,所以他们想要把这些“精彩的工作”带到生活中。

有了想法,接下来就是要找到付诸实践的路径,在探索的过程中,他们发现自己在思考的,实际上就是AI算法本身真正可以为人做些什么。

他们要做的不只是一个静态的产品,而是一个动态的过程,希望追求交互性、体验感,做到人性化。实际上,这恰恰与智能交互创新赛“科技为人”的理念不谋而合。

经过多方的调研,结合团队自身的兴趣,他们最终确定了将AI算法用于“个性化实现”的方向。因为将AI算法用在产品设计上,可以很好地满足“有创意”和“个性化”的需求,AI可以根据每个人不同的要求、提供的素材来生成拥有强烈个人特征、个人喜爱的文化元素的产品。

带着这样的想法,三阙定则科技团队最终将“杭小电”智能绘画机器人带来了我们的面前,它从大赛318所高校、1170多支队伍的项目中脱颖而出,入围决赛并斩获了一等奖,同时真正用了起来,为杭电新生制作了一批录取通知书附信和素描肖像画作品。

AI技术就这样与实际应用结合起来,让杭电2022级新生经历了一次“与科技零距离接触”。

二、实现独特交互体验背后,少不了硬核软硬件技术创新

可以说,杭小电的出色表现,让杭电2022级新生感受到了智能交互技术的独特魅力,然而想要实现这些看似并不复杂的机器人“画画”、“写字”能力,真正通过算法让机器人能够“读懂”照片并对其进行智能图像处理、让机器人真正“握笔绘画”,其背后的技术挑战是巨大的。

在产品工业设计、机械结构设计、视觉识别算法、图像生成算法等方面,三阙定则科技团队都需要攻克不少技术难题,因为他们在做的是一个全新的产品形态,需要自己去淌出一条路。

在进行技术研发创新的过程中,他们已经形成了自己的技术壁垒,目前三阙定则科技团队已经拥有10余项专利。喻家瑶特别说到,在项目推进中,团队前期进行了大量的实验,积累了高价值数据,并进行针对性算法优化,因此实验本身就决定了该项目的技术门槛是较高的。

在算法层面,目前三阙定则科技团队成员在AIGC领域已有较多论文成果输出,最近的一个成果是拿到CICAI 2022的最佳演示入围奖。团队的算法在技术指标以及图像效果方面都有比较好的提升。

在产品层面,三阙定则在硬件设备和软件方面都做出了比较多的创新,比如杭小电的产品形态在整个行业中都具有较强的独特性,几乎找不到同类产品。

对此,周景林谈到,就算法或者某一个单独的产品层面,他们会有竞争对手,但团队最大的创新性在于他们完成了从AI算法到落地产品全流程的全新探索。他们不仅完成了硬件产品的研发,还为其搭建了从网站、小程序、App到服务器的全流程软件支持。

这种全流程的创新也是他们的核心优势所在,其中需要大量的时间投入、知识和经验的积累,也是门槛较高的一件事。

比如在实际的应用过程中,团队发现了很多意料之外的挑战,他们需要不断试错,优化算法,通过和用户的持续交流去升级系统。包括原始照片数据的优化、软件操作体验的优化、用户数据隐私安全的保护。可以说杭小电最终令人惊喜的表现,离不开整个团队的技术创新能力和对于产品体验打磨的执着与认真。

本文地址:
http://www.86dhz.com/archives/5317.html
分类:
标签: