2024-09-02 09:52:07|已浏览:23次
ChatGPT催热生成式AI赛道,从新冠药物到魔幻绘画都能生成 影视业,拥抱AI新机遇,
ChatGPT催热生成式AI赛道,从新冠药物到魔幻绘画都能生成
转自:俞陶然
近日,英矽智能用人工智能(AI)平台生成的抗新冠病毒口服新药获国家药监局批准,即将进入临床试验阶段。这家研发中心在上海张江的企业,借助人工智能平台发现了10款临床前候选化合物。其中,抗特发性肺纤维化候选药物已完成Ⅰ期临床试验,将在中国、美国等国家同步开展多中心Ⅱ期临床试验。“英矽智能的Pharma.AI平台和ChatGPT一样,都使用了生成式人工智能。”英矽智能创始人、首席执行官亚历克斯·扎沃洛科夫博士说,“从生成对抗网络到Transformer,生成式人工智能正在改变药物研发、文字创作、绘画等很多行业。”随着ChatGPT的走红,生成式人工智能这条赛道越发热门。它的科技原理是什么?产业应用前景如何?记者采访了两家上海企业。
人工智能生成数据能以假乱真
扎沃洛科夫介绍,生成式人工智能诞生于2014年,古德费洛等人在一篇开创性论文中提出了生成对抗网络。这是一种深度学习模型,包含生成器和判别器。生成器负责生成类似于真实数据的新数据;判别器负责判别输入的是真实数据还是生成数据,并向生成器反馈。打个比方,生成器像造假画家,一直模仿名画创作赝品,而判别器像名画鉴定师,两者在“对抗”中共同提升能力,直至生成数据能以假乱真。
如今,生成对抗网络已应用于计算机视觉的各个领域,如图片生成、图像分割、视频预测等。引发争议的“换脸”软件,也基于这种生成式人工智能技术。
生成对抗网络还能用于医药行业。扎沃洛科夫带领团队,利用它开发出人工智能药物研发平台Pharma.AI,这个平台包括靶点发现平台PandaOmics、生成化学平台Chemistry42和临床试验预测平台InClinico,覆盖新药研发的各个环节。除了生成对抗网络,Pharma.AI还采用了Transformer算法模块等新兴技术。
扎沃洛科夫(左)和任峰博士在英矽智能AI实验室。
ChatGPT也采用了生成式算法和Transformer算法模块,名称中的GPT全称为“生成式预训练Transformer”。过去,主要的自然语言处理算法是循环神经网络,它的原理是每个单词(字)计算之后将结果继承给第二个单词(字)。其短板是需要大量串行计算,效率低,而且在处理长句子时,前面的信息很可能被稀释掉。与循环神经网络不同,Transformer模型对每个句子里的所有单词(字)进行计算,算出它们的相关度,从而确定单词(字)在句子里的准确意义。这种模型采用并行计算方式,能大幅减少训练时间,而且在文本生成、机器翻译等任务上有优越表现。
打造生物医药类ChatGPT模型
Transformer和生成对抗网络正在改变生物医药科研范式。与OpenAI训练ChatGPT的方法相仿,英矽智能将科研文献里的药物靶点、化合物结构等信息“喂”给人工智能药物研发平台,让平台通过机器学习,拥有自主发现药物靶点、设计并合成小分子化合物的能力。
与科研人员设计的药物相比,人工智能平台设计的一些药物在分子结构上更富有创新性。以英矽智能研发的抗新冠口服药ISM3312(研发代号)为例,这款获批进入临床试验的新药以新冠病毒的3CL蛋白酶为靶点,其分子结构源自生成化学平台Chemistry42生成的化合物。在分子结构上,ISM3312与相同靶点的已上市药物有很大差异,原创性强。
考虑到冠状病毒的高度变异性,临床上大量使用Paxlovid和结构类似药物后,可能出现耐药毒株,而ISM3312由于其结构与人类设计的药物迥异,具备克服临床耐药性的潜力。
人工智能药物研发平台Pharma.AI
正因为这种人类不易触及的创新性,生成式人工智能将在新药研发上发挥越来越大的作用。“它可以帮助我们发现靶点、生成分子,甚至从无到有产生一些新颖的想法。”扎沃洛科夫说。
ChatGPT问世后,他对人工智能的产业应用前景有了新想法——研发团队可以与出版机构合作,将药学、医学和生命科学期刊中的英文和中文论文“喂”给自然语言模型,打造专业领域的类ChatGPT模型,让它们在与专业人士的对话中,生成有科研价值的内容。
输入“咒语”后生成绚丽绘画
生成式人工智能这条赛道上,视觉艺术生成也有广阔的产业应用前景。去年10月,上海退格数字科技公司宣布完成了百万美元天使轮融资。作为国内第一批入局生成式人工智能的初创企业之一,退格数字凭借自主研发的算法和底层引擎,为用户提供“文本生成图像”服务。
文本生成图像的效果如何?记者登录这家企业开发的微信小程序“Tiamat AI”,体验了一番。在“咒语”框里,记者输入“海边的城堡 魔幻 鱼 彩虹”,随后在人物引擎、结构引擎、光影引擎等多个绘画引擎中选择写实引擎,点击“开始生成”。几十秒后,小程序给出了4张海边城堡的图片,供用户挑选。它们都色彩绚丽,有城堡、大海和彩虹,虽然没看到鱼,但记者要求的魔幻感还是有一点。
Tiamat生成的4张海边城堡和彩虹图片
记者挑选了其中两张图片后,点击“补充细节”,两张人工智能引擎生成的画作就完成了,用户可免费下载。
补充细节后的海边城堡和彩虹图片
公司研发人员介绍,“文本生成图像”的过程分为两个阶段:一是自然语言理解,二是基于理解结果的视觉内容生成。“这两个阶段都需要一定规模的预训练模型来实现,和开发ChatGPT的基本原理接近,但技术上我们不能做详细介绍。”据了解,退格数字的核心研发人员来自上海科技大学和伦敦艺术大学,他们组成了“人工智能+艺术”团队。
如今,人工智能绘画业务在全球方兴未艾。DALL·E 2、Stable Diffusion、Midjourney等国外模型的问世,正在深入影响艺术设计行业。上海企业开发的Tiamat模型也在快速发展,吸引了一批游戏公司、广告公司、设计师等企业和个人用户。退格数字表示,与国外模型相比,Tiamat的技术和商业优势在于:持续积累中文自然语言处理能力,提供更适合国内用户需求特点的图像。它的技术能力和用户接受度如何?这家初创企业还有待市场的检验。
影视业,拥抱AI新机遇
来源:人民日报海外版
第24届上海国际摄影器材和数码影像展览会现场,观众体验8K 3D 180°VR拍摄解决方案。王初摄(人民图片)
微短剧《神女杂货铺》中的数字人“果果”(右)与真人演员一起演戏。
“果果”的正面形象。
电视剧《二十不惑2》中的虚拟演员202(左)。
前不久,一部以元宇宙为概念的国潮微短剧《神女杂货铺》在某视频平台播出,讲述了一个现代女孩穿越进游戏的奇幻故事。虽然这不是一部“爆款剧”,但剧中一位演员却引起大家的关注,那就是数字人“果果”。和以往的数字人相比,这一次,“果果”在影视作品中完成了她的出道首秀。不点破她的身份,观众甚至难以察觉她是“非人类”演员。
近年来,AIGC(人工智能生成内容)的浪潮正席卷与内容生产有关的各行各业,影视行业亦不例外。数字人“果果”在影视剧中的出演,是人工智能赋能影视产业的又一努力成果,让人们得以窥探人工智能在影视领域的最新应用与拓展。
“AI演员”与真人演员难以分辨?
1982年,日本动画《超时空要塞》以角色林明美为基础,包装诞生了世界上第一位虚拟歌手。进入新世纪,日本的初音未来、中国的洛天依等二次元虚拟歌手渐渐走进人们的视野,并在年轻人中掀起新的文化风潮。随着技术的革新,数字人的探索也不再只停留在二次元形象上,而是朝着超写实的人类形象发展。
《神女杂货铺》的“果果”就是一个借助AI技术生成的超写实数字人。“她是采用先进的AI技术‘换脸’而成的虚拟演员,看上去就好像是真的演员在出演这个角色一样。”《神女杂货铺》总制片人陈洪伟说。
此前,超写实数字人在影视作品并不罕见,但大多通过CG(计算机动画)生成,如《阿凡达》中的人物和《速度与激情7》中“复活”的保罗·沃克,都是这类数字人。那么,此前的数字人,和“果果”这种超写实数字人有什么不同?
陈洪伟进一步介绍:“这两者最大的区别在于,此前影视作品里的数字人,主要依托真人演员的外形,通过CG技术进行分析、扫描、建模;而“果果”这种超写实数字人,完全没有真人的外形依托,而是将AI算法与CG技术结合,通过想象和理解来构建形象,从而产生一个全新的、世界上本来并不存在的人。”
2022年,中国传媒大学媒体融合与传播国家重点实验室媒体大数据中心等发布的《中国虚拟数字人影响力指数报告》显示,目前中国虚拟数字人在应用上主要有身份型(如真人虚拟分身)、服务型(如虚拟员工)、表演型(如虚拟偶像)三大类。虚拟演员并不在其列,可见在影视产业中应用并不广泛。
2022年,电视剧《二十不惑2》中使用了虚拟演员202,作为一位超写实数字人,202拥有与真人极度相似的外形,但在剧中他仍然是一位“虚拟歌手”。随着技术迭代,《神女杂货铺》中的“果果”拥有了专门为其定制的角色,完成了推动故事发展的人物表演,展示了自己的“演技”。
“观看《神女杂货铺》时,观众普遍感到惊喜,有些人甚至分辨不出哪个是数字人演员,哪个是真人演员。”陈洪伟表示,“从技术上来讲,数字人毫无违和感地融入影视作品、甚至成为亮点已经不是问题,接下来需要完善的是艺术层面,比如人物审美、光影与剧集的融合、微表情的拿捏等。这些需要通过大量实践案例来打磨。”
“数字电影”将走向“引擎电影”?
《神女杂货铺》更像是陈洪伟的一个实验。
身为80后,陈洪伟大学一毕业就进入院线,历任万达影业副总经理、腾讯影业副总裁,从事电影制作发行方面的工作,从一部电影的策划创意开发,到投融资制作,再到终端的营销与发行,他都深度参与。他的“制片榜单”中,不乏《十万个冷笑话》系列、《爱情公寓》《北京爱情故事》《滚蛋吧!肿瘤君》等大家耳熟能详的影片。
从业电影近20年,陈洪伟坚信“未来影视行业的真正变革是因为技术的进一步发展”。2021年,他又回到学校,在北京电影学院攻读博士,主要研究方向依然是他热爱的数字科技。他注意到,新冠疫情让影视拍摄一度陷入停滞——人们无法外出,却客观上让虚拟拍摄技术进入爆发式增长的状态。
比如,好莱坞的《曼达洛人》第一季就有超过50%的内容采用虚拟拍摄,不需要外景,演员们置身于一个半圆形的LED影棚中表演。不过陈洪伟认为,虚拟拍摄只是一个过渡阶段,虚拟制片的未来大可以更“激进”一些,从“数字电影”转向“引擎电影”。
他提出了未来电影的一个概念——AIEM (Artificial Intelligence Engine Movie),即AI引擎电影。所谓AI引擎电影,即以数字人、虚拟场景、虚拟道具等数字资产为基础,通过虚拟引擎生产电影,人类导演只需告诉AI想要什么风格、多少时长等要求,AI就会给出各种画面供选择。
“AI引擎电影将来是可以替换掉一部分真人电影存在的。当现实世界中的数字资产积累得越丰富,AI引擎电影就会越接近现实质感,而且更加高效、便宜。”陈洪伟表示。在他看来,这场技术革新将带来一个重大变革,即个人会被赋予强大的影像生产力。
事实上,这一切已经在悄然发生。陈洪伟认识不少“片场都没去过、摄影机都没摸过”的年轻导演,他们依靠引擎技术,做出了不乏创意与风格的影片。比如,B站上有个UP主,是一名在校研究生,他结合自己打游戏的经验,自学编程,制作了刘慈欣的《全频带阻塞干扰》的同名动画剧集,基本都是个人独立完成。
“虽然这只是一个电影爱好者的尝试,离真正的电影还有距离,但影视行业的未来,或许就在这些年轻人的探索中。”陈洪伟说。
做“使用工具的人”还是“工具人”?
毫无疑问,人工智能时代正在加速到来。影视从业者该如何应对?
业内普遍认为,现阶段AI参与影视制作的优势在于成本低和效率高,但由于缺乏一站式的工具,创作者使用起来仍有门槛,全面改变行业还需要一些时间。
“未来在影视行业,AI不仅能够表演、拍摄,还能写剧本。尽管如此,它也只是一个工具,创作者要做‘使用工具的人’,而不能做‘工具人’。你不必会摄像、剪辑,你只要有审美、有想象力、有创造力,AI就能来帮你实现。”陈洪伟认为。在他看来,创作分两种,从零到一和从一到无穷,AI解决的是从一到无穷的部分,至于从零到一,作为人的创造性不太可能被完全替代。
目前一些创作者已经在用“人工+AI”的方式进行影视画面生产。曾执导《白蛇:缘起》《新神榜:哪吒重生》《新神榜:杨戬》等动画电影的导演赵霁及其团队,就尝试过使用一些开源AI图像生成模型。使用过程中,他们发现AI能在极短的时间内提供一个大致接近构想的作品,但当需要进一步精细化、风格化加工时,目前的AI基本无法做到。
赵霁还发现,当前AI图片生成技术最具代表性的作品是动漫风格的各类人物,其本质是AI经过大量用户的不断筛选而习得了广泛的审美标准。但是随着“生成—筛选”这一过程被不断重复,人物开始逐渐呈现出审美同质化等问题。
针对这一现象,深耕人工智能领域多年的猎户星空董事长傅盛认为,AI在追求最大用户群的一次认可时,必定会选择满足大多数用户的普遍喜好,因此要形成更具个人化的AI工具,就必须进行长期的个性化训练,使用更多的提示与指令,不断细化要求。
“电影作为创意产业,其所应用的AI工具必然不宜采用某种通用模型,而要走向垂直化、个性化模型。这也是未来人工智能发展的一个新契机,涉及到对AI模型的差异化调整。”傅盛表示。
面对AI,目前全世界影视工作者都处在同一个技术起跑线上,陈洪伟认为这是中国电影弯道超车难得的契机。在他的影视项目储备中,就有与好莱坞制作人共同在AI技术应用领域进行合作的探索与尝试。“我们不能回避创新,沉浸在旧有的舒适的体系框架内,要自我突破,全面拥抱AI带给我们的各种可能。”陈洪伟说。(记者 郑娜)
《 人民日报海外版 》( 2023年08月28日 第 07 版)