返回 我的
首页 学校
帮我选课
历史 我的

“手语播报数字人”为听障人士报道冬奥会 原创 | 元宇宙合规

2024-09-18 11:52:46  人气:42

“手语播报数字人”为听障人士报道冬奥会 原创 | 元宇宙合规报告(六)虚拟数字人 

“手语播报数字人”为听障人士报道冬奥会

本报讯(记者 雷嘉)根据全国第二次残疾人抽样调查数据,中国有超过2700万名残疾性听力障碍人士,他们也期待及时了解北京冬奥会的比赛资讯。2月5日开始,采用我国首个超大规模智能信息模型和虚拟数字人技术,为听障人士打造的“冬奥手语播报数字人”每天亮相北京卫视的“冬奥赛事集锦”和“一起看冬奥”两档节目,帮助听障人士感受奥运盛会的精彩,用科技为残疾人平等参与社会生活创造无障碍环境。

“冬奥手语播报数字人”是在北京市科委、中关村管委会支持下,由智谱AI、凌云光和北京广播电视台联合打造的,清华大学贾珈教授团队和中科院计算所陈益强研究员团队也参与了关键技术的研发。这一系统以超大规模预训练模型为核心技术,自主搭建多模态肢体动作、表情、手指同步采集系统,运用跨模态拟人生成算法、超高精度写实数字人等行业领先技术,实现冬奥期间赛事新闻的专业手语翻译播报。

“冬奥手语播报数字人”系统完成了《国家通用手语词典》收录的8214条通用手语的采集和录制,并且语法都以听障群体习惯打法为准,以确保手语播报成果的准确性和专业度。由于当前国内缺少较完善的手语语料数据,研发人员在北京市残联及其聋人协会的支持下,邀请超过40余位聋人老师及手语专家进行手语文本转写和技术指导,并进行大范围的听障群体评测,最终构建了符合国家通用手语规范的国内最大规模多模态手语语料库,词汇及语句总规模超10万。

为了构建能够理解、翻译语音和手语的智能数字大脑,“冬奥手语播报数字人”系统以超大规模预训练模型为核心技术,通过语义蒸馏及手语翻译快编模型,实现新闻播报语音蒸馏成语义高度接近的手语文字,并翻译成符合手语习惯的语序。最终,手语数字脑可以通过计算机模仿听障人士的大脑,进行手语播报驱动。

为了实现高精度、高自然度的人物形象和手语动作姿态,研发团队还自主搭建了多模态肢体动作、表情、手指同步采集系统。通过采集多模态动作捕捉数据,运用跨模态拟人生成算法对超写实数字人进行自然、流畅的驱动和渲染,实现对文本内容的手语播报。其中,通过肌肉绑定技术驱动实现面部采集,结合业内领先的语音识别及高清视频合成等技术,呈现给听障人群亲切自然的冬奥手语播报服务。“冬奥手语播报数字人的应用展现了我们‘让机器像人一样思考’的愿景,不仅使听障人士能快捷获取冬奥资讯,还将无障碍环境的理念传递到数亿人群,让科技更有温度。”智谱AI的首席技术官张鹏说。


原创 | 元宇宙合规报告(六)虚拟数字人

时代的浪潮一波未平一波又起,元宇宙热度持续抬升的同时,虚拟数字人也借此机遇进入大众视野。事实上,虚拟数字人的概念及各类商业模式并不是最近才有的,笔者作为一个早期二次元和宅文化体验者,早在2007年就入坑了虚拟偶像初音未来。

时间来到2022年,随着区块链技术的发展和AR/VR、虚拟引擎,3D投影等硬件技术的成熟,虚拟数字人迎来了新的发展契机,更加完善的沉浸式体验极大地提升了虚拟数字人的商业价值。

据艾媒咨询发布的研究报告显示,早在2020年中国虚拟数字人的核心产业规模就已达到34.6亿元,同比增长70.3%,2020年的虚拟数字人周边市场规模为645.6亿元。2022年虚拟数字人借由元宇宙的热度,将会创造出更为广阔的市场。

那么,今天飒姐团队就尝试为大家分析虚拟数字人在商业应用中可能存在的法律风险。

一、虚拟数字人是什么

如果说初音未来是1.0时代的虚拟数字人,那我们当前应用于元宇宙中的虚拟数字人就是其2.0升级版。按照硬科技的虚拟数字人产业报告对虚拟数字人的定义,虚拟数字人指的是:存在于非物理世界中,由计算机图形学,图形渲染,动作捕捉,深度学习,语音合成等计算机手段,创造并使用,具有多重人类特征(人类的外貌,行动,交互能力等)的综合产物。市面上也将其称为虚拟人、数字人等名称。

(一)虚拟数字人的特征

目前来看,元宇宙中的虚拟数字人具有三个基本特征:

1. 虚拟化

虚拟数字人存在于非物质空间,是由现实世界的人通过计算机技术创造并驱动的产物。虚拟数字人并不总是存在于虚拟、数字空间中,在一定的条件下,例如借用成熟的全息投影技术,其也可以跨越次元与物质世界产生交互。

2. 拟人化

虚拟数字人的外表与人类极其相似。这也是元宇宙中的虚拟数字人区别于上一代如初音未来等虚拟数字人最显著的特征。基于图形渲染、动作捕捉、全息投影等技术日益成熟,当前的虚拟数字人甚至可以拥有与物质世界的人类相同的特征。

甚至在某些情况下已经出现以假乱真,肉眼难以分辨虚拟数字人和真实人类的情况。韩国的某档综艺节目就曾经借由AR/VR等设备,在元宇宙中实现了母亲与已故女儿的再次相见,了却母亲多年的夙愿。

3. 交互性

元宇宙中的虚拟数字人借助更加先进的数据处理和分析能力掌握了更加强大的深度学习能力。一个典型的例子就是阿尔法围棋(AlphaGo)。作为世界上第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人,由谷歌旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发,其主要的工作原理就是“深度学习”。

虽然深度学习功能目前在实际应用中还存在一定的困难,在模拟人类情感表达等方面还有很大缺陷,但在可预见的未来,虚拟数字人很有可能实现全真模拟,从而成为一个真正可以寄托人类情感之物。

(二)虚拟数字人的类型

除了在技术层面外,虚拟数字人在实际应用方面主要可以分为两类:服务型和身份型。服务型虚拟数字人是量产物、种类物,例如虚拟教师、虚拟服务员等,这类虚拟数字人被批量生产,用于服务用户的各类日常需求。

身份型虚拟数字人又可以细分为两种,一种是投入大量资源创造的具有独特身份的虚拟数字人形象,例如偶像歌手、特殊NPC(游戏看板娘)等,此类身份型虚拟数字人更多被用于特定的娱乐项目。

另一种身份型虚拟数字人则是我们自己在元宇宙世界的投影,也就是我们自己的Avatar。此类身份性虚拟数字人是最为特殊的,因为它承载了我们自身的情感和形象,甚至是我们在元宇宙中占有、使用、处分、收益财产的前提。

因此,对于此类身份型虚拟数字人的商业应用,我们必须格外注意潜在的法律风险。

二、虚拟数字人商业应用中可能存在的法律问题

(一)虚拟数字人创作的作品如何确定

著作权归属?

人工智能发展到现阶段,其已经可以进行一些简单的“创作”工作。2019年4月,源于英国画廊老板梅勒的创意,由剑桥大学的专家撰写AI算法,并在Engineered Arts的联合制作下,创生了世界上首位“超现实”AI艺术家艾达。其是以Mesmer为骨架构建出的一个年轻女人的形象,该机器人全身以硅胶和3D打印、机械组合而成。

艾达可以在45分钟内完成一项艺术创作,每份作品都是独一无二的,算法创建的路径会在事后删除,因此无法复制。艾达的算法中包含不同的人工智能和计算机程序以及对应的输入数据库,这也意味着艾达不仅能像传统的艺术家那样不断精进作品,还可以同时掌握几种不同的风格笔法。

那么,人工智能所创造的作品,到底谁享有著作权?根据我国《著作权法》第九条规定:著作权人包括:(一)作者;(二)其他依照本法享有著作权的自然人、法人或者非法人组织。

又根据《著作权法》第十一条之规定:创作作品的自然人是作者。由法人或者非法人组织主持,代表法人或者非法人组织意志创作,并由法人或者非法人组织承担责任的作品,法人或者非法人组织视为作者。

因此,享有著作权的前提是具有适格的法律主体资格(自然人、法人、非法人组织),AI也好、虚拟数字人也好,目前在我国的法律体系内尚未取得法律主体地位。

因此,虚拟数字人不能取得作品的著作权。事实上虚拟数字人本身即被视为一个“作品”。在司法实践中,一般将此类作品再创作的作品著作权归属于创作原作品(创造虚拟数字人)的自然人、法人或非法人组织。

另外,在考虑虚拟数字人创作的作品著作权归属之前,我们还需考虑,是否所有的虚拟数字人作品都能被视为受著作权法保护的“作品”?答案是否定的。

根据《著作权法》第三条,本法所称的作品,是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果,包括:文字作品;口述作品;音乐、戏剧、曲艺、舞蹈、杂技艺术作品;美术、建筑作品;摄影作品;视听作品;工程设计图、产品设计图、地图、示意图等图形作品和模型作品;计算机软件;符合作品特征的其他智力成果。

同样,《著作权法实施条例》第二条也对作品作出了相应的规定:著作权法所称作品,是指文学、艺术和科学领域内具有独创性并能以某种有形形式复制的智力成果。

可见,需要构成著作权法意义上的作品,需要具备以下要件:

1. 独创性。著作权法中的作品必须是作者创作的,能表现自己思想和感情的智力成果,没有抄袭剽窃他人的作品即可。

2. 能以某种有形形式复制。著作权是一种无形财产权,作品不同于有形财产权的客体具有一定的外在形状和物质性,并存在于现实空间中可被人直接感知。著作权法保护的作品(客体),是作者所表达的思想、感情、观念集合而成的智力成果。受著作权法保护的作品必须附着于一定的载体,以一定的形式固定、记录下来,并且可以被大量复制。

3. 作品不违反法律。依法被禁止出版、传播的作品不受著作权法保护。典型的如淫秽色情类作品,因违反我国法律和公序良俗而不能为受著作权法保护的作品。认定一部作品是合法,除宪法以外,出版法是主要依据其他法律也可以成为依据。

因此,虚拟数字人创作的作品,在构成我国著作权法所保护的作品的体现,其著作权由创造虚拟数字人的自然人、法人或非法人组织享有。

(二)使用他人形象创造虚拟数字人

存在法律风险

在今年江苏卫视的跨年晚会上,某当红明星与已故歌手邓丽君合作了《大鱼海棠》、《小城故事》等三首曲目。本次重现邓丽君的虚拟数字人形象,是采用了类似于vtuber虚拟合成技术。

类似的虚拟数字人演唱会已经屡见不鲜,成为粉丝经济的新推手。那么,创造并锚定真人形象的虚拟数字人,并将其用于商业活动,存在哪些法律风险?

此类虚拟数字人的创造需要使用真人的肖像、声音、姓名等素材。根据《民法典》第九百九十条:人格权是民事主体享有的生命权、身体权、健康权、姓名权、名称权、肖像权、名誉权、荣誉权、隐私权等权利。除前款规定的人格权外,自然人享有基于人身自由、人格尊严产生的其他人格权益。因此,创造锚定真人的虚拟数字人需要获得真人的同意和授权。

另外,人格权以民事主体的人格利益为其客体,而人格利益具有非财产性。根据《民法典》第九百九十二条之规定,人格权不得放弃、转让或者继承。因此,创造虚拟数字人所涉及的肖像权、身体权、姓名权等人格权不能以任何有偿或无偿的形式转让。

飒姐团队认为,《民法典》并不禁止自然人、法人处分自己所具有的部分人格权,例如肖像权、姓名权等只要该处分行为不属于对自身人格权的放弃、转让或继承,且不违背社会一般公序良俗,就是为法律所容忍且受到保护的处分行为。

但另一些与人身关系密不可分且关乎个人尊严的特殊人格权则不能任意处分,例如生命权、隐私权等。同时,由于人格权并非财产性权利,法律不鼓励自然人和法人组织以自己的人格权牟利,因此,有偿许可他人创造自己的虚拟数字人有可能会被视为《民法典》所禁止的转让人格权的行为,从而产生合同条款无效等法律后果。

因此,飒姐团队认为,在同意许可他人利用自身人格权创造自身虚拟数字人时,应当是无偿的。

另外,由于虚拟数字人与真人的外表极为相似,且在一定程度上可以做出行为、发表言论,这就存在侵犯他人名誉权、荣誉权、隐私权等人格权甚至宪法权利的法律风险。

试想,即使真人同意创造自己的虚拟数字人,虚拟数字人在存续期间所做出的行为和发表的言论也并不在真人的控制范围内。一旦虚拟数字人的使用者、运营者和管理者使用其作出了违背真人授权者的意志的言论或行为,极有可能面临侵犯他人人格权的法律风险。

最后,如果是已经去世的人,其近亲属是否可以代为同意他人使用其姓名、肖像、声音等创造虚拟数字人,在实践中存在非常大的法律争议的。

根据《民法典》第九百九十四条规定,死者的姓名、肖像、名誉、荣誉、隐私、遗体等受到侵害的,其配偶、子女、父母有权依法请求行为人承担民事责任;死者没有配偶、子女且父母已经死亡的,其他近亲属有权依法请求行为人承担民事责任。

法律并没有规定死者的近亲属可以处分死者的人格权,且人格权作为与自然人联系最密切的权利,原则上仅有本人可以对自身的人格权作出一定的处分行为。《民法典》仅赋予其近亲属在死者的人格权遭受侵害之时代为请求法院予以保护的权利。

写在最后

元宇宙中的虚拟数字人作为一种与真人非常相似的科技产物,在商业应用中需要十分谨慎和小心,稍有不慎就有引发法律风险、伦理风险的可能。古往今来,从未有任何自然和人造事物能像虚拟数字人一样与真实的我们如此相似,因此,在充分利用其经济价值时,也应当积极探讨科技对伦理道德的挑战和改变。归根结底,科技发展的目的应当是造福于人。

以上就是今天的分享,感恩读者!

发布于:北京

声明:频道所载文章、图片、数据等内容以及相关文章评论纯属个人观点和网友自行上传,并不代表本站立场。如发现有违法信息或侵权行为,请留言或直接与本站管理员联系,我们将在收到您的课程后24小时内作出删除处理。