狗万登录网址n

AI换脸等新技术新运用迎来强监管

AI换脸等新技术新运用迎来强监管国家网信办等发文规范网络音视频

□ 本报记者 侯建斌

PaddleDetection目前已经广泛的在智慧交通、安防监控和商品检索上实现落地引用,并且取得了良好的应用效果。

PaddleDetection是基于飞桨核心框架,结合百度科研和业务的需求,构建的目标检测开发套件。从全景图可以看到,套件中主要不仅包含各个检测算法实现,而且提供一系列的优化组件,以及更好的辅助调试的可视化的模块。同时,还提供了加速训练相关的混合精度的训练模块以及丰富的算法组件。

在环保领域的探索,百度做出的创新与尝试远未至此。作为每天服务数亿用户的科技公司,百度需要处理的数据量异常庞大,而绿色数据中心的节能减排成效卓著,值得业界借鉴。百度在业内首创“市电+UPS供电”方案,通过大型冷冻水系统配置自然冷却模块,将自建云计算数据中心单模组年均PUE值降至1.09,位居国内第一,并远超国际均值1.58。解释一下,PUE是指数据中心消耗的所有能源与IT负载消耗的能源之比,PUE值越接近于1,表示一个数据中心的绿色化程度越高。以百度山西阳泉数据中心为例,每年节约电能消耗2.2亿度,减少二氧化碳排放量21万吨。

此外,《规定》还强调,网络音视频信息服务提供者应当部署应用违法违规音视频以及非真实音视频鉴别技术,发现音视频信息服务使用者制作、发布、传播法律法规禁止的信息内容的,应当依法依约停止传输该信息,采取消除等处置措施;网络音视频信息服务提供者应当建立健全辟谣机制,发现网络音视频信息服务使用者利用基于深度学习、虚拟现实等的虚假图像、音视频生成技术制作、发布、传播谣言的,应当及时采取相应的辟谣措施,并将相关信息报网信、文化和旅游、广播电视等部门备案。

ERNIE全景图,预置了包含ERNIE通用模型、ERNIE任务模型、ERNIE领域模型以及本次发布的ERNIE Tiny轻量级模型等系列预训练模型。在此基础上,构建了包含工具和平台的飞桨语义理解开发套件。全面覆盖了训练、调优、部署等开发流程,具备轻量方案、能力全面、极速预测、部署灵活、平台赋能等五大特色。

早先传言PS VR2会随着PS5一起登场,毕竟PS VR一代在不被看好的情况下卖出了200万台。

设置便捷投诉举报入口

2.四大开发套件详细解读

此外,《规定》要求,网络音视频信息服务提供者应当设置便捷的投诉举报入口,及时受理并处理公众投诉举报。此外,网络音视频信息服务提供技术支持的主体应当遵守相关法律法规规定和国家标准规范。

风险不断叠加亟需规范

“随着‘深度伪造’等新技术新应用在网络音视频领域的运用,传播违法和不良信息、侵犯人民群众合法权益等风险隐患在不断增大。”国家互联网信息办公室有关负责人坦言,这些风险进一步集聚、放大,很可能被利用从事危害国家安全、破坏社会稳定、扰乱社会秩序、侵犯他人合法权益等法律法规禁止的活动。

PaddleSeg提供10余种数据增强的策略,有效的训练数据,大幅度提升模型的鲁棒性,开发者可以根据实际的场景进行灵活组合,根据实际场景进行选用,让整个分割模型应用泛化能力更强。

ERNIE Fine-tune微调工具旨在为给开发者提供一套简单好用的Fine-tune框架,目前覆盖NLP四大常用任务:单句分类、句对匹配、命名实体识别、阅读理解。工具集支持多机多卡Fine-tune,同时使用FP16 Tensor Core技术在Tesla V系列GPU上获得60%的训练速度提升。

端到端开发套件具有以下三个通用特点:一是满足真正的工业场景中性能要求,保持性能领先;二是开发简单易用,高效解决问题;三是打通端到端流程,落地高效易部署。

吴沈括分析指出,这是由于此前规范机制的缺乏,虚假、违法信息在网络平台上传播,难以得到有效的遏制,谣言的迅速传播以及影响范围广的特点,对公民和社会秩序都造成了严重危害。

不仅如此,百度的办公楼也堪称企业节能环保的标杆之作。据了解,百度自建楼宇均采用冰蓄冷技术。每个制冷季,通过在夜间电力负荷低谷期制备冷量,在白天电力负荷高峰期间用制备的冷量为中央空调系统供冷,减少用电高峰期的电网负荷,可有效减少电网峰谷差值,实现电力的“移峰填谷”,提高电网的负荷率,并有效节约了企业的实际用电支出。通过“移峰填谷”,百度全年可节省约400万度电量;百度太阳能集热器换热面积共1178平米,全年提供生活热水;百度科技园二期建有雨水收集池3个,全年雨水再利用2400立方米…… 可谓处处都是绿色“黑科技”。

今年年初,一个“朱茵变杨幂”的视频在bilibili(视频弹幕网站)上火了,视频中《射雕英雄传》中扮演的“黄蓉”角色被替换为杨幂。视频被传至微博后引起轩然大波,侵权、安全等争议声接踵而至。

在吴沈括看来,尽管监管部门近几年来已出台了相关文件,但由于网络音视频行业内容、用户等数量庞大,违法现象层出不穷。为此,国家网信办、文化和旅游部、国家广电总局三部门联合制定《规定》,明确了管理机制,规范了新技术的使用,对将有关技术用于违法用途的行为起到了一定的阻止作用,有利于维护网络音视频行业的健康秩序。

对此,《规定》不仅明确安全评估要求,网络音视频信息服务提供者基于新技术新应用上线具有媒体属性或者社会动员功能的音视频信息服务,或者调整增设相关功能的,应当按照国家有关规定开展安全评估。而且明确标识要求和新闻信息管理要求,网络音视频信息服务提供者和网络音视频信息服务使用者利用新技术新应用制作、发布、传播非真实音视频信息的,应当以显著方式予以标识,不得利用新技术新应用制作、发布、传播虚假新闻信息。

百度的实验数据显示,在北京市从左家庄到北京站,大约8km的路程,1辆朗逸小轿车,使用百度出行导航与司机完全凭借经验感知出行对比,平均百度导航每次比传统出行少行驶0.75Km,节约时间3.5分钟,碳减排1.51千克。根据百度官方公布的数据,目前,百度地图日均位置服务请求次数突破1200亿次,日均轨迹里程20亿公里。在数以亿计的庞大用户体量下,对于节能减排的贡献不容小觑。

本次发布还进一步增强了YOLOv3,基于COCO的mAP再进一步提升至41.4%,GPU上的推理速度进一步提升。本次还发布了BlazeFace等系列人脸检测模型,同时还发布了自研的搜索版本BlazeFace,模型大小压缩三倍的情况下,大幅提升预测速度。特别强调一下,预训练模型中的行人检测和车辆检测的模型,是基于百度内部的业务数据得到效果不错的模型,值得推荐。

此外,套件还包含了ERNIE的平台化使用方案,开发者可通过EasyDL专业版一站式完成NLP任务的数据标注、处理、ERNIE微调、优化、部署等全流程的功能,为开发者提供丰富的算法、算力服务,进一步降低ERNIE的产业化应用门槛。平台预置了常用的NLP文本分类、文本匹配等经典网络,能够快速满足多层次开发者的需求。

今天给大家带来的是系列文章之飞桨的端到端开发套件解读。

PaddleDetection在训练速度、训练显存和推理速度上,大部分模型都优于对标产品的性能。

吴沈括认为,作为规范性文件,《规定》对网络音视频信息行业的的监管作了大体规定,后期仍需更为细化的执行性文件出台,帮助有关部门以及网络音视频信息服务提供者进一步履行责任。

ElasticCTR个性化预估,是工业推荐场景下的常见需求,与工业实践的关联度非常高。以飞桨核心框架为核心,ElasticCTR实现了大量的技术突破:通过与资源调度平台深度集成提高资源调度的效率;在分布式训练的环节,提供全异步的参数服务器方案、流式训练和高性能的IO接口;最终,通过高性能的KV预估和一键部署工具实现工业级部署。

眼下,中国城镇规模不断壮大,拥堵成为不少大城市的顽疾,车辆尾气造成的环境污染接踵而至,绿色出行成为民众们最关切的社会问题之一。百度地图“实时路况查询”功能的面世,有效地缓解了这一问题。简单来说,百度地图通过汇总实时的路况信息数据,为用户提供即将通行路段的实时交通情况,并自动规划最合理畅通的行驶路径。

据国家互联网信息办公室有关负责人介绍,《规定》还明确监督检查要求和执法协助要求,各级网信、文化和旅游、广播电视等部门应当建立日常监督检查和定期检查相结合的监督管理制度,网络音视频信息服务提供者应当配合监管部门开展执法工作。而且明确了法律责任,网络音视频信息服务提供者和网络音视频信息服务使用者违反本规定的,由网信、文化和旅游、广播电视等部门依照相关法律法规规定处理。

整个PaddleSeg开发套件都是模块化设计的,无论是数据增强模块里面的多种增强算法,主干网络的多种Backbone模块选择,都可以让开发者更好的根据实际业务场景需求使用。分割网络包含了目前的4种主流网络:医疗领域常见的U-Net,经典的DeepLabV3,面向实时场景的分割模型ICNet等。同时对于损失函数的模块化设计,也可以更好的提升各个分类场景下的分割精度,例如小目标分割的效果。

吴沈括告诉记者,《规定》对非真实音视频信息的标识义务以及辟谣机制的安排,有利于识别各式各样的虚假信息,阻止虚假信息的传播,保护公民个人的权益,使新技术能够得到合法运用,与网络音视频行业共同健康发展。

根据产业的需求,PaddleSeg开发了高性能的C++预测库。在多线程计算优化、算子硬件加速方面,而且依托于真实的项目实践验证做了大量优化工作,真正满足工业级部署需求。

今年7月份,百度发布持续学习语义理解框架ERNIE 2.0,在共计16个中英文任务上超越BERT、XLNET,取得了SOTA的效果。同时ERNIE 2.0发布以来,ERNIE产业化应用进程不断加速,易用性不断提升,配套产品也不断丰富和完善。目前ERNIE 2.0在百度内部及行业内已取得了广泛应用,在多种场景下都取得了明显效果提升。这些场景的成功运用为ERNIE产业化应用积累了丰富的经验。

飞桨发布端到端开发套件的初心,是为了更好满足开发者的低开发成本、快速集成需求而来的。开发者的时间、人力非常宝贵,效率提升非常重要。为了要解放开发者劳动力,降低开发的成本,同时能够快速的集成和部署,飞桨推出了端到端开发套件。

当下,气候变化、环境污染已成为全球性难题,面对日益恶劣的地球环境,人类已成为难以分割的命运共同体。虽然美国总统特朗普开倒车“退群”巴黎气候协定,但是全球190个国家在这场必须赢下的战役中群策群力。在中国,百度和越来越多具有社会责任感企业加入,朝着绿色、可持续的方向不断创新突破,为中国在国际舞台上赢得了更多尊重。

ERNIE Fast-inference API旨在解决产品应用的延迟敏感场景,为企业开发者提供极速预测的C++ API,便于开发者集成。该工具也充分借助了最新版飞桨的高速预测优势,飞桨1.6通过OP聚合算法,有效加速了ERNIE的预测。

如今,官方正式出手。国家互联网信息办公室、文化和旅游部、国家广播电视总局近日联合印发《网络音视频信息服务管理规定》(以下简称《规定》),要求利用新技术新应用制作、发布、传播非真实音视频信息的,应当以显著方式予以标识;网络音视频信息服务提供者发现使用者利用基于深度学习、虚拟现实等的虚假图像、音视频生成技术制作、发布、传播谣言的,应当及时采取相应的辟谣措施。

特色2:模块化的设计

吴沈括注意到,《规定》对新技术新应用安全给予高度关注,对基于深度学习、虚拟现实等的新技术新应用制作、发布、传播音视频信息进行了明确规定。

国家互联网信息办公室有关负责人介绍说,《规定》还明确违法违规信息管理要求,网络音视频信息服务提供者应当部署应用违法违规音视频以及非真实音视频鉴别技术。

人工智能技术是一把双刃剑,在为我们提供便利的同时,带来诸多风险。比如前段时间各方热议的AI换脸术,在自我娱乐、娱乐大众的同时,不可避免地引发诸如用户个人隐私的泄露、侵权、虚假谣言的扩散等法律风险。

“这些规定要求网络音视频信息服务提供者自觉主动履行平台监管的义务,加大对不良信息的识别和审核力度,承担平台所应有的社会责任。”吴沈括解释说,平台方在追求经济利益的同时,实现与社会效益相统一。网络音视频信息服务提供者应加大对公民、社会和国家利益的保护力度,承担更多的主体责任。

特色1:轻量级解决方案,预测速度提升1000倍

特色2:一键式高性能全类微调工具

ERNIE 2.0拥有强大的语义理解能力,而这些能力需要强大的算力才能充分发挥,这为实际应用带来了非常大的挑战。为此,百度发布轻量级预训练模型ERNIE Tiny以及一键式数据蒸馏工具ERNIE Slim,预测速度提升达到1000倍。

对于端到端体验的流程中,数据处理也是非常重要的环节,飞桨通过扎实打通端到端流程,模块和的设计,提供一系列的工具箱辅助开发者去解决。目前发布的四大端到端开发套件,非常具有典型性,可以覆盖主流一大部分任务。

当前,网络音视频信息行业发展迅速,用户规模不断壮大。数据显示,我国网络音乐用户规模已达6.08亿,网络视频用户规模已达7.59亿。随之而来的是,相关风险在不断叠加。

“亟需出台有针对性的管理规定。”国家互联网信息办公室有关负责人说,亟需明确网络音视频信息服务提供者及其技术支持的主体的信息内容安全管理责任,规范网络音视频信息服务提供者关于利用深度学习、虚拟现实等新技术新应用的管理要求,为网络音视频信息服务及其相关技术的提供、使用、管理等提供有效的依据。

当一个用户戴着PSVR时,他会收到来自球形设备上的摄像机和麦克风的音频和视觉反馈。当你的头部转动时,另一端连接的球形装置可反馈你的动作。

同时,《规定》要求网络音视频信息服务提供者应当依照《中华人民共和国网络安全法》的规定对用户进行真实身份信息认证等。对此,吴沈括解释说,这一条可以看做是网络应用实名制条款,明确了公民个人的责任。

记者注意到,《规定》要求网络音视频信息服务提供者落实信息内容安全管理主体责任,应当依法取得法律、行政法规规定的相关资质;建立健全用户注册、信息发布审核、信息安全管理等制度。

飞桨全新发布包含语义理解(ERNIE),目标检测(PaddleDetection),图像分割(PaddleSeg)和点击率预估(ElasticCTR)四大端到端开发套件,旨在通过模块化的设计和端到端的体验,满足企业低成本开发和快速集成需求。核心内容3503字,预计阅读时间4分钟。

ElasticCTR源自真实产业实践,与原生K8S无缝结合,通过针对深度学习任务进行弹性调度的处理,可以大幅节约资源消耗。性能方面,全异步分布式CPU训练速度是对标产品的6倍,工业级部署性能是对标产品的13倍,非常适合大规模CTR的应用场景。

PaddleDetection基于飞桨高性能的引擎,提供了一套完备的部署方案。对于Linux和Windows都提供了良好的支持,GPU预测底层支持TensorRT加速以及FP16预测。CPU底层支持使用MKLDNN加速。再加上PaddleSlim提供的模型压缩策略,可以提供更小的模型和更快的速度,满足工业级部署的需求。

为进一步降低开发者使用成本,套件提供预测服务方案——ERNIE Service,来方便获取ERNIE模型的向量分布以及预测打分。

1.端到端开发套件的初心

PaddleSeg在性能优化方面开展了很多工作。包括训练速度提升、GPU利用率提升以及显存性能优化。同时支持较新的FP16混合精度的训练。特别的,对于动态的Loss Scaling,在不损失精度的情况下,性能可以有30%的提升。PaddleSeg在英伟达特斯拉V100卡上,单卡训练速度是对标产品的2.3倍,多卡上是对标产品的3.1倍。

综合来看,ERNIE的语义理解开发套件依托百度在预训练模型等自然语言处理技术和飞桨平台领先优势,为人工智能产业化大生产贡献力量,赋能各行各业。

特色4:向量服务器,支持跨平台灵活部署

“新兴技术一旦在网络上被违法运用,极有可能造成社会秩序紊乱,甚至危害国家安全。这就要求对网络音视频行业加强监管。”北京师范大学互联网发展研究院院长助理、中国互联网协会研究中心秘书长吴沈括教授告诉《法制日报》记者,《规定》不仅加大对违法行为的打击力度,制约网络水军等扰乱网络秩序的行为,而且有利于进一步保护公民、法人以及其他组织的合法权益,维护社会秩序和公共利益。《规定》的出台,意味着AI深度换脸术等新技术新运用迎来强监管。

特色3:极速预测API

PaddleSeg目前已经在广泛场景中应用,无论是工业质检中的精密零件的智能分拣,以及经典的人像分割场景的应用,还有遥感领域的地块分割,都可以很好的辅助完成行业的AI赋能。

在计算机视觉领域,图像分割有非常广泛应用的场景。基于这样背景,飞桨开发了图像分割开发套件PaddleSeg,目标是降低开发门槛,更容易实现产业落地。图像分割开发套件基于飞桨的核心框架,主要做了以下方向的建设:一是数据增强,将工业级常用分割算法开放出来;二是在模型层使用模块化的设计,将整个分割的模型拆分成三块,包括骨干网络、分割网络和模型损失函数。拆解之后,可以让这些模块自由组合,能够解决特定场景的问题。三是在训练场景上,PaddleSeg里面做了大量性能方面的优化,在显存优化和预测速度上都做了大量的工作。四是易用性方面,通过实际的项目打磨验证,找到使用过程当中的痛点并且解决掉。训练模型工业级部署,开发套件也做了集成,可以帮助广泛开发者使用。

在算法层面,PaddleDetection支持了目前常用的主流检测算法,单阶段检测算法包括:SSD,RetinaNet,YOLOv3,两阶段检测算法包括:Faster-RCNN,Mask-RCNN,Cascade-RCNN,支持两阶段的FPN。在主干网、数据增强、在预训练模型方面,都提供了很好的支持。

特色1:丰富的数据增强

辟谣机制阻断谣言传播