APP下载

互联网内容“守夜人”

2018-05-10陈光

看天下 2018年12期
关键词:李军头条算法

陈光

年初至今,李军经历了一场穿梭于昼夜,险些“摧毀灵魂”的冒险。

90后的李军是武汉青山区人。去年底,他厌倦了酒店管理工作,想尝试信息技术行业。一次技术培训课上,同事向他介绍了个听上去挺有前景的工作。青山区政府招商引资,请来短视频巨头企业快手。这期间入职的人就算武汉分部老员工,很可能升入首批管理层。

经历五天的封闭培训和考核,李军签了保密协议,成为快手的内容审核员。他没想到,刚入职三个月,就亲历了一场净化短视频平台的“最强整顿”。

4月4日,国家广播电视总局约谈快手和今日头条两家网站的主要负责人,要求其全面清查库存节目,立即下线低俗、暴力、色情等有害内容,并追究相关人责任。约谈之后,罚款、下架、永久关停等几大监管手段齐下,急速发展后,今日头条、快手等互联网内容平台亟需迈过监管这道坎。

“新的社会问题”

快手创始人兼CEO宿华没有出来说任何话,直接道歉。

4月3日,宿华在其个人微博上发表长篇文章《接受批评,重整前行》。当天,宿华还出现在快手和清华大学合作成立未来媒体数据联合研究院的活动上,他说,“大家看到的这个世界是由所有人呈现的,而历史上我们看到的世界是由少数人呈现的。今天所有人一起参与呈现这个世界,当我们以这样的方式去观察和感知这世界时,背后有一些新的社会问题其实就出现了。”

这些“新的社会问题”比所有人预想的严重。

随着短视频平台壮大,每天都有海量新类型的用户生成内容被上传到网上。这其中包含不少传统色情、暴力等分类覆盖不到的新型违规内容。快手成立8年,有7亿用户,审核成了头等难题。

3月31日,央视《新闻直播间》节目报道了快手和今日头条旗下火山小视频等短视频平台出现大量未成年怀孕视频,以未成年生子为噱头广泛传播,造成不良社会影响。4月3日晚间,新华网微博也发文《别让“社会摇”等低俗视频晃散了你的“诗和远方”》。“社会摇”是从短视频平台兴起的一种舞蹈形式,人们跟着强劲的节奏摇摆,即兴发挥。这类行为引得部分小学生和中学生模仿,对校园环境造成影响。

就连曾经深爱着它们的用户也开始渐渐对平台产生烦感。北京白领王峰算是快手的老用户,现实中,他几乎没机会和快手上的网友接触。他认为,是技术让这部分人把自己的生活剥出来一部分,拓宽了他的体验,而且这份分享是真实的,不是演出来的。

快手、今日头条旗下的抖音、火山小视频等都依托于算法推荐,每个用户的页面都独一无二。平台会根据用户点击的视频类型,迅速分析用户感兴趣的领域,并马上推送类似内容。

一开始,王峰对推送的内容很满意。但渐渐地,王峰发现,有时快手会自动向他推荐一些从未关注过的视频,如美女主播类,疑似家长拍的小孩子裸体视频。这触碰了王峰的底线。他也看到一些低龄孕妇的视频,他认为,这些孕妇并不是记录真实的日常生活,而是利用自己的身份特点去博眼球,要关注,以炒作盈利为目 的。

未成年女子怀孕视频大量流出后,激起争议。网上也出现“北快手南抖音,它们有毒我们没药”,“中国傻子一般在抖音,一般在快手”的评论,引发不少网友共鸣。

王峰也一直好奇,算法的背后到底有没有人工指导。“背后如果是一个人的话,这个人是谁?他凭什么?如果真有这么个人,还蛮可怕的。他是算法还是人?”

“算法有无价值观”

“分发机制理想状态靠算法,实际操作看人工。”一位短视频运营人员对本刊说。据他介绍,每个大平台都会从企业盈利角度推选一些他们认为会火的话题,至于这些推送是否低俗则不是企业的首要考量。

“平台不推广,大众根本看不到的。”他解释称,话题如果平台不推广,单靠民间力量传播想上一千万非常难,哪怕有民间大V转发。“这是考验平台社会责任的时候。”

这也涉及了网上吵得颇热的“算法有无价值观”之争。

成立于2012年,今日头条是国内早期以数据挖掘技术和智能推荐算法为核心竞争力迅速壮大的平台。在这里,“你关心的,才是头条”。在去年一场活动上,今日头条创始人张一鸣称,“今日头条不是媒体。我们更关注信息的吞吐量和信息的多元。我不能准确判断这个好还是坏,是高雅还是庸俗。”这翻话让张一鸣一度陷入舆论漩涡。

而宿华则一直对算法持谨慎态度。他说就算法是否有价值观这个问题。自己想了30年。“小时候是看科幻里面,经常会讨论机器人有没有意识、价值观,其实算法本身是没有价值观的,但是算法是人去定义、搭建的。”他曾说。

清华大学软件学院助理教授李振华向本刊介绍,“算法是一套架构,它是有价值观的,确实会放大一些内容。企业平台要考虑商业利益,比如一个人就喜欢看黄赌毒,我就拼命推荐这类内容,流量就能赚更多钱了。”但算法只是单纯的根据用户点击量做推荐,还是已意识到所推荐的内容涉及违法违规内容,李振华认为,这就由算法的设计者来定了。

内蒙古赤峰市的阿其也是快手用户。去年大学毕业,他在一家牛肉干工厂做车间工人,那时开始用快手。在快手,他发现了很多设计签名的网友,也开始发自己设计字体的视频,有1万多粉丝。本来通过快手展示才华,找到志趣相同的朋友是件好事,但一些莫名出现的视频让他不舒服。

当看到一些穿着暴露的主播视频时,阿其会根据系统规则,选择减少此类作品出现的功能,但他发现这种拒绝不管用,类似视频还会时不时地出现。

有次,阿其举报了一位满身文身,说大量脏话的男网红,但快手系统回复他说该用户被认定没有违规。

然而,阿其自己的内容却被判定违规。他是蒙古族人,有一次在快手直播时用蒙古语和朋友聊天,内容是他今天有空,大家可以一起吃饭,每句后面他都用汉语再翻译一次。当时他还放了一首蒙古语的流行歌曲《雨》,歌曲怀念草原上的雨和逝去的爱情。

这在阿其看来极为平常的内容,却突然收到系统通知:“您的直播A类违规:政治,已被永久封禁直播。”

阿其不明白用家乡话和朋友约饭,放抒情歌曲怎么就和政治有关了?在违规申诉中,他写道,根据国家法律,自己有权合法使用民族语言。快手可请懂蒙古语的人回放视频,绝无任何违法违规内容。

“守夜人”

阿其算得上是一桩“冤案”,他的账号终被解禁。而4月10日,今日头条旗下“内涵段子”应用程序及公众号面临的则是永久关停,其原因是存在导向不正、格调低俗等突出问题。

人民日报微评论称,如果只要价值,不要价值观,甚至鼓吹‘算法没有价值观,就难免出事。产品不能沦为算法的奴隶。” 这次整顿的一项重点内容就是对平台的算法推荐进行优化,增强审核能力。

风口浪尖上的算法到底是什么?快手CEO宿华曾给了个简单版本的介绍。“算法核心是理解。理解内容和人的属性,人和内容历史上的交互数据,然后通过一个模型,预估内容与用户之间匹配的程度(也叫特征)。比如有这么几个人都共同喜欢同样一个人,我们就会认为这些人具备了相同的某个特征。”

然而,看似很聪明的算法却失灵了。

当前阶段,人工智能并不能完全胜任视频流内容的审核,多用于文字内容。比如在用户发布的帖子、留言、文章中检测到非法词汇内容,就会删除这些内容,并向用户发出警告,甚至直接封号。很多低俗的图片或者视频,人工智能无法像识别文字般精准审核,因而只能成为人工审核员的助手。

今日头条内容质量中心负责人、副总编辑李彤在接受采访时也有示,“对于广告信息,机器会识别并标注;对于标题党,机器会识别并提醒作者,如果作者不修改,机器会降低推荐权重或直接拦截;对于虚假信息、违法信息、色情信息,则主要依靠人工审核。”

遇到监管这一难题后,“今日头条”宣布将审核团队从6000人扩大到10000人,“快手”宣布将审核团队从2000人扩大到5000人,月薪4000-9000元,都要求“共产党员优先”。目前快手在北京、天津、武汉等六地建有审核中心。

快手审核员李军所在的内容审核队迅速扩编。为了让这些人能尽快适应工作,快手用专门的培训和考核,李军介绍,培训和考核的具体内容因签了保密协议不便透露,但大体就是学习鉴别各类违法违规视频,实操就是给10部视频,让应聘者根据所学判断是否应被删去。只要三观正,基本都能过,参与培训的20人中只有两人被淘汰。

“你们看不到的,我们都看了。”李军说。从1月入职起,他和同事每天工作12小时,做一天休一天,一个月有4到5次通宵班。忙的时候,每人一天要审核150部视频。正常的工作量是人均120部,视频20秒到4分钟不等,多以两倍速度快进播放。一般,李军每日会遇到 40部正常视频,30部“比较辣眼睛”但不涉及违法内容,25部属于反人类的,15部涉黄,剩下10部血腥暴力。

李军选择这份工作的最大原因是离家近,调休时间灵活。他不怎么用快手,也谈不上好恶,但一些性质恶略的视频让他觉得“丧尽天良,摧残灵魂”。

高强度熬夜的时间也让一般人扛不住。由于夜晚正是用户上传视频的高峰期,快手相关负责人也告诉本刊,为高效整改,宿华特地提出了“守夜人”的概念。

“快手总部非常重视内容评级团队。员工压力大,又多年轻,我们通过培训,心里辅导,团队建设等,让一线员工意识到这份工作的意义。他们的重担不是一条短视频,而是企业的社会责任,行业未来发展的关键,也是一个国家文化建设的重要组成部分。”该负责人向本刊介绍。

不过李军坦言,自己到没想那么深。这份工作让他觉得最有价值感的时刻,就是他直接对抗那些扰乱网络社区和谐的“变态”时。李军最痛恨那些发布虐待猫狗等小动物的血腥暴力视频,因为用户账号和手机号绑定。针对几个屡教不改的发布者,李军联合三四十个同事和亲友,一天连续发短信表明身份,警告这些人不要再发布、更不要再在生活中施行这种反人性的恶略暴行。他发现这种在现实世界的警告更有效。

低俗和色情的分割线

从诞生起,快手内部一直有审核。2014 年春节前,创始人宿华和程一笑一直平均每天花三四小时兼职做审核工作。这套快速成长的审核队伍确实在一些关键事件中起到作用。

去年底,极限运动主播吴永宁在直播高空挑战时坠亡,引起一场对直播和伦理的讨论。此前,这位主播在快手也播放过类似高危视频,被快手即时清除掉了。王峰觉得,在平台疯狂追求流量的大势下,快手能如此克制,至少就这起事件值得点赞。

然而,审核人数还是承载不了瀑布式的视频量。2018年春节期间,快手用戶单日上传视频数量突破1500万条,每分钟上传视频的峰值达到43000条,创历史新高。这意味着快手原本的2000名内容审核员,要在机器的配合之下,对每天1500万条视频内容进行审核。

与有专门培训的快手相比,今日头条早期(2015年)的短视频审核工作线条要更粗一些。“我的标准就是看了让我觉得不舒服,但这是很主观的标准。我也会问自己,我就比很多网民品味高吗?我来审核合适吗?”在今日头条做审核工作的华明说。

有些情况就很难判断。“低俗”,是这轮整肃中出现最多的一大“罪名”。但是包括《网络安全法》在内,都没有对“低俗”的定义和说明。在实际操作中,情色、淫秽、下流好判断,但低俗和色情就不好判断。

此外,每个平台对它认定的标准都不一样,比如某些直播平台,对女主播在直播时,跷二郎腿的换腿频率有规定,多少次以上就属于性暗示,就涉黄。

华明也认为,不是所有涉及性的都是情色。有个讲二战时德军出征会给士兵配充气娃娃的趣味科普片,她判断这是大历史的一个小注脚,就通过了。而一个国外健身教练扶着女学员深蹲的视频就被她判为问题视频。虽然画面并没有不良内容,但视频中配着二人动作放出的情景剧笑声,呈现了一种性暗示。华明觉得这很庸俗。

做审核工作期间,华明一度有种黑色幽默的感觉。她觉得自己像一个荒诞小说里的人物,每天看大量无聊视频,很少动脑子。自己在这份工作里的价值感很低,她最常想的问题是“这个机器不能做吗?我干嘛要浪费青春呢?”

华明曾以为,低俗的内容终会随着网民素质的进步而被自动淘汰。但她很快发现,越低俗越受欢迎。工作三个月后,她离开了今日头条。

睁一只眼闭一只眼

尺度一直是网络监管的难题。

虽然《网络安全法》和去年施行的《互联网视听节目审核通则》等相关法律法规不断完善,但复杂的審核标准和多变的违规内容让审核员头疼。

更让他们琢磨不透的是飘忽不定的“内部标准”。早在央视曝光低龄孕妇视频前,李军和同事就已注意到这类视频的势头。一位低龄妈妈哺乳的视频让李军判断应该审掉,虽然画面并没有露点。李军认为,哺乳本身没问题,但把这一行为拍成视频发到网上就变了味。但这类视频“老大”都让过了,“老大”就是部门领导。

李军和同事也比较反感社会摇这类视频,“一天看50部社会摇,你烦不烦?”他们觉得这种视频没有营养,和低龄妈妈类视频一样,容易带坏未成年人,算低俗。但“老大”也都通过了。

“这类国家没有明令禁止但内容又有些不妥的内容,老大就睁一只眼闭一只眼。我必须说一句,那些看了脑残视频后说我们审核员是脑残,这种视频都让放的,这锅我们不背。”

其实,宿华也经常纠结。他发现一位身患罕见贫血病的用户经常以一些出格的方式炒作,获得关注和打赏。他知道此人会用这些打赏的钱治病,但有时他博关注的行为过分了,经过权衡,审核人员还是会删掉一些内容,并通过系统劝诫他。

得知快手招聘审核员的第一时间,阿其投了简历。他是党员,大学专业是马克思主义学院下的行政管理系,他应聘这份工作有个私心。因为有过被快手“封号”的经历,阿其希望快手能有一些他这样会少数民族语言的审核工作者,减少出现类似误会。

自救运动

卷入了短视频的“最强整顿”风暴后,快手还查封了大量违规账号,无限期关闭推荐相似用户的功能,并将对视频分级,严格过滤未成年人看到的视频。截止4月14日,快手已经清理问题短视频31万条,封禁5.6万名用户,清理6.5万个用户名。

宿华道歉信中称,算法的价值观就是人的价值观。快手将优先推荐个性化的更符合用户兴趣的正能量作品,放大优秀作品的影响力。

“快手的审核规则一定是越来越严的,我们的递进逻辑是,法律法规为底线,公序良俗为参照,重点打击低俗三观不正的内容。”快手负责人对本刊说。

李军也感受到变化。经过他们审核的视频不论合格与否,都由小组长复审。他听说以前总部的人视频就审一遍且以3倍速度放完。李军入职的三个月内,单位内部的审核标准就大改了三次,审核标准越来越具体,涉及领域也越宽。每次改动后大家都要重新培训。“老大”也不放水了。

人工审核的经济成本高,且易出现漏判、误判的情况。当分发技术在低俗视频传播中有意无意推波助澜时,另一项技术也在努力将“低俗”内容扼杀审核阶段。

从2016年起,今日头条、花椒直播、映客等知名视频类平台找到人工智能公司图普科技,希望能够“鉴黄、鉴暴、鉴俗”。比如,一些图像识别技术能识别出背景是卧室、画面黑暗模糊、胸部有暴露、大量肉色存在等等,用这些标签来判断是否涉黄。

为应对多变的违规内容,图普运营团队保持每1-2周对识别模型进行优化。但对于图像特征不明显、隐晦的、主观化的违规视频,还未覆盖,而这些违规情况实际出现比例还很高。

图普最近也在忙着突破这一难关。比如低龄孕妇问题,该负责人介绍,技术可通过孕妇的分类特征(比如隆起的腹部)和人物年龄等模型来结合识别。

“网络监管全世界都有,是个很正常的事。不过,我们国家的监管相对较严,” 李振华说。他介绍,清华大学的师生做研究要经常查阅谷歌学术搜索,这是全世界最大的学术搜索网,但上不了。为解决此问题,他和学生通过技术搭建了一个网站,用户可在遵守现有网络监管的前提下,查阅论文。这个网站也在工信部注册,并得到公安部门的批准。这也体现了网络监管的人性化。

面对全球性的网络监管大势,李振华觉得不管在法律、技术,产业和道德伦理等领域,都有很多值得社会各界共同探讨和思考的空间。

猜你喜欢

李军头条算法
Travellng thg World Full—time for Rree
学习算法的“三种境界”
算法框图的补全
算法初步知识盘点
浅谈初中化学的多种解题策略
埋在心底的秘密
沪港通一周成交概况
王正福、龙超云、李军