知乎优化AI算法建立互联网社交规则 杠精难题有救了

1评论 2018-06-25 17:43:43 来源:TechWeb.com.cn 赶紧加自选!这票可能要成妖

  【TechWeb报道】6月25日消息,随着网络的发达,在网络上精于抬杠的人越来越多,这群人就是所谓的“杠精”,一个20字以内的主谓宾简单句,就能让人无语凝噎,而被抬杠的人往往是受伤又无奈。知识分享平台知乎近日宣布要治治这些杠精了。

  知乎运营总监孙达云

  在知乎平台,杠精也被称为“阴阳怪气”,知乎运营总监孙达云告诉TechWeb,过去一年,知乎都在探索对阴阳怪气类评论的解决方案,其运用的是算法机器人(行情300024,诊股)“瓦力”,近期知乎还将对该技术进行产品化尝试。

  瓦力如何破解“阴阳怪气”类评论

  据孙达云介绍,知乎治理“杠精”的初衷是因为阴阳怪气类评论极大伤害了创作者和交流者的体验。这种行为通常以“不针对发言内容,而是批评对方的语气”以及“提出反对意见,但不给或给出极少数论据支持”这两类常见言论为代表。

  不过,因为网络语言的复杂性,这类评论很难解决。例如经典的“呵呵”,由于双方不同关系、说话的不同场景和时间都会带来迥然不同的表意。即便是人工判定都存在标准化难度,算法模型的训练挑战就更为艰辛。

  经过知乎团队的不懈努力,“瓦力”成为最新的阴阳怪气技术解决方案。

  知乎内容质量管理团队技术负责人刘兆来

  知乎内容质量管理团队技术负责人刘兆来解释称,针对阴阳怪气评论通常表达负面情感的特点,知乎构建了内容情感倾向性识别的算法模型和识别用户亲密度的模型,针对阴阳怪气评论的典型特征,建立了文本识别模型不断标记训练样本。

  刘兆来表示,三大模型的结合不仅摆脱了单一算法模型的局限性,也让“瓦力”的阴阳怪气识别准确率超过了大多数人工判断。具体来说,就是瓦力会首先通过知乎社区里的举报、反对等负向用户行为收集训练数据。然后通过各种同义替换、规则模版方式对训练数据进行扩展,以缓解训练数据稀疏的问题。同时,“瓦力”提取文本、句法、表情符等特征,并利用一个带attention的CNN和LSTM的融合模型进行分类,最终判断出内容是否为阴阳怪气。

  刘兆来向TechWeb等表示, 优化技术方案后,“瓦力”已能实现对“暗藏玄机夸奖”(忍不住关注答主了,你的答案很有水平!你博士快毕业了吧!)、“好为人师”(我觉得你挺惨,虽然长这么大了,还真应该回小学改造)、“强行反驳”(你开心就好、请开始你的表演)等数类阴阳怪气内容的识别。

  据TechWeb了解,有部分用户会将一些“阴阳怪气”类的评论视为神评论,甚至对这些神评论的关注超过了事件本身,如果去掉这些神评论,只剩下就事论事的评论,是否会影响用户体验?

  对此,刘兆来回应说,具体的落地会考虑一些特征,比如在用户间熟悉的情况下,一些阴阳怪气的评论可能只是开玩笑,但在陌生人间就有了嘲讽的意味。知乎的情感倾向性识别的算法模型和识别用户亲密度的模型就是针对这块设计的。此外,用户也可以自己选择要不要用这个功能。

  瓦力未来的应用方向有哪些?

  知乎在2016年推出了算法机器人瓦力,主要用于治理平台上的谩骂、答非所问、贴标签等不友善内容,如今进一步升级后,用来挑战“阴阳怪气”类评论的治理。

  在深度学习的AI大潮中,知乎的AI技术也在运用到越来越多的板块。比如现在通过站内数据做的知识图谱,识别图文相关性,以此来判断图片是否违规或含有不良信息等。

  此外,还有对视频的理解。刘兆来称,现在视频主要还是靠人工审核比较多,后面会通过算法对现在做的短视频进行识别。比如,对视频打标签,根据视频的标签或者文本,对问题或者评论的文本判断相关性。

  对于介于不同标准之间的打标签行为,刘兆来称,会结合人工进行上下文语境判断。比如用户点“踩”比较多,被举报了,但通过不友善模型识别又没有辱骂词,这种情况就需要结合人工审核来做判断。

  据介绍,目前,知乎借助AI技术,并辅以人机结合和多元的产品举措,多重手段加强对社区氛围的维护。现阶段,知乎已实现对95%以上的违法违规、广告导流和不友善等内容的主动打击、覆盖和筛查 。(周小白)

责任编辑:Robot RF13015
快来分享:
评论 已有 0 条评论
精彩推荐
11月券业遭遇集体滑铁卢?6成业绩下滑 中信、华泰净利大降超70%

2019-12-06 11:04:45来源:券商中国

邮储银行12月10日在上交所上市

2019-12-06 10:32:10来源:金融界网站

国务院关税税则委员会开展部分大豆、猪肉等自美采购商品的排除工作

2019-12-06 14:00:02来源:新华视点

不满20岁的湖南女孩 1个月网购退款624笔 被淘宝告了!

2019-12-06 07:18:25来源:每日经济新闻

超预期!央行“麻辣粉”多了1125亿 降息周期未结束

2019-12-06 11:12:31来源:中国基金报

叶檀财经:机会来了!一锤定音 第三次政策转向 赶紧上车!

2019-12-03 09:01:30来源:金融界网站

半年烧掉6亿 欠薪3000万 打败盒马的生鲜电商走到破产边缘

2019-11-29 17:34:25来源:财经女记者部落

影视行业资本退潮:横店群演改行做直播 餐馆冷清

2019-12-06 07:24:27来源:央视财经

“史上最强”生猪复产政策出炉!肉价4周降20% 香肠腊肉做起来

2019-12-06 13:10:10来源:中国证券报

电子元器件涨声再起 产业链公司产销两旺

2019-12-06 09:02:33来源:上海证券报

持牌机构领跑 北京金融科技试点“监管沙箱”

2019-12-06 00:34:20来源:北京商报网

赵志伟:世界百年之变局与中国未有之机遇 金融科技赋能未来

2019-12-05 10:30:05来源:金融界网站

人民日报海外版:视频网站会员的“坑”有多深?

2019-12-06 04:58:02来源:人民日报海外版

徐高:负利率卷土重来 要盯住决定金融市场运行的实体经济

2019-12-05 15:49:17来源:金融界网站

广东佛山限购松绑 有开发商加班调价

2019-12-01 15:02:17来源:每日经济新闻

这座城市10万套二手房待接盘 300万的房255万就卖

2019-12-01 22:21:25来源:每日经济新闻

程路:比降息更重要的是打通融资渠道

2019-12-05 12:06:06来源:金融界网站

暴跌65%!王健林的“体育梦”深陷危机

2019-11-20 08:13:58来源:全景网络

陆挺:投资回报率降低抑制宽松空间 明年中心城市的城市化是最大亮点

2019-12-05 13:50:11来源:金融界网站

北京“4000万元+”豪宅集中签约 成交206亿元占前三年近七成

2019-12-02 02:36:09来源:证券日报

加载更多

更多>> 以下为您的最近访问股
全网|财经|股票|理财 24小时点击排行
实时热点