团员分享_干货整理_2017(北京)百度技术沙龙NLP_AI游学小分队_20171104
2020年8月28日 更新
开启更多功能,提升办公效能

11月4日,百度开发者中心在北京举办了一次百度技术沙龙,主题主要围绕百度NLP(自然语言处理)最新技术进展,百度AI技术生态部高级运营顾问@张扬,百度自然语言处理架构师@孙宇等嘉宾相继做了分享。


先分享PPT下载链接:

以下PPT由@萧饭饭整理

1)《自然语言技术的应用》——张扬(链接: https://pan.baidu.com/s/1c17m9qS 密码: m5ns)

2)《语义计算技术》——孙宇(链接: https://pan.baidu.com/s/1qYdYfOK 密码: 34b8)

3)《情感分析技术》——何伯磊(链接: https://pan.baidu.com/s/1mhM5vc8 密码: ki3s)


下面图文干货记录,依次由AI游学小分队成员@萧饭饭 @缪斯的使者kale @ @张磊整理总结。



一.自然语言技术的应用 百度AI技术生态部高级运营顾问|@张扬


百度AI平台所拥有的自然语言技术:词法分析、依存句法分析、词向量表示、语义相似度、短文本相似度、评论观点抽取、情感倾向分析等几个方面。

1.情感倾向分析

1)功能:自动对包含主观信息的文本进行情感倾向性判断。

2)应用场景:UGC、电商以及客服平台舆情监控,了解客户的情感需求。便于推荐

2.评论观点抽取

1)功能:自动分析评论中的关注点和对应评价,文本内容标签化。

2)应用场景: 通过内容抽取——聚类——标签化流程,完成各个平台内容的抽取分析。

3.文本自动审核

1)功能:自动识别审核文本中夹杂的违禁反动、政治敏感、色情、推广、辱骂等垃圾文本

2)应用场景:UGC社区、电商以及客服系统。

4.词法分析

1)功能:中文分词、词性标注、实体识别。

2)应用场景:个性化推荐是分词分析技术的典型应用场景。

5.短文本相似度

1) 功能:对比短文本内容的相似度。

2) 应用场景:推荐、排序、智能客服以及自动阅卷等。例如客服中运费查询,通过计算“快递费”与“运费”相似度,解决之前只能靠关键词精准匹配问题,识别语义,扩大了应用的范围。



二.语义计算技术 百度NLP部主任架构师|@孙宇

百度NLP技术布局

1.百度NLP语义计算开放技术

  • :词向量表示、词义相似度。
  • :短文本相似度、DNN模型。

1)中文词向量表示

  • 1T网页数据
  • 100万超大规模中文词覆盖
  • 应用场景:相似度计算,咨询流推荐

2)短文本语义相似度:计算两段短文本的语义相似度

  • 应用场景:a)网页搜索精准满足:问题答案语义匹配

b)百度理财智能客服:相关问题检索

3)DNN语言模型:判断句子是否符合客观语言表达习惯

  • 应用场景:a)度秘聊天:自然语言检测

b)百度搜索:纠正不符合语言习惯的错误


2.为什么要语义计算?

一次多义、多词同义、句法结构、多样表达——>语义层面计算

3.百度NLP语义计算整体框架

2013年自主开发的语义匹配框架——SimNet

  • 技术:神经网络建模 DNN、RNN、CNN
  • 融合语言知识:多粒度、Bigram、句法搭配
  • 应用场景:1)百度搜索:搜索语义相关性优化、搜索精准满足。

2)咨询流:语义召回、兴趣匹配优化。

3)百度推广:语义触发优化、广告相关性触发。

4)其他应用:地图识别、智能客服。



三.情感分析技术 百度NLP部资深研发工程师|@张伯磊

1.背景

这是一种可以分析出句子情感偏向的技术,可以用于:

1)消费决策:可以统计出用户对某一商品的好评度,也可以将评论中相关评价进行归纳、提取,来辅助决策。

2)舆情分析:可以统计人们在社交媒体上对于某件事情的看法,比如对希拉里和特朗普的支持率。

2.技术

1)情感分析技术框架

在用户评论等数据的基础上,通过情感分析核心技术和NLP技术的辅助处理,可以实现情感分类观点抽取两个核心任务。

2)介绍两个核心任务

a)情感倾向分类

  • 任务:对于给定文本,判断文本的情感倾向:消极、积极、中性(其中,判断不出积极还是消极则归为中性)
  • 功能:句子级:分析出短句的情感倾向性

实体级:文章可能有多个主题,把文章对于某一主题的态度分析出来

篇章级:整个文章的情感倾向

b)评论观点抽取

  • 任务:给定文本,把其中表达观点的句子抽取出来。主要方法是从一句话中抽象出维度词评论词,通过拆分,解决评论观点抽取的任务。其中维度词表示要评论的事物,评论词表示对这一事物的看法,比如“服务不错”中,“服务”是维度词“不错”是评论词,这句话表达了积极的情感。
  • 基于方式:情感搭配匹配、语义计算、维度预测、维度预测、情感极性分类
  • 概念:情感搭配词典——这个词典有每一个维度词和不同评论词的映射关系。

i)情感搭配匹配

通过算法将评论数据中的维度词评论词提取出来。然后用情感搭配词典直接去匹配提取出来的维度词和评论词,从中得知情感偏向。

ii)语义相似度计算

有些情况下词典中的词不能完全和句子中的维度词匹配,这时可以通过语义相似度计算,匹配到情感搭配词典中的维度词或评论词,从中得知情感偏向。


iii)维度预测

现实评论中可能存在维度词缺失(比如:“这家旅店服务还是不错的,但是比较简陋”,“简陋”这一评论词的维度词缺失),这时可以给这个句子计算出维度,然后在情感搭配词典中找出搭配词。

iiii)维度预测+情感极性分类

有些情况下评论词在词典中没有,且维度词缺失,这时要先正确计算维度词,再把情感分析出来,给出一个评论词,这个评论词是分析出来的,不是原文中间的(比如:“这家旅店服务还是不错的,但是比较简陋”,其中“比较简陋”在情感极性分类中可能是-1级的,这时分析出的评论词可能为“一般”)。


3)应用

a)百度糯米搜索商户的各种评价信息,短观点,帮助用户决策

b)明星网络映像:给出网友好评率,推荐给感兴趣用户作为参考。

c)百度应用产品:推荐理由生成。将识别出来的观点和情感方向,通过技术生成流畅的摘要。



四.百度AI开放平台使用指导 百度AI技术生态部产品经理|@张晶晶

1.百度自然语言相关技术(http://ai.baidu.com/tech/nlp

  • 百度AI开放平台(ai.baidu.com)可找到提供的开源技术,如:8项语言处理基础技术、UNIT理解与交互技术平台、百度翻译开放平台、Familia主题模型等;
  • 开源技术提供一定免费使用量,超某一量,会收取一定费用

2.百度AI平台概览

  • 百度AI开放平台,提供最新最全最领先的各项人工智能服务:全面的产品服务、与业务融合、最新动态、技术支持、经验交流等;
  • 服务对象:企业开发者、个人开发者

3.企业如何选择AI技术?

  • 如未明确需求,可先了解同行及行业标杆具体应用场景;
  • 如未明确某项技术会给产品带来何种帮助,可参看官网具体应用场景和解决方案;
  • 如有明确需求,可查看具体方向的产品服务,根据指导文档测试调用

具体感想:

1)百度自然语言技术比较强大,可支持一般开发者需求;

2)AI人工智能的落地,一定要明确技术边界,配合具体场景展开。




以上内容,来自饭团“AI产品经理大本营”,点击这里可关注:http://fantuan.guokr.net/groups/219/ (如果遇到支付问题,请先关注饭团的官方微信服务号“fantuan-app”)


---------------------

创建者:黄钊hanniman,图灵机器人-人才战略官,前腾讯产品经理,5年AI实战经验,8年互联网背景,微信公众号/知乎/在行ID“hanniman”,饭团“AI产品经理大本营”,分享人工智能相关原创干货,200页PPT《人工智能产品经理的新起点》被业内广泛好评,下载量1万+。