团员分享_“知识图谱”项目,需产品经理考虑的几点问题_博斌_20190218
2022年1月10日 更新
开启更多功能,提升办公效能
为了构建合适并且简单可用的知识图谱(Knowladge Graph,以下简称KG),在此之前作为产品经理首先要弄清楚几个问题,同时也适合在产品生命周期内持续思考。


以下是我从产品视角出发,帮助构思如何从产品角度思考整个产品目标与用户需求,算是思维模型或纲要,而之后的关键点主要从构建知识图谱的关键点及方法入手,这几个问题放在最开始有点突兀,但本文的主体(构建KG的几个关键点)确是从中抽象而来。


1、为什么要构建该KG,要做到什么程度?

2、该KG可以帮助哪类用户解决哪类问题,市面上是否已有解决方案,在此基础上有哪些优越性?

3、该KG的知识体系如何而来,是否完善,是否准确,是否需要专业人士帮助搭建?

4、如何明确或了解知识体系中实体关系之间的属性、关系、概念或定义成立的前置条件及更深层、更广泛的知识体系?

5、努力的搭建了完整的、准确的知识体系,又是否能真的满足用户的基本需求 ? 再说一句,有没有满足用户的惊喜性需求,这又从基本需求上升到价值需求层面了。


Tips: 以下构建KG的关键点需结合上述几点问题一起考虑。


构建KG的几个关键点:明确目标与任务、不重复造轮子、穷举知识要点、确定分类层级、定义属性与关系、确定各类约束、引导用户对感兴趣的事情广泛探索以上几个关键点均从KG产品构建顺序予以阐述,但在实际中并不完全按照此顺序,前进与回退往往不按章法,可根据具体情况加以考虑。


明确目标与任务


不同行业的知识体系区别非常大。在项目初期确定任务领域与其细分知识要点非常重要,且同一领域常常也分不同的知识范围,如下图:金融学专业知识体系。随着项目的深入,对于领域知识体系的认识也会更加深入,在系统设计初期与系统构建阶段应不断完善知识体系,所有的数据与知识体系均为满足业务应用,整个产品生命周期内对于系统的可用应、易用性、扩展性需严格把控,避免越走越偏。



不重复造轮子


企业级KG项目的特点一般是时间紧、任务重、资金及投资方压力大,所以一般不建议从零开始构建,最好是站在前人的肩膀上,目前市面上已经有很多领域的开源KG项目,尽量基于已有项目进行扩展或优化,项目伊始,先广泛调研已有相关KG项目,如各领域词典:医学CancerOntology、文化艺术与建筑AAT、地理TGN,各类开源知识图谱Freebase、OpenCyc、YAGO、DBpedia,以及维基百科、百度百科、互动百科、搜狗百科。


穷举知识要点


“确定了文章提纲,下面即是一点点的填进血肉”。在设计之初要想明白,哪些要素要展示在图谱中哪些不展示在图谱中,对知识体系中的概念进行清晰的定义和划分,尽量多的罗列对构建完整知识体系有帮助的要素,如人的属性:姓名、年龄、肤色、学历、职业、民族、国籍、籍贯、出生地、成长地、父亲、母亲、子女、祖父、祖母、母校等等,大致可分为自然属性和社会属性。穷举虽好,但也要考虑冗余性,尽量使图谱成为小而轻的存储载体,有利于高效的查询与检索。


确定分类层级


收集足够的知识构建要素,接下来就要对这些要素进行严格的层级分类,有利于构建完整的知识体系,KG的构建一般分为两种方式自顶向下与自底向上,也可以说是从抽象到具象和从具象到抽象,这两种方式的实施对知识的分类层级都有严格的要求。下层分类需完全属于上层分类,上层分类需囊括所有下层分类。如:人包括男人、女人、"renyao"、"taijian"与变性人,所有的"renyao"也是人,类似于这种问题也应随着时代的发展进行必要的更新。


定义属性与关系


为分类层级之后的实例确定属性值与各实例之间的关系属性值定义实例的内在特征,如人的年龄、性别、爱好等;关系描述不同实例之间的联系,如人与人之间的亲子关系、朋友关系、师生关系等;属性要受分类的约束,下层实例的属性一般要承接所有上层属性,此过程可能会发现分类层级中存在的缺陷,需及时进行修正。目前大多数KG主要对实例、概念、属性、关系进行建模,少有对函数、约束、规则、公理等复杂的知识进行建模,也算KG深入发展的一个方向。


定义各类约束


不同的实例有不同的属性和关系,不同的属性和关系有不同的定义域和值域。如:“国家”不存在爱好与颜色的属性,“人物”不存在出版社的属性;“茶叶”与“咖啡”之间不存在亲子关系、朋友关系等。人的年龄不超过150岁,家禽的年龄一般有十几年。我国古有:“犬无八年,鸡无六载”之说,因此定义值域保证其在合理范围内,尽量避免异常数据,提升产品可信度。


引导用户对感兴趣的事情广泛探索


Google知识图谱产品经理Emily Moxley将知识图谱的作用精炼地归纳为3点:

  • 向用户明了的展示他们正在找的东西;
  • 让用户在梗概中拥有深入探索的乐趣;
  • 用户能够围绕一个话题进行广泛的探索;

以上3点,虽然简单,却是KG的精髓。学习任何知识在脑海中有一个清晰地轮廓,这对于学习是很有帮助的,比如:当我们学习产品经理的技能时对产品经理的势(趋势)道(规律)、法(团队管理办法)、术(执行方法)、器(工具)需要有一个梗概,学习便有了方向,也是学习前人经过大量思考与实践检验的结果。


道家常说:道生一、一生二、二生三、三生万物。放在这里可以说,当用户有了某件感兴趣的事,对此不断探索、发现,从而构建某方面完整的知识体系,这也是知识图谱出现的初衷。


关于构建KG,先说以上几点,后面有新想法时再做补充。
构建了优质的KG接下来就是进行应用,好钢用在刀刃上,下一篇将重点说如何用好KG。


附件:AMiner 2019年第二期《人工智能之知识图谱》报告

knowledgegraph.pdf8.1MB

良心推荐:清华大学AMiner各种AI报告的下载页面:https://www.aminer.cn/research_report/articlelist



附:博斌之前的第1篇分享文章


-END-

以上内容,来自知识星球“AI产品经理大本营识别下图二维码,即可加入

---------------------

作者:黄钊hanniman,前图灵机器人-人才战略官/AI产品经理,前腾讯产品经理,9年AI行业经验,12年互联网背景;垂直于“AI产品经理”的行业第一社群(知识星球“AI产品经理大本营”,已运营4年半)和第一自媒体(微信公众号/知乎ID“hanniman”,已运营7年);200页PPT《人工智能产品经理的新起点》被业内广泛好评,下载量1万+。