前言:本文作者是团员“勇运”的第1篇分享输出,欢迎有更多的团员们来分享你的AI干货~
前言
人工智能作为当下最为火热的话题之一,一直被关注着,疫情期间一些依托自动驾驶、语音识别、图像识别技术的“零接触”产品和服务的不断上线,为全球抗疫助力。
而什么是人工智能,什么是神经网络,人工智能(语音助手、人脸识别)是怎么实现的?对于许多非ai从业人员或想入行/刚入行的ai产品经理来说,ai的实现原理犹如黑盒子,看不透摸不清。
抱着“知其然,知其所以然”的求知态度,在入行ai领域之初,就一直在学习和理解人工智能其背后的原理。但网上对于ai尤其是nlp的介绍很多是偏技术导向的,开篇即是rnn/lstm/bert或者大量数学公式推导,读起来一头雾水、晦涩难懂,对于初入者或仅仅有兴趣了解的同学来说不太友好,寻找、筛选合适的资源需要花费的时间和精力非常多。
基于以上原因,在两年的行业实践(负责过 接听助理、车载语音助手等对话产品)和学习后,想和大家分享下一些我对ai的理解和ai产品设计经验,尽量用通俗易懂的大白话,为大家在理解ai、理解自然语言处理及应用的路上打开一个小口子。
系列输出大概会分为两个部分,约六个小章节:
【part 1:AI的原理:神经网络的起源和实现过程】
1、我们是如何去认识事物的?
2、深度神经网络是如何诞生的
3、文本表征,word2vec的力量
【part 2:AI的应用:产品设计经验分享】
4、nlp的经典任务介绍
5、语音助手的构成和关键指标
6、语音助手产品设计要点分享
7、总结与展望
面向对象:对人工智能感兴趣的同学、想入行或刚入行AI领域的产品经理
需要知识:无必需知识,能简单了解数学中的矩阵的相关内容更好
我们是如何认识事物的?
本节的内容比较宏观,主要是从生物智能的角度去理解人工智能,以我们日常熟知的例子,说明人工智能(神经网络)是如何参考人的认知模式,设计出分层抽象迭代的结构。系列文章会逐步收敛,整体介绍人工智能的原理和应用。
一、什么是智能?
要了解人工智能,我们首先了解什么是智能,智能的定义数不胜数,要归纳出合适的智能的范畴何其困难。所以让我们从另一个角度来切入:为什么生命需要智能,智能的作用是什么?而这个答案却是唯一的,那就是为了生存和繁衍,本质是让自己的基因传递下去。
我们都知道这么一句话“物竞天择,适者生存”,讲的就是生物在激烈的生存竞争中不断进行着变异和进化,优胜劣汰。在外部不断变化的环境下(包括自然环境和生物环境),能适应环境的基因(个体/群体)存活下来,并保存下去,其他的就被淘汰消失。
生存斗争与智能
在这里就体现了智能对于生命的很重要的三个点,认知、学习记忆和预测。
认识就是能从外部环境中感知到当环境发生变化时,什么样的行为是有利于生存的,比如鹿在被狮子追猎时,第一反应是逃跑而不是原地装死;
个体(装死的鹿)的死亡会让剩余的正确逃生的鹿群认识到在被狮子追猎时该如何行动,这种行动形成了经验并储存在记忆和本能反应之中;
最后是预测,鹿群可以根据已有的经验,当发现有老虎接近时,能及时的逃跑避免种群的伤亡。这种能力存储于生命的DNA当中,不断的更新和变化。
一般理论认为,人工智能分为运算智能、感知智能、认知智能,这其实是和生命的智能是一样的。我们认识世界,获取经验,并在类似的情况下根据以往经验进行推理和预测,计算机程序对生命智能的模拟和学习借鉴,就形成了当下的人工智能。
二、盲人摸象里潜藏着的认知模式
人是怎么认识世界的呢,比如当我们看到一个新事物的时候,是如何从认识到学会使用的呢?
以缝纫机为例,首先看到是缝纫机的外形和构造,然后是使用方法,最后我们把它拆开来就了解了它的缝合原理。
线圈缝合系统
在经典的盲人摸象故事中,不同的人摸到大象不同的部位,摸到鼻子的认为是竹子、摸到身体的认为是墙壁、摸到脚的认为是柱子、摸到尾巴的认为是绳子。盲人们没有见过大象,智能根据自己所摸到的部位(获取到的部分特征),去关联到其记忆中的相似物品,这样就形成了自己认知中的“大象”,最后闹出了笑话。
盲人摸象
对于知道“大象”这个概念的我们来说,当然是知道只要把他们各自获取到的不同特征组合起来,就能知道大象是什么样子的了。可见我们认识事物、认识世界是由部分到全面、由表及里、是从低纬度到高纬度的,即是从点到面开始的。
在日常生活中,我们正是用着这种模式去观察和发现事物:
假设我们走在路上,看到一个小植物时,我们是怎么去辨别它的呢?
(1)首先我们在远处看到这个小植物的形状,从他的整体躯干,花瓣我们知道它是一朵花
(2)接下来我们走近去看,发现是个带刺的花,带刺的花有很多,那会不会是玫瑰呢?
(3)为了进一步分辨,我们就要再靠近仔细观察他们的特征(花径、味道、花瓣数),还可能会用到以下的方法:
方法一:看花径上的刺。月季刺少,刺大,花径光滑。玫瑰刺多,有刚毛,密密麻麻。
方法二:看叶子。月季叶泛亮光;玫瑰叶无光泽。
(4)当我们发现这朵花刺比较多,叶子没光泽,就大概确定是玫瑰花了,如果我们是个植物爱好者,还会去辨别这是什么品种的玫瑰花
(5)顺着这个念头下去,我们还要继续去观察他们的特征,根据这些特征联系已有的经验去辨别,譬如现在的时间是否玫瑰花的花期,当地是否有适合玫瑰花的生长环境,附近是否大量的玫瑰花等等。
上面这个过程在我们日常生活中是很常见的,里面却蕴含了几个比较重要的过程:
1、我们从浅层到深层逐渐认识事物,在这个过程中我们会联系已有的经验来协助判断;
2、认识事物时一个重要的概念是特征,在这个例子中我们从比较浅层的特征(形状、结构)得知他是一朵花,再结合一些深层的特征比如(花径、味道、花瓣数),一些列特征的结合帮助我们判断这是玫瑰花。这个在机器学习中的话就是重要的一环-特征工程;
3、我们获取特征后再逐步区分,本质上是进行着分类活动,在机器学习中就是构建分类器的过程,通过多个分类器不断细化。
语言的理解也是类似的,在看到一个句子时,我们首先获取到字词的构成,再到句子意思,再联系自己脑海里的知识去理解,在“自然语言太难了”中就有很多这样的例子:
中国:我们好多了
欧洲:我们好多了
中国:我们快完了
欧洲:我们快完了
在2020年以前,我们看到这句话可能比较懵,但联系到近期的肺炎疫情变化,就能理解表达的是国内疫情控制住了,国外疫情却开始爆发的情况。一个字词完全相同的句子在逐层解读下有了完全不同的含义,这和我们上学时做的语文题里解析一句/一段话表达的意思是一样的。
在视觉机理方面的研究,人们也同样发现了类似的过程。
三、人脑的视觉机理和神经网络
人类视觉系统是这个世界上最为神奇的一个系统。1981年的诺贝尔医学奖得主David H.Hubel 和Torsten Wiesel的研究表明:即人脑视觉机理,是指视觉系统的信息处理在可视皮层是分级的,大脑的工作过程是一个不断迭代、不断抽象的过程。
视觉信息的传递过程
那么他们做了什么样的实验呢?1958 年,两位研究者为研究瞳孔区域与大脑皮层神经元的对应关系。他们在猫的后脑头骨上,开了一个3 毫米的小洞,向洞里插入电极,测量神经元的活跃程度。然后,他们在小猫的眼前,展现各种形状、各种亮度的物体。并且,在展现每一件物体时,还改变物体放置的位置和角度。他们期望通过这个办法,让小猫瞳孔感受不同类型、不同强弱的刺激。
之所以做这个试验,目的是去证明一个猜测。位于后脑皮层的不同视觉神经元,与瞳孔所受刺激之间,存在某种对应关系。一旦瞳孔受到某一种刺激,后脑皮层的某一部分神经元就会活跃。经历了很多天反复的枯燥的试验,同时牺牲了若干只可怜的小猫,他们终于发现了一种被称为“方向选择性细胞”的神经元细胞。当瞳孔发现了眼前的物体的边缘,而且这个边缘指向某个方向时,这种神经元细胞就会活跃。这个发现激发了人们对于神经系统的进一步思考。
神经-中枢-大脑的工作过程,或许是一个不断迭代、不断抽象的过程。这里的关键词有两个,一个是抽象,一个是迭代。从原始信号,做低级抽象,逐渐向高级抽象迭代。
例如,从原始信号摄入开始(瞳孔摄入像素 Pixels),接着做初步处理(大脑皮层某些细胞发现边缘和方向),然后抽象(大脑判定,眼前的物体的形状,是圆形的),然后进一步抽象(大脑进一步判定该物体是只气球)。这个生理学的发现,促成了计算机人工智能,在四十年后的突破性发展。计算机专家仿照人类大脑由低层到高层逐层迭代、抽象的视觉信息处理机理,建立深度网络模型。
总的来说,人的视觉系统的信息处理是分级的。视网膜在得到原始信息后,首先从低级的V1区提取边缘特征,再到V2区的形状轮廓或者目标的部分等,再到更高层,整个目标、目标的行为等。也就是说高层的特征是低层特征的组合,从低层到高层的特征表示越来越抽象,越来越能表现语义或者意图。而抽象层面越高,存在的可能猜测就越少,就越利于分类。如上文所说,多个字词单组成了句子,多个句子组合形成了不同的语义和主题。
相反地,人类的逻辑思维,经常使用高度抽象的概念,表达出来的东西是高度抽象的,一个人的语言、动作和行为在不同的场景、文化、阅历的解读下可以是完全不一样的。对于机器(人工智能)要去理解它,就需要效仿人的理解和认识过程,从低纬度到高纬度去理解,在图像识别的深度神经网络中就模拟应用了这种思想:
人脸识别神经网络
我们可以看到这个人脸识别神经网络中,第一层往往是一些类似边线、棱角等基础线条,接着在第二层中这些元素组成了五官,再到最后组成不同的人脸。当我们输入一个图片时,它被解构成各种边线,然后组合成五官,最后组合成一个人脸(数据化的表示),最后输出这个人脸属于是哪个人的一连串概率,最后得知这最大概率是个叫sara的女性。
这就是一个神经网络的整体构成的解读,不同的神经网络的大小和形式不尽相同,但其根本目的和思想是一致的。
最后回顾本节的内容,有几个要点:
(1)生存斗争促使了生命产生智能,生命的智能表现在能够认知外部环境的变化,能够在适应环境中将有利因素保存下来(记忆、DNA),并且在类似情况发生时能够根据以往经验作出判断或行动;
(2)我们认知事物的过程正是从部分到整体,从低纬度到高纬度的(从点到面),无论是认识一个新事物(如缝纫机),还是根据已有经验判别旧事物(如辨别花的种类),都是一样的;
(3)人脑的视觉机理,正如我们认识事物的过程,是分层级的。从底层到高层的抽象和迭代让我们更好地关联和理解,神经网络的设计也是参考并应用了这样的思想。
下一个章节的内容,将介绍神经网络是如何借鉴人脑神经网络构建的,经典的前馈人工神经网络结构中的各个部分有什么含义,它们又是如何运行和应用到实际任务中的。
参考内容:
-END-
以上内容,来自饭团“AI产品经理大本营”,点击这里可关注:http://fantuan.guokr.net/groups/219/ (如果遇到支付问题,请先关注饭团的官方微信服务号“fantuan-app”)
---------------------
作者:黄钊hanniman,图灵机器人-人才战略官,前腾讯产品经理,7年AI实战经验,10年互联网背景,微信公众号/知乎/在行ID“hanniman”,饭团“AI产品经理大本营”,分享人工智能相关原创干货,200页PPT《人工智能产品经理的新起点》被业内广泛好评,下载量1万+。