导读:很多朋友问到关于人工智能是如何感知的的相关问题,本文首席CTO笔记就来为大家做个详细解答,供大家参考,希望对大家有所帮助!一起来看看吧!
人工智能的原理是什么
人工智能的原理,简单的形容就是:
人工智能=数学计算。
机器的智能程度,取决于“算法”。最初,人们发现用电路的开和关,可以表示1和0。那么很多个电路组织在一起,不同的排列变化,就可以表示很多的事情,比如颜色、形状、字母。再加上逻辑元件(三极管),就形成了“输入(按开关按钮)——计算(电流通过线路)——输出(灯亮了)”
这种模式。
想象家里的双控开关。
为了实现更复杂的计算,最终变成了,“大规模集成电路”——芯片。
电路逻辑层层嵌套,层层封装之后,我们改变电流状态的方法,就变成了“编写程序语言”。程序员就是干这个的。
程序员让电脑怎么执行,它就怎么执行,整个流程都是被程序固定死的。
所以,要让电脑执行某项任务,程序员必须首先完全弄清楚任务的流程。
就拿联控电梯举例:
别小看这电梯,也挺“智能”呢。考虑一下它需要做哪些判断:上下方向、是否满员、高峰时段、停止时间是否足够、单双楼层等等,需要提前想好所有的可能性,否则就要出bug。
某种程度上说,是程序员控制了这个世界。可总是这样事必躬亲,程序员太累了,你看他们加班都熬红了眼睛。
于是就想:能不能让电脑自己学习,遇到问题自己解决呢?而我们只需要告诉它一套学习方法。
大家还记得1997年的时候,IBM用专门设计的计算机,下赢了国际象棋冠军。其实,它的办法很笨——暴力计算,术语叫“穷举”(实际上,为了节省算力,IBM人工替它修剪去了很多不必要的计算,比如那些明显的蠢棋,并针对卡斯帕罗夫的风格做了优化)。计算机把每一步棋的每一种下法全部算清楚,然后对比人类的比赛棋谱,找出最优解。
一句话:大力出奇迹!
但是到了围棋这里,没法再这样穷举了。力量再大,终有极限。围棋的可能性走法,远超宇宙中全部原子之和(已知),即使用目前最牛逼的超算,也要算几万年。在量子计算机成熟之前,电子计算机几无可能。
所以,程序员给阿尔法狗多加了一层算法:
A、先计算:哪里需要计算,哪里需要忽略。
B、然后,有针对性地计算。
——本质上,还是计算。哪有什么“感知”!
在A步,它该如何判断“哪里需要计算”呢?
这就是“人工智能”的核心问题了:“学习”的过程。
仔细想一下,人类是怎样学习的?
人类的所有认知,都来源于对观察到的现象进行总结,并根据总结的规律,预测未来。
当你见过一只四条腿、短毛、个子中等、嘴巴长、汪汪叫的动物,名之为狗,你就会把以后见到的所有类似物体,归为狗类。
不过,机器的学习方式,和人类有着质的不同:
人通过观察少数特征,就能推及多数未知。举一隅而反三隅。
机器必须观察好多好多条狗,才能知道跑来的这条,是不是狗。
这么笨的机器,能指望它来统治人类吗。
它就是仗着算力蛮干而已!力气活。
具体来讲,它“学习”的算法,术语叫“神经网络”(比较唬人)。
(特征提取器,总结对象的特征,然后把特征放进一个池子里整合,全连接神经网络输出最终结论)
它需要两个前提条件:
1、吃进大量的数据来试错,逐渐调整自己的准确度;
2、神经网络层数越多,计算越准确(有极限),需要的算力也越大。
所以,神经网络这种方法,虽然多年前就有了(那时还叫做“感知机”)。但是受限于数据量和计算力,没有发展起来。
神经网络听起来比感知机不知道高端到哪里去了!这再次告诉我们起一个好听的名字对于研(zhuang)究(bi)有多重要!
现在,这两个条件都已具备——大数据和云计算。谁拥有数据,谁才有可能做AI。
目前AI常见的应用领域:
图像识别(安防识别、指纹、美颜、图片搜索、医疗图像诊断),用的是“卷积神经网络(CNN)”,主要提取空间维度的特征,来识别图像。
自然语言处理(人机对话、翻译),用的是”循环神经网络(RNN)“,主要提取时间维度的特征。因为说话是有前后顺序的,单词出现的时间决定了语义。
神经网络算法的设计水平,决定了它对现实的刻画能力。顶级大牛吴恩达就曾经设计过高达100多层的卷积层(层数过多容易出现过拟合问题)。
当我们深入理解了计算的涵义:有明确的数学规律。那么,
这个世界是是有量子(随机)特征的,就决定了计算机的理论局限性。——事实上,计算机连真正的随机数都产生不了。
——机器仍然是笨笨的。
更多神佑深度的人工智能知识,想要了解,可以私信询问。
机器人怎么感知世界?
机器人图像处理(视觉)
正如图像是在我们的眼球内形成的,机器人也可以在相机的帮助下创建数字图像。
数字图像可以定义为二维图像的表达形式,即有限的数字值集合,称为图像元素或像素。将图像数字转化为像素意味着图像是实际图像的近似。
像素值包含许多信息,如灰度、颜色、高度、不透明度等等。在计算机科学中,数字图像处理是利用计算机算法对数字图像进行图像处理。
数字图像处理是作为数字信号处理的一个子范畴或领域,它与模拟图像处理相比具有许多优势。
它允许更广泛的算法应用于输入数据,并可以帮助您避免在处理过程中产生的干扰和信号失真等问题。
自然语言处理(听觉)
我们人类理解语言的方式是非常直观的,但计算机在处理语言时采用了一种更合乎逻辑的方法。
自然语言处理(NLP)是计算机科学、信息工程和人工智能的一个子领域,研究计算机和人类语言之间的语言差异。
自然语言处理有两种形式:基于规则的NLP和统计的NLP。
在NLP的早期,大多数处理都是基于手写代码。后来,NLP转向了更多的使用统计方法的机器学习范式。
许多不同种类的机器学习算法已被应用于自然语言处理中。这些算法采用从输入数据生成的大量“特性”。(机器学习相关,搜索下我们之前文章了解)
感知智能包括哪些内容呢?
感知智能包括视觉、听觉、触觉等感知能力。人和动物都具备,能够通过各种智能感知能力与自然界进行交互。自动驾驶汽车,就是通过激光雷达等感知设备和人工智能算法,实现这样的感知智能的。机器在感知世界方面,比人类还有优势。
人类都是被动感知的,但是机器可以主动感知,如:激光雷达、微波雷达和红外雷达。不管是Big Dog这样的感知机器人,还是自动驾驶汽车,因为充分利用了DNN和大数据的成果,机器在感知智能方面已越来越接近于人类。
感知智能介绍:
感知智能是指将物理世界的信号通过摄像头、麦克风或者其他传感器的硬件设备,借助语音识别、图像识别等前沿技术,映射到数字世界,再将这些数字信息进一步提升至可认知的层次,比如记忆、理解、规划、决策等等。而在这个过程中,人机界面的交互至关重要。
有研究者认为,人工智能的发展主要分为三个层次,即运算智能、感知智能和认知智能。所谓运算智能,是指计算机快速计算和记忆存储的能力。所谓感知智能,是指通过各种传感器获取信息的能力。所谓认知智能,是指机器具有理解、推理等能力。
以上内容参考:百度百科-感知智能
结语:以上就是首席CTO笔记为大家介绍的关于人工智能是如何感知的的全部内容了,希望对大家有所帮助,如果你还想了解更多这方面的信息,记得收藏关注本站。