RSS订阅 | 匿名投稿
您的位置:网站首页 > 相关知识 > 正文

冷静审视人工智能技术的本质 一图看懂新一代人工智能知识体系大全

作者:habao 来源: 日期:2018-3-17 21:16:48 人气: 标签:计算机基础知识大全

  人工智能的发展离不开基础支持层和技术层,基础支持层包括大数据、计算力和算法;技术层包括计算机视觉、语音识别和自然语言处理。在过去的2016年人工智能风风火火了一把,到目前为止,还在大力向前发展,研究机构、企业、投资机构和都对人工智能投入了很多关注,并陆续出台了一些政策。人工智能的技术本质是什么,本文会详细分析。

  基础支撑层的算法创新发生在20世纪80年代末,是大数据和计算力将人工智能推到镁光灯之下,而建立在这之上的基础技术便是计算机视觉、语音识别和自然语言理解,机器试图看懂、听懂人类的世界、用人类的语言和人类交流,研究人类智能活动的规律。

  “人的大脑皮层的活动, 大约70%是在处理视觉相关信息。视觉就相当于人脑的大门,其它如听觉、触觉、味觉那都是带宽较窄的通道。视觉相当于八车道的高速, 其它感觉是两旁的人行道。如果不能处理视觉信息的话,整个人工智能系统是个空架子,只能做符号推理,比如下棋、证明, 没法进入现实世界。计算机视觉之于人工智能,它相当于说芝麻开门。大门就在这里面,这个门打不开, 就没法研究真实世界的人工智能。”

  根据科普中国撰写的对计算机视觉的定义,这是一门研究如何让机器“看”的科学,更进一步的说,是指用计算机代替人眼对目标进行识别、和测量的机器视觉,并进一步做图形处理,使计算机处理成为更适合人眼观察或传送给仪器检测的图像。

  计算机视觉更关注图像信号本身以及图像相关交叉领域(地图、医疗影像)的研究;机器视觉则偏重计算机视觉技术工程化,更关注广义上的图像信号(激光和摄像头)和自动化控制(生产线)计算机视觉识别技术的分类

  训练模型:样本数据包括正样本(包含待检目标的样本)和负样本(不包含目标的样本),视觉系统利用算法对原始样本进行特征的选择和提取训练出分类器(模型);此外因为样本数据成千上万、提取出来的特征更是翻番,所以一般为了缩短训练的过程,会人为加入知识库(提前告诉计算机一些规则),或者引入条件来缩小搜索空间。

  目前世界上图像识别最大的数据库,是斯坦福大学人工智能实验室提供的ImageNet,针对诸如医疗等细分领域也需要收集相应的训练数据;Google、Microsoft此类科技巨头会面向市场提供开源算法框架,为初创视觉识别公司提供初级算法。

  语音识别是以语音为研究对象,通过信号处理和识别技术让机器自动识别和理解人类的语言后,将语音信号转换为相应的文本或命令的一门技术。

  语音信号经过前端信号处理、端点检测等预处理后,逐帧提取语音特征,传统的特征类型包括有MFCC、PLP、FBANK等特征,提取好的特征会送到解码器,在训练好的声学模型、语言模型之下,找到最为匹配的此序列作为识别结果输出。

  基础层:包含大数据、计算力和算法三块,其中大数据等接入的是相应领域的第三方服务商。机器在识别人类的语音指令后接入、提供相应的服务。诸如影视、电影票、餐饮等;

  自然语言理解即文本理解,和语音图像的模式识别技术有着本质的区别,语言作为知识的载体,承载了复杂的信息量,具有高度的抽象性,对语言的理解属于认知层面,不能仅靠模式匹配的方式完成。

  事实上搜索引擎和机器翻译不分家,互联网、移动互联网为其充实了语料库使得其发展模态发生了质的改变。互联网、移动互联网除了将原先线下的信息(原有语料)进行在线化之外,还衍生出来的新型UGC模式:知识分享数据,像、百度百科等都是人为校准过的词条,噪声小;社交数据,像微博和微信等展现用户的个性化、主观化、时效性,可以用来做个性化推荐、情感倾向分析、以及热点舆情的检测和等;社区、论坛数据,像果壳、知乎等为搜索引擎提供了问答知识、问答资源等数据源。

  “远望智库”聚焦前沿科技领域,着眼科技未来发展,围绕军民融合、科技创新、管理创新、科技安全、知识产权等主题,开展情报挖掘、发展战略研究、规划论证、评估评价、项目筛选,以及等工作,为管理决策、产业规划、企业发展、机构投资提供情报、咨询、培训等服务,为推动国家创新驱动发展和军民融合深度发展提供智力支撑

  

读完这篇文章后,您心情如何?
0
0
0
0
0
0
0
0
本文网址:
下一篇:没有资料