人工智能的核心(人工智能有哪些核心技术)
人工智能的核心:1。计算机视觉是指计算机从图像中识别物体、场景和活动的能力;2.机器学习意味着计算机系统不需要遵循明确的程序指令;3.自然语言处理;4.机器人;5.语音识别主要研究人类语音的自动准确转录。
操作环境:windows7系统,戴尔G3电脑。
人工智能的核心:
1.计算机视觉
计算机视觉是指计算机从图像中识别物体、场景和活动的能力。计算机视觉技术利用图像处理操作等技术组成的序列,将图像分析任务分解成可管理的小任务。例如,一些技术可以从图像中检测对象的边缘和纹理,并且分类技术可以用于确定所识别的特征是否可以表示系统已知的一类对象。
计算机视觉有着广泛的应用,包括:医学影像分析用于提高疾病的预测、诊断和治疗;脸书使用人脸识别来自动识别照片中的人;用于识别安全和监控领域的嫌疑人;在购物方面,消费者现在可以用智能手机对产品拍照,以获得更多的购买选择。
机器视觉作为一门相关学科,一般指工业自动化领域中的视觉应用。在这些应用中,计算机在高度受限的工厂环境中识别生产零件等对象,因此目标比计算机视觉寻求在不受限制的环境中操作更简单。计算机视觉是正在进行的研究,而机器视觉是“已解决的问题”,是系统工程的课题而不是研究课题。由于应用范围的不断扩大,2011年以来,一些计算机视觉领域的初创企业吸引了数亿美元的风险投资。
2.机器学习
机器学习是指计算机系统通过仅依赖数据而不遵循显式程序指令来提高其性能的能力。机器学习的核心是从数据中自动发现模式,一旦发现模式,就可以用于预测。例如,如果给机器学习系统一个信用卡交易信息数据库,如交易时间、商家、地点、价格和交易是否合法,系统将学习可用于预测信用卡欺诈的模式。处理的交易数据越多,预测就越准确。
机器学习有着广泛的应用,它有潜力提高几乎所有产生巨大数据的活动的性能。除了欺诈筛选,这些活动还包括销售预测、库存管理、石油和天然气勘探以及公共卫生。机器学习技术在计算机视觉等其他认知技术领域也发挥着重要的作用,可以通过不断训练和改进海量图像中的视觉模型来提高其识别物体的能力。
如今,机器学习已经成为认知技术领域最热门的研究领域之一,从2011年到2014年吸引了近10亿美元的风险投资。谷歌还在2014年斥资4亿美元收购了研究机器学习技术的公司Deepmind。
3.自然语言处理
自然语言处理是指计算机拥有的类似人类的文本处理能力。例如,我们可以从文本中提取意义,甚至可以独立于那些具有自然风格和正确语法的可读文本来解释意义。一个自然语言处理系统不知道人类是如何处理文本的,但是它可以通过非常复杂和成熟的手段来熟练地处理文本。例如,自动识别文档中提到的所有人和地方;确定文件的核心问题;在一堆人类可读的合同中,各种条款和条件被提取出来并制成表格。这些任务是传统的文本处理软件无法完成的,只能对简单的文本匹配和模式进行操作。
自然语言处理和计算机视觉技术一样,集成了各种有助于实现目标的技术。建立一个语言模型来预测语言表达的概率分布,例如,它是给定字符串或单词表达特定语义的最大可能性。选定的特征可以与文本中的某些元素相结合,以识别一段文本。通过识别这些元素,可以将某些类型的文本与其他文本区分开来,例如垃圾邮件和普通邮件。机器学习驱动的分类方法将成为筛选标准,用于确定一封电子邮件是否是垃圾邮件。
因为语境对于理解“时光飞逝”和“果蝇”的区别如此重要,自然语言处理技术的实际应用领域相对狭窄。这些领域包括分析客户对特定产品和服务的反馈,自动发现民事诉讼或政府调查中的一些含义,以及自动编写公式模型,如企业收入和体育等。
4.机器人
机器视觉、自动规划等认知技术融入极小但高性能的传感器、刹车和巧妙设计的硬件,催生了新一代机器人,能够与人类协同工作,在各种未知环境中灵活处理不同任务。比如无人机,可以在车间为人类分担工作的“cobots”等。
5.计算机语音识别
语音识别主要研究人类语音的自动准确转录。这项技术必须面对一些类似于自然语言处理的问题,比如处理不同的口音、背景噪音、区分同音异义词/同义词(“买”和“按”音不变),同时需要有一个跟得上正常语速的工作速度。语音识别系统使用一些与自然语言处理系统相同的技术,辅以其他技术,如描述声音及其在特定序列和语言中出现的概率的声学模型。语音识别的主要应用包括医学听写、语音书写、计算机系统语音控制、电话客服等。例如,多米诺披萨(Domino Pizza)最近推出了一款移动应用,允许用户通过语音下单。