非技术人工智能科普

据麦肯锡称，从如今到2030年，人工智能将缔造约13万亿美元的国内生产总值增进。比拟之下，2017年整个美国内生产总值约为19万亿。

领先的人工智能科学家，如安德鲁·吴，将人工智能描述为第四次工业革命或"新电力"。人工智能无疑是数字化转型的焦点，它在整个行业中的应用将极大地改变我们的世界以及我们若何开展买卖。

问题在于好多人都进展介入这场人工智能革命，但他们的手艺成熟水平让他们不胜重负。他们不知道AI能做什么，更不消说他们若何将它用于他们的公司。

这恰是本文旨在解决的问题：让没有手艺配景的人更轻易懂得AI，以便他们可以本身评估AI的或者用例。这很主要，因为没有人比他们更认识他们的买卖的前因后果，他们能够提出关于若何在公司内部使用AI的最有价格的设法。

关于人工智能的曲解

什么是机械进修？

人工智能术语

什么是数据？

你若何获得数据？

滥用数据

摘要关于人工智能的曲解

人工智能有好多不需要的炒作，这首要是因为很多人都有一种常见的曲解。人工智能可分为两部门或两部门：

人工窄智能（ANI）

这描述了擅长一项特定义务的AI，它们是经由练习和斥地的。例如，这能够是一小我工智能系统，可凭据汗青数据或向你介绍YouTube视频的算法，或许展望衡宇价钱。其他例子是展望性维护，质量掌握等。ANI是一个非常壮大的对象，它将在将来几年为我们的社会增加很多额外的价格。我们近年来所看到的所有进展，以及我们在新闻中络续听到的，都发生在ANI范畴。这些惹人饮茶注目的新闻文章指导人们错误地认为科学在AGI方面取得了很猛进展，但实际上我们只在AN中取得了进展。

通用人工智能（AGI）

这是人工智能的最终方针：一个比人类伶俐或伶俐的较量机系统。AGI能够成功地完成人类能够做的任何智力义务。这也是AI引起人们最大惧怕的一部门。他们想象一个较量机比人类伶俐得多的世界，几乎每个工作都是主动化的，甚至是雷同终结者的场景。这就是我的意思，不需要的炒作。它导致了对人类将来的非理性惧怕，而实际上，我们仍远未达到真正的AGI手艺冲破。

什么是机械进修？

你能够说机械进修是人工智能的主干手艺。它使用统计手艺使较量机法式可以从数据中进修（例如慢慢提高其在特定义务上的机能），而无需明确编程。

机械进修是人工智能的对象，它引起了所有的炒作，几乎能够实现经由AI系统缔造的所有价格。它也能够分成分歧的部门，但只有一个部门负责经由机械进修建立的值的80％。我所说的是监视进修。

监视进修算法只是进修输入（A）到输出（B）映射，经由进修大量数据中的关系。想要构建能够将电子邮件分类为垃圾邮件和非垃圾邮件的系统的映像。你需要储蓄好多"标记"的电子邮件示例。这意味着每个电子邮件都有一个标签，示知它是否是垃圾邮件。你需要使用标签累积数千封电子邮件，然后将此数据供应给受监视的机械进修算法。在练习过程中，算法会剖析您给他的所有电子邮件，并会频频提高对垃圾邮件与非垃圾邮件的区其余懂得。在此示例中，系统必需将电子邮件（A）映射到标签，该标签示知邮件是否是垃圾邮件（B）。

就像我说的那样，你经由给他数以千计的标记电子邮件来练习算法。在你对该数据进行了算法练习后，能够向他供应一个全新的电子邮件（该算法以前从未见过）作为输入，它会敷陈你它是否认为该电子邮件是垃圾邮件。

另一个例子是在线告白，个中输入是关于用户（A）的信息，而且系统的输出是示知用户是否将点击添加（B）的标签。

另一个例子是语音识别，个中输入是作为音频文件（A）的语音，输出是音频文件（B）中所述内容的手本。

另一个例子是缺陷检测，当你给算法一个钢板（A）的图像时，它必需判断它是缺陷照样无缺陷（B）。乍一看，这似乎是一项非常有限的手艺，但若是你找到合适的应用法式，它就会非常壮大。它是经由AI为我们的社会缔造额外价格的独一首要原因。这项手艺的分歧用例数量似乎无限无尽，人们天天都邑发现新的用例。人工智能术语

人工智能是一个非常复杂的范畴，好多术语在起头时或者会让人很疑心。你或者据说过神经收集、深度进修或数据科学。如今，我们将认识人工智能最主要的术语并揭示其寄义，以便您可以与其他人商议人工智能，并思虑若何在您的买卖中应用人工智能。

我给你最常用的AI术语界说，但要注重AI是一个非常不透亮的范畴，很多术语能够交换使用，有时也纷歧致。

人工智能

人工智能是一个较量机科学范畴，它强调智能机械的缔造，它像人类一般工作和回响。就像我已经提到的那样，当人们谈论AI时，他们首要是通用人工智能（AGI）。你应该将AI视为整个区域，将机械进修和深度进修视为用于使较量机智能把持的手艺。

机械进修

机械进修是AI的一个子范畴。这是一个研究范畴，使较量机可以在不明确编程的情形下从数据中进修。是以，经由机械进修，您根基上能够练习法式执行某项义务。是以，机械进修平日会导致运行的AI系统，这根基上是一个软件。

机械进修项目的示例：想象一下，您是一家房地产公司，而且拥有大量有关衡宇的数据。与机械进修公司合作，竖立机械进修系统，以展望衡宇的将来价钱。如许的系统使您可以更好地决意您想要投资的衡宇，并找出清理投资的合适时机。

深度进修

深度进修是机械进修的一个子部门，机械进修负责所有媒体炒作和ANI的大部门冲破，我们在近几年看到并仍然看到今天。

它与机械进修根基沟通：你给算法标记数据，它学会展望标签。机械进修的分歧之处在于您使用了更现代，更复杂的算法，称为神经收集。比拟之下：在机械进修中，您使用更简洁的传统算法。

因为它们的复杂性，新的手艺发现以及充沛的数据和较量能力，深度进修算法可以打破很多义务的先前基准，甚至在个中一些义务上跨越人类（例如：组织病理学图像剖析，或在Netflix上介绍片子）。

固然神经收集（例如深度进修算法）几乎老是比传统算法示意更好，但它们具有某些瑕玷。

我们经常据说神经收集的构建体式与人类大脑相似或受其开导，但实际上，它们几乎与它无关。的确，他们最初受到大脑的开导，但他们工作体式的细节与人类生物大脑的工作体式完全无关。请注重，很多人能够交换地使用术语深度进修和神经收集。

深度进修项目的示例：当我们从高级视图查察时，深度进修项目与机械进修项目没有太大不同。只需要更多数据、更多较量能力和高花样工程师。

数据科学

数据科学项目的输出平日是一组看法，可匡助您做出更好的买卖决议，例如决意是否投资某些器材，是否应该购置某些设备，或许是否应从新构建您的网站。您能够说，数据科学是经由统计方式，可视化等剖析数据来提取数据常识和洞察力的科学。输出平日是演示文稿或幻灯片，总结了高管，向导者或产物团队做出某些决议的结论。

数据科学项目示例：想象一下您是在线告白行业。经由剖析贵公司的发卖数据，您的数据科学家发现旅行行业不会从您那边购置好多产物。是以，您能够将发卖团队的重点转移到旅行行业的公司。

另一个例子：想象一下，您正在经营一家电子商务企业，而且您礼聘了一些数据科学家来更深入地认识您的买卖。该项目的究竟或者是一个幻灯片，介绍若何点窜订价的规划，以便提高整体发卖或洞察若何更有效地..特定产物。有人说AI是数据科学的一个子集，有些人说它是另一种体式。所以，这取决于你与谁攀谈，但我会说数据科学是一个跨学科的范畴，使用AI机械进修和深度进修的很多对象，但它也有本身自力的对象。其方针首要是鞭策买卖洞察力。

您或者还据说过其他风行语，如强化进修，生成性匹敌收集（Gans）等。这些只是使AI系统智能化的其他对象，换句话说，就是说机械进修，有时也是数据科学。

您如今认识AI，机械进修，数据科学和深度进修（例如神经收集）。我进展这能让您认识AI中最常用的术语，而且您能够起头考虑这些事情若何适用于您的买卖。什么是数据？

数据能够采用多种形式：电子表格，图像，音频，传感器数据等。这些可分为两大类：构造化和非构造化数据。

构造化数据（"生活在巨型电子表格中的数据"）构造化数据，就像它的名称所暗示的那样，是按照预界说模式以构造化花样存储的数据。它指的是驻留在记录或文件中的固定字段中的任何数据。它能够是文本的也能够是非文本的。您能够鄙人面看到风行的泰坦尼克号数据集中的构造化数据示例。它包含有关泰坦尼克号上每位乘客的信息。

非构造化数据非构造化数据素质上是未经由预界说模式构建的其他所有内容。它能够是文本的或非文本的，但当人们谈论非构造化数据时，它们首要是指图像，视频，音频文件，文档等。

我已经注释了监视进修的内容。因为监视进修是最常用的机械进修类型，当人们说"数据"时，它们首要是指标记数据。示例：您有一个数据集，个中包含100,000只狗和猫的照片，个中每张照片都有一个标签，"Cat"或"Dog"。另一个例子是包含房价信息的数据集。在这里，您将获得有关衡宇的信息（如平方米，卧室数量，位置等）以及作为标签的价钱。若何获得数据？

能够在互联网上找到很多问题的数据集（一些是免费的，一些是花钱的），但大多数时候需要建立本身的数据集（若是您还没有它），这是专门为你试图用AI解决的问题。

获取数据有三种首要体式：

1.手动标签

想象一下，你想要竖立一个分类器，能够检测给定图片上是否有汉子或女人。要训练如许的分类器，你需要缔造或获得很多男女形象。然后，你需要为每个图像指定一个标签：men（标签1）或女人（标签2）。也能够向人们付费为我们做标签工作。

2.视察行为

想象一下，你经营一家电子商务公司并进展展望客户何时会进行购置，从而使你可以更好地治理股票等。能够经由视察用户在网站上的行为以及若何建立数据集来建立数据集。他们购置。这将导致描述每个用户的把持的数据集（由某些变量描述，例如：一天中的时间，他们点击的位置等），以及标签：购置（标签1）或不购置（标签2））。另一个例子是视察机械的行为，这能够使你展望何时需要维护等。

3.使用免费数据源，购置数据或从合作伙伴处获取数据

像如许的数据集有很多免费资源。还能够使用，其功能雷同于Google，但仅适用于数据集。若是你没有找到任何内容，您能够在数据市场上查找数据集或从合作伙伴处获取数据集。滥用数据

乍一看，获取数据或者看起来很简洁，但或者显现的问题好多。在人工智能和机械进修中，我们说："垃圾中的垃圾"，这意味着在练习时代将AI质量从你的AI系统中提掏出来。

想象一下，您知道您想建立一个特定的AI应用法式并起头获取数据。您的规划是累积数据两年，然后构建AI系统。这是非常糟糕的做法。

在这种情形下，准确的方式是获取您可以获得的数据并尽快将其供应给AI专家。经由一些评估后，他能够敷陈你，它的哪些部门是有效的，哪些部门是完全无用的，以及你应该添加哪些数据。经由如许做，您没有在两年内获取数据的风险，然后您意识到这是错误的数据，而且您无法对其进行任何把持。节约金钱和时间：与专家一路快速评估数据质量。

另一个大问题是标签不准确。示例：标记为狗和狗的猫图像被标记为猫等。这能够防止你的算法进修真正将猫与狗分隔的器材并完全搅浑它。好的一点是，标签不准确的问题变得越来越不主要了。若是你有一个伟大的数据集，有跨越200万个标记的猫和狗图像，一些不准确的标签不会影响其机能。

另一个问题是，有些人认为，因为他们的公司拥有大量数据，这些数据很有效，或许AI团队能够使其有效。那完全错了。固然更多的数据平日更好，但你能够拥稀有十亿的数据条目，值得一提，即使是世界上最好的AI工程师也无法从没有价格的器材中缔造价格。

是以，请不要向ai团队抛出数据，并假设它在某种水平上是有价格的。您或者认为这是常识，但因为对数据和AI的曲解，我在业内多次发现它。甚至有创业公司成立，因为人们认为他们拥有有效的数据，而事实上他们没有。其他问题是贫乏值，多种类型的数据（能够解决 - 但成本奋发）等等。总结

进展这篇文章可以从高条理的角度为人人供应人工智能范畴的靠得住介绍，进展列位如今能够更好地舆解AI的工作道理以及它的真正功能。若是仍然仍然有不清楚的处所，人人能够在谈论中留言。

非技术人工智能科普

相关文章

热点文章

推荐文章