8个顶级AI API平台,用于构建超智能应用
在软件历史上的第一次,企业可以构建真正智能的应用程序。
最棒的部分?
利用这种智能与访问API没有任何区别,这要归功于几个引领变革的AI平台。如果你是一家企业,你不能忽视这些服务提供的可能性。
在2010-20年期间,我们正式进入了人工智能(AI)时代。大多数人环顾四周,说:“嗯,我错过了什么吗?”因为这看起来与AI“福音传教士”和流行文化传播的炒作完全不同。没有巨大的金属乌贼军队来消灭,也没有用类似人类智慧的智能玩心机的游戏。
然而,正如技术总是做的那样,AI已经悄悄地渗透到我们周围的几乎所有事物。虽然这种看起来有点神奇的技术在人类意义上可以说是不聪明的,但是当正确使用时,它的应用确实能够产生近乎神奇的结果。对于普通人来说,AI可能没有任何改变生活的事情(只是每天的改进,无论大小);对于企业来说,它具有无限的创造力、速度、增长等等。
面部识别、物体识别、语音识别等技术承诺提供极其优越的客户体验和几乎不公平的竞争优势。难怪每个企业要么成立一个AI部门,要么思考这些问题。谢天谢地,不需要雇佣一支由博士组成的军队;机器学习(或者更确切地说是机器学习)已经发展到了几个主要和利基的玩家都提供好的REST API服务的地步。
只需要几美元,有时甚至是免费的,你就可以评估这些服务,看看它们是否为你的业务生命周期提供了可靠的价值主张。
是的,一旦你确定了一个服务并开始在生产中使用它,你应该严格关注每月账单。人工智能本质上是在一组非常强大的服务器上处理大量数据(主要使用在显卡中找到的处理器芯片);自然而然,处理大数据和大计算将会更加昂贵。
请不要误会我的意思。
我的意图既不是诋毁这些公司,也不是阻止任何人探索人工智能领域。这些公司已经详细列出了他们的定价计划(或者根据要求提供);除此之外,他们无能为力。因此,当使用情况未经监控(或者更糟糕的是,自动化系统存在错误,导致例如服务器RAM填满,并且在每台新创建的处理这个“负载”的机器中得到复制),责任就像对待电费账单一样落在你身上。
解决方案呢?
哦,这很简单。绝大多数服务提供商都有一个警报系统,你可以指定一个作为警报阈值的金额(比如500美元/月)。因此,一旦你一个月的使用量超过500美元,系统就会向通知部分中提到的每个人发送电子邮件、短信等等。这样的恐慌很难被忽视。😄那么,今天的教训是什么呢?这个财务警报系统是你应该了解的第一件事,也应该是你设置和测试的第一件事。相信我,总有一天你会感谢我的建议。
好了,够啰嗦了!继续列出我发现令人印象深刻的AI平台及其提供的功能。
谷歌
当谈到AI时,谷歌是自然而然首先想到的名字。
第二个名字呢?
嗯,至少我想不出任何一个!😂 谷歌在人工智能讨论中占据了主导地位,原因是有充分的理由。多年来,该公司投入了数十亿美元进行人工智能研究和人才培养。它的几个雄心勃勃的人工智能项目是众所周知的,一瞥最新的作品令人毛骨悚然:
由于拥有这种深厚的专业知识,谷歌在人工智能/机器学习领域提供了一些最高质量的API。让我们来看看他们的一些主要产品。
文本分析(自然语言处理)
人工智能领域的一些最大的飞跃是理解和处理自然语言,无论是书面的还是口头的。谷歌的文本分析API非常强大,提供以下功能:
- 语法分析(分析给定的文本并识别关键部分)
- 实体分析(查找非结构化文档中的发票数据,例如)
- 情感分析(从书面或口头的文字中识别情绪、意图等)
- 多语言(适用于多种语言)
因此,如果您渴望从客户支持聊天中了解客户的情绪,try it out立即行动起来!
预测
如果您拥有自己的模型并希望在新数据上生成预测,谷歌有一个专门的预测服务为您提供支持。如果您希望进行一些非标准或实验性的工作,甚至可以添加自定义代码。预测服务是一个全面的产品,称为AI平台,我们将在下一节进行讨论。
AI平台
了解数据和人工智能的人都知道,整个过程中每一步都可能非常繁琐且耗时。为了解决这些问题,谷歌提供了一个端到端的全面平台,称为AI Platform。这是一个完全托管的数据科学和机器学习服务,旨在使机器学习和数据处理的运营变得尽可能顺畅。
因此,如果您有一个复杂的机器学习设置,并且对于其中的问题和等待感到厌倦,谷歌的AI平台可能值得一试。
描述每个谷歌AI/ML服务是要求太高了,所以感兴趣的人可以前往official docs。那里还有更多严肃、未被探索和令人瞠目结舌的东西!
OpenAI
如果您对人工智能领域有丝毫兴趣,您可能已经注意到GPT-3的出现。它是一个用于处理自然语言的先进机器学习模型,一度引起了(还在引起?)所有人对末日的担忧。GPT-3背后的力量是OpenAI,这是一个旨在培养人工智能领域的研究和合作的组织,而且这一切都是公开的,在当今世界中这是罕见的。
该公司由其中一位创始人埃隆·马斯克广为人知,当它的人工智能研究引起了媒体的大量关注时,该公司逐渐受到大众认可。其中一个例子是该公司的游戏AI与顶级职业DOTA 2玩家对战并战胜他们:
截至撰写本文时,埃隆·马斯克已经不再参与,而且OpenAI并不完全符合其创始原则中的“开放”概念。但这是另一个讨论话题,您可以找到大量相关资料。
对我们来说,最重要的是OpenAI在人工智能领域做出了一些非常具有开创性的工作,特别是在文本处理、视频/image processing等方面。他们提供了多个人工智能服务作为API,我相信每一个服务都有强大的用途。
- 语义搜索:允许基于自然语言提供的查询,在自由格式的文本数据(例如文档)上进行搜索。因此,如果您拥有一个所有链接的数字化图书馆,您可以询问类似“显示客户因解决方案延迟而非常生气的聊天记录列表”。这不是官方示例,但我想清楚地说明可能性!😁
- 聊天机器人:大多数聊天机器人今天只是无尽的遗憾堆积。决定部署它们的企业后悔,创建机器人的开发人员后悔这个无用的创作,浏览网站的客户后悔与机器人互动等等。你懂的。相比之下,OpenAI的聊天能力要优秀得多,尤其是在闲聊、对话的意外转折、间接意图等方面。当然,它并不完美,但它将聊天机器人从讨厌/愚蠢变得有趣。
- 客户服务:如果您担心您必须以某种方式结合上述两个服务来创建可行的客户服务体验,OpenAI已经做到了。有一个专门的客户服务,具有搜索、推荐等功能。
- 文本生成:与我们之前讨论过的GPT-3技术非常相似,OpenAI通过API提供文本生成能力。结果是关于几乎任何事情(甚至抽象和奇怪的东西)的真实、智能的文本,您可以以各种创意方式使用!
- 理解:该服务接受给定的文本并生成其摘要。是的,用它自己的话!这可以节省大量时间,并具有巨大的实用性。在我看来,电子邮件疲劳是一个很好的用例:只需让AI概述消息,您就可以在10分钟内清理收件箱,而不是三个小时!
- 其他工具:OpenAI还有一些其他在实际使用中非常有用的工具/服务。例如,可以将语义搜索结果转换为电子表格,以便进行方便的分析;然后还有一项将文本从一种语言翻译成另一种语言的服务(这是一个非常常见的需求)等等。
虽然OpenAI最近在人工智能领域引起了轰动,但访问其API并不容易。您必须申请加入等待列表;谁能获准,何时以及如何获准仍然是个谜。最后,不要忘记,尽管这些技术非常强大,但它们并不完全成熟。因此,在它们的整个服务范围上加上“beta”标签。尽管如此,我认为申请并在试点项目中尝试一下是值得的。
Microsoft Azure
说到云计算,微软在人工智能领域被认为是遥不可及的第三名(在AWS和谷歌之后)。但这并不意味着该业务面临麻烦;它有自己的特殊策略(迁移现有的Windows业务)并且正在进行自己的竞赛。虽然Azure这个名字很出名,但不为人知的是,Azure在与人工智能相关的服务方面也有强大的供应。来见识一下Azure认知服务吧!
而且,如果你认为微软在人工智能领域什么都没做,那就看看这个:
Azure Cognitive Services 是一个完整的人工智能产品,几乎拥有构建智能、强大应用所需的一切。实际上,他们的大多数API都有有趣且更专业的用例,我认为这给他们带来了优势。这里是他们的主要API及其功能的简要总结:
- 语言:这些API是围绕计算机科学中的自然语言处理构建的。简单来说,它是关于从人类语言中提取意义,生成和处理人类语言(无论是口语还是书面语)。一些有趣的功能包括会话式问答生成器(想象一下在培训/教育/招聘方面的可能性!),将对话智能注入到物联网和其他设备中,对给定文本进行情感分析和其他元数据,翻译(截至撰写本文已有60多种语言)等。
- 语音:这些API为应用程序提供处理人类语音的功能。关键功能包括语音转文本,文本转语音,语音翻译和语音识别。
- 视觉:计算机视觉一直是一个热门话题,虽然离完美还有很大差距,但在存在一定误差的场景中已经足够强大。提供的视觉API包括图像和视频分析,对象识别(在图像和视频中),人脸检测,视频索引器(从视频生成元数据)等。
- 决策:这是一组通用API,帮助提高决策能力或改进基于机器学习的决策过程。在这个范围内提供的功能包括异常检测(对于数据科学家非常有用),内容审核,个性化服务(帮助您为应用程序用户创建智能个性化互动)等。
如今的微软已经发生了很大的变化,明确的愿景和关注云端、服务和集成解决方案。如果您正在运行基于Windows的操作(无论是本地还是云端),将Azure认知API集成到您的产品中的意义更加明显。
AWS AI服务
在讨论基于云的服务和基础设施时,不得不提到亚马逊网络服务(AWS)。我找不到一个非常可靠的来源,所以无法提供链接,但显然,AWS独自占据了约33%的云市场份额。作为一名开发者,我可以证明这个平台对于各种软件架构师、CTO、开发者、业务所有者等有着强大的吸引力。
如果是一个新的SaaS产品,人们希望从一开始就在AWS上托管;如果有扩展或稳定性问题,他们希望将其迁移到AWS。
我并不是说AWS是云基础设施的绝对最佳选择,但它的服务范围和低价策略很难击败。重点是,如果将AI/ML功能集成到您的(新的或现有的)应用程序中,使用AWS永远不会错。
以下是他们的电梯演讲:
在AI/ML方面,AWS提供了几种强大且功能丰富的服务。让我们快速了解一下:
- Polly:文本转语音是当今一个非常需要的功能,特别是因为它允许企业创建真正“活跃”,能够以人类般可信的声音进行对话的智能应用。Amazon Polly正是做到了这一点。虽然输出并不完全如梦想中那样(听一下官方示例 here 和 here),但对于大多数用例来说效果还是相当不错的。
有兴趣尝试这个解决方案吗?看看您可以如何 convert articles into audio。
- 转录:这项服务是Polly的反向过程,将语音转化为文本。我个人可以证明其有效性,因为我在一个项目中使用Transcribe来读取呼叫中心的录音并生成链接_17。输出结果非常准确(虽然我没有统计数据,但我可以说准确率超过95%),它可以轻松地识别不同的口音,即使有一些背景噪音。此外,它生成的元数据数量也非常庞大。
- Rekognition:Rekognition是亚马逊的计算机视觉服务(用于图像和视频)。除了标准的面部识别、物体检测、标注等功能外,它还具有一些有趣的功能,例如内容审核(例如控制孩子在设备上观看的内容)、名人识别、设备识别(用于工人安全和合规性)等。
- 欺诈检测器:欺诈是一个每天都在消耗企业大量资金和精力的泥潭。这项服务通过提供有关新账户创建、来宾结账、在线支付、滥用忠诚计划等方面的链接_18功能来提供帮助。显然,这项服务对电子商务生态系统非常有用。
- Lex:如果聊天机器人是你所热衷的,但你厌倦了无聊、愚蠢的机器人,那么Lex就是值得探索的东西。它具备现代聊天机器人所需的所有功能,而且由于是托管服务,你不必担心运行服务器的问题。
- Kendra:Kendra是一种文档搜索服务,但搜索查询是用人类语言进行的。该服务显然在一些行业拥有深厚的“专业知识”,这意味着如果你的数据恰好来自这些行业之一,搜索可以进行更精确的微调。
AWS还列出了更多的服务,但如果我试图涵盖所有这些,我将用尽纸张和墨水!😁此外,如果我对AWS有一点了解,那就是它遵循链接_19,导致它的服务范围不断扩大。当你阅读这篇文章时,他们的AI服务数量可能已经增加了一倍,甚至增加了十倍!所以,如果你感兴趣,我鼓励你访问链接_20,并花一些时间探索服务、功能、成本等。
由于AWS拥有最高的市场份额,你很有可能已经托管在AWS上。或许你正在考虑将基础设施迁移到AWS?如果是这样,选择AWS AI服务将使你的应用程序能够与其他AWS服务(例如S3、EC2、SNS等)无缝、可靠地配合工作。只要与那些不得不维护分布在不同基础设施上的应用程序的人们交谈,你就会被说服一生。😝
ParallelDots
ParallelDots在知名度上确实远远不及前面列出的公司。然而,他们是一个难得的发现,我认为他们应该更有知名度。
作为一家主要从事人工智能的公司,他们开发了非常有用的工具和行业特定的解决方案。但最重要的是,他们似乎更注重质量而不是数量;在他们的产品菜单中,只有四个项目(至少目前是这样),其中一个项目因为其通用性和高准确性而脱颖而出。我们谈论的服务就是他们的链接_21。
如果你访问上面的链接并向下滚动一点,你会发现一个类似游乐场的实时界面,在这里你可以输入任何文本,并通过点击按钮查看人工智能的分析能力。
顺便说一下,你在截图中看到的文本是他们设置的默认文本。一旦你点击绿色的分析按钮,根据各个类别的文本分析结果将出现在下面(类别是按钮)。
那么,这个API有多好呢?我想自己做一些测试,所以我输入了一些不那么直接的东西——一段摘自现代文学经典之一的散文(对于那些好奇的人,这本书是杰克·克鲁亚克(Jack Kerouac)于1957年写的《在路上》)。让我们先自己读一下这段文本:
对于我来说,唯一的人是那些疯狂的人,那些疯狂地活着,疯狂地说话,疯狂地被拯救,渴望一切的人,那些从不打哈欠或说平常话的人,但像绚丽的黄色罗马烟花一样燃烧、燃烧、燃烧,像蜘蛛一样越过星星。
你对此有何看法?它试图传达什么?你认为它反映了什么样的情绪?停下来思考一下这些问题会很好。
然后我把它粘贴到文本框中并点击了“分析”。以下是结果:
总的来说,非常不错!我选择的散文相当具有挑战性,没有明确表明任何事情。然而,有经验的读者会发现一个明显的痛苦/愤怒的色调。这也是API显示的主要情绪!然而,这段文本并不只是简单的愤怒,这在API的置信度为30.58%中得到了体现。接近20%的“厌倦”和“幸福”得分也是有道理的,因为我认为这些情绪在文本中也有反映,尽管不是占主导地位的情绪。恐惧、悲伤、兴奋……好吧,我又有什么资格说这些在文本中不存在呢?事实上,散文的构图和理解在很大程度上是主观的,所以如果你不同意我的看法,没关系。🙂
然而,就我个人而言,我对ParallelDots的服务同样印象深刻,因为我在上述分析的其他部分中进行了探索。当然,它并不总是完全准确的,而且在一些情况下也很奇怪;但正如我在本文前面写的那样,100%的准确性并不是目标(也许甚至不可实现)。目标是一个强大的人工智能,帮助我们构建那些我们几十年来一直只能梦想的应用程序。
那么,ParallelDots的文本分析服务适合你吗?
如果你的需求仅限于文本分析,你希望获得极高的准确性,并且不喜欢在选择最大的names in the game时得到的关注不足,我会说是的。
IBM Watson
不久前,IBM的沃森项目是一种全能的人工智能,它将一劳永逸地取代人类。它在创造链接_23的同时,打败了最佳的链接_24,并取得了其他成就。即将到来的末日,每个人都是坚信不疑的。快进到2020年,沃森在公众记忆中已经消失。
但这并不意味着它是一个后来被放弃的昙花一现的项目。虽然这种人工智能没有达到其史诗般的潜力(或者说这或许一直是公关策略?!),但链接_25作为IBM企业级人工智能产品的核心仍然存在。
下面是链接_26下提供的关键服务:
- Watson Assistant: 这项服务包含许多组件,旨在改善客户服务体验 – 无论是对于客户还是代理商!帮助代理商快速找到信息以解决查询,理解客户查询并个性化其旅程,提供详细的数据和指标,并从数据中提取洞察力 – Watson Assistant应有尽有。
- RegTech: IBM RegTech是一个重量级服务,旨在提高合规性并将风险管理整合到组织的所有层面。在更细的层面上,它还解决了关键问题,例如付款欺诈、金融犯罪等。
- Watson Health: Watson Health是专门为医疗保健行业提供的高度专业化的人工智能服务。它可以协助研究、诊断成像、优化医疗计划成本和质量等方面的数据需求。
- AIOps: AI + Ops = AIOps,IBM如是说。这是一个专门为优化IT运营的人工智能服务。IT工具链和IT运营可能会变得如此庞大和复杂,以至于没有解决方案在企业级别上似乎可行。在这些情况下,AIOps帮助提前发现问题、解决方案的弹性、改进决策等。
- Watson Media: Watson Media服务是专门针对大规模实时视频流的。人工智能部分使其能够实时生成字幕、视频搜索、视频分析等。由于安全摄像头的视频也是一种实时流,因此Watson Media在威胁检测、物体识别等方面也很合适。
IBM还有其他几个AI服务,您可以在here了解所有服务。IBM是AI服务的可靠选择,但请记住,它们的定位和提供的服务针对的是大型到非常大型企业,所以请确保双方适应。
Rev.ai
Rev.ai是另一个那些相信培养专业知识并擅长少数事情的AI公司。只是他们决定只擅长做一件事。是的,只有一件!语音转文字。是的,这确实是他们唯一提供的服务!甚至没有文字转语音,更不用说其他类别的AI/ML了。
而这种极端甚至有点疯狂的追求的结果是什么?极高的准确性,可以说是世界上最好的之一。他们在this页面上提供了他们的AI的证明。
正如您所见,他们的测试显示Rev.ai比谷歌的语音转文字更准确。该页面上有许多类似的比较(所有比较都是与谷歌相比,并显示超越谷歌),尽管可惜的是没有实时测试环境(我不知道为什么;它会使用大量计算资源吗?还是其他原因?)。但这并不意味着您不能评估该服务;您可以创建一个免费帐户,尽可能详细地审查API。🙂
Rev.ai可能在未来推出更多的服务,我将努力“修复”本文章。然而,今天并非如此,所以如果您想要一个在准确性上毫不妥协的语音转文字服务,Rev.ai值得您关注。
Wit.ai
Wit.ai是一个AI平台,具有高级的语音处理和文本处理能力。是的,这听起来像是其他NLP和文本分析/转录服务,但更多的是:
- Wit.ai是open source。因此,没有任何阻止你从他们的技术中学习或在你的基础设施上托管平台。
- Wit.ai不仅仅是在GitHub上的一些代码转储-它也是一个实际运行的API服务(以HTTP API的形式),对任何人开放使用。
- API服务免费。是的,完全免费!事实上,它是如此自由,以至于没有定价计划存在。🤣🤣
- Wit.ai的目的是可扩展的。也就是说,它的核心目的更多或多少是帮助你(推动你?)创建、训练、测试和使用ML模型。
上面列表中的最后一点(关于可扩展性)需要一些详细说明,所以这里就是:Wit.ai的目的是坐在用户和接受命令并执行操作的设备之间。用户与Wit.ai交谈或发送消息,Wit.ai可以分析消息并生成元数据。一旦它弄清楚了用户想要做什么(在上面的截图中查找“意图”)以及他们如何做(截图中的其他细节:任务和日期时间),它会将相关的命令和信息发送到设备。
我必须强调:Wit.ai的开箱即用功能非常有限。整个想法是推动你创建自己的ML模型,这个过程通常很令人沮丧,但Wit.ai使其变得有趣且容易。这就是它的优势所在。哦,还有,如果你决定使用免费的API,请记住存在速率限制(大约每分钟100-250个请求,具体取决于端点)。
结论
人工智能(AI)、机器学习(ML)、神经网络、数据、模型、训练、预测…这些都不再是时髦词汇了。就像任何突破性技术一样,一旦稳定下来,AI已经成为商品化的。本文讨论的平台为每个人提供了相同的超能力,无论你是初创企业还是行业巨头。
不要忘记探索这些courses to learn AI。
这迫使我警告利益相关者-单独使用AI / ML(无论是否有API)不会神奇地增加你的增长(就像“去社交化”本身无所作为一样)。虽然令人兴奋,但AI已经创造了一个公平竞争的环境。其余的取决于我们。🙂
接下来,探索一些构建现代应用程序的最佳AI frameworks。