编写人工智能驱动的应用程序
Programming an AI-Powered App
介绍
欢迎来到人工智能驱动的应用程序的激动人心的世界!我是 Sandra Rodgers,我将成为您的导师,我们将一起踏上创建人工智能驱动的应用程序的旅程,该应用程序使用一些最新、最强大的人工智能技术。
在整个课程中,您将学习创建真正智能的应用程序所需的技能和技术,该应用程序可以与用户交互、理解自然语言、处理音频输入,甚至分析图像。
人工智能工具和技术
您将获得使用多种知名 AI API 和技术的实践经验。这些行业领先的平台将作为我们人工智能应用程序的构建块。我们将使用的一些技术是:
- 开放人工智能:
- 我们将深入研究 OpenAI 的聊天完成 API,这是一个革命性的工具,使我们的应用程序能够与用户进行自然且动态的对话。
- 深度图:
- 我们将利用 Deepgram 语音识别 API 的强大功能来转录音频文件,从而使我们能够将音频分析无缝集成到我们的应用程序中。
- 复制:
- 我们将了解 Replicate,它是开源 AI 领域的游戏规则改变者。我们将使用它来利用名为 miniGPT 的图像分析模型的强大功能,以便我们的应用程序能够理解图像的内容并智能地响应有关图像的问题。
- 朗链:
- 我们将使用这项技术为我们的应用程序提供独特形式的“记忆”。借助 Langchain,我们的应用程序将能够记住之前的交互,并根据积累的知识做出智能响应。
我们将要构建什么
现在我们对将要学习的所有令人着迷的人工智能技术感到兴奋,让我们看看我们将要构建的内容。
这是一个我们可以用来分析内容(文本、音频或图像)的应用程序。
对于我们的文本分析功能,我们选择文本,然后向人工智能询问相关问题,并得到答复。
它由几个主要元素组成:
- 要添加到我们的文本中的文本区域
- 用于提交问题的输入和按钮
- 一个 div 来呈现 AI 的响应。
对于我们的音频分析功能,我们将音频文件转录为文本。当我们得到转录后,我们会向人工智能询问相关问题。首先将其转录为文本,让我们可以使用与文本分析功能相同的人工智能 – 人工智能以文本形式分析音频。
该功能由转录器组件和聊天窗口组成,与文本分析功能中的聊天窗口类似。
我们还将添加向 AI 询问多个问题的功能,以便我们可以继续向其询问有关音频文件的问题。
最后,我们将构建图像分析功能。对于这一点,我们将在输入中添加一个图像 url。然后我们可以向人工智能询问有关图像的问题。
我们将添加能够提出多个问题的功能。我们将赋予人工智能记忆力,以便它能够记住之前的问题和答案,并掌握对话的整个上下文!
入门
我们现在将设置我们的项目,以便我们可以直接开始构建我们的人工智能应用程序。
该项目的示例代码可以在此处的存储库中找到。我建议您克隆该项目并使用名为的分支starting-code
,其中包含开始构建 AI 功能的代码。
如果您希望看到完成的项目正常运行,您需要添加一个.env
文件。使用.env-example
来作为其中应包含哪些内容的指南。您需要添加 OpenAI、Deepgram 和 Replicate 的 API 密钥。
当我们学习后面介绍每个 API 的课程时,我们将注册每个 API。但如果您想抢占先机,以便看到项目正常运行,可以使用下面的链接进行注册并获取每个 API 的密钥:
Open AI- https://platform.openai.com/signup
Deepgram – https://dpgr.am/deepgram-signup
Replicate- https://replicate.com/
准备构建
现在我们准备开始构建了!在课程的下一课中,我们将学习如何使用 Open AI 的聊天完成 API。这就是著名的 chatGPT 背后的主要技术。我们希望为我们的应用程序提供回答有关文本的问题所需的智能,因此我们将使用 OpenAI 作为人工智能驱动的应用程序的大脑。让我们开始吧!
评论(0)