新一代人工智能发展规划

来自于公众号：数字化深度思考者

一文快速盘点Al新技术新动向

国务院发布《新一代人工智能发展规划》2025年部分AI技术达到世界领先水平，2030年成为世界主要人工智能创新中心

一、人工智能成都三大阶段：ANI、AGI、ASI弱、强、超人工智能

著名的人工智能巨头Open AI 公司提出的人工智能5级标准：

第一级：聊天机器人，具有会话语言的人工智能

第二级：推理者，解决人类水平问题的人工智能

第三级：代理，能够代表用户采取行动的人工智能

AI Agent目前被火爆炒作！OpenAI将AI Agent定义为“以大语言模型LLM为大脑驱动的系统，具备自主理解、感知、规划、记忆和使用工具的能力，能够自动化执行完成复杂任务的系统。”

从AI Agent到“数字员工“

第四级：创新者，能够帮助发明的人工智能

第五级：组织者，能够完成组织工作的人工智能

二、人工智能三大学派

三、人工智能三大核心要素：算法(机器学习、深度学习)、算力（AI芯片、GPU）和数据（DT, Daas）

四、AI产业链

AI产业链分基础层、技术层和应用曾并逐步延伸。

五、生成式人工智能AIGC –AI 2.0时代

人工智能生成内容（Artificial Intelligence Generated Content，AIGC）是人工智能1.0时代进入2.0时代的重要标志。

AIGC多以单模型应用的形式出现，主要分为文本生成、图像生成、视频生成、音频生成，其中文本生成成为其他内容生成的基础。

1.文本生成

文本生成（AI Text Generation），人工智能文本生成是使用人工智能(AI)算法和模型来生成模仿人类书写内容的文本。它涉及在现有文本的大型数据集上训练机器学习模型，以生成在风格、语气和内容上与输入数据相似的新文本。

2.图像生成

图像生成（AI Image Generation），人工智能(AI)可用于生成非人类艺术家作品的图像。这种类型的图像被称为“人工智能生成的图像”。人工智能图像可以是现实的或抽象的，也可以传达特定的主题或信息。

3.语音生成

语音生成（AI Audio Generation），AIGC的音频生成技术可以分为两类，分别是文本到语音合成和语音克隆。文本到语音合成需要输入文本并输出特定说话者的语音，主要用于机器人和语音播报任务。到目前为止，文本转语音任务已经相对成熟，语音质量已达到自然标准，未来将向更具情感的语音合成和小样本语音学习方向发展；语音克隆以给定的目标语音作为输入，然后将输入语音或文本转换为目标说话人的语音。此类任务用于智能配音等类似场景，合成特定说话人的语音。

4.视频生成

视频生成（AI Video Generation），AIGC已被用于视频剪辑处理以生成预告片和宣传视频。工作流程类似于图像生成，视频的每一帧都在帧级别进行处理，然后利用 AI 算法检测视频片段。AIGC生成引人入胜且高效的宣传视频的能力是通过结合不同的AI算法实现的。凭借其先进的功能和日益普及，AIGC可能会继续革新视频内容的创建和营销方式。

新一代人工智能发展规划

相关问题

相关文章