新一代人工智能发展规划

阳光普照行业应用 2025-02-20 11:03:56 132阅读 举报
来自于公众号: 数字化深度思考者

一文快速盘点Al新技术新动向

国务院发布《新一代人工智能发展规划》2025年部分AI技术达到世界领先水平,2030年成为世界主要人工智能创新中心

一、人工智能成都三大阶段:ANI、AGI、ASI弱、强、超人工智能

著名的人工智能巨头Open AI 公司提出的人工智能5级标准:

第一级:聊天机器人,具有会话语言的人工智能

第二级:推理者,解决人类水平问题的人工智能

第三级:代理,能够代表用户采取行动的人工智能    

AI Agent目前被火爆炒作!OpenAI将AI Agent定义为“以大语言模型LLM为大脑驱动的系统,具备自主理解、感知、规划、记忆和使用工具的能力,能够自动化执行完成复杂任务的系统。”

从AI Agent到“数字员工“


第四级:创新者,能够帮助发明的人工智能   

第五级:组织者,能够完成组织工作的人工智能

二、人工智能三大学派

三、人工智能三大核心要素:算法(机器学习、深度学习)、算力(AI芯片、GPU)和数据(DT, Daas)

四、AI产业链

AI产业链分基础层、技术层和应用曾并逐步延伸。    

五、生成式人工智能AIGC –AI 2.0时代

人工智能生成内容(Artificial Intelligence Generated Content,AIGC)是人工智能1.0时代进入2.0时代的重要标志。

AIGC多以单模型应用的形式出现,主要分为文本生成、图像生成、视频生成、音频生成,其中文本生成成为其他内容生成的基础。

1.文本生成    

文本生成(AI Text Generation),人工智能文本生成是使用人工智能(AI)算法和模型来生成模仿人类书写内容的文本。它涉及在现有文本的大型数据集上训练机器学习模型,以生成在风格、语气和内容上与输入数据相似的新文本。 

2.图像生成

图像生成(AI Image Generation),人工智能(AI)可用于生成非人类艺术家作品的图像。这种类型的图像被称为“人工智能生成的图像”。人工智能图像可以是现实的或抽象的,也可以传达特定的主题或信息。 

3.语音生成

语音生成(AI Audio Generation),AIGC的音频生成技术可以分为两类,分别是文本到语音合成和语音克隆。文本到语音合成需要输入文本并输出特定说话者的语音,主要用于机器人和语音播报任务。到目前为止,文本转语音任务已经相对成熟,语音质量已达到自然标准,未来将向更具情感的语音合成和小样本语音学习方向发展;语音克隆以给定的目标语音作为输入,然后将输入语音或文本转换为目标说话人的语音。此类任务用于智能配音等类似场景,合成特定说话人的语音。 

4.视频生成

视频生成(AI Video Generation),AIGC已被用于视频剪辑处理以生成预告片和宣传视频。工作流程类似于图像生成,视频的每一帧都在帧级别进行处理,然后利用 AI 算法检测视频片段。AIGC生成引人入胜且高效的宣传视频的能力是通过结合不同的AI算法实现的。凭借其先进的功能和日益普及,AIGC可能会继续革新视频内容的创建和营销方式。

版权声明:
作者:阳光普照
链接:https://www.erpcool.com/p/19a4d23b34a22d.html
来源:行业应用
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以点击 “举报”


登录 后发表评论
0条评论
还没有人评论过~