# 【春】2024特别关注行业——生成式AI

By [UME财经](https://paragraph.com/@ume) · 2024-02-10

---

**新年快乐**

2023年是被AIGC点爆的一年，OpenAI的ChatGPT横空出世，人们看到了GPT的魔力，资本更是嗅到了GPT的强大发展前景，正如红杉美国在几个月之前就发表了一篇题为\*\*《生成式AI：一个创造性的新世界》\*\*，去年是第一年，但发展速度超乎想象。

前不久，腾讯研究院也发表了《AIGC发展趋势报告2023——迎接人工智能的下一个时代》，报告预测**未来五年10%-30%的互联网图像将由AI生成，AIGC市场规模将在2030年达到1100亿美元。**

2024年，我们关注的四大赛道之一——**生成式AI**。

### 1、如何理解AIGC生态？

AIGC，AI Generated Content的缩写，人工智能生成内容。狭义理解，就是利用AI自动生成内容的生产方式，随着AI技术的发展，现在的人工智能生成新的东西，不再是过去那种分析已经存在的东西了，而是从感知理解世界跨越到了生成创造世界，这就有了AIGC的广义理解，**像人类一样具备生成创造能力的AI技术。**

从潜伏到火爆出圈，AIGC的技术升级速度之快，生态圈也得到了完善，基本形成了以文本(text)、图像(image)、视频(video)、编码(code)、演说(speech)和3D为主的应用生态。

![资料来源：红杉资本](https://storage.googleapis.com/papyrus_images/b05066accd9a6547122c2b1b7dc5fb5831824d54b7ddf87b2aacc6cfb6972295.png)

资料来源：红杉资本

尽管门类之多，并且这几年生态圈会进一步扩大，AI在细分领域的应用也将得到实现，例如AIGC与web3的结合、AIGC与医疗教育的结合等等，但目前我们谈论生成式AI主要说的还是生文生图生视频，偏内容生产。

在这场盛宴中，资本从不缺席，微软从市值接近苹果到超过苹果，最新市值来到3.12万亿美元，打破了苹果创造的最高市值企业记录，成为全球市值最高的企业，\*\*这与微软在AIGC上的布局密不可分。\*\*反观全球市值前十的企业，都或多或少处在AIGC浪潮中，并且都是顶级玩家。

![资料来源：Global Ranking](https://storage.googleapis.com/papyrus_images/6f980197624e3659577a8f8cf62d508bd83775d807c1c00eb0cebdc882ee4fb2.png)

资料来源：Global Ranking

2024年，AIGC垂直赛道、基础设置和模型优化等等依然会获得资金的涌入。

### 2、盘点AIGC顶级玩家

（1）OpenAI和背后的微软

去年Sam Altman奥特曼被OpenAI董事会罢免风波，转手就传出入职微软的消息，这件事将微软推到了ChatGPT台前。其实**微软早在2023年一月份的时候就向OpenAI投了100亿美元**，成为OpenAI最大的股东，占比49%。

2022年年底OpenAI划时代地发布ChatGPT，一年多的时间GPT也来到了GPT4.0，OpenAI的估值也是一路走高，去年圣诞节的时候，OpenAI就以**1000亿美元的估值**进行下一轮的融资谈判，如果谈成的话，OpenAI也就成为仅次于SpaceX的第二大估值的美国初创独角兽企业。

![](https://storage.googleapis.com/papyrus_images/663f2cf47cd9d053847bc90d7330d48b8a49b57fba996bc9fa8193fed54f031d.png)

最近OpenAI似乎在憋着更大的招，**代号Q\***。怎么理解Q\*呢？它基于一种Qlearning的底层逻辑，意思就是能够实现自己学习自己。我们知道GPT3.0几乎学习了整个互联网的内容，但这终究是有限的，人类写的东西学完了怎么办呢？这个时候Q\*可以学习自己生成的东西，这有可能代表**大模型可以通过学习自己生成的内容来实现自我变强**。至今，OpenAI官方没有给出Q\*的正式消息。

![](https://storage.googleapis.com/papyrus_images/c27f61facd8b89eece4b9db420129c52ce359c746df99226c3a6a9acf57026fe.png)

毫无疑问，**OpenAI变得越来越神秘，也变得越来越强大。**

（2）鸟瞰一生的Google

去年在乌镇有一场医疗峰会，会上医学专家称，现在ChatGPT开的方子可以达到人类的水平，甚至超过，因为它有强大的数据支撑和学习能力。

Google在AIGC的布局虽晚不迟，除了常规的文生图模型、视频生成模型、AI生成广告等等，Google也有两个大招。

其一，Google的**医疗人工智能大模型MedLM**，据悉准确率现在可以达到86.5%，并已经和生物医药公司、医院机构展开了合作。

![](https://storage.googleapis.com/papyrus_images/e5b665908e62816aa0ec83576c578fba751867365d75c73b4b2d50805e46038c.png)

其二，Google的**Project Ellmann**，这是一个据说可以“鸟瞰”人们一生的项目，AI大模型会读取用户的数据，包括搜索历史、照片、生活记忆碎片等等，更全面更懂你。试想一下，面对一个清楚你生活一切的ChatGPT，你会问它什么？那时的你就是赤裸裸的，想想其实蛮可怕的。

（3）开源的Meta

Meta一来就搞开源，2023年2月24日Meta发布了**开源大模型LLaMA**。通过数据开源、训练过程开源，每一个人都有机会参与进来，服务社区与开发者，这将是一个十分透明的过程。

不得不说，扎克伯格的骨子里是有元宇宙，是有web3的。当然对于开源的风险也经常被提及，开源之后被有心思的人利用可能会带来灾难，但是不开源被几个科技巨头垄断的ChatGPT，哪一个风险更大？

### 3、理想与现实之间的距离

不管ChatGPT的风潮多大，被媒体宣传的多么美好，我们还是要承认理想与现实之间的距离。就像Google的文生视频发布会，宣传片是经过32次试验把每次试验的最好结果剪辑出来生成的。

国内的ChatGPT也发展的很快，阿里、腾讯、百度、360、科大讯分、字节等等大厂纷纷布局，但普遍存在一个问题，ChatGPT解决了什么，解决的是用户需要的吗？一些大厂的产品出来，答非所问，一本正经的胡说八道，能给出“番茄炒篮球”的菜谱，说到底有几百几千亿的数据做支撑，**唯独没有学习能力。**

简单实测了Pika和Gemini。

**Pika是一家做文生视频**，国内A股上市公司老板女儿的创业公司，pika一发布，这家上市企业连收几个涨停板。不过说实话，pika的东西真的不能让我满意。下面左边是“拜年”，右边是“新年快乐”的生成视频，很有特点。

![](https://storage.googleapis.com/papyrus_images/c0390a7e95cd69fc489eb56ef09b1f34d5b21798900c31ce180483021f7f1708.png)

**Gemini是谷歌的大模型**。首先，我们用文生图生成happy new year，感觉还不错。

![](https://storage.googleapis.com/papyrus_images/c8382c68cf241733530956f76ca5727916cdfd0ac23630aba53cbee2cac4176a.png)

然后，我们让Gemini做一个AGI的简单介绍，

![](https://storage.googleapis.com/papyrus_images/0b430e26fcd7811fe5c5757605d7ff0f5a783c340f710b5885ea621044d751c2.png)

这份简报足以形成对AGI的初步了解，有框架有条理，分别阐述了什么是AGI、AGI的现状、AGI的挑战、AGI的潜在利益和风险、AGI的发展，最后还附上了补充资料方便用户进一步深入了解。

### 4、生成式AI的两大挑战

AIGC对产业、社会带来的可以预见的未来变革，风险也市场被提及，诸如真假信息危害、恶意使用、歧视、人机交互危害等等。我们从实际使用过程中谈生成式AI的安全性和产权问题两大挑战。

**安全问题**是Ai技术发展和应用中不可避免的。这里不仅包括真假信息安全，对AIGC技术的恶意使用，做一些道德法律不允许的事情，还包括用户隐私和身份安全，Google的鸟瞰模型如何平衡使用体验和用户隐私安全之间的关系。

**产权明确问题**。现阶段的生成式Ai似乎并没有对生成内容的归属做明确的界定，是属于创作者还是属于ChatGPT还是属于双方，区块链技术或许可以解决部分问题。

---

*Originally published on [UME财经](https://paragraph.com/@ume/2024-ai)*
