# 【春】2024特别关注行业——生成式AI **Published by:** [UME财经](https://paragraph.com/@ume/) **Published on:** 2024-02-10 **URL:** https://paragraph.com/@ume/2024-ai ## Content 新年快乐 2023年是被AIGC点爆的一年,OpenAI的ChatGPT横空出世,人们看到了GPT的魔力,资本更是嗅到了GPT的强大发展前景,正如红杉美国在几个月之前就发表了一篇题为**《生成式AI:一个创造性的新世界》**,去年是第一年,但发展速度超乎想象。 前不久,腾讯研究院也发表了《AIGC发展趋势报告2023——迎接人工智能的下一个时代》,报告预测未来五年10%-30%的互联网图像将由AI生成,AIGC市场规模将在2030年达到1100亿美元。 2024年,我们关注的四大赛道之一——生成式AI。1、如何理解AIGC生态?AIGC,AI Generated Content的缩写,人工智能生成内容。狭义理解,就是利用AI自动生成内容的生产方式,随着AI技术的发展,现在的人工智能生成新的东西,不再是过去那种分析已经存在的东西了,而是从感知理解世界跨越到了生成创造世界,这就有了AIGC的广义理解,像人类一样具备生成创造能力的AI技术。 从潜伏到火爆出圈,AIGC的技术升级速度之快,生态圈也得到了完善,基本形成了以文本(text)、图像(image)、视频(video)、编码(code)、演说(speech)和3D为主的应用生态。资料来源:红杉资本尽管门类之多,并且这几年生态圈会进一步扩大,AI在细分领域的应用也将得到实现,例如AIGC与web3的结合、AIGC与医疗教育的结合等等,但目前我们谈论生成式AI主要说的还是生文生图生视频,偏内容生产。 在这场盛宴中,资本从不缺席,微软从市值接近苹果到超过苹果,最新市值来到3.12万亿美元,打破了苹果创造的最高市值企业记录,成为全球市值最高的企业,**这与微软在AIGC上的布局密不可分。**反观全球市值前十的企业,都或多或少处在AIGC浪潮中,并且都是顶级玩家。资料来源:Global Ranking2024年,AIGC垂直赛道、基础设置和模型优化等等依然会获得资金的涌入。2、盘点AIGC顶级玩家(1)OpenAI和背后的微软 去年Sam Altman奥特曼被OpenAI董事会罢免风波,转手就传出入职微软的消息,这件事将微软推到了ChatGPT台前。其实微软早在2023年一月份的时候就向OpenAI投了100亿美元,成为OpenAI最大的股东,占比49%。 2022年年底OpenAI划时代地发布ChatGPT,一年多的时间GPT也来到了GPT4.0,OpenAI的估值也是一路走高,去年圣诞节的时候,OpenAI就以1000亿美元的估值进行下一轮的融资谈判,如果谈成的话,OpenAI也就成为仅次于SpaceX的第二大估值的美国初创独角兽企业。最近OpenAI似乎在憋着更大的招,代号Q*。怎么理解Q*呢?它基于一种Qlearning的底层逻辑,意思就是能够实现自己学习自己。我们知道GPT3.0几乎学习了整个互联网的内容,但这终究是有限的,人类写的东西学完了怎么办呢?这个时候Q*可以学习自己生成的东西,这有可能代表大模型可以通过学习自己生成的内容来实现自我变强。至今,OpenAI官方没有给出Q*的正式消息。毫无疑问,OpenAI变得越来越神秘,也变得越来越强大。 (2)鸟瞰一生的Google 去年在乌镇有一场医疗峰会,会上医学专家称,现在ChatGPT开的方子可以达到人类的水平,甚至超过,因为它有强大的数据支撑和学习能力。 Google在AIGC的布局虽晚不迟,除了常规的文生图模型、视频生成模型、AI生成广告等等,Google也有两个大招。 其一,Google的医疗人工智能大模型MedLM,据悉准确率现在可以达到86.5%,并已经和生物医药公司、医院机构展开了合作。其二,Google的Project Ellmann,这是一个据说可以“鸟瞰”人们一生的项目,AI大模型会读取用户的数据,包括搜索历史、照片、生活记忆碎片等等,更全面更懂你。试想一下,面对一个清楚你生活一切的ChatGPT,你会问它什么?那时的你就是赤裸裸的,想想其实蛮可怕的。 (3)开源的Meta Meta一来就搞开源,2023年2月24日Meta发布了开源大模型LLaMA。通过数据开源、训练过程开源,每一个人都有机会参与进来,服务社区与开发者,这将是一个十分透明的过程。 不得不说,扎克伯格的骨子里是有元宇宙,是有web3的。当然对于开源的风险也经常被提及,开源之后被有心思的人利用可能会带来灾难,但是不开源被几个科技巨头垄断的ChatGPT,哪一个风险更大?3、理想与现实之间的距离不管ChatGPT的风潮多大,被媒体宣传的多么美好,我们还是要承认理想与现实之间的距离。就像Google的文生视频发布会,宣传片是经过32次试验把每次试验的最好结果剪辑出来生成的。 国内的ChatGPT也发展的很快,阿里、腾讯、百度、360、科大讯分、字节等等大厂纷纷布局,但普遍存在一个问题,ChatGPT解决了什么,解决的是用户需要的吗?一些大厂的产品出来,答非所问,一本正经的胡说八道,能给出“番茄炒篮球”的菜谱,说到底有几百几千亿的数据做支撑,唯独没有学习能力。 简单实测了Pika和Gemini。 Pika是一家做文生视频,国内A股上市公司老板女儿的创业公司,pika一发布,这家上市企业连收几个涨停板。不过说实话,pika的东西真的不能让我满意。下面左边是“拜年”,右边是“新年快乐”的生成视频,很有特点。Gemini是谷歌的大模型。首先,我们用文生图生成happy new year,感觉还不错。然后,我们让Gemini做一个AGI的简单介绍,这份简报足以形成对AGI的初步了解,有框架有条理,分别阐述了什么是AGI、AGI的现状、AGI的挑战、AGI的潜在利益和风险、AGI的发展,最后还附上了补充资料方便用户进一步深入了解。4、生成式AI的两大挑战AIGC对产业、社会带来的可以预见的未来变革,风险也市场被提及,诸如真假信息危害、恶意使用、歧视、人机交互危害等等。我们从实际使用过程中谈生成式AI的安全性和产权问题两大挑战。 安全问题是Ai技术发展和应用中不可避免的。这里不仅包括真假信息安全,对AIGC技术的恶意使用,做一些道德法律不允许的事情,还包括用户隐私和身份安全,Google的鸟瞰模型如何平衡使用体验和用户隐私安全之间的关系。 产权明确问题。现阶段的生成式Ai似乎并没有对生成内容的归属做明确的界定,是属于创作者还是属于ChatGPT还是属于双方,区块链技术或许可以解决部分问题。 ## Publication Information - [UME财经](https://paragraph.com/@ume/): Publication homepage - [All Posts](https://paragraph.com/@ume/): More posts from this publication - [RSS Feed](https://api.paragraph.com/blogs/rss/@ume): Subscribe to updates