搜索

个人中心
退出登录

快捷登录
密码登录
新用户注册

验证即登录，未注册则自动创建新账号如果手机号已注册则自动登录

登录即代表您已同意投中网《用户注册服务协议》与《隐私政策》

打开微信扫码分享

投中网 > 业界动态 > 正文

创·享 CGC-XView｜AIGC专场回顾

华创资本 | 华创资本

2022-12-02 14:22:39

一场AIGC带来的奇幻革命

AI-generated content（AIGC，即“AI生成内容”），被认为是颠覆现有内容生产方式的新一代技术，2022年8月，在美国科罗拉多州举办的新兴数字艺术家竞赛中，参赛者 Jason Allen 提交了一幅使用 Midjourney 完成的 AI 生成绘画作品《太空歌剧院》，他没有绘画基础但却获得了“数字艺术/数字修饰照片”类别一等奖，引发了全球科技界对 AIGC 的热议。

应用层快速爆红的背后则是预训练大模型的突破性发展。2020年5月 OpenAI发布了 GPT-3 语言模型，1750亿参数的 GPT-3 在问答、摘要生成、文本生成上展现出极强的通用能力；2021年，OpenAI 为致敬《WALL-E》以及超现实主义画派达利，推出了新型人工智能模型 DALL-E，并快速优化到第二代。2022年9月20日，百度首次发布“2022十大科技前沿发明”，跨模态AIGC 上榜。（编者注：跨模态通用可控AIGC提出语言与视觉统一的理解与生成模型，创新提出融合知识的生成，实现了文本生成、图像生成、视频生成、数字人生成的实用化跨越。可应用于图文转视频、高精度数字人生成、文生图等创新领域，大幅提升内容生产效率。）

随着海外迅速进入商业化和 VC 热捧的 AIGC 应用公司 Jasper AI、Copy.ai、Stability AI 等受到真实热烈的用户好评，以及被称为“模型届的Github”的Hugging Face 的开发者生态崛起，AIGC正在逐步探索性地进入真实工业生产链条，应用到营销、游戏、代码、生命科学等多个领域。

11月19日，创·享 CGC-XView AIGC 专场线下闭门会，来自大厂、创业公司、学界以及投资机构的朋友们齐聚一堂，围绕“生产力的范式转移：一场AIGC带来的奇幻革命“进行了热烈的讨论。

本文摘取了当天讨论部分精彩内容，分享如下：

Outline：

AI 是否真正进入应用爆发的时代，从研究模式转变为商业模式？
AIGC 在文字、图片、视频等领域，能给业务流程带来更深刻的改变吗？真实生产环境中的部署会碰到什么问题？
模型开源化，下游及垂类应用将如何差异性发展自己的优势？
国内生态环境下，大厂会各自建立AI模型，还是会有中国的 OpenAI？
海外由英伟达主导 GPU 和人工智能硬件，国内面临“芯片封锁”等问题该如何应对？
AI 下一步有机会大幅提升效率的会是什么领域？挑战在哪里？

Q1.

中国会诞生自己的OpenAI 吗？

黄民烈：

聆心智能创始人。自然语言生成、对话系统领域专家、清华大学计算机科学与技术系长聘副教授

中国和北美的商业和科技环境不一样，OpenAI这种技术见长的公司需要很多特别牛的工程技术人才，同时也非常烧钱。Open AI 现在收入应该比较少，远远覆盖不了支出，需要雄厚资本的支撑，这样的资本投入在中国还是挺难复制的，需要有远见的资金方支持。从技术层面来讲，中国人的技术不亚于欧美。在本土化实践技术、中文大模型等方面，我们甚至某些方面领先。

钟凯祺：

某大厂数据科学家

AI 技术的创新本质上是开创性的工作，背后一定要有一家大型的公司做资金支持，因为它是烧很多钱却看不到明确短期收益的事。如果要在国内做，问题就是谁来出钱。目前国内大厂暂时都更在乎经济上的表现。AI 技术需要短期内用大的资本投入去引领未来开创型的模型，用短期的投入换10年后千倍收益的事。我理解大厂们现阶段很难是引领者或规划者，可能更多是技术追随者。当技术相对明确后，大厂的优势是能够快速跟上，找到落地场景，做大规模的落地，从而转变为企业内部价值和用户价值。

胡家康：

就职于某大厂，负责AIGC/大模型相关的战略和投资

在我们的 2C 应用里，已经有不少内容是 AI 生成的了，甚至有一些广告的文案的撰写已经在大规模落地使用 AIGC 技术。我理解我们做这事的一个优势就是，投入资源做出来的一个大模型，它在内部是可以带来价值的。对外的价值点在于，一是，面向创作者或者广告主提供生产力工具；二是，技术引领；三是，开放API接口给应用层。不管做 GPT-3 还是 DALLE2，其实都是开放了一个 API 接口，让大家做应用。

Q2.

当下是否到了应用大爆发的阶段？

陈雨恒：

rct AI创始人&CEO

我在硅谷，接触的大部分投资人都很看重商业化落地，非常看重项目的metric，以及是否有很好的应用场景切入。例如，jasper.ai 是具有标杆性的，它的增量做得非常好，一年收入做到了9000多万美金。我觉得未来5~6个月的时间，甚至是明年下半年，市场上才能迎来在产品侧或者商业侧的小高潮。大家还需要时间和资本来持续投入，总得来说行业都在追求实际的商业价值。

闫俊宇：

计算机在读博士，北航 VR 国家重点实验室

从去年开始，学术界在多模态和 AI 生成方面有了比较大的突破，并且开始迅速迭代，一步步向业界演化渗透，今年上半年国内外很多比较好的案例和产品被快速推出，年中伴随着红杉美国的报告，AIGC 在资本界迅速爆红，这里有明确的过程的演化。同时，如果我们横向看，去年底开始AIgenerativemode在不同的领域中也同样迅速发展，比如在蛋白质设计和电路设计等都有了彻底超越传统方法，并且可以应用于实践的 AI based mode。但在迅速发展的同时，我们也能看到这些尚处于相对早期，技术扩展是需要时间的。从理论、学术领域向其它领域拓展需要时间，从一个学术领域向其它服务领域的拓展的过程，也需要时间。现在最能够容易看到和离产品最近的，比如娱乐产业方面。向更深的工业领域渗透，塑造更大的变革不会是一蹴而就的。从现在开始算，明年下半年以及往后是一个持续扩张的浪潮，这个浪潮同时伴随着横向领域和纵向深度（和模式）的拓展，大家还是要从两个方面都进行关注。

王思捷：

启元世界战略副总裁

AIGC 应用的场景拓展，可能跟 unity/Unreal 有点类似，先在某一个比较直接的场景落地，比如游戏，再拓展到其他相似的数字孪生领域。启元提供的游戏策划端离线工具，可以用深度强化学习技术辅助策划生成游戏关卡、数值，也已经用到生成式大模型生成对话和做剧情创作。我们也在研究现在最火的文生图，如何真正地跟游戏美术结合在一起。文生图看上去很好，但可能对游戏美术画师来说没有多大价值。在整个生产流程中的前10%，即创意阶段，会有一定的参考作用，但仍无法嵌入到游戏美术生产流程，完整替代某一个环节。举个例子，比如线稿透视笔触，现在的技术根本无法在这个维度上去做调整，AIGC 还理解不了。所以我目前感觉文生图大规模商业应用并不会那么快，未形成和场景的深度耦合。

Q3.

真实生产环境中模型落地的问题，是否有解决方案？

黄民烈：

过去两三年，技术得到了很大的发展。AI 模型在对话、智能写作、图像生成等领域已经接近甚至超过人类的水平。今天我们已经具备了做商业落地的可能性，找到比较好的场景。我们处在一个非常好的起点和时机，跟一些特定应用场景结合起来落地，商业路径上也会比较顺利一点。

闫俊宇：

从商业的角度来看，关键是用好现有的技术水平解决需求，解决市场需求是第一位的。模型不能落地说明这个 PMF 是伪拟合的，这根本上不只是技术的问题，是商业逻辑就有问题。技术的发展是连续的，是一步步积累的，把需求的解决，寄希望于新技术的突然爆发是比较冒险的事。但整体而言，AI 在越来越多的领域展现了可喜的进步，一个阶段的技术可以做出一个阶段的产品，满足一个阶段的需求，如果目前落不了地，那就去看看能用哪些落地的模型去解决其他问题。目前大型的工程，虽然使用了大量的数据，每个模块做了很多精巧的调整，看起来能解决很多通用问题，但是模型的作用、意涵、能解决哪些问题都是非常明确的，不能指望模型变大了，解决的问题更多更综合了，就更好落地了，落地不落地也不能单纯从技术侧去讨论。而且创业公司也不是要解决模型层的问题，是要解决技术和需求匹配的问题。

Q4.

下游具体的场景和用户的数据是非常重要的。大厂的数据优势是否有助于解决方案？

钟凯祺：

我理解当下 AIGC 的模型，创业公司也好，大厂也好，做的都是用产品去适配，让 AI 和人类之间能更好地互相理解，包括有很多 Prompt Engineering 的库，其实也试着在人类和 AI 之间搭桥，短期之内的突破肯定是来自于产品上的演进。

技术侧可以突破的点有两个，一个是可控性，一个是可解释性。当下的 AIGC 还有一定的黑盒性质，可控性决定着在工业的生产下，更加精准和稳定。可解释性，可以部分帮助解决版权问题。AIGC 有一个很重要的关键点，就是版权和确权很多时候会出问题。过去的5年，研究深度学习的人越来越多，如果把数据资产和数据的确权的问题给解决好，是一个比较重要的方向。

胡家康：

我们去年年底已经发布了文生图，还有文本生成的 demo，但当时用户量不及现在。今年4月份这一波火了之后，大家的应用场景越来越多。这个领域技术迭代的加速度非常之快，吸引了更多的创业者进入，相信大家会碰撞出更多的想法。

这个领域是一种全新的应用形态，对产品经理是个非常大的考验。整个创业生态一起探索创新，会给技术一个加速度。从技术迭代到应用玩法的加速度，这两波叠加在一起，我们是非常看好这一波机会的。

Q5.

垂直应用的差异性壁垒在哪？

于春景：

心识宇宙研究院院长

对比现在基于大数据、神经网络或其它单一进路的人工智能，我们一开始就想做一个通用的数字心智系统，像人一样，它能够从内在系统上沟通所有的信息，所有的感官输入，包括所有的单点任务 AI 能力，这是我们做的底座。我们推出了一个小程序，叫万物总动员，任意扫一个物品，跟物品进行对话，运用的就是我们一部分的开放式对话能力。现在的预训练大模型是一个类似人的直觉系统，很简单，但数据量很大，类似一个潜意识系统，但没有像人的语言智能或推理智能，本质一种被动的统计学习。它没有像人那样的工作记忆系统（Working memory），在一个全局空间（Global Workspace）有自己的人格和记忆、或像自我意识那样的念流。比如你和很多机器人对话，上一句跟你很亲，下去问问我是谁，他不认识你了或和前面无关了。这就是我们研发MindOS 系统，相信过不了多久大家就能像捏人一样捏心了。其实相比于今年Yann LeC un 或其它几位AI大佬提倡基于世界模型的自主通用智能或NeuroAI，我们很早就开始涉及我们称之为 MindAI 方面研究，专注于虚拟人心智的赛道。在我们看来它最关键是这样一个内在心智系统底层，加上外部跟别人的开放交互和实时数据输入。我们把两部分结合起来，就相当于把神经 AI 、任务式AI 、AIGC、C端流量等系统统一到一个界面，这就是我们致力于打造的壁垒。

李文珏：

聆心智能联合创始人

我们底层确实用了大模型，也不只是用了大模型，对话会比文图或者写作更复杂、更难一些，但大模型只能提供比较基础的对话能力，但如果我们要提供支持灵活定制的灵魂引擎，还需要知识、情感、个性等额外的关键技术。比如，知识表示和知识融合；情感分两个方面，一要是能够识别说话人的情绪和背后隐藏的意图，就是言外之意。最难的是机器人的个性和风格，比如是霸道总裁型或者是温柔型等等。我们希望每个 AI 智能体都能有“灵魂”，那就是 TA 要有思想、见识、有观点、态度，有个性和风格。

陈雨恒：

欧美的大厂和创业公司之间的生态比国内更成熟一些。其实是分两个方向，一是做基础设施型、平台型的，以技术为重；另外一种是应用场景，明确解决某个场景的需求，并用现在的技术就能够解决。产品做增长，有增长就有数据，数据的积累跟社区也是分不开的。

硅谷的创业氛围，特别对早期的用户，通常是建立一个社区，通过社区形成付费用户群体。有一些创业公司在非常垂直的且定义清晰的场景里做产品，非常清楚这个场景面对的用户群体，基于用户增长有了数据，有了数据就可以转化，逐步建立起忠实的客户群之后，它在这个特定场景积累的数据就是它的壁垒之一。我觉得 AIGC 公司大部分都是在找这样一个特定的场景，解决细分的需求。例如 Replika，2019年给国内的朋友看，当时他们一个月大概赚2-3万美金，只有几千个付费用户，2021年已经超过1000万用户，说明已经围绕一个忠实的付费客户群体发生了显著的增长。所以我觉得核心还是围绕增长，基于数据的基础上建立自己的壁垒。

Q6.

听起来数据决定了壁垒。那么，拥有数据优势的大厂，垄断性威胁是否存在？

胡家康：

国外已经形成了比较明确的分工体系——OpenAI 提供技术模型 GPT-3，创业公司在上面翻新模型，得到返回数据，不断优化模型，在技术上形成竞争力和壁垒。我们也希望中国能够走出这样的模式，比如有几家企业集中地买好服务器、资源，做好性能优化，把基础模型做好点，提供给应用层公司。应用层公司再基于自己的板块数据和场景，把模型翻新得更好，这是一种更良性的生态。比如文生图的应用，已经开始和垂直行业做结合。

Q7.

芯片封锁会是未来发展的潜在瓶颈吗？

闫俊宇：

影响是实际存在的，但这可能不是国内某一家商业公司能够突破的。目前，对创业公司而言，短期还好（规模、体量、时间尺度）。体量上，创业公司需求并不大，或总能有方法来满足相关的标准；而且其中变数较多，影响的是方方面面。但对创业公司来说，目前面临的主要问题不是显卡，创业公司做不好不能赖显卡。

陈雨恒：

撇开技术本身，这个问题不是我们能讨论得出来的，作为创业者聊这个问题没有意义。假设这个事情一定会往极端的方向走，我觉得更需要像百度、华为这样的公司，在国内建立完善健康的开发者生态，再去服务创业者。所以不如做好分工，把生态上下游都建立起来，而不是所有人都去想着解决终端需求。

Q8.

AI行业的下一个机会在哪？

王思捷：

不断给成熟技术找到真正刚需的具体场景。启元之前主要是在数字娱乐场景和一些科研项目中，后面会探索包括元宇宙、数字人等，这也是游戏公司包括3D 引擎公司本身在破圈探索的领域。AI 公司重要的是形成可以由用户自助使用，可规模化扩展的产品，不一定要纯 to C，比如 Jasper.ai 生成营销文案，很难说到底是 C 端还是 B 端的工具。

赵亿阳：

云知声联合创始人、首席战略官

我想到三个关键词。

第一个是时间感。人工智能的概念至今差不多 60 多年了，并不是从 AlphaGo 战胜李世石开始的，要看在19世纪60年代、70年代、80 年代、90 年代发生了什么，时间是连续性的，大家通过自己正在做的事情可能会有一些启发。

第二个是空间感。我们属于中国的创业公司，在本土发展时，一定要符合国情。除了中、美以外，也可以关注一下印度、一带一路沿线国家在发生什么，这些市场可能也有属于自己的 AI 创业机会，而这些机会也许在商业上非常好复制中国5 年前、美国10 年前的道路，这是个非常大的机会。

第三个是系统观念。我们非常在乎业务和收入怎么落地。现在环境变了，客户结构发生巨大变化，必须清楚我们的客户是谁？他们在哪里？这是生命线的问题；第二，以我们的基因能够提供什么样的产品靠近客户；第三是方式和方法，短期之内，个人建议可以关注以场景为中心的知识图谱产品。

黄民烈：

从智能的角度来讲，感知智能、认知智能，最后才是通用人工智能 AGI，AGI的最终目标就是无障碍的人机交互。现在文生图已经非常卷了，一些非常低成本的工具开始出现。如果聚焦未来1~2 年，Character.ai 已经是很好的样板了，可以关注认知智能这个方向，尤其中文对话，中文比英文更难做，在技术上我们大概有0.5 年的技术滞后，英文做得比较好才会反映到中文上。但我们中文对话的能力已经在世界上领先，超过了 Character ai 的中文能力。

网站编辑：郭靖