投中网
搜索
登录 | 注册
投中网  >  业界动态  >  正文

创·享 CGC-XView|AIGC专场回顾

华创资本   |   华创资本
2022-12-02 14:22:39

一场AIGC带来的奇幻革命

图片

AI-generated content(AIGC,即“AI生成内容”),被认为是颠覆现有内容生产方式的新一代技术,2022年8月,在美国科罗拉多州举办的新兴数字艺术家竞赛中,参赛者 Jason Allen 提交了一幅使用 Midjourney 完成的 AI 生成绘画作品《太空歌剧院》,他没有绘画基础但却获得了“数字艺术/数字修饰照片”类别一等奖,引发了全球科技界对 AIGC 的热议。

应用层快速爆红的背后则是预训练大模型的突破性发展。2020年5月 OpenAI发布了 GPT-3 语言模型,1750亿参数的 GPT-3 在问答、摘要生成、文本生成上展现出极强的通用能力;2021年,OpenAI 为致敬《WALL-E》以及超现实主义画派达利,推出了新型人工智能模型 DALL-E,并快速优化到第二代。2022年9月20日,百度首次发布“2022十大科技前沿发明”,跨模态AIGC 上榜。(编者注:跨模态通用可控AIGC提出语言与视觉统一的理解与生成模型,创新提出融合知识的生成,实现了文本生成、图像生成、视频生成、数字人生成的实用化跨越。可应用于图文转视频、高精度数字人生成、文生图等创新领域,大幅提升内容生产效率。)

随着海外迅速进入商业化和 VC 热捧的 AIGC 应用公司 Jasper AI、Copy.ai、Stability AI 等受到真实热烈的用户好评,以及被称为“模型届的Github”的Hugging Face 的开发者生态崛起,AIGC正在逐步探索性地进入真实工业生产链条,应用到营销、游戏、代码、生命科学等多个领域。

11月19日,创·享 CGC-XView AIGC 专场线下闭门会,来自大厂、创业公司、学界以及投资机构的朋友们齐聚一堂,围绕“生产力的范式转移:一场AIGC带来的奇幻革命“进行了热烈的讨论。

本文摘取了当天讨论部分精彩内容,分享如下:

Outline:

    • AI 是否真正进入应用爆发的时代,从研究模式转变为商业模式?

    • AIGC 在文字、图片、视频等领域,能给业务流程带来更深刻的改变吗?真实生产环境中的部署会碰到什么问题?

    • 模型开源化,下游及垂类应用将如何差异性发展自己的优势?

    • 国内生态环境下,大厂会各自建立AI模型,还是会有中国的 OpenAI?

    • 海外由英伟达主导 GPU 和人工智能硬件,国内面临“芯片封锁”等问题该如何应对?

    • AI 下一步有机会大幅提升效率的会是什么领域?挑战在哪里?

Q1. 

中国会诞生自己的OpenAI 吗?

黄民烈:

聆心智能创始人。自然语言生成、对话系统领域专家、清华大学计算机科学与技术系长聘副教授

中国和北美的商业和科技环境不一样,OpenAI这种技术见长的公司需要很多特别牛的工程技术人才,同时也非常烧钱。Open AI 现在收入应该比较少,远远覆盖不了支出,需要雄厚资本的支撑,这样的资本投入在中国还是挺难复制的,需要有远见的资金方支持。从技术层面来讲,中国人的技术不亚于欧美。在本土化实践技术、中文大模型等方面,我们甚至某些方面领先。

钟凯祺:

某大厂数据科学家

AI 技术的创新本质上是开创性的工作,背后一定要有一家大型的公司做资金支持,因为它是烧很多钱却看不到明确短期收益的事。如果要在国内做,问题就是谁来出钱。目前国内大厂暂时都更在乎经济上的表现。AI 技术需要短期内用大的资本投入去引领未来开创型的模型,用短期的投入换10年后千倍收益的事。我理解大厂们现阶段很难是引领者或规划者,可能更多是技术追随者。当技术相对明确后,大厂的优势是能够快速跟上,找到落地场景,做大规模的落地,从而转变为企业内部价值和用户价值。

胡家康:

就职于某大厂,负责AIGC/大模型相关的战略和投资

在我们的 2C 应用里,已经有不少内容是 AI 生成的了,甚至有一些广告的文案的撰写已经在大规模落地使用 AIGC 技术。我理解我们做这事的一个优势就是,投入资源做出来的一个大模型,它在内部是可以带来价值的。对外的价值点在于,一是,面向创作者或者广告主提供生产力工具;二是,技术引领;三是,开放API接口给应用层。不管做 GPT-3 还是 DALLE2,其实都是开放了一个 API 接口,让大家做应用。

Q2.

当下是否到了应用大爆发的阶段?

陈雨恒:

rct AI创始人&CEO

我在硅谷,接触的大部分投资人都很看重商业化落地,非常看重项目的metric,以及是否有很好的应用场景切入。例如,jasper.ai 是具有标杆性的,它的增量做得非常好,一年收入做到了9000多万美金。我觉得未来5~6个月的时间,甚至是明年下半年,市场上才能迎来在产品侧或者商业侧的小高潮。大家还需要时间和资本来持续投入,总得来说行业都在追求实际的商业价值。

闫俊宇:

计算机在读博士,北航 VR 国家重点实验室

从去年开始,学术界在多模态和 AI 生成方面有了比较大的突破,并且开始迅速迭代,一步步向业界演化渗透,今年上半年国内外很多比较好的案例和产品被快速推出,年中伴随着红杉美国的报告,AIGC 在资本界迅速爆红,这里有明确的过程的演化。同时,如果我们横向看,去年底开始AIgenerativemode在不同的领域中也同样迅速发展,比如在蛋白质设计和电路设计等都有了彻底超越传统方法,并且可以应用于实践的 AI based mode。但在迅速发展的同时,我们也能看到这些尚处于相对早期,技术扩展是需要时间的。从理论、学术领域向其它领域拓展需要时间,从一个学术领域向其它服务领域的拓展的过程,也需要时间。现在最能够容易看到和离产品最近的,比如娱乐产业方面。向更深的工业领域渗透,塑造更大的变革不会是一蹴而就的。从现在开始算,明年下半年以及往后是一个持续扩张的浪潮,这个浪潮同时伴随着横向领域和纵向深度(和模式)的拓展,大家还是要从两个方面都进行关注。

王思捷:

启元世界战略副总裁

AIGC 应用的场景拓展,可能跟 unity/Unreal 有点类似,先在某一个比较直接的场景落地,比如游戏,再拓展到其他相似的数字孪生领域。启元提供的游戏策划端离线工具,可以用深度强化学习技术辅助策划生成游戏关卡、数值,也已经用到生成式大模型生成对话和做剧情创作。我们也在研究现在最火的文生图,如何真正地跟游戏美术结合在一起。文生图看上去很好,但可能对游戏美术画师来说没有多大价值。在整个生产流程中的前10%,即创意阶段,会有一定的参考作用,但仍无法嵌入到游戏美术生产流程,完整替代某一个环节。举个例子,比如线稿透视笔触,现在的技术根本无法在这个维度上去做调整,AIGC 还理解不了。所以我目前感觉文生图大规模商业应用并不会那么快,未形成和场景的深度耦合。

Q3.

真实生产环境中模型落地的问题,是否有解决方案?

黄民烈:

过去两三年,技术得到了很大的发展。AI 模型在对话、智能写作、图像生成等领域已经接近甚至超过人类的水平。今天我们已经具备了做商业落地的可能性,找到比较好的场景。我们处在一个非常好的起点和时机,跟一些特定应用场景结合起来落地,商业路径上也会比较顺利一点。

闫俊宇:

从商业的角度来看,关键是用好现有的技术水平解决需求,解决市场需求是第一位的。模型不能落地说明这个 PMF 是伪拟合的,这根本上不只是技术的问题,是商业逻辑就有问题。技术的发展是连续的,是一步步积累的,把需求的解决,寄希望于新技术的突然爆发是比较冒险的事。但整体而言,AI 在越来越多的领域展现了可喜的进步,一个阶段的技术可以做出一个阶段的产品,满足一个阶段的需求,如果目前落不了地,那就去看看能用哪些落地的模型去解决其他问题。目前大型的工程,虽然使用了大量的数据,每个模块做了很多精巧的调整,看起来能解决很多通用问题,但是模型的作用、意涵、能解决哪些问题都是非常明确的,不能指望模型变大了,解决的问题更多更综合了,就更好落地了,落地不落地也不能单纯从技术侧去讨论。而且创业公司也不是要解决模型层的问题,是要解决技术和需求匹配的问题。

Q4.

下游具体的场景和用户的数据是非常重要的。大厂的数据优势是否有助于解决方案?

钟凯祺:

我理解当下 AIGC 的模型,创业公司也好,大厂也好,做的都是用产品去适配,让 AI 和人类之间能更好地互相理解,包括有很多 Prompt Engineering 的库,其实也试着在人类和 AI 之间搭桥,短期之内的突破肯定是来自于产品上的演进。

技术侧可以突破的点有两个,一个是可控性,一个是可解释性。当下的 AIGC 还有一定的黑盒性质,可控性决定着在工业的生产下,更加精准和稳定。可解释性,可以部分帮助解决版权问题。AIGC 有一个很重要的关键点,就是版权和确权很多时候会出问题。过去的5年,研究深度学习的人越来越多,如果把数据资产和数据的确权的问题给解决好,是一个比较重要的方向。

胡家康:

我们去年年底已经发布了文生图,还有文本生成的 demo,但当时用户量不及现在。今年4月份这一波火了之后,大家的应用场景越来越多。这个领域技术迭代的加速度非常之快,吸引了更多的创业者进入,相信大家会碰撞出更多的想法。

这个领域是一种全新的应用形态,对产品经理是个非常大的考验。整个创业生态一起探索创新,会给技术一个加速度。从技术迭代到应用玩法的加速度,这两波叠加在一起,我们是非常看好这一波机会的。

Q5.

垂直应用的差异性壁垒在哪?

于春景:

心识宇宙研究院院长

对比现在基于大数据、神经网络或其它单一进路的人工智能,我们一开始就想做一个通用的数字心智系统,像人一样,它能够从内在系统上沟通所有的信息,所有的感官输入,包括所有的单点任务 AI 能力,这是我们做的底座。我们推出了一个小程序,叫万物总动员,任意扫一个物品,跟物品进行对话,运用的就是我们一部分的开放式对话能力。现在的预训练大模型是一个类似人的直觉系统,很简单,但数据量很大,类似一个潜意识系统,但没有像人的语言智能或推理智能,本质一种被动的统计学习。它没有像人那样的工作记忆系统(Working memory),在一个全局空间(Global Workspace)有自己的人格和记忆、或像自我意识那样的念流。比如你和很多机器人对话,上一句跟你很亲,下去问问我是谁,他不认识你了或和前面无关了。这就是我们研发MindOS 系统,相信过不了多久大家就能像捏人一样捏心了。其实相比于今年Yann LeC un 或其它几位AI大佬提倡基于世界模型的自主通用智能或NeuroAI,我们很早就开始涉及我们称之为 MindAI 方面研究,专注于虚拟人心智的赛道。在我们看来它最关键是这样一个内在心智系统底层,加上外部跟别人的开放交互和实时数据输入。我们把两部分结合起来,就相当于把神经 AI 、任务式AI 、AIGC、C端流量等系统统一到一个界面,这就是我们致力于打造的壁垒。

李文珏:

聆心智能联合创始人

我们底层确实用了大模型,也不只是用了大模型,对话会比文图或者写作更复杂、更难一些,但大模型只能提供比较基础的对话能力,但如果我们要提供支持灵活定制的灵魂引擎,还需要知识、情感、个性等额外的关键技术。比如,知识表示和知识融合;情感分两个方面,一要是能够识别说话人的情绪和背后隐藏的意图,就是言外之意。最难的是机器人的个性和风格,比如是霸道总裁型或者是温柔型等等。我们希望每个 AI 智能体都能有“灵魂”,那就是 TA 要有思想、见识、有观点、态度,有个性和风格。

陈雨恒:

欧美的大厂和创业公司之间的生态比国内更成熟一些。其实是分两个方向,一是做基础设施型、平台型的,以技术为重;另外一种是应用场景,明确解决某个场景的需求,并用现在的技术就能够解决。产品做增长,有增长就有数据,数据的积累跟社区也是分不开的。

硅谷的创业氛围,特别对早期的用户,通常是建立一个社区,通过社区形成付费用户群体。有一些创业公司在非常垂直的且定义清晰的场景里做产品,非常清楚这个场景面对的用户群体,基于用户增长有了数据,有了数据就可以转化,逐步建立起忠实的客户群之后,它在这个特定场景积累的数据就是它的壁垒之一。我觉得 AIGC 公司大部分都是在找这样一个特定的场景,解决细分的需求。例如 Replika,2019年给国内的朋友看,当时他们一个月大概赚2-3万美金,只有几千个付费用户,2021年已经超过1000万用户,说明已经围绕一个忠实的付费客户群体发生了显著的增长。所以我觉得核心还是围绕增长,基于数据的基础上建立自己的壁垒。

Q6.

听起来数据决定了壁垒。那么,拥有数据优势的大厂,垄断性威胁是否存在?

胡家康:

国外已经形成了比较明确的分工体系——OpenAI 提供技术模型 GPT-3,创业公司在上面翻新模型,得到返回数据,不断优化模型,在技术上形成竞争力和壁垒。我们也希望中国能够走出这样的模式,比如有几家企业集中地买好服务器、资源,做好性能优化,把基础模型做好点,提供给应用层公司。应用层公司再基于自己的板块数据和场景,把模型翻新得更好,这是一种更良性的生态。比如文生图的应用,已经开始和垂直行业做结合。

Q7.

芯片封锁会是未来发展的潜在瓶颈吗?

闫俊宇:

影响是实际存在的,但这可能不是国内某一家商业公司能够突破的。目前,对创业公司而言,短期还好(规模、体量、时间尺度)。体量上,创业公司需求并不大,或总能有方法来满足相关的标准;而且其中变数较多,影响的是方方面面。但对创业公司来说,目前面临的主要问题不是显卡,创业公司做不好不能赖显卡。

陈雨恒:

撇开技术本身,这个问题不是我们能讨论得出来的,作为创业者聊这个问题没有意义。假设这个事情一定会往极端的方向走,我觉得更需要像百度、华为这样的公司,在国内建立完善健康的开发者生态,再去服务创业者。所以不如做好分工,把生态上下游都建立起来,而不是所有人都去想着解决终端需求。

Q8.

AI行业的下一个机会在哪?

王思捷:

不断给成熟技术找到真正刚需的具体场景。启元之前主要是在数字娱乐场景和一些科研项目中,后面会探索包括元宇宙、数字人等,这也是游戏公司包括3D 引擎公司本身在破圈探索的领域。AI 公司重要的是形成可以由用户自助使用,可规模化扩展的产品,不一定要纯 to C,比如 Jasper.ai 生成营销文案,很难说到底是 C 端还是 B 端的工具。

赵亿阳:

云知声联合创始人、首席战略官

我想到三个关键词。

第一个是时间感。人工智能的概念至今差不多 60 多年了,并不是从 AlphaGo 战胜李世石开始的,要看在19世纪60年代、70年代、80 年代、90 年代发生了什么,时间是连续性的,大家通过自己正在做的事情可能会有一些启发。

第二个是空间感。我们属于中国的创业公司,在本土发展时,一定要符合国情。除了中、美以外,也可以关注一下印度、一带一路沿线国家在发生什么,这些市场可能也有属于自己的 AI 创业机会,而这些机会也许在商业上非常好复制中国5 年前、美国10 年前的道路,这是个非常大的机会。

第三个是系统观念。我们非常在乎业务和收入怎么落地。现在环境变了,客户结构发生巨大变化,必须清楚我们的客户是谁?他们在哪里?这是生命线的问题;第二,以我们的基因能够提供什么样的产品靠近客户;第三是方式和方法,短期之内,个人建议可以关注以场景为中心的知识图谱产品。

黄民烈:

从智能的角度来讲,感知智能、认知智能,最后才是 通用人工智能 AGI,AGI的最终目标 就是无障碍的人机交互。现在文生图已经非常卷了,一些非常低成本的工具开始出现。如果聚焦未来1~2 年,Character.ai 已经是很好的样板了,可以关注认知智能这个方向,尤其中文对话,中文比英文更难做,在技术上我们大概有0.5 年的技术滞后,英文做得比较好才会反映到中文上。但我们中文对话的能力已经在世界上领先,超过了 Character ai 的中文能力。


网站编辑: 郭靖

0

第一时间获取股权投资行业新鲜资讯和深度商业分析,请在微信公众账号中搜索投中网,或用手机扫描左侧二维码,即可获得投中网每日精华内容推送。

发表评论

 / 200

全部评论

—— 没有更多评论了 ——
—— 没有更多评论了 ——
联系我们 欢迎投稿
  • 投中网
  • CVS投中数据
  1. 创新经济的
    智识、洞见和未来

  2. 投资人都在用的
    数据专家

返回顶部