AI 3D 生成会有“抖音时刻”吗?与 VAST 聊人人玩 3D 的未来 | AI 大爆炸

2024-02-01 13:51:5348:16 3315
声音简介

喜马拉雅禁止我们使用外部链接,这完全违背了互联网开放的精神。并且晚点聊每一期都会有很多引用链接,这让我们无法把嘉宾的分享或者报道的原文放到简介里。推荐重新在苹果或小宇宙订阅《晚点聊 LatePost》。如果已经在苹果订阅却还能看到这段,是因为订阅的是晚点聊(中国区)。搜索《晚点聊 LatePost》重新订阅正常版本即可:)


本期是《晚点聊》「AI 大爆炸」系列第二期节目。我们关注 AIGC 领域里的 3D 图形生成。

这期的嘉宾是 2023 年初成立的 AI 3D 生成公司 VAST 的创始人、CEO 宋亚宸和 VAST CTO 梁鼎。

去年 10 月上线的热门 Github 开源项目 Wonder3D 背后就有 VAST 团队的贡献。

VAST 也刚刚在 2023 年 12 月上线了第一个产品 Tripo,这是一个可以用文字描述和图像生成 3D 模型的 Web 端产品,测试阶段可免费试用。目前用户在 Tripo 上已生成了 30 多万个 3D 模型。

宋亚宸同时是一位非常年轻的创始人,他出生于 1997 年,毕业于约翰斯·霍普金斯大学。在创立 VAST 之前,曾在商汤和 MiniMax 工作;梁鼎之前则在商汤担任通用模型负责人,毕业于清华大学。

VAST 团队对未来的一个设想是:3D 内容会重复文字、图像、视频之路,从 3A 内容,即需要 a lot of people, time and money 的高门槛内容变成人人都能方便地创作和消费的内容。

第一步是有大众级的 3D 生成工具,第二步是 3D 内容平台。前者的成熟是 3D 生成的 ChatGPT 或 Midjourney 时刻。后者我们可以称他为“抖音时刻”。

这是一个可以数年后回看以验证的想法。希望这期节目只是一个微小的开端。

本期节目我们聊了:

创业故事 & 第一款产品 Tripo

01:51-为何在 3D 领域创业?——看到 3D 内容平台机会,第一步是做大众级 3D 生成工具。

07:16-Tripo 背后使用了多种模型结构,有 Diffusion 也有 Transformer。大语言模型是用端到端的一个模型完成任务,而 3D 生成目前是多种模块组合。

12:25-当前 3D 生成与文字和 2D 图像的一大区别是,后者有业界通用的表示方式,如 2D 图形是矩阵,而 3D 图形的最佳表示方式还在探索中。

13:13 -Mesh、NeRF 等 3D 表示(3D representation)指什么?

Midjourney 时刻和抖音时刻如何到来?

14:32-3D 生成效果到了相当于文生图应用 Midjourney V4、V5 的水平,是工具成熟的里程碑。这可能发生在 2024 年底到 2025 年初。

16:37-用户也需要存储、托管、分享和展示 3D 内容的平台。VAST 正在内测一个 3D 内容托管平台。

19:37-现在已有很多业余 3D 内容制作者,但没有分享、展示渠道。

22:49-用户的玩法举例:造一个 3D 鬼屋,请朋友来被吓。

23:55-这个平台目前是一个 PC 客户端,未来会考虑做 XR App。

27:11-总结:3D 生成效果达到 Midjourney V5 水平,是工具成熟的时刻;内容平台爆发的关键则是出现一种新的 3D 内容范式——一种可被跟风、模仿的 UGC 内容。

28:52-这件事可能发生在头显成熟前,头显成熟是充分不必要条件。

当前的竞争

31:31-大小公司都在做 3D 生成工具。VAST 的差异之处:做大众级工具,而不是替代现在的主流 3D 软件。

32:50-3D 生成是一个新领域,而且是华人团队不落后于美国团队的领域。

34:11-希望更多人用 Tripo,也用竞品,更多人体验 3D 内容生成。

36:26-VAST 掌握了大量 3D 原生数据集。

37:43-3D 内容生成的远期壁垒在产品和社区、开发者运营。

38:04-开发者自己玩出的例子:Tripo Go,可以让不同人生成的不同 3D 模型对战。

AI 潮里的年轻创始人

41:18-移动互联网领域,一批创始人起步于 25-30 岁。

42:30-VAST 是一个创始人很年轻,核心团队成员也有不少老炮的公司。

43:06-一个公司为什么能聚集多个以前自己创过业的人?

45:05-连续创业者能提前避坑,年轻人敢冲。

相关阅读:

如果放链接,喜马拉雅会提示:检测到您插入的超链接不属于喜马拉雅链接,更换后才能发布声音哦~

本期节目中出现的技术、公司等名词:

·一些 3D 表示(3D representation):Mesh、NeRF、Gaussian Splatting、SDF

3D 表示是以某种形式表达 3D 对象或场景的几何形状、纹理、材质和光照等信息,可以是数学模型、数据结构或其他形式的描述,常见的有多边形表格(Mesh)、点云、体素(voxels)、参数化表面等。

·Diffusion:文生图领域的主流模型,被 Midjourney、Stability AI 等公司使用。

·一些大公司发布的 3D 生成模型或成果:DreamFusion(Google),Point-E、Shape-E(OpenAI),Magic 3D、Get 3D、(英伟达),3DGen(meta)。

·该领域创业公司:Luma AI、Meshy

·一些3D行业常用的DCC(Digital Content Creation)软件:ZBrush、Blender、3DsMax、Houdini、Maya。

登场人物:

宋亚宸,VAST 创始人、CEO。

梁鼎,VAST CTO。

更多信息或合作可联系:微信/即刻/Twitter: whyvirtualsiena

程曼祺,晚点科技报道负责人。即刻:程曼祺_火柴Q

剪辑:甜食

封面:Tripo 生成的 avocado chair “鳄梨椅”

用户评论

表情0/300

_落雨___

成本太高了 我三维工作者都肝不动

猜你喜欢
生成课程

生成课程适合于教师和家长阅读

by:quiet静静

终生成长

终生成长全球畅销书,值得一度。

by:启个霸气的名字

人生成败

▲有宝宝的父母注意啦!请微信搜索公众号:【有娃必看】———这里有98%的父母都想知道的育儿知识。

by:有娃必看

人生成长

节目内容:人生低谷如何跨越主播介绍:居然有声适合人群:因处于人生低谷而苦恼人,或者他们的朋友和家人你将收获:认清楚原因而更好的去改变,最终走出人生低谷

by:居然有声

重生成富豪

重生成富豪前世的错,这一世从新弥补。林年重生了,他只想过简单地日子,所以他想法挣钱,并且改变自己,却一不小心吓走了某人。既然走了,他林年也不稀罕,决定再见面...

by:播音男神

重生成为树

【内容简介】何树重生成为一棵月桂。原本他以为自己一辈子都可能就这么孤零零地生活在山谷里,然而他发现至从他重生成为月桂树后,山里的模样开始了疯狂的变化。许久之后,...

by:水龙吟有声故事

重生成妖

【内容简介】讲述一个倒霉的物理学博士,穿越到了西游的世界,重生在灵台方寸山上的一只普通的乌鸦身上,正赶上孙悟空初来灵台方寸山学艺,然后,跟着猴子偷师……这是一...

by:华风五

末劫之光(AI自动生成版)

日更5集,不定期爆更!订阅可以收到更新提醒哦~【内容简介】在一个平静的日子,丧尸疫情突如其来,社会秩序迅速崩溃。李毅,一个曾沉迷于丧尸影视作品的青年,发现影...

by:韵律先生