你还在用AI玩3D人物吗? Gemini 3 Deep Think 可生成STL并直接打印真实物体

编辑| SIA推理模型赛道几乎是一场体力战。一方面,有OpenAI o1系列,主打“想得更远”的增强推理路径,用更长的思考时间来换取更稳定的结论。一方面是来自Anthropic的Claude Thinking。他深入参与研究和情景分析,强调长期背景下的谨慎性和可靠性。现在,谷歌也加入了这一行动。 Gemini 3 Deep Think 预示着重大更新。但真正脱颖而出的不仅仅是它的各种标杆成果,而是它的定位:“从事科学研究和工程决策”的能力。业界提供了经典的民用压力测试,它允许您为模型中的“骑自行车的鹈鹕”生成 SVG 代码。这个问题似乎是一个模因,但任何了解 itca 的人都知道它会同时干扰三件事:空间逻辑、结构正确性和传输能力。查看详细信息。有网友发布了一个非常好的版本,也是我见过的最好的版本。 https://simonwillison.net/额外难度,极端约束情况:生成加州鹈鹕骑自行车的 SVG。自行车必须有辐条和形状正确的自行车车架。鹈鹕有其特有的大育儿袋,羽毛清晰可见。显然,鹈鹕一定是在骑自行车。鹈。难度一下子从“会画画”跳到了“会模型+会做生物+会做物理”。我特别会画加州褐鹈鹕的繁殖羽毛。您不能通过简单地应用随机颜色来欺骗这一点。在繁殖季节,头部变成黄色,颈部变成红棕色,因此该模型需要非常专业的生物学知识。 “踩踏板”需要AI正确处理肢体与机器之间的交互。动物的腿应与足部对齐LS。因此,Gemini 3 Deep Think 还可以可靠地提供高质量的 SVG。此案例来自https://simonwillison.net/。这里给出的信号其实很明确:Gemini 3 DeepThink 不是要“变得更好地思考”,而是要更可靠地把事情做好,在科研层面、在工程层面、针对多重条件约束的问题。从“纸上谈兵”到“动手创作”,一个更明显的用例是能够将用户需求、草图甚至照片直接建模为物理 3D 打印文件。这是来自 Google 软件工程师@rakyll。事实上,谷歌还在推广 Deep Think,它可以分析绘图、构建复杂的形状、生成文件,并使用 3D 打印机创建物理对象。要知道,AI曾经只是一个画家。如果你给他们看一张罐子的图片,他们可以复制同一张图片,但这只是平面上的阴影。 Gemini 3 Deep Think 可以查看照片并查看照片了解任意角度手柄的长、宽、高、厚度甚至曲率,直接创建3D物理原型。这意味着除了空间推理(理解结构、体积、厚度和连通性)之外,我们还必须考虑更多实际问题:“这个可以制造吗?” “这个可以实际使用吗?”答案是肯定的。我们开始实施具有美学和结构意图的生成设计。这是为此目的而设计的锅。 x 来自网友@ytiskw,“设计一个精美的新花盆并使用 Python 将其作为 STL 文件发送。状态:可排水…”“脸”和“角度”的外观根据角度而变化,赋予其三维和现代的感觉。它更像是一种建模语言,而不仅仅是一堆几何图形。还有更激烈的游戏玩法。麻省理工学院的教授首先给了他们一张 3D 蜘蛛网的照片,并要求他们生成一个交互式设计工具。因此,程序控制,si仿真直接生成完整的设计集,涵盖优化过程,可以一步成功执行,还支持STL文件导出。 https://x.com/ProfBuehlerMIT/status/2022635227609268480教授使用该工具包设计了受蜘蛛网启发的新超材料结构和桥接解决方案。 3D 打印后,进行了压力测试(使用重约 2.5 公斤的 nvidia DGX Spark),以确保结构设计能够承受。想象一下在网上发现一个奇怪的设计。以前,如果您想要 3D 打印类似的东西,您必须知道如何使用 Blender 或 Fusion 360 等软件绘制表面、调整表面尺寸并创建厚度。初学者通常需要学习几周的时间。现在,截图交给AI→生成STL→扔进3D打印机→几个小时后得到实物,这和将专业3D建模压缩成“一键生成”是一样的。让我们看看另一个用例。使用 Deep Think 对周围 WiFi 网络进行空间化和可视化,以 3D 形式显示信号强度和可能的物理位置。通常,手机的 WiFi 列表按数字强度 (RSSI) 排序,但在物理空间中,强度并不等于距离。例如,距离承重墙 2 米的路由器可能比室外 10 米外的路由器的阻力要小。在这里,Deep Think 巧妙地引入了 Pearson 相关分析等统计相关性来推断哪些 AP 很可能在物理上彼此接近。此外,还有比较典型的科研故事。例如,Deep Think 可以审查高度专业化的数学文章,并指出同行评审遗漏的微妙逻辑缺陷。它还被用于优化半导体晶体生长工艺。换句话说,谷歌想要证明的不是它能够更好地“思考”,而是它确实“有效”。此外,它还扩大了其范围操作。不仅涉及数学和编程,还涉及化学、物理(包括理论物理)等许多科学领域。随着通用对话能力的快速商业化,真正可以应用的深度推理能力。管理复杂的金融模型、实验数据和工程设计正在成为竞争力的新高度。 Googleasushisutantoから科学研究や工学shisutemuの「第二の脳」に押し上げようとしている。如果未来能够保持实际的采用率,那么这一步的重要性可能会超过纯粹的性能提升。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。

admin

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注