AI
image2-codex
image2-codex

不用学Three.js,Image2+Codex两步生成360°全景渲染

360度全景渲染听起来是个技术活——要处理等距柱状投影,要用Three.js写球形贴图,还要实现鼠标交互。但用GPT Image2和Codex组合,整个流程缩减成两步:让Image2生成全景图,让Codex把图变成可以转动的查看器。

第一步:用Image2生成全景图

关键是提示词。普通的"生成风景图"不够,需要明确告诉Image2这是等距柱状投影格式:

360 度等距柱状全景图(equirectangular),[场景描述],高细节,电影感,超沉浸式 VR 环境,真实 360° 空间透视,8K,2:1 宽高比

[场景描述] 换成具体场景。以浮空夜市为例:

360 度等距柱状全景图(equirectangular),漂浮在云层中的东方幻想夜市,红灯笼、悬空木桥、蒸汽小吃摊、飞行纸鹤与远处巨大空中神殿,夜雨后的石板路有霓虹倒影,人群与摊位形成环绕式空间构图,动态烟雾与暖色灯光交织,高细节,电影感,超沉浸式 VR 环境,真实 360° 空间透视,8K,2:1 宽高比

Image2会生成一张2:1比例的图片——这是标准equirectangular格式,把球形空间展开成平面,水平360度、垂直180度。

Image2生成的全景图

第二步:让Codex生成查看器

把生成的图片上传到Codex,输入:

生成 HTML 代码,用 Three.js 将这张全景图渲染成一个可交互的 360 度查看器

Codex会输出完整的HTML文件,包含Three.js球形贴图渲染、鼠标拖动和滚轮缩放。下载后直接用浏览器打开。

360°全景查看器效果

为什么这个组合能跑通

Image2能理解equirectangular格式,生成的图片不是普通风景图,而是一张"展开的球形"。把它贴到Three.js球体的内壁,相机在球心,转动视角就相当于在360度空间里环顾。

提示词里指定2:1宽高比是必须的,equirectangular格式的宽高比固定是2:1,否则贴到球体上会变形。

Codex生成的代码逻辑:创建球体几何体 → 将全景图作为纹理从内部贴到球体上(材质设置双面渲染)→ 相机放在球心 → 监听鼠标事件控制相机旋转。这部分不需要自己写,Codex会处理好。

适合哪些场景

整个流程不需要配置环境:Image2在ChatGPT网页端直接用,Codex生成的是单个HTML文件,浏览器打开即可。

场景选题的思路:全景图适合有纵深感和环绕感的场景,比如室内(茶馆、书房)、奇幻场景(浮空岛、地下城)、城市街景。全是平面元素的场景转起来效果有限。