
iOS相机应用程序Photon Camera与形象编辑软件Photon Enhance的开发商LateNiteSoft进行一项大规模测试,通过超过600次形象生成,比较OpenAI、Google及ByteDance 3款主流AI形象编辑模型的表现。测试结果显示现阶段没有任何单一模型能够全面胜出,不同模型各有所长。
LateNiteSoft选用5张不同类型的测试照片,包括宠物、人像、风景、汽车及产品摄影,并以多种编辑指令测试3款AI模型。测试对象包括OpenAI的gpt-image-1、Google的gemini-2.5-flash-image (又称Nano Banana) 及ByteDance的seedream-4-0-250828。测试于2025年10月8日在日本进行,使用公称10Gbps光纤网络连接。
生成速度方面OpenAI高品质模式平均需时80秒,Google Gemini仅需11秒,ByteDance Seedream则为9秒,速度差异明显。
测试中以“肮脏复古照片”(Grungy vintage photo) 指令编辑猫照片时,gpt-image-1能灵活配合指令进行编辑,但有时会过度偏离原本构图。Nano Banana则过度保留原始形象资讯,导致编辑效果较弱。seedream-4-0-250828的表现介于两者之间。

在“套用热力图效果”(Apply a heat map effect) 测试中,只有Nano Banana未能正确呈现热力图风格形象。当指令为“针孔相机”(Pinhole camera) 时,Nano Banana更出现理解偏差,在设备左上角加入相机图案,而非模拟针孔相机拍摄的周边减光模糊效果。

不过当指令改为“针孔相机效果”(Pinhole camera effect) 后,Nano Banana便能正确呈现预期风格。这反映Google模型对指令用词较为敏感,需要更精确的描述。


生成比较像玻璃的风格测试(Make it look like the photo is etched in glass)中,只有seedream-4-0-250828模型可以造到产品像玻璃制一样,其他都有理解不正常的问题:

如果想为对象提供金属效果,可发现seedream-4-0-250828模型提供了最强烈的金属感,但其他两个模型会相对较自然:

在艺术风格转换方面OpenAI表现较佳。“套用日本浮世绘木版画风格”(Apply a ukiyo-e Japanese woodblock print style) 测试中,只有Nano Banana未能呈现浮世绘风格。

“转换为低多边形艺术”(Transform into low poly art) 指令下,seedream-4-0-250828呈现出最优秀效果。

在“变成泡壳包装内的动作人偶”(Turn them into an action figure in the blister pack) 测试中,3款模型各有特色:gpt-image-1采用较夸张变形画风,Nano Banana维持原始姿势与体型,seedream-4-0-250828则介于两者之间。

LateNiteSoft总结指出目前没有万能模型存在。gpt-image-1最适合风格转换或创意生成等滤镜功能,Nano Banana则适合真实感编辑,seedream-4-0-250828介于两者之间。该公司表示正在研发“指令分类器”,自动将艺术类指令发送至OpenAI,真实感编辑指令则交给Gemini处理,以充分发挥各模型优势。
LateNiteSoft从事iOS摄影相关应用程序开发已有15年,旗下产品包括Camera+、Photon及REC等市场领先应用程序。该公司从未接受创投资金,所有产品均需自负盈亏,因此在评估AI项目时特别着重成本效益。
数据源:LateNiteSoft










