GPT-Image-2 实测:与谷歌、豆包文生图效果对比

这个是image2 生成的图片。 这个是banana 生成的图片。 这个是豆包生成的图片。 大家觉得哪个图片更好一些呢? 最近,GPT-Image-2 刷屏网络,它是OpenAI公司最新发布的文生图模型。 只需要简单打几个字,就能帮你画出连专业摄影师都看不出破绽的照片。 真实感真的是拉满了。 所以,本IT博主对这个新模型的诞生也是倍感激动,迫不及待想体验一下这个工具。 1、初始界面 打开chatgpt官网,可以看到,官网这里已经推送了更新提示。 这里,我们只要点击下一步就可以了。 另外我们可以看到,这里我用的是免费版,并没有开通plus、pro会员。 所以说,免费的账户也可以体验 image2 的使用。 2、文生图步骤 接下来,我输入框里给了它一段提示词——“请生成一个曹操在抖音直播间卖布洛芬的图片”。 经过一番等待,图片就生成了。 点击小箭头这里,会有一个弹窗,点击下载就可以顺利地下载下来。 3、赏析图片 首先这个画面的布景和ui设计,做的非常逼真,跟抖音直播间是像素级别的复刻。 画面里的字体,个别做的不是很清晰,但大部分是很到位的。 直播间的头像和观众,略微有点瑕疵。 左上角头像这里,我个人感觉,有点像孔老夫子 然后,右上角这个人有点像奥地利落榜美术生。 大家觉得呢? 这里有一些细节,蛮搞笑的。 这里显示发货地是,许昌。这个挺符合历史背景的。 左下角这里是曹魏集团文官武将对老板的支持。 曹丕说:父王带货,必须支持! 张辽说:已拍,家中常备。 典韦说:这价格太给力了。 最后,这个图片是没有水印的,这也是一个优势吧。 4、对比 接下来,我们对比一下谷歌和豆包,生成的图片。 这里也是用的同样的提示词,我们先来看一下谷歌banana模型生成的效果如何。 ok,我们来赏析一下。 这里直播间的布景和ui细节,稍微弱了一些。 不是太像我们平时在抖音看到的直播间。 字体部分,我看着大部分都还可以。个别字体,没有展示出来。 然后,这里弹幕部分比较单一,只有曹公一个人在讲话。 感觉直播间人气不是很旺。 这里右下角有点别扭,它有个水印,这个毫无疑问是谷歌添加的水印。 接下来,我们看一下豆包生成的图片,我们用的是seedream 5.0 lite 模型,也是用的同样的提示词。 豆包比较给力,一次生成了四个图片。 我们挑两个来说一下吧。 这个图片就是动画风格。其实,跟我们的预期是完全不一样的。 我觉得,可能豆包模型是想试探一下我们,想让我们筛选自己想要的风格,然后再进一步沟通优化。 字体稍微有点瑕疵,胶囊两个字没有出来,有点像二维码。 这个官帽也不太对吧?!感觉像唐朝的官帽。有没有懂哥,评论区或者弹幕来指点一下。 然后,这个图片的话,相对来说比较符合预期。 这里的字体细节,有点问题。还有弹幕这里的显示,也是存在一些细节问题。 从人物形象来看,这个官帽也有问题。汉朝的官帽应该没有这个小翅膀的。 ...

2026年4月24日 · 高勉

MemPalace:让AI拥有本地记忆,无需API Key的开源解决方案

万万没有想到,生化危机的女主角,居然成为了git大佬。 她参与的开源项目,MemPalace(记忆宫殿)爆火 AI 圈。 短短一周的时间,就已经收获了 4万+ 的stars。 这真的是我见过,玩跨界玩的最6的演员了。不得不感叹,这位真的是乘风破浪的姐姐。 项目地址参考如下:https://github.com/MemPalace/mempalace 1、痛点 该项目解决的最大痛点就是:ai没有记忆。 你每次打开新对话的时候,你会发现 ai 对你一无所知。 你之前跟它说过什么话,做过什么决定,踩过什么坑,在新一轮的对话中,ai通通忘记了。 虽然,也有一些云端解决方案,但是这些解决方案,通通要消耗 money。 因为你要把数据存到别人的服务器上,所以,安全性和成本,都是很棘手的问题。 而MemPalace解决了这个问题。 它使用SQLite作为轻量级数据库,处理知识图谱和时间的关系;使用 ChromaDB 作为向量数据库,处理存储和语义搜索;采用python作为开发语言,串起了整个项目。 也正因为它用了这些轻量化的本地工具,所以,正如它的项目介绍所言——一切都在本地,无需api key,无需外部网络。 2、安装 MemPalace 2.1 MemPalace工具安装 保证你的 python 版本在 3.9 以上。 输入一条指令,即可下载。 pip install mempalace 输入指令, 对当前项目进行初始化。 mempalace init ./ 输入指令,将当前项目存入记忆库。 mempalace mine ./ 2.2 Claude Code 插件安装 输入两条指令,即可安装 MemPalace 插件。 claude plugin marketplace add milla-jovovich/mempalace claude plugin install --scope user mempalace 3、使用 MemPalace 举个例子,这里我在 claude 中修改了我的项目,对项目中的内容进行了调整。 那么,过了一大段时间之后,我们可能已经忘记了这一部分调整的原因。 ...

2026年4月13日 · 高勉

AI 文生图提示词宝库:2.8k star 开源项目,让你的图片更真实

你知道这些真人感十足的图片是如何生成的吗?只需要一个简单的文生图指令,就可以做出一张这样的图片吗? 并非如此,好的图片不仅仅依赖模型,提示词也同样重要。 换句话说,好的图片 = 厉害的模型 + 厉害的提示词。 那么如何写出对应的提示词呢?下面这个开源项目,应该可以帮到你。 今天分享一个非常牛的开源项目,star 达到了 2.8k,开源项目链接。 大家可以在 git 平台搜索 gpt4o-image-prompts ,然后,就可以找到这个项目了。 你可以在项目的 README 上,找到示例图片以及示例提示词。 点击之后,会跳转到对应的案例,案例中会显示图片、提示词、模型、原作者信息,如下所示。 图片: 提示词: { "meta": { “项目”:“Ski_Gondola_Egirl_Flux_V4.2” "target_engine": "Flux.1 [dev] / Nano Banana Pro", 版本:4.2.0(一切尽在掌控 - f/11) "created_at": "2025-12-18T15:35:00Z" }, "engine_configuration": { “模型”: { "base": "flux1-dev.safetensors", “量化”: “fp8 / nf4”, "vae": "ae.safetensors" }, "lora_slots": [ { "name": "Realism_LoRA_v2(可选)", “强度”:0.5, “注意”:“增强瓷白的肤色、尼龙的质感和雪的反射效果。” } ], “采样”:{ "sampler_name": "欧拉, "调度器": "简单", “步骤”:28, "guidance_scale": 2.5, "shift": 1.0 }, “方面”: { 宽度:1024, “高度”:1536, "aspect_ratio": "2:3", "megapixel_class": "1.5MP" } }, "prompt_construction": { "narrative_layer": { "风格": "冬季生活方式/旅行摄影", “拍摄说明”:“在滑雪缆车内拍摄一张清晰、高对比度的照片,使车内主体与车外明亮的雪山景色达到平衡。” “subject_flow”: “一位肤色苍白、留着黑色狼头短发的年轻女子,身穿白色羽绒服,坐在缆车里,抚摸着自己的头发。” }, "texture_layer": { "skin_physics": "苍白的瓷肌,亮泽的嘴唇,夸张的电子女孩眼线,光滑的妆效" "fabric_physics": "白色羽绒服的亮面尼龙质感,黑色滑雪裤的哑光科技面料,滑雪镜的反光镜片", "environment_physics": "背景细节清晰:透明玻璃窗、山上的白色积雪纹理、深绿色的松树、蓝色的天空" }, "camera_physics": { "lens_imperfections": "高对比度,锐利的日光,玻璃上有轻微反射" “对焦”:“景深大(f/11)——无模糊。女子、缆车内部以及远处的雪山都清晰锐利。” 设置:索尼 A7R V,35mm 镜头,1/1000 秒,ISO 100(明亮的雪天) }, "color_grading": { “white_balance”: “冷色调日光(蓝天/白雪为主)” “阴影”:“小屋内深邃而清晰的阴影”, “亮点”:“雪地和外套上的明亮、清晰的高光” } }, "final_prompt_string": "一张使用索尼A7R V 35mm f/11镜头拍摄的真实生活照。景深大,画面清晰。一位年轻女性(19-25岁),拥有白皙的肌肤,留着齐肩黑发,刘海齐肩(狼刘海),坐在滑雪缆车内。她身穿亮白色短款羽绒服、黑色滑雪裤,头戴黑色滑雪镜。她轻轻拨了拨耳后的头发,神情平静地看向镜头。妆容精致,带有猫女风格,眼线上扬,唇彩闪亮。明亮的冬日阳光洒在她的脸上。背景清晰锐利:透过宽大的玻璃窗,可以清晰地看到白雪皑皑的阿尔卑斯山脉、滑雪道、松树和湛蓝的天空,没有丝毫虚化。高对比度。展现了冬季旅行的美感。" "negative_prompt_string": "", "note_on_negative": "Flux 会忽略明确的否定提示。清晰度由诸如“f/11”和“深景深”之类的肯定描述符保证。" "post_processing": { “高档”: { “启用”:true, “方法”:“Magnific_AI_Style(创造力:1)” }, “面部修复”:{ “启用”:false, 警告:严重:禁用面部恢复功能。 } } } 你可以把上面的提示词 copy 下来,丢到豆包、gemini banana 等 ai 工具中去使用。 ...

2026年3月24日 · 高勉

你真的需要 AI Skills 吗?分享AI Skills 完整教程:目录结构配置与 Claude Code 实战案例

AI Skills 本质上是一个给 AI Agent 看的“行动指南”。 它可以应用于 Claude Code(以下简称CC)、OpenCode、Codex 等 AI Cli 工具。 它的作用是什么呢?(以 CC 为例) 如果没有 Skills,那么 CC 生成的代码或者文案质量参差不齐、想一出是一出、没有任何标准; 有了 Skills 之后,Claude 就会先读取 Skill.md 的要求,按照已有规则给出代码、文案或者其它文本内容。 1、目录结构 使用 Skills 工具,最重要的一个环节是配置好目录。 所以,我们先介绍一下目录结构。 一个完整的目录,如下所示: your-project/ └── .claude/ └── skills/ └── your-skills-content/ ├── SKILL.md ├── scripts/ │ ├── generate_title.py │ └── format_article.py ├── references/ │ ├── cat.md │ └── dog.md └── assets/ └── article_template.md .claude 放在你的项目目录下,CC 需要从这个目录找到 Skills,所以,这个目录必须要有,且名字保持一致; skills 放在 .claude 目录下,里面存放着各种不同功能的 skills ,所以,这个目录必须要有且名字保持一致; ...

2026年3月21日 · 高勉

如何利用AI赚钱呢?实际经历分享如何使用AI编程、AI提示词,赚到第一桶“金”

本篇博客分享一下,我是如何通过ai工具和ai提示词赚到了“第一桶金”。(哈哈哈,说的有点夸张了) 这笔钱总计是:260多块钱,如下图所示。 1、灵感来源 我在网上冲浪的时候,发现一些宠物赛道的账号流量特别好,而且这些文章写的内容也很简单 —— 分享一些萌宠图片,然后吐槽一下。 如下图所示,这些文章的阅读量都达到了上万级别,而且每天都有上万的爆款! 所以,我也萌生了做宠物赛道的想法。 2、ai编程 方向定下来之后,我便开始了进一步的分析:如果在文章中使用简单的贴图,恐怕不够吸引人。 所以,我的想法是,从网上找萌宠视频转化为gif动图。 然后,把动图贴到文章里,而不仅仅是贴几张静态的jpg、png图片。 那么问题来了,有些视频比较长,如果全部转成一张gif,那这个文件就太大了。 因此,需要把视频切成多段,然后,分别转换成gif。 那么问题又来了,以上这一套流程 —— 裁视频转gif,如果纯手动操作的话,非常之麻烦。我想找一些现成的工具来完成这个工作。 但是,并没有找到。 于是,我借助ai编程,自己开发了这样一款软件。 简单介绍一下这个软件吧: 软件使用了免费开源的音视频解码工具——大名鼎鼎的ffmpeg 开发语言:python 3.12 主要功能:使用命令行(下图所示),批量处理指定目录下的视频,然后,自动切割并转换为gif 次要功能:切割时间跨度可调,视频帧率可调,是否展示缩略图可调 ai编程工具用的gpt 4.1 软件代码我已经上传至git平台: 裁剪视频转gif 3、ai提示词 除了图片,文案也很重要。 我自己琢磨出来了一套 ai 提示词帮助我生成文案,提示词如下: 你是一个10万粉丝的 公众号 宠物赛道的博主。 擅长写宠物的 文章。 你年龄不大,是个20多岁的可爱的小女孩。喜欢看萌萌的,可爱的,宠物短视频以及图片。 并且,会吐槽这些可爱的小猫小狗。 下面有一个或多个内容,这些内容,是对萌宠图片的描述。 要求: 1、请给每一个内容,分别起两个标题。我会从中挑选一个,作为所有内容的总标题。标题字数至少15字,要能够吸引读者点击。标题要给人一种共鸣的感觉,就是那种“太像我家狗了”、“天啊我也有这种感觉”、“我要转给我朋友看” 2、请给每个内容,扩展生成两个生活中的故事,我会从中选择一个。你不需要提供完整的故事,只需要根据 遇到什么问题、经过是什么、结果是什么,给到我就可以了。不要用第一人称描述故事,要用第三人称,因为都是网友家的宠物。故事要能引起多数人的共鸣,能让人看完想评论。故事不要局限于我写的内容,我只是提供一个片段。 3、请给每个内容,生成一个 punch 的两句话,能戳中人心的那种,我会从中选一个。 4、请给每个内容,增加一个跟内容相关的宠物知识。风格:大白话,通俗易懂。这一部分内容,可以多写一些。另外,引入这个小知识的时候,前文与小知识之间,能有一个丝滑地过度。 5、不同的内容之间,请给我一些过渡的语句,让文章能丝滑、不突兀地顺下去。 6、请给每个内容加一些宠物的吐槽,就是宠物内心os。 7、请加两条网友的爆笑评论或者吐槽。 内容如下: 这个狗子实在是太绝了,居然会后空翻…… ai会根据我的提示词生成一堆内容,一定一定要注意:千万不能把这些内容直接复制粘贴使用。 要用自己的语言,把它写下来,否则,这个ai味就太浓了,会被平台判定为ai创作。 4、完整的sop流程 找一段或者多段视频,保存在电脑上。 执行软件,将该视频进行切割。 根据视频内容,先自己简单写几句话。然后,把它们放到提示词那里,丢给ai帮你扩写。 将ai生成的内容,转换为自己的语言放到你的文章里,然后,在合适的位置放上合适的图。 发布文章 以上就是本期博客的完整内容,感谢阅读。

2026年3月13日 · 高勉