文字到图像的魔法:Kimi+豆包
在这个信息爆炸的时代,内容的呈现方式比以往任何时候都更加多样化。文字,作为最传统的表达方式,如何能够突破界限,以更直观、更生动的形式呈现给读者?
欢迎走进文字到图像的魔法世界,这里,Kimi+豆包将带您体验一场创作革命。本文将选择四类对象进行测试:风景、虚构人物、现实人物、非特指人物。
一、关于“风景”的文生图
打开Kimi网页之后,与其对话,询问:这个季节,大家喜欢看什么画面呢?
依据Kimi生成的结果,我选第一个主题:金黄的落叶,继续让其帮我生成三句场景词,需要从浅入深,依次展开画面。
Kimi生成的场景词如下:
1. 初秋的序曲:
“微风轻拂,几片金黄的叶子在空中轻轻旋转,预示着秋天的悄然来临。”
2. 秋意渐浓:
“街道两旁,金黄的落叶铺成了一条金色的地毯,行人踏过,发出沙沙的响声,空气中弥漫着淡淡的秋日气息。”
3. 深秋的交响:
“整个公园被金黄的落叶覆盖,阳光透过树梢,斑驳地洒在地面上,孩子们在落叶堆中欢笑打滚,构成了一幅生动的深秋画卷。
我将上述场景词核心句子分别输入到豆包“图像生成”对话框中,依次呈现如下画面(针对每个场景词,豆包会同时生成四张图片):
针对上面每组图片,我从中选择并下载了一张图片,供大家欣赏。看起来质量非常高哦!
图片生成之后,把鼠标放在图片左上角位置,就会出现五个功能按钮:继续编辑、区域重绘、扩图、擦除、下载原图。下文将重点介绍“继续编辑”和“区域重绘”两个功能。
示例:针对上面最后一张图片,点击“继续编辑”,输入:请去掉图片中的小孩画面。该功能的具体位置如下图所示:
最终生成结果如下:
之后继续使用“继续编辑”功能,输入:请增加一对白发苍苍的老年人在林间散步的画面。最终生成结果如下:
二、关于“虚构人物”的文生图
打开Kimi网页之后,与其对话,询问:请帮忙写一段虚幻题材的画面:关于哈利波特和孙悟空共同降妖伏魔的故事,分三个场景,分别给我提供一句场景词。
Kimi生成的场景词如下:
1.神秘森林的邂逅:“在月光下的神秘森林中,哈利波特挥舞着魔杖,与手持金箍棒的孙悟空不期而遇,两位英雄的目光在妖气弥漫的空气中交汇。”
2.古堡中的奇遇:“哈利波特的魔咒与孙悟空的神通在古堡中交织,他们并肩作战,对抗着从古老壁画中苏醒的邪恶妖魔,魔法与仙术的火花在空气中激烈碰撞。”
3.决战妖魔之巅:“在妖魔盘踞的高山之巅,哈利波特的守护神与孙悟空的分身术共同施展,他们的身影在雷电与火焰中穿梭,最终合力将妖魔封印,天空恢复了宁静与祥和。”
我将上述场景词核心句子分别输入到豆包“图像生成”对话框中,最终依次呈现如下画面:
针对上面每组图片,我从中选择并下载了一张图片,供大家欣赏。看起来质量还可以哦!
三、关于“现实人物”的文生图
打开Kimi网页之后,与其对话,询问:请帮我生成一段马斯克和自己研发的相关产品在一起的画面,分三个场景,分别给我提供一句场景词。
Kimi生成的场景词如下:
1.场景一:特斯拉工厂
场景词:“在特斯拉的高科技工厂中,埃隆·马斯克站在一排即将下线的Model 3旁,他的目光坚定,展望着可持续能源的未来。”
2.场景二:SpaceX发射场
场景词:“在SpaceX的发射场,马斯克仰望着即将发射的猎鹰重型火箭,他的脸上洋溢着对太空探索的热情和期待。”
3.场景三:Neuralink实验室
场景词:“在Neuralink的实验室里,马斯克正与团队讨论最新的脑机接口技术,他的眼神中闪烁着对未来人类与机器融合的无限想象。”
我将上述场景词核心句子分别输入到豆包“图像生成”对话框中,依次呈现如下画面:
上面第二组图片,豆包生成的效果不是很好,我试了两次都是类似的画面。下面我会从其他两组图片中分别下载一张,供大家观看。豆包图片中的人物相貌与现实人物非常接近,但是相似度还有改善空间。
四、关于“非特指人物”文生图
打开Kimi网页之后,与其对话,询问:请帮我生成一段一个美女在沙滩游玩的画面,分三个场景,分别给我提供一句场景词。
Kimi生成的场景词如下:
1.场景一:沙滩漫步
场景词:“阳光洒在细腻的沙滩上,一位美女穿着飘逸的长裙,赤脚走在海边,海风轻拂着她的长发,留下一串串轻盈的脚印。”
2.场景二:海滨日光浴
场景词:“在温暖的阳光下,美女躺在沙滩椅上,戴着墨镜,享受着日光浴,她的皮肤在阳光下闪耀着健康的光泽,旁边放着一杯色彩缤纷的热带鸡尾酒。”
3.场景三:海边嬉戏
场景词:“随着海浪的轻拍,美女在海边欢快地嬉戏,她捧起一把细沙,轻轻撒向空中,笑容灿烂,与周围的自然美景融为一体。”
将上述场景词核心句子分别输入到豆包“图像生成”对话框中,依次呈现如下画面:
针对上面每组图片,我从中选择并下载了一张图片,供大家欣赏。看起来画面质量很棒哦!
针对上面第一张图片,我们再体验一下豆包的“区域重绘”功能,该功能的具体位置如下:
我在这个女生两边选定了相关区域,之后输入提示词:请生成两只海鸥在飞翔。最终生成结果如下:
总体来看,Kimi的文字生成能力很强,依据指令生成的场景词很有画面感。豆包生成风景图片及非特指人物图片的质量一流,生成虚构人物的画面也不错。但是针对现实人物的图片生成质量不够稳定,还有进一步完善的空间。此外,豆包的图片深度处理功能的确很强大哦!
在看完本文之后,您肯定会明白在掌握了Kimi+豆包的魔法之后,我们的创作之旅将变得更加轻松和精彩。感谢您的阅读,愿您的每一个创意都能通过文字和图像绽放光彩。希望本文对您创作有所帮助!
出处:微信公众号 @AI应用学习研究