近日,MidJourney发布了其最新的微信模型——MidJourney V7,这次更新堪称一次质的飞跃。新功能包括Draft模式(草稿模式)、成本减半与速度提升10倍的生成体验,以及支持中文的语音生图模式。据官方透露,未来60天内,MidJourney还将每1-2周推出一个新功能。
V7核心升级:Draft模式与性能优化
V7的重头戏无疑是Draft Mode 模式。在该模式下,生成图像的成本降低至原来的1/2,渲染速度更是提升10倍。实测显示,生成4张图片仅需1-2秒,相较于以往漫长的等待和高昂的Fast Hours消耗。
Draft模式虽然会牺牲部分图像质量,但V7提供了Enhance(高净化)和Vary(局部细节调整)功能,用户可以轻松将草稿优化为高精度成品。
V7目前只能选择两种运行模式:Turbo 和 Relax。目前标准模式仍在优化中,暂时不可用。在Turbo模式下,未开启Draft时资源消耗是V6的两倍;而开启Draft后,仅为V6的1/2(约1-2个Fast Hours点数),性价比极高。
此外,Upscalers 、Zoom Out、 和 Editor 功能暂未适配V7,仍调用V6模型。
语音生图:中文支持,智能提示生成
V7的另一大亮点是语音生图模式。在MidJourney官网右上角点击“Start Voice Mode”,打开麦克风后,用户可以用中文语音描述想要的图像。
系统不会直接翻译文字,而是根据描述智能生成AI提示词,类似GPT的辅助创作。
例如,我说“画一个写诗风格的小男孩”,不到2秒就生成了4张符合意境的图片;
接着说“要一个16:9的图片”,系统立刻调整分辨率并生成新图。
更厉害的是,它支持上下文连接,画面无缝衔接,超级适合用来创作绘本或故事插图。
图像质量:细节惊艳,多风格适配
V7在文本与图像提示的理解能力上更加智能,尤其是在人物细节处理上表现卓越。我测试了人物生成,输入关键词后放大查看,毛孔、毛发和皮肤纹理的真实感令人震撼,完全没有V6那种明显的“AI感”。
从写实度上看,V7的提升如同Stable Diffusion从SDXL跃升至Flux。
多人场景测试中,我输入“一张家庭合照,爸爸妈妈女儿和孩子四个人”,V7准确生成了四人画面;
再试“10人组合照”,人数也完全吻合。
不过放大远景人物时,部分面部仍有崩塌现象,复杂场景下的细节仍需优化。
除了写实风格,V7在皮克斯风格、80年代动漫风格等二次元场景中同样出色。生成的卡通人物饱和度更高,配色鲜艳自然,即使不指定颜色提示词,效果也十分抓眼。
例如“骑着摩托车的女生”生成的图像,视觉冲击力极强,适合海报或游戏场景设计。
可爱的卡通形象如“卡皮巴拉”和“树懒”也让人爱不释手。
个性化设置:定制专属审美
V7是MidJourney首款默认开启个性化设置(Personalization)的模型。通过解锁该功能,可让生成结果更贴近个人审美。
V7需从200张图片中挑选喜欢的风格(V6仅需40张),可用鼠标或快捷键(1选左、2选右、3跳过)选择。
完成设置不仅提升效果,还能获得免费Fast Hours奖励。我昨天选了50-60张,就拿到了107分钟Fast Hours,外加1小时GPU Hours。不过,奖励限每天前2000名用户,建议多选以确保上榜。
未来期待:角色引用与AI视频
官方透露,未来60天内将每1-2周推出一项新功能,其中最受期待的是角色和对象引用,可能涉及人物一致性或外部图片融合,具体细节待公布。
MidJourney正在研发AI视频生成模型。据3月20日官网消息,他们已完成技术开发,正通过调研决定发布时间。未来若推出AI视频,或将在分辨率、时长和一致性上实现突破。
不足之处
V7的文字生成能力提升有限。例如输入“ARLULU”,系统仅简单将文字附在图像上,且识别效果没得到改进,类似PS效果,与V6差别不大。
此外,人物一致性仍是短板,多场景下角色面部易失真。可用CRIF(风格控制)和SRIF(一致性控制)功能改善,但效果不及Comfy UI。
V7凭借Draft模式的超高效率、语音生图的便捷性和细节处理的惊艳表现,在美学审美与图像质量上稳居前列。结合近期GPT-4o、Comfy UI 2.1等工具的更新,AI圈正迎来“一天人间一年”的爆发期。
暂无评论内容