可灵AI生成视频的完整工作流:从提示词到成片,每一步我都跑过了
可灵AI(Kling AI)是快手在2024年6月推出的视频生成模型,到现在已经迭代到1.6版本。和Runway、Pika这些国外工具相比,可灵最大的优势有两个:一是免费额度慷慨,新用户注册送66个灵感值,每天签到还能再领;二是对中文提示词的理解更好,你不需要费劲翻译成英文也能得到不错的效果。
我最近一个月用可灵AI做了30多条短视频,包括产品展示、自然风景、城市航拍、人物动作等不同类型。这篇文章不是简单罗列功能,而是把从提示词设计到最终成片的完整工作流拆解出来,每个环节都配上实际操作步骤和踩坑记录。
可灵AI的三个核心功能
很多人把可灵AI等同于”文生视频”,但它其实有三个独立的功能模块,适合不同的使用场景:
| 功能 | 输入方式 | 视频时长 | 免费消耗 | 适合场景 |
|---|---|---|---|---|
| 文生视频(Text to Video) | 文字描述 | 5秒/10秒 | 10灵感值/条 | 从零创建新画面 |
| 图生视频(Image to Video) | 图片+描述 | 5秒/10秒 | 10灵感值/条 | 让静态图片动起来 |
| 视频续写(Video Extend) | 已有视频 | 续写5秒 | 5灵感值/条 | 延长现有视频时长 |
66个灵感值听起来不多,但如果你策略性地使用——主要用图生视频(成功率最高),配合视频续写——实际能产出7-8条可用的5秒视频。如果购买会员(标准版39元/月,送666灵感值),可以支撑60多条视频的生成。
文生视频:提示词是关键
文生视频是可灵AI最基础也是最考验提示词能力的功能。一段好的提示词能让生成质量提升一个档次。以下是我在实践中总结出来的提示词模板:
提示词结构公式
一个好的视频生成提示词应该包含以下要素(按优先级排列):
- 主体描述:视频的核心内容是什么(一个人/一个物体/一个场景)
- 动作/运动:主体在做什么(走动/旋转/飘落/飞行)
- 镜头运动:摄像机怎么移动(推进/平移/航拍/跟随)
- 环境/氛围:光线、天气、时间、色调
- 风格/画质:写实/动画/电影感/4K
举个例子,同样是”海边”这个场景:
- ❌ 差的提示词:海边的风景,有浪花
- ✅ 好的提示词:航拍视角缓缓下降,俯瞰一片金色沙滩,碧蓝的海浪轻轻拍打岸边,远处有几块礁石,夕阳的光线洒在海面上,电影质感,4K画质
两者的生成效果差距非常明显。差的提示词生成出来的画面模糊、构图混乱,好的提示词则画面稳定、构图专业。
不同场景的提示词示例
以下是我实测效果较好的几类场景提示词,你可以直接参考修改:
- 城市夜景:延时摄影风格,高楼林立的城市天际线,车流灯光形成的光带在街道上流动,夜空中有些许星光,霓虹灯倒映在湿润的路面上
- 自然风景:斯坦尼康稳定器跟随拍摄,镜头穿过一片茂密的竹林,阳光透过竹叶形成斑驳的光影,微风吹过竹叶轻轻摇曳
- 产品展示:产品在纯白背景上缓慢旋转展示,柔光照明,阴影柔和,镜头从侧面缓慢推进到正面特写
- 人物动作:中景镜头,一个穿白色连衣裙的女孩在樱花树下旋转,花瓣随风飘落,慢动作效果
图生视频:成功率最高的方式
如果你用过可灵AI的文生视频,大概率经历过生成结果和预期差距较大的情况。图生视频是解决这个问题的最佳方案——你先用Midjourney或Stable Diffusion生成一张高质量的首帧图片,然后让可灵AI基于这张图片生成视频。
这样做的好处是:你已经确定了画面的构图、风格和主体,AI只需要负责”让它动起来”,不确定性大幅降低。根据我的统计,图生视频的成功率(一次生成就能用的比例)大约在60-70%,而文生视频只有30-40%。
图生视频操作步骤
- 准备一张高质量的首帧图片(推荐用Midjourney生成,如果你还没用过,可以参考 Midjourney国内使用指南)
- 打开可灵AI网页版(kling.kuaishou.com),选择”图生视频”
- 上传你的图片,在下方输入描述图片中你希望发生的运动
- 选择视频时长(5秒或10秒),10秒的效果更完整但消耗双倍灵感值
- 点击生成,等待约1-3分钟
- 如果结果不满意,可以点击”重新生成”或调整提示词后重试
图片生成视频时的提示词不需要像文生视频那么详细,因为你已经通过图片确定了大部分视觉信息。提示词主要聚焦在”运动”上:风吹动头发、水波荡漾、镜头缓缓推进等。
视频续写:把5秒变成30秒
可灵AI单次最多生成10秒的视频,对于很多场景来说太短了。视频续写功能可以解决这个问题——它会把已有视频的最后几帧作为起点,继续生成新的内容。
我的做法是:先用图生视频生成一个5秒的基础视频,然后用视频续写功能连续续写4-5次,最终得到25-30秒的视频。需要注意以下几点:
- 续写时运动方向的连贯性:如果原视频是向右移动的,续写时要明确告诉AI”继续向右”
- 时间流逝的一致性:如果原视频是白天,续写时不要突然变成黄昏
- 每次续写之间最好间隔几秒操作,避免生成结果雷同
- 最终拼接时在剪映等工具中做过渡处理,遮盖续写接缝
续写5次+1次图生视频=6次操作=55灵感值,大约能生成30秒的视频。虽然会有一些不连贯的地方,但通过后期剪辑可以处理得比较自然。如果你对视频生成的整体工具生态感兴趣,可以看看 AI视频生成工具的全面对比。
可灵AI vs 其他视频生成工具
如果你在选择视频生成工具,以下是可灵AI和几个主要竞品的对比。需要说明的是,各工具更新很快,数据基于2026年4月的版本:
| 对比项 | 可灵AI 1.6 | Runway Gen-3 Alpha | Pika 2.0 | Sora |
|---|---|---|---|---|
| 最长视频时长 | 10秒 | 10秒 | 4秒 | 20秒 |
| 分辨率 | 1080p | 720p(免费) | 720p | 1080p |
| 中文提示词 | 优秀 | 一般 | 一般 | 较差 |
| 免费额度 | 66灵感值 | 125积分 | 30积分 | 无免费额度 |
| 国内访问 | 直接访问 | 需梯子 | 需梯子 | 需梯子 |
| 图生视频 | 支持 | 支持 | 支持 | 支持 |
| 视频续写 | 支持 | 支持 | 不支持 | 支持 |
| 月费 | 39元起 | $12起 | $8起 | $20起 |
可灵AI在中文支持、国内访问和性价比上有明显优势。Runway Gen-3在画面质感和运动流畅度上略胜一筹,但需要翻墙且价格更高。Sora虽然能生成20秒视频,但免费额度为零且国内使用门槛最高。如果你还在纠结选哪个,我的建议是:国内用户首选可灵AI,除非你对画面质量有极致追求且不介意翻墙。
高级技巧:提升生成质量的5个方法
- 参考视频功能:可灵AI支持上传一段参考视频来控制运动风格。比如你想生成一段赛车的视频,上传一段真实的赛车视频作为运动参考,生成的运动轨迹会更自然
- 负面提示词:在可灵AI的设置中可以添加负面提示词(不希望出现的内容),比如”不要变形、不要模糊、不要文字水印”
- 分辨率选择:可灵AI支持横屏(16:9)和竖屏(9:16)两种比例,根据你的发布平台选择。抖音/快手用竖屏,B站/YouTube用横屏
- 生成后放大:先用低分辨率快速生成多个版本筛选,选中最满意的一个后用高清模式重新生成
- 多版本对比:同一个提示词生成3-4个版本,从中挑选最好的。虽然消耗更多灵感值,但比反复调整提示词效率更高
关于AI图片生成的基础知识,如果你还想了解 Stable Diffusion 等工具,可以参考 Stable Diffusion安装教程。
常见问题
可灵AI生成的视频有水印吗?
免费用户生成的视频右下角会有”可灵AI”的水印。开通会员后(39元/月标准版)可以去除水印,获得商用授权。如果你只是自己娱乐或发社交媒体,免费版的水印问题不大。
可灵AI生成一条视频要多久?
5秒视频大约需要1-2分钟,10秒视频大约需要2-3分钟。高峰时段(晚上8-11点)可能需要更长时间,最长不超过5分钟。视频续写的时间略短,大约30秒到1分钟。
生成的视频版权归属?
根据可灵AI的用户协议,付费用户生成的视频拥有商用授权,可以用于短视频创作、广告素材、产品展示等。免费用户生成的内容仅限个人非商用。不过需要注意,如果你用他人享有版权的图片作为图生视频的输入,可能存在版权纠纷风险。
为什么我生成的视频画质很差?
画质差通常有三个原因:一是提示词太模糊,AI不知道你要什么效果;二是没有使用”高清模式”(会员功能);三是选择的场景本身就很复杂(比如大量人物、快速运动),这类场景对AI的挑战更大。建议先从简单的场景开始练习,逐步增加复杂度。
可灵AI能生成带声音的视频吗?
不能。可灵AI只生成无声视频。如果需要配乐或音效,可以在剪映等工具中添加。可灵AI的网页端有”智能配音”入口,但那是一个独立的TTS功能,不是视频原声。
手机上能用可灵AI吗?
可灵AI的网页版(kling.kuaishou.com)在手机浏览器中可以正常使用,但体验不如电脑端。快手App内也集成了可灵AI的功能入口,但功能比网页版少。建议在电脑上操作,手机只用于查看结果和分享。