本文最后更新于 2025-04-09,文章内容可能已经过时。

项目简介

Krillin AI 是一款功能强大的本地化音视频处理工具,专注于提供一站式的视频翻译、配音和增强解决方案。它设计简洁而功能丰富,能够帮助内容创作者轻松将视频内容适配到各大主流平台(包括哔哩哔哩、小红书、抖音、视频号、快手、YouTube、TikTok等),支持横竖屏格式输出,确保内容在不同平台上都能完美呈现。

通过端到端的自动化工作流程,Krillin AI 只需几次点击操作,即可将原始视频素材转化为高质量的跨平台内容,大幅提升内容创作效率。

核心功能亮点

  • 🎯 一键启动:无需复杂环境配置,自动安装所有依赖,即开即用。全新桌面版本让操作更加便捷!

  • 📥 多源视频获取:支持通过yt-dlp从各大平台下载视频,也可直接上传本地视频文件

  • 📜 高精度语音识别:基于Whisper模型的语音识别技术,确保字幕准确度

  • 🧠 智能分段处理:利用大语言模型(LLM)进行智能字幕分段和时间轴对齐,使字幕呈现更加自然

  • 🔄 专业术语优化:一键替换专业领域词汇,确保内容专业性

  • 🌍 语义连贯翻译:采用段落级翻译技术,基于LLM保持语义连贯性,翻译质量远超传统工具

  • 🎙️ 高质量配音与克隆:提供CosyVoice精选音色库,也支持自定义音色克隆,让配音更贴合内容风格

  • 🎬 智能视频合成:自动处理横竖版视频和字幕排版,一键生成适配各平台的成品视频

效果展示

  • 精准字幕识别与翻译:46分钟本地视频一键处理后的效果展示,字幕无缺失、无重叠,断句自然,翻译质量优异,无需任何手动调整。

  • 专业配音效果:通过AI技术生成的自然流畅配音,与视频内容完美融合。

  • 竖屏适配:自动将横版视频转为竖屏格式,适配移动端平台需求。

界面预览

语言支持

  • 输入语言:中文、英文、日语、德语、土耳其语等(持续扩展中)

  • 翻译语言:支持英文、中文、俄语、西班牙语、法语等56种语言的互译

快速开始

基本步骤

  1. https://github.com/krillinai/KrillinAI/releases页面下载与您设备系统匹配的可执行文件

  2. 将文件放入一个空文件夹中(便于管理生成的文件和目录)

  3. 根据您下载的版本类型,按照以下指引操作:

桌面版(文件名带"desktop"标识)

桌面版专为新手用户设计,操作简单直观:

  • 直接双击文件即可启动应用程序

  • 通过图形界面完成所有操作

  • 注意:桌面版为新发布版本,仍在持续优化中

非桌面版(文件名不带"desktop"标识)

非桌面版功能更稳定,适合高级用户和服务器部署:

  1. 在文件夹内创建config文件夹

  2. config文件夹中创建config.toml文件

  3. 复制源代码config目录下的config-example.toml文件内容到config.toml

  4. 按照说明填写配置信息

  5. 双击或在终端执行可执行文件启动服务

  6. 打开浏览器,访问http://127.0.0.1:8888(端口号以您的配置为准)

macOS用户特别说明

桌面版用户

  • 下载后可能需要将文件名改为"KrillinAI"后双击运行(此问题正在修复中)

非桌面版用户

由于软件未签名,需要在终端执行以下命令授权:

sudo xattr -rd com.apple.quarantine ./KrillinAI_1.0.0_macOS_arm64
sudo chmod +x ./KrillinAI_1.0.0_macOS_arm64
./KrillinAI_1.0.0_macOS_arm64

Docker部署

本项目支持Docker部署,详细说明请参考Docker部署文档

配置指南

快速配置方案

最简便的配置方式:

  • transcription_providerllm_provider都设置为openai

  • 在配置文件中只需填写openai.apikey即可开始使用

  • app.proxymodelopenai.base_url可按需配置

本地语音识别配置(兼顾成本与质量)

  • transcription_provider设置为fasterwhisper

  • llm_provider设置为openai

  • 填写openai.apikeylocal_model.faster_whisper配置项

  • 本地模型会自动下载(注意:暂不支持macOS)

阿里云服务配置

以下情况需要配置阿里云服务:

  1. 使用阿里云大模型服务(llm_provider设为aliyun):需配置aliyun.bailian

  2. 使用阿里云语音服务(transcription_provider设为aliyun或启用配音功能):需配置aliyun.speech

  3. 使用音色克隆功能并上传本地音频:需配置aliyun.oss

详细配置说明请参考阿里云配置文档

Cookie配置(可选)

如遇视频下载失败情况,请参考Cookie配置说明完成相关设置。

软件下载

如果没有条件访问GitHub的朋友,这里也准备了本地win包:

夸克网盘

我用夸克网盘分享了「Krillin AI」,点击链接 链接:https://pan.quark.cn/s/e49054b66693

百度网盘

通过网盘分享的文件:Krillin AI
链接: https://pan.baidu.com/s/1fK4vi9FFnItOi3crmCVPog?pwd=kfm3
提取码: kfm3

- END -