OpenMontage 是 2026 年崛起最快的開源 AI 專案之一——上線數天內就在 GitHub 突破數萬顆星,並一度登上 GitHub Trending 榜首。如果你一直看到這個名字,想用最白話的方式搞懂 OpenMontage 到底是什麼、該怎麼用,以及它能不能取代 HeyGen、Synthesia 或 VisionStory 這類工具,這份指南都會講清楚。原始專案:github.com/calesthio/OpenMontage(採 GNU AGPL-3.0 授權)。
OpenMontage 是什麼?
OpenMontage 是一套開源、以代理(agent)驅動的框架,能把 AI 程式設計助手——例如 Claude Code、Cursor、Copilot、Codex 或 Windsurf——變成一座完整的影片製作工作室。你不必在時間軸上點來點去,只要用自然語言描述想要的影片,代理就會替你跑完整條流程:網路調研、撰寫腳本、規劃分鏡、生成素材、剪輯,直到最終輸出。
關鍵在於要理解這一點:OpenMontage 是一款開發者工具,不是雲端託管的網站。它沒有註冊頁面,也沒有瀏覽器應用程式。你要用 Python、Node.js 和 FFmpeg 在本機安裝它,再透過你的 AI 程式設計助手來操控。這讓它極為靈活,而且免費就能運行,但同時也代表確實需要一番安裝設定的功夫。
OpenMontage 如何運作:整條流程
OpenMontage 沒有中央化的協調器。你的 AI 助手會讀取人類可讀的 YAML 製作清單(manifest)和 Markdown 技能檔,然後逐階段呼叫 Python 工具。每一條流程大致都走相同的路徑:

在生成素材時,它可以從 Archive.org、NASA、Wikimedia 等免費資料庫抓取真實的素材影像與動態畫面,或在你提供金鑰時呼叫付費的生成 API。供應商的選擇會經過評分並具備自動備援機制,而且每個階段都會記錄它的推理過程與預估成本,讓整次執行都能被稽核。
重點功能一覽
- 12 條製作流程——說明影片、真人講解(talking head)、螢幕示範、預告片、動畫、紀錄片式蒙太奇、Podcast 二次利用,以及在地化。
- 52 種以上製作工具與 500 種以上代理技能,涵蓋影片生成、圖像生成、文字轉語音、配樂、字幕與畫質強化。
- 多供應商搭配評分式備援——14 套影片生成器、10 種圖像工具,以及 4 套 TTS 系統,並可選用 Kling、Runway Gen-4、Veo 3、FLUX、DALL-E 3 與 ElevenLabs。
- 真正零成本的路徑,採用離線的 Piper TTS、Remotion 輸出、FFmpeg 與免費資料庫素材——完全不需付費 API。
- 參考素材驅動的創作——指向一段 YouTube 影片或短影音,它就會分析其節奏與風格來產出變化版本。
- 品質與預算把關——合成前驗證、輸出後自我審查、花費上限,以及逐動作的核准門檻。
如何使用 OpenMontage:逐步安裝設定
OpenMontage 在本機運行,所以在製作第一支影片前,你得先準備好幾項前置條件。
前置需求
- Python 3.10 或更新版本
- Node.js 18 或更新版本
- 已安裝 FFmpeg 並加入 PATH
- 一款 AI 程式設計助手(Claude Code、Cursor、Copilot、Codex 或 Windsurf)
安裝設定
- 複製儲存庫(repository)。執行
git clone https://github.com/calesthio/OpenMontage再執行cd OpenMontage。 - 安裝相依套件。執行
make setup安裝 Python 與 Node 的工具鏈。 - 加入 API 金鑰(選用)。如果你想使用進階生成功能,就把供應商金鑰加入你的環境變數。想維持免費的本機路徑,可以略過這一步。
- 對助手下提示(prompt)。在你的 AI 程式設計助手裡開啟專案,然後描述影片,例如:做一支關於神經網路的 60 秒動畫說明影片。代理就會處理調研、腳本、素材、剪輯與輸出。
由於官方專案目前還沒有附上逐步教學,第一次操作時,請預期要先讀過內附的 AGENT_GUIDE 與技能檔。
OpenMontage 要花多少錢?
OpenMontage 本身依 AGPL-3.0 授權,免費且開源。你真正的花費取決於使用哪些供應商:
- 免費本機路徑:Piper TTS、Remotion、FFmpeg 與免費資料庫素材,除了你自己的硬體與時間之外不需任何花費。
- 進階 API:當你接上付費的影片、圖像或語音生成器時,一支短影片通常落在大約 0.15 至 3 美元之間,視長度與你呼叫哪些模型而定。
它沒有訂閱制,也沒有按席次計價,這對開發者來說是很大的吸引力——但你是在用金錢換取安裝設定與維護的時間。
你能用它做出什麼
該專案透過其官方 YouTube 頻道上的展示作品集來呈現它的能耐——電影感預告片、60 秒動畫短片、歷史微型紀錄片、含資料視覺化的產品廣告,以及動漫風格的作品,其中好幾支的製作成本都遠低於兩美元。對於說明影片、社群短影音、行銷短片,以及希望完全掌控每個分鏡的教育內容來說,它都非常合適。
Demo videos by OpenMontage (github.com/calesthio/OpenMontage), embedded for reference.
OpenMontage 對比雲端託管 AI 影片工具(VisionStory、HeyGen、Synthesia)
大多數人最後都會卡在這個問題上,所以我們坦白說:OpenMontage 和雲端託管的虛擬人(avatar)工具解決的是不同的問題。
- 選 OpenMontage,如果你對 Python 和 FFmpeg 駕輕就熟、想要跨多家供應商的流程級掌控權,而且你重視免費的本機路徑勝過速度。
- 選雲端託管工具,如果你只想快速拿到一支成品影片,完全不必安裝設定。VisionStory 能直接在你的瀏覽器裡,幾分鐘內把一張照片或一段腳本變成嘴型同步的虛擬人講解影片——不需 Python、不需 FFmpeg、不需 API 金鑰。
如果你的目標明確就是要做一支會說話的主持人或代言人影片,雲端託管的虛擬人工具幾乎一定會更快。你可以在我們的比較文章中看看各家雲端方案如何較勁:VisionStory 對比 HeyGen 與 VisionStory 對比 Synthesia,或直接前往體驗 AI 影片創作。
想做一支會說話的影片,卻什麼都不想安裝?免費試用 VisionStory——上傳一張照片、輸入腳本,幾分鐘內就能得到一支可分享的虛擬人講解影片。
