Higgsfield是一家专注于电影级镜头控制技术的AI视频生成初创公司,致力于为营销人员和内容创作者提供专业级视频制作能力。2025年4月1日发布新模型和视频Demo,主打各种高级电影摄影效果,在社交媒体上有一定声量。CEO Alex在访谈中透露这个功能针对影视行业从业者的具体痛点,“只花了预算的1%,大约四个月的研发时间。”
核心技术
专有AI驱动镜头控制实现电影级运镜效果,如360度环绕、子弹时间和推拉镜头
人工精标数据:由影视专业人士对关键帧进行专业运镜参数标注,建立镜头语言参数库。通过移动应用持续收集用户行为数据优化创意理解
「本期简介」
这是一场关于AI摄像技术革命的对话,主要嘉宾Alex来自Higgsfield公司,他们开发了能模拟各种摄像机动作的AI工具。讨论了现有技术的突破,AI摄像在社交媒体和影视行业的应用,以及未来发展方向。
X Space链接Interview with Alex (CEO)
「本期嘉宾」
主持人:Robert,摄影和VR领域专家;Irena,对AI和机器人领域有深入了解的参与者。
嘉宾:Alex Mashrabov,Higgsfield创始人,前Snapchat AR滤镜技术负责人,主导MyAI聊天机器人开发;2020年将AI Factory以1.66亿美元出售给Snap。
「精选内容」
AI视频的现状
"I think we have a long way to go. I mean, that's just the first release, which kind of democratizes maybe 90, 99 percent of the effects, but not the hundred percent."
当前阶段:视频AI处于关键时期 - 质量达到历史新高,但制作成本仍然高昂(一分钟高质量内容约需50美元)。这使得技术主要服务于专业人士,而非普通消费者。
Higgsfield的实用主义方法:
专注解决具体问题而非追求理论突破:"我们总是从专业人士那里学习,确保我们能够解决市场上的最大瓶颈,而不是从零开始重新定义行业。"
快速迭代周期:"制作AI相机只花了我们预算的1%,大约四个月的研发时间,就超越了Runway和市场上许多其他模型。建立这种非常短而快速的反馈循环非常重要。"
基于用户反馈持续改进:"我总是告诉团队倾听客户的声音并保持谦逊。我们欢迎业内专业人士的反馈,确保我们从中改进。"
优先解决高影响力功能:"我们首先解决90-99%的效果,使大多数创作者能够使用这些工具,然后再逐步完善剩余的细节。"
针对具体用例开发:"我们清楚地知道我们为谁解决什么问题...我们不是带着非常强烈的世界应该如何的观点,我们只是试图让这项技术变得可及。"
2. 未来3-5年展望
“We definitely work towards the future where like 99 percent of pixels which we consume on social media are going to be generated with AI."
Alex大胆预测:未来两年内,社交媒体内容将有90-99%由AI生成。
行业变革展望:
AI生成内容在完成率、参与率和点击率方面已超越传统内容
广告、音乐视频等商业领域率先采用,生产成本大幅降低
好莱坞转型相对缓慢
未来3-5年内,AI视频技术将实现突破性发展,能够完美模拟最复杂的电影级视觉效果,包括超级碗广告和电影制作。这场技术民主化浪潮必将重塑创意内容生产格局。
商业模式
除了2C的订阅模式以外,Higgsfield的B2B商业模式主要包括:
定制模型训练 - 为专业工作室提供针对其特定IP和角色的自定义AI模型,确保角色一致性
特定风格定制 - 根据客户需求创建特定动画或视觉风格的模型
使用授权 - 客户付费使用这些定制训练的模型
Alex特别强调专业工作室通常会带着自己的IP(知识产权)和特定需求来合作,这需要Higgsfield提供超出标准B2C产品的定制化服务。这种B2B模式针对的是好莱坞工作室、广告公司和专业YouTube制作团队等企业级客户,他们需要将AI视频技术应用于商业项目,并确保与其现有品牌资产的一致性。
公司名的由来
公司名称"Higgsfield"(希格斯场)源自物理学概念,旨在吸引物理学家加入AI行业,因为Alex认为这些了解世界运作方式的专业人士能够更好地解决AI领域的关键问题。
实虚相机能结合吗?
"What you are describing is like bringing physical cameras to the job, kind of building this bridge between digital and physical cameras using AI. It is going to require this full world model."
Alex确认Higgsfield正探索将实体相机与AI生成技术结合的前沿方向。这种融合面临的核心挑战是创建真正的"世界模型"——能深入理解现实并实现物理与数字无缝连接的AI系统。
他透露公司计划与"世界上最好的研究团队之一"合作专门研究这个领域。这种技术将允许创作者用实体相机捕获内容,再应用AI进行风格化处理,或在物理场景中移动虚拟相机。
Alex预计这类技术需要3-5年才能成熟,与社交媒体AI内容的快速普及形成对比。Higgsfield采取渐进方法,先解决民主化和讲故事问题,而这种先进的物理-数字融合技术可能率先在好莱坞等高端领域应用,然后才进入主流市场。
「衍生思考」
随着AI与真实内容界限日益模糊,用户视角有效识别内容真实性对于整个媒体行业是一个关键挑战。虽然Alex未详细讨论标记AI内容的机制,但这正成为全球监管焦点。中国已率先要求AI生成内容必须添加标签,而欧洲也在考虑类似措施。类似于Higgsfield的各类AI公司应积极参与建立行业标准,而非被动等待监管。
核心伦理挑战包括:
内容透明度:随着AI生成内容质量提高,辨别真实与生成内容变得困难,可能导致信息混淆和误导。
隐私问题:使用互联网数据训练模型涉及复杂隐私问题,特别是当摄像技术涉及人物肖像。
训练数据:用户上传数据责任,以及Alex提到的定制模型训练需要明确数据使用边界和责任归属。
潜在偏见:AI摄影风格可能复制并放大现有视觉媒体中的偏见,需要多样化数据集和评估机制。
Higgsfield"向专业人士学习"的理念和方法值得肯定。Alex强调公司不断从行业专家那里收集反馈,确保技术发展符合实际需求。这种人机协作方法有助于创建更符合专业标准的工具,同时关注解决实际问题而非纯粹技术驱动,通过HITL的设计,也为AI系统提供了一层兜底策略。
知识产权与所有权 最近的AI版权案例显示内容创作领域正面临重新定义。2025年3月18日最新的Thaler诉美国版权局案 (Thaler v. U.S. Copyright Office)一案给AI创作者提供了一定的借鉴意义:美国版权局允许注册由人类使用AI创作的作品,前提是有"足够的人类参与"。具体请看这期「策听」Bloomberg Law - Only Humans have Copyright (待上传)
「本期章节」
00:01:07 开场讨论:摄像技术和机器人的发展
00:08:29 Alex加入讨论AI摄像技术
00:13:42 视频AI的现状和成本
00:18:25 新型摄像机语言需求与好莱坞影响
00:24:14 AI生成的独特摄像风格
00:29:08 AI摄像技术的商业模式
00:32:02 公司名称的由来及技术愿景
00:37:20 VR、游戏和创作者经济的未来
00:46:35 AI视频与实体相机的结合
00:54:16 互动视频体验的未来发展