AI日报:阶跃星辰内测视频大模型Step-Video;即梦AI图片2.1模型支持生成文字;腾讯发布混元视频生成大模型


欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用 。
新鲜AI产品点击了解:https://top.aibase.com/
1、阶跃星辰视频生成大模型Step-Video开启内测 可在跃问视频申请
阶跃星辰的Step-Video模型正式开启内测,用户可以通过跃问视频官网申请资格 。该模型支持从文本生成高达1080P分辨率、最长10秒的视频,展现出在自动优化提示词、美学风格和运动控制方面的显著优势 。
2、Luma发布全新图像生成模型Luma Photon,速度更快,成本更低!
Luma Labs推出的Luma Photon和Photon Flash是两款革命性的图像生成模型 , 具有超高的生成速度和低成本优势 。Luma Photon在多项测试中表现出色,能够生成高质量的图像,适用于广告、影视、艺术等多个领域 。
3、可灵AI导演共创计划作品12月6日上线 将发布9部电影级AI视频
快手科技宣布将于12月6日正式上线中国首个AIGC导演共创计划——“可灵AI导演共创计划” 。此计划由快手自研的视频生成大模型“可灵AI”联合多位知名导演共同发起,旨在通过AI技术拓宽影视创作的边界 。
4、字节旗下即梦AI灰测图片2.1模型 AI生图终于可以出中文字体了!
字节跳动旗下的即梦AI最近推出了图片2.1模型,解决了AI图像生成中文字体的问题 。用户只需简单输入文字描述,便可快速生成个性化海报 , 极大提高了设计师的工作效率 。新模型的应用场景广泛,包括海报制作、书籍封面设计和社交媒体配图 。
5、秘塔AI搜索:「学术搜索」数据增加7倍 新增”解释“功能
上海秘塔网络科技有限公司最近对其AI秘塔学术搜索功能进行了重大升级,数据量增加了7倍,用户现在可以更全面地检索到数千万篇Open Access论文,包括40%的SCI论文及顶级期刊如《Nature》和《Science》 。此次更新还新增了“解释”功能,帮助用户理解复杂的文献内容 。
6、李飞飞创业首秀:一张图生成交互式3D 世界,AIGC 进入全新时代!
李飞飞的最新创业项目World Labs,带来了颠覆性的3D生成技术 。用户只需提供一张图片或一句话,就能创造出互动的3D场景 , 标志着AIGC进入全新的沉浸式时代 。这项技术不仅能精准还原细节,还能模拟各种相机效果,赋予用户导演般的控制感 。
7、告别语音克隆侵权!Hume AI推出语音控制功能,可创建个性化AI语音
Hume AI最近推出了一项名为“语音控制”的实验性功能 , 使用户能够轻松创建个性化的AI声音,无需任何编码技能 。该功能允许用户通过滑块调整声音特征,提供多种维度的定制选项,旨在满足多样化的应用需求 。
8、Cohere推新的搜索模型 Rerank3.5:可处理100多种语言精准查询
Cohere最近推出的Rerank3.5搜索模型,标志着企业数据检索的重大进步 。该模型支持超过100种语言的查询,尤其在阿拉伯语、日语和韩语等主要商业语言中表现出色,帮助跨国公司打破语言障碍 。内部测试显示,Rerank3.5在金融服务领域的表现显著提升,能够节省成本并降低风险 。
9、OpenAI CFO 回应广告传闻:当前不考虑引入广告模式
OpenAI的首席财务官Sarah Friar在接受采访时表示,当前公司并无计划引入广告 , 尽管广告收入对盈利公司来说是一个诱人的选择 。Friar提到,OpenAI正在快速增长,并在现有商业模式中发现了机会,未来可能会探索其他收入来源 。
10、提到 “David Mayer”一词ChatGPT就崩溃,这是什么神秘力量?
最近,社交媒体上出现了一个让人困惑的现象:OpenAI的聊天机器人ChatGPT在提到“David Mayer”时无法正常回应,并强制结束对话 。这一现象引发了网友们的广泛讨论与猜测,许多人尝试询问ChatGPT有关“David Mayer”的信息,却都遭遇了同样的结局 。
11.WPS Office 推出 AI 语音速记功能
WPS Office 近期发布了 AI 语音速记功能,增强了语音转文字的体验,支持实时录音和多语言互译 。该功能通过声纹识别和 AI 自动总结提升准确性,并与 WPS 云文档深度整合,确保用户在录音过程中能顺利继续录音 。用户可在最新版本的 WPS Office 中轻松找到并使用此功能 。
12.腾讯发布混元视频生成大模型: 130 亿参数全面开源
【AI日报:阶跃星辰内测视频大模型Step-Video;即梦AI图片2.1模型支持生成文字;腾讯发布混元视频生成大模型】腾讯推出了混元视频生成模型,拥有 130 亿参数,是当前最大开源视频生成模型 。该模型支持高清、真实感视频生成,适用于广告和创意视频等商业应用 。用户可通过腾讯元宝 APP 和腾讯云接口进行试用或对接,降低了视频生成的技术门槛 , 促进了 AI 技术的普及 。

    推荐阅读