Runway推出新一代视频生成模型 Gen-3 Alpha,具备更高的保真度和一致性,能够生成逼真的人类角色和 […]
麻省理工学院(MIT)的研究人员开发了一款名为Future You “未来的你”的AI聊天机器人,它可以让你和 […]
DeepSeek宣布发布开源模型DeepSeek-Coder-V2,该模型在代码和数学能力上超越了GPT-4- […]
DeepMind最新研发了一种叫视频转音频(V2A)的技术。这种技术可以根据视频画面和文字描述,自动生成丰富的 […]
Color Health与OpenAI合作开发了一款名为Color’s copilot的工具,旨在通过使用GP […]
MimicBrush 由阿里巴巴开发的一种新型的图像编辑方法,也可以称为模仿编辑(imitative edit […]
通过语音音频输入来驱动肖像图像生成动画视频,也就是一段语音+个人图像生成会说话唱歌的视频。 研究团队提出了一种 […]
随着人工智能的快速发展,诸如GPT-4和LLaMA等大语言模型在自然语言处理能力方面取得了显著进步。这些模型展 […]
如果你想让通过ChatGPT来生成图像,一般一次只会生成一张,一张一张的生成而且想要保持图像风格和角色一致非常 […]
NVIDIA 发布了 Nemotron-4 340B 开源模型家族,该模型主要用于生成高质量的合成数据,从而提 […]
“Soft and Squishy Linework” 是一个文本生成图像模型,专门设计用于创建柔和的、低保真 […]
移动设备和可穿戴设备(如智能手表和健身追踪器)能够持续、详细和长期地记录个人的生理状态和行为数据。例如: 步数 […]
VideoLLaMA 2 是一个旨在提升视频大语言模型(Video-LLM)时空建模和音频理解能力的项目。该模 […]
MaxKB 是一个基于大语言模型 (LLM) 的智能知识库问答系统。它能够帮助企业高效地管理知识,并提供智能问 […]
PROTEUS是斯坦福大学的研究人员和Apparate Labs推出的一款用于生成逼真、具有表现力的人类形象的 […]
Luma Dream Machine 基于 DIT 视频生成架构,能够快速从文本和图像生成高质量、逼真的视频。 […]
Suno 发布了一项新功能,允许用户从任何声音创建歌曲。所有专业版和高级版用户现在可以上传或录制音频,并将其转 […]
Uizard 发布 Autodesigner 2.0 AI设计引擎,结合了 uizard 的专有模型和Anth […]
东京大学的一组研究人员开发并训练了一款名为Musashi的“肌骨类人机器人”,能够驾驶一辆小型电动车。这款机器 […]
吴恩达 Andrew Ng 分享了一种基于反思代理工作流的机器翻译 Python 实现。他认为它有可能超越传统 […]
俄罗斯科技巨头Yandex发布了一款新的开源工具YaFSDP,称可以帮助AI公司在训练新模型时节省资金和资源。 […]
Stability AI 开源其Stable Diffusion 3 Medium 模型,该模型是其迄今为止最 […]
这个版本主要在以下几个部分做了改进: 1、可更换的主屏幕图标颜色。 2、重新设计的控制中心。 3、应用加密、通 […]
在本教程中,我们将一步步教你如何在私人Discord服务器中通过Midjourney,来创建和个性化图像。即使 […]
个性化功能是Midjourney用来根据你的喜好生成图像的一种工具。它会记住你喜欢什么样的图像,然后根据你的喜 […]
苹果今日发布了 iOS 18 预览版,推出了更多自定义选项,为照片 app 带来迄今最重大的设计更新,并为用户 […]
苹果今日发布适用于 iPhone、iPad 和 Mac 的个人智能化系统 Apple Intelligence […]
苹果介绍了其在基础生成模型,这些模型是 Apple Intelligence 系统的核心,深度集成在 iOS […]
今天,我将向大家展示如何通过结合两个AI工具:Domo AI和Udio来创建音乐视频。下面是详细的步骤和一些扩 […]
Proofread 是谷歌Gboard键盘应用中的一个新功能,利用大语言模型(LLM)实现句子级和段落级的错误 […]
Runway推出新一代视频生成模型 Gen-3 Alpha,具备更高的保真度和一致性,能够生成逼真的人类角色和 […]