EMOKINE 是一个软件包和数据集创建框架,用于研究实验心理学、情感神经科学和计算机视觉中的情感全身运动。E […]
FunAudioLLM 是阿里巴巴开发的一组语音处理模型,旨在改善人类与大语言模型之间的语音交互。它由两个主要 […]
X/Twitter 目前正在经历大量变化,包括埃隆·马斯克开源的算法。如果您是创作者,跟踪这些变化是有意义的, […]
InternLM-XComposer-2.5 (浦语灵笔 IXC-2.5) 是由上海人工智能实验室, 香港中文 […]
LivePortrait是一个用于生成逼真肖像动画的框架,只需一张静态肖像图像就能生成动态视频。其主要目标是实 […]
Kyutai 研究实验室今天在巴黎发布了 Moshi AI语音助手,一个能与人类进行自然对话的AI语音助手,可 […]
为了帮助内容创作者维护安全的互联网,Cloudflare 推出了全新的一键按钮: “easy button” […]
Clone Robotics是一家致力于开发低成本、生物仿生和智能仿生机器人的公司。其使命是利用先进的肌肉骨骼 […]
最新泄露的细节显示,Google Pixel 9系列将带来更多复杂的AI体验。据Android Authori […]
Perplexity 发布了Pro Search的新升级版本,旨在解决更复杂的问题并提高研究效率。Pro Se […]
Retool 刚刚发布了最新2024上半年《人工智能现状报告》,收集了约750名技术人员的意见,包括开发者、数 […]
Meta 3D-Gen (3DGen) 是Meta开发的一种最新的文本到3D资产生成技术,可以端到端生成高质量 […]
Fish Speech 是一个全新的文本转语音 (TTS) 解决方案,该项目由fishaudio开发。当前模型 […]
Gen-3 Alpha 是Runway推出的新一代视频生成模型,它在保真度、一致性、运动和速度方面都比以前的模 […]
Figure是一家总部位于加利福尼亚的公司,专注于开发自主人形机器人。该公司宣布与BMW制造公司签署商业协议, […]
StableFace是一个使用Stable Diffusion 2.1构建自己的面部美颜应用程序的项目。 通过 […]
SuperAnimal是由洛桑联邦理工学院(EPFL)团队开发的一种革命性深度学习模型。这个工具是一个开源的姿 […]
Resona V2A 是首个商用的视频转音频(Video to Audio,V2A)技术产品,能够通过视频数据 […]
OmniParse 是一个数据摄取和解析平台,可以将各种非结构化数据(如文档、表格、图像、视频、音频文件和网页 […]
🔥 Magnific Relight 🔥 通过一个提示、参考图像或光照图来改变任何场景的照明和背景! 主要信息 […]
Solos公司在香港智能眼镜峰会上发布了其最新的Solos AirGo Vision智能眼镜,这是首款集成Ch […]
简介 📌 本教程将指导您如何使用 Magnific.ai 的最新 Relight功能将手机自拍转化为专业肖像照 […]
的Character.AI公司宣布,现在用户可以通过电话与AI角色进行对话。这个功能支持多种语言,包括英语、西 […]
Hebbia是一家利用生成式AI进行大型文档搜索并返回答案的初创公司。该公司近日获得了由Andreessen […]
Azure的文本转语音虚拟形象功能允许用户通过输入文本来创建说话的虚拟形象视频。这些虚拟形象使用高级神经网络模 […]
本研究的主要目的是开发一种新的方法,使人工智能语言代理能够自主学习和进化,从而减少对人工工程设计的依赖,并推动 […]
OpenAI 开发了一种名为 CriticGPT 的模型,该模型基于 GPT-4,用于帮助发现 ChatGPT […]
Austin Starks详细对比了Anthropic的Claude 3.5 Sonnet和OpenAI的GP […]
斯图加特大学自然语言处理研究所(IMS)开发了一个超全文本转语音模型ToucanTTS。ToucanTTS专为 […]
Daily与Cerebrium合作开发的一款语音AI机器人,该机器人能够实现500毫秒的语音到语音响应时间。5 […]
EMOKINE 是一个软件包和数据集创建框架,用于研究实验心理学、情感神经科学和计算机视觉中的情感全身运动。E […]