首页 > Ai资讯 > Ai日报
EMOKINE;提取分析人体运动参数 从全身动作中解码和分析情绪
EMOKINE;提取分析人体运动参数 从全身动作中解码和分析情绪

EMOKINE 是一个软件包和数据集创建框架,用于研究实验心理学、情感神经科学和计算机视觉中的情感全身运动。E […]

阿里巴巴发布语音处理模型 FunAudioLLM 能理解和生成各种人类语音
阿里巴巴发布语音处理模型 FunAudioLLM 能理解和生成各种人类语音

FunAudioLLM 是阿里巴巴开发的一组语音处理模型,旨在改善人类与大语言模型之间的语音交互。它由两个主要 […]

𝕏/Twitter 算法解析 如何提高自己的粉丝和帖子的曝光量
𝕏/Twitter 算法解析 如何提高自己的粉丝和帖子的曝光量

X/Twitter 目前正在经历大量变化,包括埃隆·马斯克开源的算法。如果您是创作者,跟踪这些变化是有意义的, […]

浦语灵笔 IXC-2.5:能看懂视频,完整书写文章、自动生成网站的多模态模型
浦语灵笔 IXC-2.5:能看懂视频,完整书写文章、自动生成网站的多模态模型

InternLM-XComposer-2.5 (浦语灵笔 IXC-2.5) 是由上海人工智能实验室, 香港中文 […]

LivePortrait:只需一张静态肖像图像就能生成动态视频 可精确控制眼睛和嘴唇的动作
LivePortrait:只需一张静态肖像图像就能生成动态视频 可精确控制眼睛和嘴唇的动作

LivePortrait是一个用于生成逼真肖像动画的框架,只需一张静态肖像图像就能生成动态视频。其主要目标是实 […]

Kyutai 发布全新的开源 AI 语音助手 Moshi 平替 OpenAI 的GPT 4o
Kyutai 发布全新的开源 AI 语音助手 Moshi 平替 OpenAI 的GPT 4o

Kyutai 研究实验室今天在巴黎发布了 Moshi AI语音助手,一个能与人类进行自然对话的AI语音助手,可 […]

Cloudflare 推出对抗 AI 机器人的工具 可一键阻止所有 AI 机器人、抓取工具和爬虫
Cloudflare 推出对抗 AI 机器人的工具 可一键阻止所有 AI 机器人、抓取工具和爬虫

为了帮助内容创作者维护安全的互联网,Cloudflare 推出了全新的一键按钮: “easy button” […]

Clone Robotics:可以生产类似西部世界里面的仿生机器人的公司
Clone Robotics:可以生产类似西部世界里面的仿生机器人的公司

Clone Robotics是一家致力于开发低成本、生物仿生和智能仿生机器人的公司。其使命是利用先进的肌肉骨骼 […]

最新泄露的细节显示 Google Pixel 9将带来更多 AI 功能 包括类似微软的Recall功能
最新泄露的细节显示 Google Pixel 9将带来更多 AI 功能 包括类似微软的Recall功能

最新泄露的细节显示,Google Pixel 9系列将带来更多复杂的AI体验。据Android Authori […]

Perplexity发布 Pro Search 高级搜索功能 支持多步推理、先进的数学和编程能力
Perplexity发布 Pro Search 高级搜索功能 支持多步推理、先进的数学和编程能力

Perplexity 发布了Pro Search的新升级版本,旨在解决更复杂的问题并提高研究效率。Pro Se […]

2024上半年《人工智能现状报告》来自750名AI行业领导者和技术人员的意见
2024上半年《人工智能现状报告》来自750名AI行业领导者和技术人员的意见

Retool 刚刚发布了最新2024上半年《人工智能现状报告》,收集了约750名技术人员的意见,包括开发者、数 […]

Meta 发布端到端生成高质量的 3D 资产生成模型 不到一分钟生成高质量3D模型
Meta 发布端到端生成高质量的 3D 资产生成模型 不到一分钟生成高质量3D模型

Meta 3D-Gen (3DGen) 是Meta开发的一种最新的文本到3D资产生成技术,可以端到端生成高质量 […]

Fish Speech:完美支持中英日语言的开源TTS模型 接近人类水平
Fish Speech:完美支持中英日语言的开源TTS模型 接近人类水平

Fish Speech 是一个全新的文本转语音 (TTS) 解决方案,该项目由fishaudio开发。当前模型 […]

Runway Gen-3 Alpha 详细使用教程以及提示词指南大全
Runway Gen-3 Alpha 详细使用教程以及提示词指南大全

Gen-3 Alpha 是Runway推出的新一代视频生成模型,它在保真度、一致性、运动和速度方面都比以前的模 […]

Figure宣布与BMW制造公司签署商业协议 将通用机器人引入汽车生产
Figure宣布与BMW制造公司签署商业协议 将通用机器人引入汽车生产

Figure是一家总部位于加利福尼亚的公司,专注于开发自主人形机器人。该公司宣布与BMW制造公司签署商业协议, […]

StableFace:使用Stable Diffusion 2.1构建自己的面部美颜应用程序
StableFace:使用Stable Diffusion 2.1构建自己的面部美颜应用程序

StableFace是一个使用Stable Diffusion 2.1构建自己的面部美颜应用程序的项目。 通过 […]

SuperAnimal:能够自动检测和分析动物的运动行为的模型
SuperAnimal:能够自动检测和分析动物的运动行为的模型

SuperAnimal是由洛桑联邦理工学院(EPFL)团队开发的一种革命性深度学习模型。这个工具是一个开源的姿 […]

Resona V2A :利用AI解读理解视频 自动为视频进行配音配乐
Resona V2A :利用AI解读理解视频 自动为视频进行配音配乐

Resona V2A 是首个商用的视频转音频(Video to Audio,V2A)技术产品,能够通过视频数据 […]

OmniParse :一个开源的数据清理和整理的自动化工具 支持多种文件格式
OmniParse :一个开源的数据清理和整理的自动化工具 支持多种文件格式

OmniParse 是一个数据摄取和解析平台,可以将各种非结构化数据(如文档、表格、图像、视频、音频文件和网页 […]

Magnific Relight 教程:通过一个提示和参考图像来改变任何图像场景的照明和背景
Magnific Relight 教程:通过一个提示和参考图像来改变任何图像场景的照明和背景

🔥 Magnific Relight 🔥 通过一个提示、参考图像或光照图来改变任何场景的照明和背景! 主要信息 […]

全球首款集成GPT-4o 的智能眼镜发布 支持视觉能力和实时问答
全球首款集成GPT-4o 的智能眼镜发布 支持视觉能力和实时问答

Solos公司在香港智能眼镜峰会上发布了其最新的Solos AirGo Vision智能眼镜,这是首款集成Ch […]

如何用 Magnific Relight 把手机自拍转为写真照 & 制作电商产品图
如何用 Magnific Relight 把手机自拍转为写真照 & 制作电商产品图

简介 📌 本教程将指导您如何使用 Magnific.ai 的最新 Relight功能将手机自拍转化为专业肖像照 […]

Character.AI推出新功能 让你可以与AI角色进行通电话
Character.AI推出新功能 让你可以与AI角色进行通电话

的Character.AI公司宣布,现在用户可以通过电话与AI角色进行对话。这个功能支持多种语言,包括英语、西 […]

Hebbia获得近1亿美元B轮融资 利用AI一次可以处理多达数百万份文档
Hebbia获得近1亿美元B轮融资 利用AI一次可以处理多达数百万份文档

Hebbia是一家利用生成式AI进行大型文档搜索并返回答案的初创公司。该公司近日获得了由Andreessen […]

微软文本转语音虚拟数字人功能上线 可以创建实时互动的数字人
微软文本转语音虚拟数字人功能上线 可以创建实时互动的数字人

Azure的文本转语音虚拟形象功能允许用户通过输入文本来创建说话的虚拟形象视频。这些虚拟形象使用高级神经网络模 […]

代理符号学习框架:使人工智能代理能够自主学习和自我进化优化
代理符号学习框架:使人工智能代理能够自主学习和自我进化优化

本研究的主要目的是开发一种新的方法,使人工智能语言代理能够自主学习和进化,从而减少对人工工程设计的依赖,并推动 […]

OpenAI 开发了一个名为 CriticGPT 的模型 专门用来找ChatGPT的错误
OpenAI 开发了一个名为 CriticGPT 的模型 专门用来找ChatGPT的错误

OpenAI 开发了一种名为 CriticGPT 的模型,该模型基于 GPT-4,用于帮助发现 ChatGPT […]

Anthropic击败OpenAI:Claude 3.5 Sonnet与GPT-4o的并排对比
Anthropic击败OpenAI:Claude 3.5 Sonnet与GPT-4o的并排对比

Austin Starks详细对比了Anthropic的Claude 3.5 Sonnet和OpenAI的GP […]

ToucanTTS:支持语言种类最多的 TTS 模型 支持超过7000种语言的语音合成
ToucanTTS:支持语言种类最多的 TTS 模型 支持超过7000种语言的语音合成

斯图加特大学自然语言处理研究所(IMS)开发了一个超全文本转语音模型ToucanTTS。ToucanTTS专为 […]

和 GPT 4o 匹敌 世界上最快的语音机器 实现500毫秒的语音到语音响应
和 GPT 4o 匹敌 世界上最快的语音机器 实现500毫秒的语音到语音响应

Daily与Cerebrium合作开发的一款语音AI机器人,该机器人能够实现500毫秒的语音到语音响应时间。5 […]


1 11 12 13 14 15 31