首页 > Ai资讯 > Ai日报
T-Rex2:在无需训练的情况下精准识别视频中的目标对象
T-Rex2:在无需训练的情况下精准识别视频中的目标对象

T-Rex2项目是由IDEA-Research团队开发的一个开源项目,旨在通过结合文本提示和视觉提示的方式,提 […]

MoneyPrinterTurbo:利用大语言模型 一键生成1分钟长的短视频
MoneyPrinterTurbo:利用大语言模型 一键生成1分钟长的短视频

MoneyPrinterTurbo 是一个开源项目,利用大语言模型(LLM)自动一键生成短视频。这个项目通过简 […]

Stability AI 推出经过指令调优的Stable Code Instruct 3B 代码编程模型
Stability AI 推出经过指令调优的Stable Code Instruct 3B 代码编程模型

https://img.xiaohu.ai/2024/03/Comp_4.gif Stability AI 推 […]

一站式AI最新研究更新、面试资源、免费课程等综合库
一站式AI最新研究更新、面试资源、免费课程等综合库

这个项目是一个非常全面的资源库,旨在为那些对生成式人工智能(Generative AI)感兴趣的人提供最新的研 […]

AniPortrait:根据音频和图像输入 生成会说话、唱歌的动态视频
AniPortrait:根据音频和图像输入 生成会说话、唱歌的动态视频

AniPortrait是一个由腾讯开发的创新的项目,它可以根据音频(比如说话声)和一张静态的人脸图片,自动生成 […]

AI Comic Factory:漫画工厂,自动生成有情感、有故事性的漫画内容
AI Comic Factory:漫画工厂,自动生成有情感、有故事性的漫画内容

AI Comic Factory是一个基于人工智能的开源项目,它使用大语言模型(LLM)和图像生成技术(如SD […]

Creatie AI:AI驱动的产品设计工具 几分钟之内设计出一个网站或程序
Creatie AI:AI驱动的产品设计工具 几分钟之内设计出一个网站或程序

Creatie是一款由AI驱动的一站式产品设计工具,它集思维导图、设计、协作、原型制作、代码交接于一身。它可以 […]

Hume AI发布情感感知对话AI:EVI 能理解用户的情感状态和意图
Hume AI发布情感感知对话AI:EVI 能理解用户的情感状态和意图

Hume AI成功完成了由EQT Ventures领投、Union Square Ventures、Nat F […]

Magic Fixup:一种革命性的照片编辑技术 将粗略编辑转化为逼真图像
Magic Fixup:一种革命性的照片编辑技术 将粗略编辑转化为逼真图像

Magic Fixup 是一种新颖的照片编辑技术,其核心理念是通过分析动态视频来理解物体和环境如何随光照、视角 […]

DBRX: 132B参数的 新开源大语言模型 细粒度混合专家架构
DBRX: 132B参数的 新开源大语言模型 细粒度混合专家架构

Databricks 团队宣布推出 DBRX,这是一种开放、通用的大语言模型(LLM),在一系列标准基准测试中 […]

Midjourney 角色一致性功能是讲述故事或推动营销创意的有力工具
Midjourney 角色一致性功能是讲述故事或推动营销创意的有力工具

Halim Alrasihi 在分享了 Midjourney Character Mockups 作为讲述故事 […]

如何使用 Midjourney 的 /describe 命令来创造独特的图像
如何使用 Midjourney 的 /describe 命令来创造独特的图像

Gizem Akdag 最近分享了一个新的模拟教程,展示了如何使用 Midjourney 的 /describ […]

Jamba:首个Mamba的生产级模型 开创性的SSM – Transformer架构
Jamba:首个Mamba的生产级模型 开创性的SSM – Transformer架构

AI21推出Jamba,这是世界上首个基于Mamba的生产级模型。Jamba结合了Mamba结构化状态空间(S […]

X.AI 宣布推出了:Grok-1.5 128k 上下文长度,即将在𝕏上进行提供
X.AI 宣布推出了:Grok-1.5 128k 上下文长度,即将在𝕏上进行提供

X.AI 宣布推出了:Grok-1.5 模型,具备长文本理解和高级推理能力。它将在未来几天内向早期测试者和现有 […]

阿里云发布其第一个MoE模型:Qwen1.5-MoE-A2.7B 匹敌7B性能
阿里云发布其第一个MoE模型:Qwen1.5-MoE-A2.7B 匹敌7B性能

Qwen团队发布了他们的新型混合专家(MoE)模型——Qwen1.5-MoE-A2.7B,这是一款只有2.7亿 […]

VideoSwap:替换视频中的人物、物体 同时保持视频背景不变
VideoSwap:替换视频中的人物、物体 同时保持视频背景不变

VideoSwap是由新加坡国立大学的ShowLab和Meta的GenAI团队共同开发的一个项目,旨在通过交互 […]

OpenAI发布其语音生成模型:Voice Engine 15秒克隆你的声音
OpenAI发布其语音生成模型:Voice Engine 15秒克隆你的声音

OpenA分享了关于Voice Engine的初步见解和结果,这是一个可以根据文本输入和一个15秒的音频样本生 […]

Coframe AI:只要输入网址 自动优化你网站上的图片 使其更吸引人
Coframe AI:只要输入网址 自动优化你网站上的图片 使其更吸引人

Living Images旨在通过不断试验不同的图片变体,找到最能提高转化率和商业价值的图片,这对于网站/商业 […]

Arc2Face:根据你的独特面部特征生成极为逼真且多样化的人脸图像
Arc2Face:根据你的独特面部特征生成极为逼真且多样化的人脸图像

Arc2Face是一个先进的人工智能项目,能够根据一个人的独特面部特征(通过所谓的ArcFace嵌入表示)生成 […]

Emo 机器人:能够几乎实时模仿包括微笑在内的各种人类面部表情
Emo 机器人:能够几乎实时模仿包括微笑在内的各种人类面部表情

哥伦比亚大学的创意机器实验室开发出了一种名为 Emo 的人形机器人头,它能够精准恰如其分的模拟面部表情,并。 […]

BinaryVectorDB: 二进制向量数据库 速度提高20倍 成本降低100倍
BinaryVectorDB: 二进制向量数据库 速度提高20倍 成本降低100倍

BinaryVectorDB是由cohere-ai开发的一个项目,旨在创建一个高效的向量数据库,用于处理上亿级 […]

BioMedLM :一个可以在笔记本电脑上运行推理的生物医学语言模型
BioMedLM :一个可以在笔记本电脑上运行推理的生物医学语言模型

BioMedLM 是一个由斯坦福大学和DataBricks团队合作开发的基于GPT风格的自回归语言模型,具有2 […]

苹果推出Swift开发教程 无需编码知识也能学
苹果推出Swift开发教程 无需编码知识也能学

“Develop in Swift”教程通过一系列精心设计的章节和项目,教授开发者如何使用 Swift、Swi […]

Pipedream:快速连接和集成超过2000多个应用程序
Pipedream:快速连接和集成超过2000多个应用程序

Pipedream是一个为开发者设计的服务平台,它提供了一个强大的集成和自动化工具,使开发者能够轻松连接和自动 […]

Meta将在Ray-Ban眼镜中加入快速识别任何物体的AI功能
Meta将在Ray-Ban眼镜中加入快速识别任何物体的AI功能

据《纽约时报》报道,Meta将在4月为其Ray-Ban智能眼镜引入一系列相当强大的AI功能。   这些新功能将 […]

Polaris:媲美人类护士的医疗护理保健模型 能和患者进行多轮语音对话
Polaris:媲美人类护士的医疗护理保健模型 能和患者进行多轮语音对话

Polaris是由Hippocratic AI 开发的一款高度专注于安全、用于医疗保健的大语言模型(LLM)系 […]

GRM:只需少量图片 能在0.1秒内构建出物体的3D模型或整个场景
GRM:只需少量图片 能在0.1秒内构建出物体的3D模型或整个场景

GRM(Large Gaussian Reconstruction Model)是一个用于3D重建和生成的大型 […]

微软对Azure AI语音服务升级 发布9种更真实的AI语音
微软对Azure AI语音服务升级 发布9种更真实的AI语音

微软对Azure AI语音服务的Personal Voice功能进行了升级,引入了新的零样本学习(zero-s […]

Google:为特定领域专门化大语言模型的三步设计模式
Google:为特定领域专门化大语言模型的三步设计模式

Google和纽约大学的研究人员,介绍了一种将大语言模型(LLMs)的专门化的方法,并提出了一种三步设计模式。 […]

Adobe的Firefly服务为开发者提供超过20种新的生成和创意API
Adobe的Firefly服务为开发者提供超过20种新的生成和创意API

Adobe推出Firefly服务,这是一套超过20种新的生成和创意API、工具和服务。Firefly 服务使企 […]


1 23 24 25 26 27 31