首页 > Ai资讯
Android Studio 引入 Gemini 让Android 开发更快、更简单
Android Studio 引入 Gemini 让Android 开发更快、更简单

Android Studio 是 Google 官方推出的集成开发环境(IDE),专门为 Android 应用 […]

马里兰大学开发出一种”隐形斗篷” 可以让监控无法识别到你
马里兰大学开发出一种”隐形斗篷” 可以让监控无法识别到你

该项目为马里兰大学帕克分校和 Facebook AI 的研究人员,关于现实世界中对对象检测器的对抗性攻击研究。 […]

X AI 发布Grok-1.5 Vision多模态模型预览 多项基准测试领先GPT 4V
X AI 发布Grok-1.5 Vision多模态模型预览 多项基准测试领先GPT 4V

马斯克X AI发布Grok-1.5 Vision 多模态模型 Grok-1.5V能够处理文本以及各种视觉信息, […]

ScreenAI:能读懂用户屏幕和信息图的视觉语言模型
ScreenAI:能读懂用户屏幕和信息图的视觉语言模型

ScreenAI 是Google Research开发的一款视觉语言模型,专门针对用户界面(UI)和信息图的理 […]

Newton:能理解和推理物理世界的模型 实时了解真实世界
Newton:能理解和推理物理世界的模型 实时了解真实世界

Archetype AI 发布了一个创新的人工智能平台 —— Newton™,这是一个专门为理解物理世界设计的 […]

清华大学设计出用于通用人工智能光子芯片:太极芯片
清华大学设计出用于通用人工智能光子芯片:太极芯片

清华大学电子工程系卢芳副教授和自动化系戴琼海教授团队设计出一种基于光子技术而非传统电子晶体管的革命性人工智能( […]

Xiaohu.AI 会员权益
Xiaohu.AI 会员权益

Xiaohu.AI 会员权益 Xiaohu.AI 是什么 Xiaohu.AI 是有小互建立的一个专门发布AI资 […]

Jina-ai/Reader:将任何网页URL转换为大语言模型友好的输入格式
Jina-ai/Reader:将任何网页URL转换为大语言模型友好的输入格式

jina-ai/reader 将任何网页URL转换为大语言模型(LLM)友好的输入格式。它通过一个简单的前缀 […]

Supermemory:轻松构建一个“第二大脑” 可以和你收藏的任何内容聊天
Supermemory:轻松构建一个“第二大脑” 可以和你收藏的任何内容聊天

supermemory 的主要作用是帮助用户构建一个“第二大脑”,通过一个简单的Chrome扩展,用户可以保存 […]

Adobe Premiere Pro 引入 AI 视频编辑和Sora等AI视频模型
Adobe Premiere Pro 引入 AI 视频编辑和Sora等AI视频模型

Adobe Premiere Pro 正在引入 AI 工具以简化视频编辑工作流程,减少完成繁琐任务的时间。 其 […]

Rewind推出可穿戴AI设备:Limitless吊坠 续航100小时 记录你整天内容
Rewind推出可穿戴AI设备:Limitless吊坠 续航100小时 记录你整天内容

Rewind公司正式推出之前他们展示可穿戴吊坠AI设备:Limitless   Limitless可以作为项链 […]

2txt:Image to text 提取任意图像上的文字并转换成可编辑的文本格式
2txt:Image to text 提取任意图像上的文字并转换成可编辑的文本格式

2txt:Image to text 图像转文字   使用Claude Haiku 和@vercel AI S […]

斯坦福大学人工智能研究院发布《2024 年人工智能指数报告》
斯坦福大学人工智能研究院发布《2024 年人工智能指数报告》

2024年的人工智能指数报告是迄今为止最全面的一次,涵盖了AI技术进步、公众对AI的看法以及AI发展的地缘政治 […]

Cohere Compass:一种面向多方面数据的先进基础嵌入模型
Cohere Compass:一种面向多方面数据的先进基础嵌入模型

Cohere推出其最新的基础嵌入模型Compass的私人测试版。Cohere Compass 是一个基础嵌入模 […]

JetMoE-8B:不到10万美元的训练成本 性能却超越LLaMA2-7B
JetMoE-8B:不到10万美元的训练成本 性能却超越LLaMA2-7B

JetMoE-8B 是一个高性能的大语言模型,它以不到10万美元的成本训练,性能超过了Meta AI的LLaM […]

利用大语言模型生成的知识图谱加速生物材料发现
利用大语言模型生成的知识图谱加速生物材料发现

该论文的主要研究目的是利用生成式人工智能(AI)技术,通过创建和分析一个大规模的知识图谱来加速科学发现。研究团 […]

CTRL-F-VIDEO: 视频Ctrl-F 可以在视频中搜索特定的单词或短语
CTRL-F-VIDEO: 视频Ctrl-F 可以在视频中搜索特定的单词或短语

CTRL-F-VIDEO 是一个开源项目,使用户能够在视频中搜索特定的单词或短语。 这个项目主要针对YouTu […]

Reka Core:和GPT 4性能不相上下的多模态语言模型
Reka Core:和GPT 4性能不相上下的多模态语言模型

Reka AI推出了其最大、最强大的多模态语言模型——Reka Core。Core能够处理文本、图像、视频和音 […]

使用Magnific AI 几分钟将手绘草图转变为精美图画甚至是3D渲染
使用Magnific AI 几分钟将手绘草图转变为精美图画甚至是3D渲染

Javi Lopez展示了如何将一幅简单的手绘草图在7分钟内转变为精美的图画甚至是3D渲染效果。他首先快速完成 […]

ZeST:将一种材质从一个图像迁移到另一个图像的对象上
ZeST:将一种材质从一个图像迁移到另一个图像的对象上

ZeST(Zero-Shot Material Transfer)是一种从单一图像进行材质迁移的方法。该技术能 […]

Spline 推出3D设计工具:AI 3D Generation 支持文本生成3D模型
Spline 推出3D设计工具:AI 3D Generation 支持文本生成3D模型

Spline 推出一个免费的3D设计工具:AI 3D Generation,可以帮助用户快速生成三维模型的工具 […]

InstantMesh:10秒内从单张图片快速生成高质量的3D模型
InstantMesh:10秒内从单张图片快速生成高质量的3D模型

InstantMesh 是一个使用前馈框架的技术,它能够从单张图像快速生成高质量的三维网格模型。这个框架结合了 […]

FireCrawl:能够抓取任何网站的所有可访问子页面,无需站点地图
FireCrawl:能够抓取任何网站的所有可访问子页面,无需站点地图

FireCrawl 是由 Mendable.ai 开发的一个项目,它能够抓取任何网站的所有可访问子页面,而且无 […]

MagicClothing:根据文本提示定制生成穿着特定服装的人物图像
MagicClothing:根据文本提示定制生成穿着特定服装的人物图像

Magic Clothing是一个基于潜在扩散模型(Latent Diffusion Model, LDM)的 […]

Stable Diffusion 3 API 发布 性能媲美Midjourney v6
Stable Diffusion 3 API 发布 性能媲美Midjourney v6

Stability AI 宣布其开发者平台API现已支持Stable Diffusion 3及其增强版本Sta […]

VASA-1:一张静态图像 + 一段语音生成逼真的对话面部视频
VASA-1:一张静态图像 + 一段语音生成逼真的对话面部视频

VASA-1,由微软亚洲研究员开发的项目,可以实现从单一静态图像和一段语音音频生成逼真的对话面部动画。VASA […]

Meta 发布开源模型 Llama 3,以及新版本Meta AI 助手
Meta 发布开源模型 Llama 3,以及新版本Meta AI 助手

Meta 发布开源模型 Llama 3,包括预训练和指令调优的8B和70B两种参数的模型以及新版本 AI 助手 […]

Imagine Flash:加速Emu扩散模型 提高生成图像的速度和质量
Imagine Flash:加速Emu扩散模型 提高生成图像的速度和质量

Meta发表一篇新论文:Imagine Flash:利用逆向蒸馏加速Emu扩散模型 Imagine Flash […]

TeToS:集成多个文本到语音(TTS)服务商的统一接口
TeToS:集成多个文本到语音(TTS)服务商的统一接口

TeToS(Text-to-Speech Operating System)是一个开源项目,提供了一个统一的接 […]

Twitter-Insight-LLM:抓取Twitter数据并可通过自然语言搜索图像
Twitter-Insight-LLM:抓取Twitter数据并可通过自然语言搜索图像

Twitter-Insight-LLM 是一个开源项目,主要功能包括从Twitter抓取数据、基于嵌入的图像搜 […]


1 81 82 83 84 85 128