首页 > Ai资讯 > Ai日报
CrayEye :利用AI实时分析智能手机摄像头捕捉到的环境 并提供问答帮助
CrayEye :利用AI实时分析智能手机摄像头捕捉到的环境 并提供问答帮助

CrayEye是一个利用人工智能技术开发的多功能移动应用程序。它主要通过整合智能手机上的多种传感器(如摄像头和 […]

英伟达 ChatRTX 增加了语音图像等多种新功能并支持新的模型
英伟达 ChatRTX 增加了语音图像等多种新功能并支持新的模型

NVIDIA的ChatRTX最新更新,首次在3月的GTC展示,增加了多种新功能并支持新的模型,进一步扩展了这款 […]

AI21 推出Jamba-Instruct 模型 256K上下文窗口 专为商业用途设计
AI21 推出Jamba-Instruct 模型 256K上下文窗口 专为商业用途设计

继最近发布的开创性 Jamba 开源模型后,AI21宣布推出其最新产品:Jamba-Instruct模型。这是 […]

Frame:具备视觉能力和实时联网问答的开源AR眼镜
Frame:具备视觉能力和实时联网问答的开源AR眼镜

Brilliant Labs发布了一款为“Frame”的开源AR眼镜,使用户能够通过视觉分析和即时翻译,体验数 […]

StoryDiffusion:可以创造漫画故事 实现连贯叙事的图像视频生成模型
StoryDiffusion:可以创造漫画故事 实现连贯叙事的图像视频生成模型

StoryDiffusion 是一个基于一致性自注意力(Consistent Self-Attention)和 […]

英伟达推出视觉语言模型:VILA 具备情景学习能力 可在多个图像之间推理、理解视频
英伟达推出视觉语言模型:VILA 具备情景学习能力 可在多个图像之间推理、理解视频

NVIDIA和MIT的研究人员推出了一种新的视觉语言模型(VLM)预训练框架,名为VILA。这个框架旨在通过有 […]

将Llama-3 的上下文长度从8K扩展到超过100万
将Llama-3 的上下文长度从8K扩展到超过100万

Gradient AI最近将Llama-3 8B和7B模型通过渐进式训练方法不断将Llama-3模型的上下文长 […]

微软开发出数据驱动的AI天气预测模型 能准确预报未来 30 天天气情况
微软开发出数据驱动的AI天气预测模型 能准确预报未来 30 天天气情况

微软为 MSN 天气引入一项最新的天气预测模型,该模型基于微软 Start 团队近日的最新研究成果,结合了 5 […]

Project Neo:能快速为图标、动画插图和创建独特的3D形状
Project Neo:能快速为图标、动画插图和创建独特的3D形状

Project Neo示意图哦陪你过3D技术来提升传统2D图形设计的视觉效果和制作效率。 通过将3D元素和效果 […]

CURE:借助庞大的患者数据训练 能准确预测治疗结果的AI模型
CURE:借助庞大的患者数据训练 能准确预测治疗结果的AI模型

俄亥俄州立大学的科学家们设计了一种新的人工智能模型:CURE。CURE是一个基于深度学习的框架,专门设计来估计 […]

DrEureka: 利用大语言模型自动化将机器人仿真环境训练结果转移到真实世界
DrEureka: 利用大语言模型自动化将机器人仿真环境训练结果转移到真实世界

DrEureka 利用大语言模型(LLMs)自动化从仿真环境到真实世界的技术转移。这个项目解决了一个常见问题: […]

Adobe 最新研究:从单一普通视频生成从不同视角观看的视频画面
Adobe 最新研究:从单一普通视频生成从不同视角观看的视频画面

该项目可以快速从任意视频中创建新的视角,类似于你能从不同的角度观看同一场景,即使原视频只是从一个角度拍摄的。这 […]

Supertone Shift:实时语音变换器 将你的声音变成各种角色和性别的声音
Supertone Shift:实时语音变换器 将你的声音变成各种角色和性别的声音

Supertone Shift 是一款实时语音变换技术产品,允许用户即时切换到任选的声音。只需选择一个声音并开 […]

ChatGPT-Plus:一套完整的AI助手开源方案 自带运营管理后台
ChatGPT-Plus:一套完整的AI助手开源方案 自带运营管理后台

ChatGPT-Plus是一套完整的AI助手开源解决方案,自带运营管理后台,开箱即用。该项目集成了ChatGP […]

基于模型的多智能体短视频推荐系统 已经为数亿用户提供服务
基于模型的多智能体短视频推荐系统 已经为数亿用户提供服务

该论文介绍了一个先进的短视频推荐系统,通过使用多个智能体同时工作,每个智能体关注不同的用户偏好,如观看时间、点 […]

Logo Diffusion:利用AI在几秒钟内任何人都可轻松创建Logo标志
Logo Diffusion:利用AI在几秒钟内任何人都可轻松创建Logo标志

Logo Diffusion 是一个利用人工智能来创建独特、定制化logo的平台。用户可以通过简单的文本提示来 […]

儿童图书插图提示示范 为儿童创作引人入胜的插图
儿童图书插图提示示范 为儿童创作引人入胜的插图

该提示旨在为儿童创作引人入胜的插图,设计简单,色彩柔和,非常适合儿童图书或房间装饰。 主提示结构: A cut […]

Wayve 获得由软银领投超 10 亿美元融资,将开发具身体智能自动驾驶产品
Wayve 获得由软银领投超 10 亿美元融资,将开发具身体智能自动驾驶产品

Wayve 宣布获得由 SoftBank 集团领导的 10.5 亿美元 C 轮投资轮,新投资者 NVIDIA […]

Google推出由 Gemini 驱动的网络安全产品 可识别和防御网络钓鱼攻击
Google推出由 Gemini 驱动的网络安全产品 可识别和防御网络钓鱼攻击

Google在RSA大会上宣布推出Google Threat Intelligence,这是一个全新的威胁情报 […]

DeepSeek发布236B参数 160位专家的专家混合(MoE)模型:DeepSeek-V2
DeepSeek发布236B参数 160位专家的专家混合(MoE)模型:DeepSeek-V2

DeepSeek-V2,一个专家混合(MoE)语言模型,其特点是经济高效的训练和推理。它包含 2360 亿个总 […]

AI 应用程序是如何赚钱的?他们的定价模式、价值指标…五个主要发现
AI 应用程序是如何赚钱的?他们的定价模式、价值指标…五个主要发现

近年来,AI 产品和应用呈现爆炸式增长,吸引了超过五分之一的风险投资。许多 AI 应用改变了我们与软件的关系, […]

SaaS 产品的定价的现状、误区、策略和趋势
SaaS 产品的定价的现状、误区、策略和趋势

几年前,我开始写作时注意到SaaS定价领域出现了一个新趋势。 与传统按用户座位数量预先收取订阅费的方式不同,我 […]

微软为美国情报机构专门定制了一个间谍版的GPT 4
微软为美国情报机构专门定制了一个间谍版的GPT 4

据 Bloomberg 的报道,微软推出了一款专为美国情报机构设计的 GPT-4 生成式 AI 模型,该模型与 […]

Google将推出Ask Photos 用户能够通过自然语言搜索本机里照片和视频
Google将推出Ask Photos 用户能够通过自然语言搜索本机里照片和视频

Ask Photos 是 Google Photos 即将推出的实验性功能,利用 AI 模型 Gemini,使 […]

Google升级Gemini 1.5 Pro和即将推出新的 Gemini 1.5 Flash 模型以及Gemma 2
Google升级Gemini 1.5 Pro和即将推出新的 Gemini 1.5 Flash 模型以及Gemma 2

Google 在I/O大会上发布了一系列更新,包括对 Gemini 1.5 Pro 的改进、新的 Gemini […]

Project Astra详细介绍:Google的全能AI助手 能听、能看并能实时回答任何问题
Project Astra详细介绍:Google的全能AI助手 能听、能看并能实时回答任何问题

Project Astra 是Google DeepMind的一个前瞻性项目,旨在开发未来的AI助手,使其在日 […]

GPT-4o官方演示的16个完整视频中文翻译
GPT-4o官方演示的16个完整视频中文翻译

1. 《生日快乐》与 AI一起庆祝生日 2. 与GPT-4o打招呼 3. 模仿讽刺的语气 4. 两个 GPT- […]

Google Veo详细介绍:可与 Sora 竞争的高清 AI 视频生成器
Google Veo详细介绍:可与 Sora 竞争的高清 AI 视频生成器

DeepMind推出了他们最强大的生成视频模型Veo,类似于 OpenAI 的 Sora,能够制作高质量的10 […]

ChatGPT 改进数据分析功能 可以与数据表格进行实时交互
ChatGPT 改进数据分析功能 可以与数据表格进行实时交互

ChatGPT推出交互式表格和图表功能,让你可以与表格和图表进行实时互动,并能直接从 Google Drive […]

ZeST:将一个图像中物体材料提取并转移到另一个图像的目标对象上
ZeST:将一个图像中物体材料提取并转移到另一个图像的目标对象上

ZeST(Zero-Shot Material Transfer)是一种基于零样本的方法,它可以从一个示例图像 […]


1 29 30 31 32