首页 > Ai资讯 > Ai日报
Med-Gemini:基于Google Gemini的多模态医学大模型 可以理解手术视频
Med-Gemini:基于Google Gemini的多模态医学大模型 可以理解手术视频

Med-Gemini 特别针对医学领域进行优化,可以整合最新的网络搜索结果,使用定制的编码器,适应新的医疗模式 […]

LoG:百万平方米大场景的3D实时视图合成
LoG:百万平方米大场景的3D实时视图合成

LoG (Level of Gaussians) 是浙江大学3DV小组提出的一个新型的3D场景高效渲染方法。该 […]

Midjourney不同相机角度的使用教程 提高图像摄影技巧
Midjourney不同相机角度的使用教程 提高图像摄影技巧

Anima Labs 提供了一个关于如何在图像提示中掌握不同相机角度的使用的教程,以增强您的摄影控制力和效果。 […]

Play AI:模拟人类的交流方式 提供自然且富有人情味的人机交互体验
Play AI:模拟人类的交流方式 提供自然且富有人情味的人机交互体验

Play AI 是一家专注于开发和应用语音人工智能技术的研究公司。 一个高级对话系统,能够在实时对话中模拟人类 […]

Amazon Q:为企业和开发人员提供支持的生成式 AI 助手
Amazon Q:为企业和开发人员提供支持的生成式 AI 助手

亚马逊推出一款面向企业和开发者的 AI 助手。这款 AI 助手专为加速软件开发和利用公司内部数据而设计。 Am […]

乌克兰外交部引入人工智能新闻发言人 即时更新战争信息
乌克兰外交部引入人工智能新闻发言人 即时更新战争信息

乌克兰外交部引入了一位名为Victoria Shi的人工智能新闻发言人,为国内抵抗俄罗斯侵略的战争努力提供信息 […]

CrayEye :利用AI实时分析智能手机摄像头捕捉到的环境 并提供问答帮助
CrayEye :利用AI实时分析智能手机摄像头捕捉到的环境 并提供问答帮助

CrayEye是一个利用人工智能技术开发的多功能移动应用程序。它主要通过整合智能手机上的多种传感器(如摄像头和 […]

英伟达 ChatRTX 增加了语音图像等多种新功能并支持新的模型
英伟达 ChatRTX 增加了语音图像等多种新功能并支持新的模型

NVIDIA的ChatRTX最新更新,首次在3月的GTC展示,增加了多种新功能并支持新的模型,进一步扩展了这款 […]

AI21 推出Jamba-Instruct 模型 256K上下文窗口 专为商业用途设计
AI21 推出Jamba-Instruct 模型 256K上下文窗口 专为商业用途设计

继最近发布的开创性 Jamba 开源模型后,AI21宣布推出其最新产品:Jamba-Instruct模型。这是 […]

Frame:具备视觉能力和实时联网问答的开源AR眼镜
Frame:具备视觉能力和实时联网问答的开源AR眼镜

Brilliant Labs发布了一款为“Frame”的开源AR眼镜,使用户能够通过视觉分析和即时翻译,体验数 […]

StoryDiffusion:可以创造漫画故事 实现连贯叙事的图像视频生成模型
StoryDiffusion:可以创造漫画故事 实现连贯叙事的图像视频生成模型

StoryDiffusion 是一个基于一致性自注意力(Consistent Self-Attention)和 […]

英伟达推出视觉语言模型:VILA 具备情景学习能力 可在多个图像之间推理、理解视频
英伟达推出视觉语言模型:VILA 具备情景学习能力 可在多个图像之间推理、理解视频

NVIDIA和MIT的研究人员推出了一种新的视觉语言模型(VLM)预训练框架,名为VILA。这个框架旨在通过有 […]

将Llama-3 的上下文长度从8K扩展到超过100万
将Llama-3 的上下文长度从8K扩展到超过100万

Gradient AI最近将Llama-3 8B和7B模型通过渐进式训练方法不断将Llama-3模型的上下文长 […]

微软开发出数据驱动的AI天气预测模型 能准确预报未来 30 天天气情况
微软开发出数据驱动的AI天气预测模型 能准确预报未来 30 天天气情况

微软为 MSN 天气引入一项最新的天气预测模型,该模型基于微软 Start 团队近日的最新研究成果,结合了 5 […]

Project Neo:能快速为图标、动画插图和创建独特的3D形状
Project Neo:能快速为图标、动画插图和创建独特的3D形状

Project Neo示意图哦陪你过3D技术来提升传统2D图形设计的视觉效果和制作效率。 通过将3D元素和效果 […]

CURE:借助庞大的患者数据训练 能准确预测治疗结果的AI模型
CURE:借助庞大的患者数据训练 能准确预测治疗结果的AI模型

俄亥俄州立大学的科学家们设计了一种新的人工智能模型:CURE。CURE是一个基于深度学习的框架,专门设计来估计 […]

DrEureka: 利用大语言模型自动化将机器人仿真环境训练结果转移到真实世界
DrEureka: 利用大语言模型自动化将机器人仿真环境训练结果转移到真实世界

DrEureka 利用大语言模型(LLMs)自动化从仿真环境到真实世界的技术转移。这个项目解决了一个常见问题: […]

Adobe 最新研究:从单一普通视频生成从不同视角观看的视频画面
Adobe 最新研究:从单一普通视频生成从不同视角观看的视频画面

该项目可以快速从任意视频中创建新的视角,类似于你能从不同的角度观看同一场景,即使原视频只是从一个角度拍摄的。这 […]

Supertone Shift:实时语音变换器 将你的声音变成各种角色和性别的声音
Supertone Shift:实时语音变换器 将你的声音变成各种角色和性别的声音

Supertone Shift 是一款实时语音变换技术产品,允许用户即时切换到任选的声音。只需选择一个声音并开 […]

ChatGPT-Plus:一套完整的AI助手开源方案 自带运营管理后台
ChatGPT-Plus:一套完整的AI助手开源方案 自带运营管理后台

ChatGPT-Plus是一套完整的AI助手开源解决方案,自带运营管理后台,开箱即用。该项目集成了ChatGP […]

基于模型的多智能体短视频推荐系统 已经为数亿用户提供服务
基于模型的多智能体短视频推荐系统 已经为数亿用户提供服务

该论文介绍了一个先进的短视频推荐系统,通过使用多个智能体同时工作,每个智能体关注不同的用户偏好,如观看时间、点 […]

Logo Diffusion:利用AI在几秒钟内任何人都可轻松创建Logo标志
Logo Diffusion:利用AI在几秒钟内任何人都可轻松创建Logo标志

Logo Diffusion 是一个利用人工智能来创建独特、定制化logo的平台。用户可以通过简单的文本提示来 […]

儿童图书插图提示示范 为儿童创作引人入胜的插图
儿童图书插图提示示范 为儿童创作引人入胜的插图

该提示旨在为儿童创作引人入胜的插图,设计简单,色彩柔和,非常适合儿童图书或房间装饰。 主提示结构: A cut […]

Wayve 获得由软银领投超 10 亿美元融资,将开发具身体智能自动驾驶产品
Wayve 获得由软银领投超 10 亿美元融资,将开发具身体智能自动驾驶产品

Wayve 宣布获得由 SoftBank 集团领导的 10.5 亿美元 C 轮投资轮,新投资者 NVIDIA […]

Google推出由 Gemini 驱动的网络安全产品 可识别和防御网络钓鱼攻击
Google推出由 Gemini 驱动的网络安全产品 可识别和防御网络钓鱼攻击

Google在RSA大会上宣布推出Google Threat Intelligence,这是一个全新的威胁情报 […]

DeepSeek发布236B参数 160位专家的专家混合(MoE)模型:DeepSeek-V2
DeepSeek发布236B参数 160位专家的专家混合(MoE)模型:DeepSeek-V2

DeepSeek-V2,一个专家混合(MoE)语言模型,其特点是经济高效的训练和推理。它包含 2360 亿个总 […]

AI 应用程序是如何赚钱的?他们的定价模式、价值指标…五个主要发现
AI 应用程序是如何赚钱的?他们的定价模式、价值指标…五个主要发现

近年来,AI 产品和应用呈现爆炸式增长,吸引了超过五分之一的风险投资。许多 AI 应用改变了我们与软件的关系, […]

SaaS 产品的定价的现状、误区、策略和趋势
SaaS 产品的定价的现状、误区、策略和趋势

几年前,我开始写作时注意到SaaS定价领域出现了一个新趋势。 与传统按用户座位数量预先收取订阅费的方式不同,我 […]

微软为美国情报机构专门定制了一个间谍版的GPT 4
微软为美国情报机构专门定制了一个间谍版的GPT 4

据 Bloomberg 的报道,微软推出了一款专为美国情报机构设计的 GPT-4 生成式 AI 模型,该模型与 […]

Google将推出Ask Photos 用户能够通过自然语言搜索本机里照片和视频
Google将推出Ask Photos 用户能够通过自然语言搜索本机里照片和视频

Ask Photos 是 Google Photos 即将推出的实验性功能,利用 AI 模型 Gemini,使 […]


1 26 27 28 29