首页 > Ai资讯
InternVL:GPT-4V开源替代方案 最接近 GPT-4V 表现的可商用开源模型
InternVL:GPT-4V开源替代方案 最接近 GPT-4V 表现的可商用开源模型

InternVL 1.5由上海人工智能实验室开发,一个旨在缩小开源和专有商业模型在多模态理解能力上差距的开源多 […]

FILM-7B:解决大语言模型在长上下文信息的中间丢失问题
FILM-7B:解决大语言模型在长上下文信息的中间丢失问题

FILM-7B (FILl-in-the-Middle),是一个专注于提高大语言模型(LLM)在长上下文信息利 […]

Anime gf :你的动漫女友 一个本地且开源的 CharacterAI 替代工具
Anime gf :你的动漫女友 一个本地且开源的 CharacterAI 替代工具

Anime gf 一个本地且开源的工具,提供了一个与虚拟角色互动的平台,类似于 CharacterAI。它提供 […]

Chat2DB:AI驱动的数据开发分析平台 让普通人也能处理分析数据
Chat2DB:AI驱动的数据开发分析平台 让普通人也能处理分析数据

Chat2DB 是一个由 AI 驱动的数据管理平台,目标是简化和增强数据库操作的流程。该项目已经吸引了超过一百 […]

OpenBioLLM-8B:基于 Llama-3-8B 微调训练的生物医学领域专门模型
OpenBioLLM-8B:基于 Llama-3-8B 微调训练的生物医学领域专门模型

OpenBioLLM-8B 是一个为生物医学领域专门设计的高级开源语言模型,该模型由 Saama AI 实验室 […]

GitHub 发布 Copilot Workspace 可通过自然语言编程并测试和运行代码
GitHub 发布 Copilot Workspace 可通过自然语言编程并测试和运行代码

GitHub Copilot Workspace 是一种为开发者提供的全新环境,它使用自然语言编程来简化从想法 […]

Meditron:基于 Llama 完全开源的医学大语言模型 性能优于所有开源模型
Meditron:基于 Llama 完全开源的医学大语言模型 性能优于所有开源模型

Meditron 是一款专为医疗领域设计的开源大型多模态基础模型套件。它基于 Meta Llama 2 构建, […]

ChatGPT 记忆功能上线 能记住你和GPT互动的所有内容
ChatGPT 记忆功能上线 能记住你和GPT互动的所有内容

现在所有的 ChatGPT Plus 用户都可以使用记忆功能了。使用记忆功能很简单:只需开始一个新的聊天,并告 […]

BlenderAlchemy:集成GPT-4V 通过聊天形式来进行3D图形编辑
BlenderAlchemy:集成GPT-4V 通过聊天形式来进行3D图形编辑

BlenderAlchemy 是一个创新的系统,由斯坦福大学开发,旨在通过视觉语言模型(如 GPT-4V)在 […]

Med-Gemini:基于Google Gemini的多模态医学大模型 可以理解手术视频
Med-Gemini:基于Google Gemini的多模态医学大模型 可以理解手术视频

Med-Gemini 特别针对医学领域进行优化,可以整合最新的网络搜索结果,使用定制的编码器,适应新的医疗模式 […]

LoG:百万平方米大场景的3D实时视图合成
LoG:百万平方米大场景的3D实时视图合成

LoG (Level of Gaussians) 是浙江大学3DV小组提出的一个新型的3D场景高效渲染方法。该 […]

Midjourney不同相机角度的使用教程 提高图像摄影技巧
Midjourney不同相机角度的使用教程 提高图像摄影技巧

Anima Labs 提供了一个关于如何在图像提示中掌握不同相机角度的使用的教程,以增强您的摄影控制力和效果。 […]

Play AI:模拟人类的交流方式 提供自然且富有人情味的人机交互体验
Play AI:模拟人类的交流方式 提供自然且富有人情味的人机交互体验

Play AI 是一家专注于开发和应用语音人工智能技术的研究公司。 一个高级对话系统,能够在实时对话中模拟人类 […]

Amazon Q:为企业和开发人员提供支持的生成式 AI 助手
Amazon Q:为企业和开发人员提供支持的生成式 AI 助手

亚马逊推出一款面向企业和开发者的 AI 助手。这款 AI 助手专为加速软件开发和利用公司内部数据而设计。 Am […]

乌克兰外交部引入人工智能新闻发言人 即时更新战争信息
乌克兰外交部引入人工智能新闻发言人 即时更新战争信息

乌克兰外交部引入了一位名为Victoria Shi的人工智能新闻发言人,为国内抵抗俄罗斯侵略的战争努力提供信息 […]

CrayEye :利用AI实时分析智能手机摄像头捕捉到的环境 并提供问答帮助
CrayEye :利用AI实时分析智能手机摄像头捕捉到的环境 并提供问答帮助

CrayEye是一个利用人工智能技术开发的多功能移动应用程序。它主要通过整合智能手机上的多种传感器(如摄像头和 […]

英伟达 ChatRTX 增加了语音图像等多种新功能并支持新的模型
英伟达 ChatRTX 增加了语音图像等多种新功能并支持新的模型

NVIDIA的ChatRTX最新更新,首次在3月的GTC展示,增加了多种新功能并支持新的模型,进一步扩展了这款 […]

AI21 推出Jamba-Instruct 模型 256K上下文窗口 专为商业用途设计
AI21 推出Jamba-Instruct 模型 256K上下文窗口 专为商业用途设计

继最近发布的开创性 Jamba 开源模型后,AI21宣布推出其最新产品:Jamba-Instruct模型。这是 […]

Frame:具备视觉能力和实时联网问答的开源AR眼镜
Frame:具备视觉能力和实时联网问答的开源AR眼镜

Brilliant Labs发布了一款为“Frame”的开源AR眼镜,使用户能够通过视觉分析和即时翻译,体验数 […]

StoryDiffusion:可以创造漫画故事 实现连贯叙事的图像视频生成模型
StoryDiffusion:可以创造漫画故事 实现连贯叙事的图像视频生成模型

StoryDiffusion 是一个基于一致性自注意力(Consistent Self-Attention)和 […]

英伟达推出视觉语言模型:VILA 具备情景学习能力 可在多个图像之间推理、理解视频
英伟达推出视觉语言模型:VILA 具备情景学习能力 可在多个图像之间推理、理解视频

NVIDIA和MIT的研究人员推出了一种新的视觉语言模型(VLM)预训练框架,名为VILA。这个框架旨在通过有 […]

将Llama-3 的上下文长度从8K扩展到超过100万
将Llama-3 的上下文长度从8K扩展到超过100万

Gradient AI最近将Llama-3 8B和7B模型通过渐进式训练方法不断将Llama-3模型的上下文长 […]

微软开发出数据驱动的AI天气预测模型 能准确预报未来 30 天天气情况
微软开发出数据驱动的AI天气预测模型 能准确预报未来 30 天天气情况

微软为 MSN 天气引入一项最新的天气预测模型,该模型基于微软 Start 团队近日的最新研究成果,结合了 5 […]

Project Neo:能快速为图标、动画插图和创建独特的3D形状
Project Neo:能快速为图标、动画插图和创建独特的3D形状

Project Neo示意图哦陪你过3D技术来提升传统2D图形设计的视觉效果和制作效率。 通过将3D元素和效果 […]

CURE:借助庞大的患者数据训练 能准确预测治疗结果的AI模型
CURE:借助庞大的患者数据训练 能准确预测治疗结果的AI模型

俄亥俄州立大学的科学家们设计了一种新的人工智能模型:CURE。CURE是一个基于深度学习的框架,专门设计来估计 […]

DrEureka: 利用大语言模型自动化将机器人仿真环境训练结果转移到真实世界
DrEureka: 利用大语言模型自动化将机器人仿真环境训练结果转移到真实世界

DrEureka 利用大语言模型(LLMs)自动化从仿真环境到真实世界的技术转移。这个项目解决了一个常见问题: […]

Adobe 最新研究:从单一普通视频生成从不同视角观看的视频画面
Adobe 最新研究:从单一普通视频生成从不同视角观看的视频画面

该项目可以快速从任意视频中创建新的视角,类似于你能从不同的角度观看同一场景,即使原视频只是从一个角度拍摄的。这 […]

Supertone Shift:实时语音变换器 将你的声音变成各种角色和性别的声音
Supertone Shift:实时语音变换器 将你的声音变成各种角色和性别的声音

Supertone Shift 是一款实时语音变换技术产品,允许用户即时切换到任选的声音。只需选择一个声音并开 […]

ChatGPT-Plus:一套完整的AI助手开源方案 自带运营管理后台
ChatGPT-Plus:一套完整的AI助手开源方案 自带运营管理后台

ChatGPT-Plus是一套完整的AI助手开源解决方案,自带运营管理后台,开箱即用。该项目集成了ChatGP […]

基于模型的多智能体短视频推荐系统 已经为数亿用户提供服务
基于模型的多智能体短视频推荐系统 已经为数亿用户提供服务

该论文介绍了一个先进的短视频推荐系统,通过使用多个智能体同时工作,每个智能体关注不同的用户偏好,如观看时间、点 […]


1 81 82 83 84 85 126