Ai日报 - 第 15 页 - 智汇宝库

首页 > Ai资讯 > Ai日报

DriveVLM：自动驾驶与视觉语言模型的融合增强智能汽车场景理解和规划能力

DriveVLM：自动驾驶与视觉语言模型的融合增强智能汽车场景理解和规划能力

DriveVLM 项目有由清华大学和理想汽车联合开发的一个自动驾驶辅助系统，旨在改善自动驾驶系统的场景理解和规 […]

LibreChat：一个免费的开源 ChatGPT 克隆版可以接入各种 AI 模型

LibreChat：一个免费的开源 ChatGPT 克隆版可以接入各种 AI 模型

LibreChat是一个免费的开源ChatGPT克隆版，用户可以在一个界面中选择使用不同的AI模型。它支持与O […]

南洋理工大学提出Q*框架：可大幅提升大语言模型的多步推理能力

南洋理工大学提出Q*框架：可大幅提升大语言模型的多步推理能力

大语言模型（LLMs）在许多自然语言任务中展示了令人印象深刻的能力。然而，在执行多步推理时，自动回归生成过程使 […]

RTranslator ：一款开源、免费离线的实时翻译应用可实现多人、多语言的实时对话翻译

RTranslator ：一款开源、免费离线的实时翻译应用可实现多人、多语言的实时对话翻译

RTranslator是一个几乎完全开源的免费离线实时翻译应用，专为Android系统设计。用户可以通过蓝牙耳 […]

Diffutoon：将任何真实感视频直接渲染为高清动漫风格并可通过文字进行编辑

Diffutoon：将任何真实感视频直接渲染为高清动漫风格并可通过文字进行编辑

Diffutoon，一种基于扩散模型的创新型toon shading方法。它可以将真实感视频直接渲染为动漫风格 […]

Claude 3.5 Sonnet 在 GPQA 测试中达到 67.2% 超越了专业博士的水平

Claude 3.5 Sonnet 在 GPQA 测试中达到 67.2% 超越了专业博士的水平

Anthropic发布了其最新的Claude 3.5 Sonnet模型，在研究生水平推理 (GPQA)、本科生 […]

OpenAI CTO Mira Murati 母校访谈实录博士级别的人工智能有望在一年半的时间内发布

OpenAI CTO Mira Murati 母校访谈实录博士级别的人工智能有望在一年半的时间内发布

在对话中，Mira与主持人Jeff Blackburn探讨了她的职业生涯、人工智能的未来发展以及其对社会的影响 […]

腾讯元宝发布新版本支持1000万字超长文处理同时接入微信搜索

腾讯元宝发布新版本支持1000万字超长文处理同时接入微信搜索

腾讯旗下AI聊天机器人元宝发布新版本，支持1000万字超长文处理新版本提升了 AI 搜索和解析能力，并支持超 […]

环球音乐与 AI音乐初创公司 SoundLabs合作将为歌手定制自己语音克隆模型

环球音乐与 AI音乐初创公司 SoundLabs合作将为歌手定制自己语音克隆模型

环球音乐集团（UMG）与AI音乐技术公司SoundLabs合作，将为歌手和艺术家提供创建自己语音克隆模型的技术 […]

Florence-2：微软全新开源视觉模型能够执行超过10种不同的视觉任务

Florence-2：微软全新开源视觉模型能够执行超过10种不同的视觉任务

Florence-2 是一个由微软开发的新的视觉模型，主要用来处理各种图像任务。它可以通过简单的文字提示完成任 […]

在分析了 500 万个自由职业岗位后发现这些工作最可能被 AI 替代

在分析了 500 万个自由职业岗位后发现这些工作最可能被 AI 替代

本文通过分析Upwork平台上自2022年11月1日至2024年2月14日的500万个自由职业工作，探讨了哪些 […]

GPT-4 通过图灵测试？研究人员称人们在图灵测试中无法区分 GPT-4 和人类

GPT-4 通过图灵测试？研究人员称人们在图灵测试中无法区分 GPT-4 和人类

“图灵测试”最初是由计算机科学家艾伦·图灵在1950年提出的“模仿游戏”，用于判断机器显示智能的能力是否与人类 […]

TikTok 推出生成式 AI 内容工具套件Symphony 包含一系列 AI 内容生成工具

TikTok 推出生成式 AI 内容工具套件Symphony 包含一系列 AI 内容生成工具

TikTok 刚推出了一个超实用的新工具包——TikTok Symphony。这套工具用上了生成式人工智能，目 […]

直接生成答案网页 Perplexity 竞争对手出现一个新的 AI 驱动搜索引擎登场

直接生成答案网页 Perplexity 竞争对手出现一个新的 AI 驱动搜索引擎登场

Perplexity竞争对手出现，，一个新的AI驱动搜索引擎登场—— Genspark 与Perplexity […]

Anthropic 发布Claude 3.5 Sonnet最新模型与GPT 4o不相上下可在聊天窗口运行代码

Anthropic 发布Claude 3.5 Sonnet最新模型与GPT 4o不相上下可在聊天窗口运行代码

Anthropic 发布Claude 3.5 Sonnet最新模型，新模型在推理、知识和编码能力评估方面超越了 […]

Meta AI 公布了多项新的研究成果包括4个可用的AI模型和2个额外的研究成果

Meta AI 公布了多项新的研究成果包括4个可用的AI模型和2个额外的研究成果

Meta FAIR公开发布了多项新的研究成果、模型和数据集，旨在通过开放、合作和卓越的原则，推动AI领域的创新 […]

Hedra：上传人物照片+任意语音可实现人物唱歌、说话

Hedra：上传人物照片+任意语音可实现人物唱歌、说话

Hedra Labs 推出了 Character-1 的研究预览版。支持根据任意人物照片和语音内容生成个人会说 […]

OpenAI、斯坦福、微软等多所机构筛选出1565篇论文发布大模型提示技术报告

OpenAI、斯坦福、微软等多所机构筛选出1565篇论文发布大模型提示技术报告

来自全球多所大学和科技公司的研究人员们共同完成了一项重要的工作，他们系统地整理了关于生成性人工智能（GenAI […]

首个 AI 高考评测结果发布 GPT-4o名列第二

首个 AI 高考评测结果发布 GPT-4o名列第二

高考覆盖各类学科及题型，同时因其开考前的“绝密性”，被视作中国最具权威的考试之一，成为评估考生综合能力的“试金 […]

基于 ChatTTS 2600个音色库稳定性评分并按性别和年龄分类可试听

基于 ChatTTS 2600个音色库稳定性评分并按性别和年龄分类可试听

ChatTTS Speaker 提供了ChatTTS生成的音色的稳定性评分，并根据性别和年龄分类，用户可以试听 […]

Xiaoju Survey：一个开源的多功能调查问卷系统内置40多种题型 100多个模板

Xiaoju Survey：一个开源的多功能调查问卷系统内置40多种题型 100多个模板

Xiaoju Survey 是一个轻量、安全的问卷系统基座，提供面向个人和企业的一站式产品级解决方案，旨在快速 […]

加州大学研发出新的 Transformer 架构显著减少大模型对GPU的依赖

加州大学研发出新的 Transformer 架构显著减少大模型对GPU的依赖

矩阵乘法（MatMul）是使用Transformer架构的大语言模型（LLM）中最耗费计算资源的操作，需要大量 […]

Runway 推出新一代视频生成模型 Gen-3 Alpha 能够进行精细时间控制

Runway 推出新一代视频生成模型 Gen-3 Alpha 能够进行精细时间控制

Runway推出新一代视频生成模型 Gen-3 Alpha，具备更高的保真度和一致性，能够生成逼真的人类角色和 […]

麻省理工开发出 AI 聊天机器人可以让你和60岁的自己进行对话

麻省理工开发出 AI 聊天机器人可以让你和60岁的自己进行对话

麻省理工学院（MIT）的研究人员开发了一款名为Future You “未来的你”的AI聊天机器人，它可以让你和 […]

DeepSeek发布开源模型DeepSeek-Coder-V2 在代码和数学能力上超越了GPT-4-Turbo

DeepSeek发布开源模型DeepSeek-Coder-V2 在代码和数学能力上超越了GPT-4-Turbo

DeepSeek宣布发布开源模型DeepSeek-Coder-V2，该模型在代码和数学能力上超越了GPT-4- […]

Google 发布根据视频生成音频技术：V2A 也就是给视频自动配音、配乐

Google 发布根据视频生成音频技术：V2A 也就是给视频自动配音、配乐

DeepMind最新研发了一种叫视频转音频（V2A）的技术。这种技术可以根据视频画面和文字描述，自动生成丰富的 […]

Color Health 与OpenAI 合作开发出Cancer Copilot 加速癌症患者治疗

Color Health 与OpenAI 合作开发出Cancer Copilot 加速癌症患者治疗

Color Health与OpenAI合作开发了一款名为Color’s copilot的工具，旨在通过使用GP […]

MimicBrush：通过模仿参考图像对目标图像选定区域自动进行局部编辑

MimicBrush：通过模仿参考图像对目标图像选定区域自动进行局部编辑

MimicBrush 由阿里巴巴开发的一种新型的图像编辑方法，也可以称为模仿编辑（imitative edit […]

根据单张图像和音频输入生成唱歌和说话视频，并能控制人物表情和姿态

根据单张图像和音频输入生成唱歌和说话视频，并能控制人物表情和姿态

通过语音音频输入来驱动肖像图像生成动画视频，也就是一段语音+个人图像生成会说话唱歌的视频。研究团队提出了一种 […]

让 AI 像人类一样通过试错法学习决策和推理提高其逻辑推理和数学能力

让 AI 像人类一样通过试错法学习决策和推理提高其逻辑推理和数学能力

随着人工智能的快速发展，诸如GPT-4和LLaMA等大语言模型在自然语言处理能力方面取得了显著进步。这些模型展 […]

1 … 13 14 15 16 17 … 32