Open NotebookLM 是一个将 PDF 文件转化为播客的工具,依靠 Llama 3.1 和 meloTTS 等开源技术构建,可以实现 NotebookLM 的部分体验。用户可以上传文件或通过 URL 提供内容,并能对播客的语气和长度进行定制化。
由于采用了 meloTTS 理论上是支持中文的。
- PDF 转播客:可以将任何 PDF 文档或者链接转换为播客形式。通过分析 PDF 内容,生成自然的对话,适合音频播客格式。
- 对话生成:工具生成的对话设计为既信息丰富又具有娱乐性,使内容易于聆听和理解。
- 用户友好界面:使用基于 Gradio 的简单交互界面,用户可以轻松上传 PDF 并生成播客内容,无需复杂的设置。
- 文本转语音:利用开源的 LLM(大语言模型) 和 文本转语音模型,将文本转换为自然的语音对话,支持多种语言,并以 MP3 格式导出。
- 使用了 Llama 3.1、meloTTS 和 Gradio 等开源 AI 工具构建。
GitHub:https://github.com/gabrielchua/open-notebooklm
在线演示:https://huggingface.co/spaces/gabrielchua/open-notebooklm
案例展示:
英文:
中文:
造梦日记Ai,凭借在AI领域多年的深耕以及西湖大学实验室的成熟算力,用户输入一些关键词或者一段描述某场景的文字,便可在几秒内生成一张独创的、版权归属于自己的图片。